本文分类:news发布日期:2026/1/10 9:03:14
打赏

相关文章

AIME25得分74.4意味着什么?与人类选手水平对照表

AIME25得分74.4意味着什么?与人类选手水平对照表 在AI模型参数规模不断突破百亿、千亿的今天,一个仅15亿参数的小模型却悄然登上了数学推理能力排行榜的前列——VibeThinker-1.5B-APP 在 AIME25 测试中取得了 74.4分 的成绩。这个数字看似平淡&#xff0…

参数仅1/400却反超DeepSeek?AIME评分细节深度解读

参数仅1/400却反超DeepSeek?AIME评分细节深度解读 在大模型动辄千亿参数、训练成本突破千万美元的今天,一个仅有15亿参数的小模型突然杀出重围——VibeThinker-1.5B-APP 不仅在数学推理与编程任务中表现惊人,甚至在多个权威基准上击败了参数…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部