
微博推出仅30亿参数推理模型VibeThinker-3B 在数学编程任务上媲美国际一线
近日,微博推出的VibeThinker-3B模型在海外引发关注,登上多个技术社区热榜。据悉,该模型仅有30亿参数,但在数学解题、竞赛编程等高难度推理任务上,其性能已进入国际前沿模型的区间,在国内也具备对标一线模型的能力。
VibeThinker-3B是其初代模型的升级版,将小模型的推理能力上限推至新高度,核心亮点在于以极小的参数规模在特定赛道接近一线大模型表现。其能力适配数学教育、编程教学辅助、STEM领域推理及数据分析应用。有反馈显示,该模型甚至在消费级显卡正规买球的网站上解决了复杂数学难题。
不过,该模型在开放领域知识、通用对话等方面与千亿级大模型存在差距。这种“偏科”是技术路线的选择,其通过定向强化推理能力的训练方法,成本远低于行业主流。团队据此提出了“参数压缩覆盖假设”,认为可验证推理能力可以被有效压缩,而通用知识更依赖大规模参数。
VibeThinker-3B的出现动摇了“规模即智能”的行业共识。它大幅降低了高性能推理的部署门槛,并开辟了效率优先的新技术路径。虽然无法替代通用大模型,但它证明了在特定能力上,小模型可与大模型形成互补,其技术突破有望降低AI应用成本,引发行业对发展路径的重新思考。
