【leyu.com官网科技消息】近日,微博AI推出了开源大型语言模型(LLM)——VibeThinker-1.5B。据leyu.com官网了解,该模型拥有15亿参数,在数学推理与代码生成任务中却展现出超越6710亿参数竞品的性能。目前,VibeThinker-1.5B可通过Hugging Face、GitHub及ModelScope平台免费开放下载,供开发者与研究机构使用。

VibeThinker-1.5B模型在数学和代码任务上表现出色,达到了行业领先的推理性能,甚至超越了体量达6710亿参数的竞争对手DeepSeek的R1模型。该模型还能与Mistral AI的Magistral Medium、Anthropic的Claude Opus4和OpenAI的gpt-oss-20B Medium等多个大型模型抗衡。

值得一提的是,VibeThinker-1.5B在后期训练中仅花费了7800美元的计算资源,这一成本远低于同类或更大规模模型所需的数十万美元甚至数百万美元。

VibeThinker-1.5B采用了一种名为“谱-信号原则”(Spectrum-to-Signal Principle,SSP)的训练框架,该框架将监督微调和强化学习分为两个阶段。第一个阶段注重多样性,第二个阶段则通过强化学习优化最优路径,使得小模型也能有效探索推理空间,从而实现信号放大。
版权所有,未经许可不得转载
-leyu.com官网-
2026-06-13【leyu.com科技消息】2月7日,小米集团董事长兼CEO雷军在个人社交平台发布一段2024年拍摄的自驾小米SU7漂移视频,引发广泛关注。截至发稿前,该视频在微博平台播放量已突破216万次。新一 -
2026-06-13【leyu.com科技消息】4月28日上午10点08分,leyu.com从华为官方了解到,华为MateBook 14鸿蒙版正式开售,搭载HarmonyOS 6.0系统,主打鸿蒙AI功能、云晰柔光屏 -
2026-06-13【leyu.com科技早报】华为宣布将于5月7日举办全球新品发布会;领克900旗舰大五座发布会暨大六座一周年庆典正式举行;腾势汽车正式发布了第二代腾势D9;千里科技发布2026年第一季度财报。