天海逍遥 (@biggerm)新浪微博发布其首个开源大模型 VibeThinker-1.5B,小模型挑战巨量参数对手 中发帖

消息来源:新浪微博发布其首个开源大模型 VibeThinker-1.5B,小模型挑战巨量参数对手 - IT之家 
IT之家 11 月 13 日消息,今日新浪微博发布了其首个开源大模型 VibeThinker-1.5B,号称“小模型也可以有大智慧”。
IT之家附官方介绍如下:
目前业界最强大模型参数量大都超过了 1T,甚至出现了 2T 规模的模型,是否只有巨量参数模型才有高度的智能?是否只有少量科技巨头才有能力做大模型?
VibeThinker-1.5B,正是微博 AI 对此问题给出的否定答案,它证明了小模型也可以有高智商。这意味着做最强大模型不再像传统观念以为的那样主要依赖推高参数量,也可以通过巧妙的算法设计来做到这一点。
这款模型仅有 1.5B (15 亿) 参数,经过微博 AI 研发人员提出的创新“频谱到信号原理”(SSP)方法训练后,其效果堪称颠覆:VibeThinker 在...