Earmer Carey (@earmer) 在 在哈基米3.0发布前说开去…… 中发帖
lithiumflow,是这个模型在大模型竞技场中的代号。我不知道谷歌什么时候发布它,或许是明天凌晨3点(对应太平洋标准时间的2025年10月22日12时),或许是永远不。
这是一个写文章的模型。
传统的聊天并不适合测评代码类模型。起码对于现在这个AI Agent的时代,与Agent工具配合,精准地调用工具读取代码,也是十分重要的。这要求模型必须要有强大的情景意识和准确度,这通常需要后训练,而我们都知道,谷歌的后训练是不足甚至可以说是孱弱的。
而同时测试的,共有这几个模型:
Acadia
Miramar
Zion
Lithiumflow
Sierra
Marble
创意写作的模型吃力不讨好,譬如GPT-4.5。这种写作能力似乎与模型的餐数量正相关。所以,我有点担忧,谷歌会不会放出来这个模型。
我的想法很乱,只是发些感想。