@HCPTangHY 在 Mimo v2.5 Pro测评:进步不错,问题也大 中发帖
放私有bench
[image]
mimo 2.0 pro测评
这个模型的基础还算扎实,但是比glm还差点。
而且很多有背题嫌疑
[image]
比如这个MC,看起来写的相当不错,但是竟然存在无法跳跃的bug。遥想2.0p时期写出来的MC,不知道背的谁家,,
[image]
[image]
这个案例里,其他逻辑都还行,结果建筑绘制拉了
而且在测试途中,爆思维链的现象非常严重
[image]
罗福莉你看你带的兵
思维链无限循环撑爆上下文,然后空回
不过还是要一下,小米这个迭代速度有点吓人了。现在这llm公司们都卷疯了,,