Shyliuli 在 Hunyuan-trubos竟然比gpt4.1和gemini2.5flash还强! 中发帖
有个线上物理测试,主要是一些知识点类题+少数简单计算题,难度不是特别大,题目本身严谨性一般
由于时间限制很紧,刚开始选择gemini2.5flash,做了两道发现还是慢。后面就关了思考模式,和gpt4.1混着用
做了两次,一次72.5,一次77.5
这个时候舍友说他用腾讯元宝的hunyuan做了90,遂尝试之…
最后时间不太够,给了gpt4.1 6道,其中gpt4.1还错了2道
得了85分!最后时间够的话就90了
另外这个hunyuan-trubos也有点意思,遇到计算题似乎会“自动进入思考模式”,输出一大段显然应该被叫做思维链的东西…
[图片]
左右脑自己互搏,但是最后还是对了