shijinhui (@sjh0823) 在 llama4发布,疑似竞技场和实际发布模型差距过大,货不对板? 中发帖
[image]
[image]
请看以上两张图片,同样的提示词,同样的模型,竞技场的文风很好,但是放到or里面的这个模型就是天差地别。(还有天气卡测试题,or的天气卡完全是一团混乱不成样子,而竞技场的虽然算不上太好,但是起码正常表述了天气,请看图片)
[image]
[image]
而根据meta官方所发布的博客中写到
[image]
llama4拥有和deepseekv3一样强劲的代码能力。
可是deepseekv3的天气卡相比大家都看过了,不用我再重述了。
所以meta藏了一手?(或者说开源大模型的都要藏一手,可是这两个模型差距大到让我怀疑meta官方发错了代码,这发布了个什么玩意。)