shijinhui (@sjh0823) 在 llama4发布，疑似竞技场和实际发布模型差距过大，货不对板？中发帖[image] [image] 请看以上两张图片，同样的提示词，同样的模型，竞技场的文风很好，但是放到or里面的这个模型就是天差地别

shijinhui (@sjh0823) 在 llama4发布，疑似竞技场和实际发布模型差距过大，货不对板？中发帖

[image] 
[image] 
请看以上两张图片，同样的提示词，同样的模型，竞技场的文风很好，但是放到or里面的这个模型就是天差地别。（还有天气卡测试题，or的天气卡完全是一团混乱不成样子，而竞技场的虽然算不上太好，但是起码正常表述了天气，请看图片） 
[image] 
[image] 
而根据meta官方所发布的博客中写到 
[image] 
llama4拥有和deepseekv3一样强劲的代码能力。 
可是deepseekv3的天气卡相比大家都看过了，不用我再重述了。 
所以meta藏了一手？（或者说开源大模型的都要藏一手，可是这两个模型差距大到让我怀疑meta官方发错了代码，这发布了个什么玩意。）