@Van使用不同大模型测试测试他们在论文中的推理能力 中发帖

最近正在写论文,有时候思路经常会卡壳,就会用大模型想想思路和点子,突发奇想使用不同的模型测试测试一下他们在论文中的推理能力,给的同一篇论文pdf和同一个问题(有意思的是claude和ds如果不加说中文输出的都是英文,站内大佬的chat01直接就能输出中文,可能是佬加了一些内置的提示词) 
各位大佬也评价评价哪一个写的好

问题
我找到的外部常识知识分别是视频模态的visualcomet和音频模态的PACS,请仿照这篇论文的Textual Enhancement Module这一节分别写出visualEnhancement Module和audio Enhancement Module这两节,说中文

deepseek r1
[image]
[image]
gpt o1
[image]
gpt o3-mini-high
[image]
claude sonnet
...