白日星梦 (@Acheron) 在 盘点各个领域的最强AI,纯属个人观点 中发帖
RT。纯属个人观点,欢迎交流讨论。
是不是很像短视频标题?
写代码:gpt-5-high
体验下来gpt-5-high能修改最少的代码,达成最优的效果,在全局上是最优的。
claude系列模型初次生成都很好。
Gemini-2.5-pro通常不能发现自己问题,但由用户提出问题后,改代码也很好用。
调用工具:gpt-5-high
同样全局最优,gpt-5-codex确实调用工具还没high做得好,幻觉可能有点大?
Gemini-2.5-pro 有时候好,有时候不好,也有可能是我API厂商的缘故?
claude我体验的时候幻觉有点大,同Gemini,正常来说我用CC,自家的适配应该还好点才对。
这里特别举出glm,调用工具能调用,但328行的代码,能被他看成36行
联网搜索:gork-4-fast 当之无愧
不过他居然搜索不到自己是最强搜索模型
写作:Gemini-2...