@SugarBreeze被gpt-5-chat的幻觉气笑了 中发帖

拿kilocode的余额调openrouter上的gpt5模型试试vibe能力,然后看到有gpt-5和gpt-5-chat两个模型,价格一样,简单试了试gpt-5,效果还行,可以作为claude的廉价替代。然后突发奇想想试试这个给一般用户用的chat模型是怎么个事,结果就发现这玩意会库库调工具读不存在的文件,或者是一行代码不写就一串下来说自己干完活了,属实难绷,即使不是专门特化的,但也不能这样吧 
[image]
说完之后你猜怎么着,它直接认为任务完成了 🫠
[image]