129s 在 我宣布codex是真正的外科手术刀 中发帖
虽然这个比喻已经被各种大模型用烂了,这回用来形容codex却意外的恰当。
这玩意真的指哪打哪,不像claude一样随地大小便,创建一堆fallback方案,而且提示词服从得明明白白的,该更新文档就更新,该跑测试就跑(点名批评augment,压根不听话)。
可能的缺陷是需求不明确时,可能会曲解你的意思,二话不说硬干一小时发现不是你想要的。(不过这不是模型的问题,大多数时候确实是我自己也不清楚要啥,也是当上甲方为难人了)。
所以我现在的工作流是这样的:codex一边写代码,我一边理解他之前写了点什么,然后和别的模型沟通明确接下来的需求。没有花哨的subagent、mcp,遇到啥问题就解决啥,这是干实事的llm。
btw,windows系统嫌麻烦没折腾wsl,用的是msys2环境,感觉体验没有论坛里大家说的那么糟糕,就是cli的设计可能没cc好看。