Terrasse 在 我要称赞一下5.1-codex-max 中发帖
看站里佬友说max提升不大,自己试了一下:
今天有一个项目用claude写好单元测试之后它自己一直无法通过测试。换成5.1-codex-max,直接跑了45min,最终把几十个fail的测试全通过了,看了下代码质量也没有屎感。这45min他基本上把整个上下文窗口跑完了,一个prompt直接把周限给我烧了15%😂
或许,A社的时代要结束了?