@lostsheep浅度对比 Droid 中使用 sonnet 4.5 & gpt-5 和第三方模型的样式输出 中发帖

对比各个模型(Factory provided models & Custom models) 输出样式

在同一个项目目录内,同一个项目 AGENTS.md 文件,同一个 factory.ai 账号,打开不同的 session 会话前提下进行

结论先行: sonnet 4.5 (自带及第三方都差不多)样式最好

对比方式

引用指定的一个设计文档,在 spec 模式下提问: 分析设计文档与当前项目代码的匹配程度

阅读这份设计文档: @xxx详细设计文档.md
检查和当前项目代码的功能实现匹配程度

对比样式结果
Factory provided models: GPT-5
[PixPin_2025-10-15_00-16-46]
[PixPin_2025-10-15_00-16-58]
浅评:层级清晰,有结论有后续改进方案,且不同颜色区分,在方案中明确重点下一步执行内容,个人...