Bunn (@BunnHack) 在 LongCat发布LongCat-Flash-Thinking-2601:专为深度与通用代理式思维打造的全新进化版本 中发帖
LongCat-Flash-Thinking-2601 — 为深入且通用的代理式思维而构建的版本。
✨ 亮点:
🤖 顶级代理能力
🔹 性能:在基准测试中位列前茅(TIR / Agentic Search / Agentic Tool Use);优秀的泛化能力,在复杂且随机的任务中表现优于 Claude
🔹 环境扩展:多个自动构建的高质量环境;密集的依赖图
🔹 多环境强化学习:扩展的 DORA(我们的 RL 基础设施),支持大规模多环境代理训练
🛡 真实世界的鲁棒性
🔹 性能:在混乱、不确定的场景中表现稳健(Vita-Noise 与 Tau^2-Noise)
🔹 噪声分析:系统性分析了代理场景下的真实世界噪声
🔹 课程式强化学习:训练过程中逐步增加噪声类型与强度
🎯 深度思考模式
🔹 并行思考:通过多个独立的推理路径扩大广度
🔹 迭代总结:使用摘要模型合成输出以增强深...