@fengchris 在 美团更新LongCat-Flash-Thinking-2601 中发帖
LongCat-Flash-Thinking-2601正式发布。该模型作为升级版推理模型,基于混合专家(MoE)架构,总参数量达 5600 亿。在保持传统推理基准极强竞争力的同时,通过大规模多环境强化学习,系统性增强了Agent思维能力。
[image]
相较于 LongCat-Flash-Thinking 模型,本次升级核心特性如下:
极致的抗噪环境鲁棒性:针对现实环境中的噪声与不确定性开展系统性课程式训练,模型在Agent工具调用、Agent搜索及工具融合推理领域表现卓越,泛化能力显著提升;
强大的 Agent 能力:构建包含 60 余种工具的紧密依赖图谱,通过多环境扩展与大规模探索训练,显著提升模型在复杂、分布外现实场景中的泛化能力;
先进的深度思考模式:利用并行推理拓展思维广度,配合递归反馈的总结归纳机制拓展思维深度,有效攻克高难度问题。
开...