Bunn (@BunnHack) 在 欧洲公司Mistral 发布首款融合模型 Medium 3.5:128B 参数超越Sonnet 4.5 中发帖
欧洲公司Mistral 正式宣布推出融合模型 Mistral Medium 3.5。目前,该模型已开启公开测试,旨在通过高效的参数架构提供顶尖的推理、编程和多模态处理能力。
Mistral Medium 3.5 是一个拥有 128B 参数 的稠密模型,具备 256k 超长上下文窗口。与以往不同,它在单一权重组中融合了指令遵循、复杂推理和代码生成能力。尽管拥有性能,但该模型优化了显存占用,用户可以在少至 4 块 GPU 上实现自托管私有化部署。推理力度(Reasoning effort)现在支持按需配置。这意味着同一个模型既能秒回日常闲聊,也能在复杂代理任务(Agentic runs)中进行深度思考。Mistral 从零开始训练了全新的视觉编码器,能够完美处理各种纵横比和尺寸的图像。
根据官方发布的测试数据,Mistral Medium 3.5 在多项核心指标上表现良好,甚至超越了参数量...