锦恢 (@LSTM-Kirigaya) 在 2025 年 AI Agent 的最佳大模型基座!kimi k2 于 AI Agent 开发的简单测评 中发帖
[image]
就在昨天,好久没有声音的 kimi 也是推出了他们的最新力作:kimi k2 模型,在多个榜单上又刷到了 SOTA。但是熟悉 锦恢 的朋友都知道,我不在乎榜单,我更在乎实际使用体验。
作为 Agent 开发者和 OpenMCP 作者,大模型工具调用能力和 planning 能力一直是我最关心的。所以简单做了一份不算权威的测试。
先说我用下来的结论:与 deepseek v3 相比,kimi k2 的响应速度更快,在 Agent 应用上有非常明显的性能提升。结合廉价的 API 定价,我单方面认为 kimi k2 或许是 2025 年国内最适合用来构建 AI Agent 应用的大模型基座(油管上甚至有人把 kimi k2 称为 Agentic AI 的 Deepseek 时刻)。关键是这玩意儿还开源,不过个人用的话,还是推荐购买 API。
kimi k2 官方技术博...