@apparitionAider Polygolt 测试 Kimi K2 源头性能 中发帖

先简介一下 
Aider Polygolt 共有 225 个 Exercism 程式设计题目
涵盖 C++、Go、Java、JavaScript、Python 和 Rust
用来测试 LLM 的多程式语言能力
当然,基准测试本来就有盲点,高分低能的 LLM 比比皆是
那为什么这里还要测试 Aider Polygolt 呢?
因为我们始终需要一个基准来评判模型
不仅是模型的能力,还有模型的供应来源
另一个原因
因为之前我拿的两次 KiloCode 的 Credit 要过期了 😆
要找地方花掉,不过我觉得随意找个任务烧掉有点浪费
所以呢,我想说测试 Openrouter 中 Kimi k2 的来源稳不稳
应该是一件有帮助的事情 🤔
测试背景
目前来说,Openrouter Kimi k2 共有 11 个付费和 2 个免费供应源
我暂时只有测试 6 个看起来似乎有价值的...