HOX2333 在 【教程】别逗你xx笑了,自研模型?你上你也行!(Cursor Composer-2 训练路径分析) 中发帖
综述
Cursor 发布的官方论文:Composer2.pdf
[image]
最近Cursor针对套壳Kimi的事情沸沸扬扬,之后Cursor直接通过论文的形式开放了训练过程。论坛里也有很多人在聊 Cursor 的 Composer 2的效果,作为一个练习时长两年半的大模型饲养员(bushi),也想给大家详细拆解下,让大家也可以尝试着自己训练一个~
由于domain gap(域间隙,即在一个数据集上训练模型,在另外一个数据集上进行预测性能下降很大)几乎为0,Composer 2 上线就直接把Opus 4.6按在地上摩擦(SWE-bench直接能干到 Multilingual 73.7%)当然这里指的是部分场景,Composer 2还是会过渡乱改(特别在老代码库)。
Cursor的核心思路就是:先让模型更懂代码,再把它放进真实开发环境里反复练。
Cursor 公布的数据里,Co...