@lu-wen【视频分享】大模型竞技场,谁是最强写代码模型? 中发帖

B 站 up 主 karminski-牙医 评测视频地址 : bilibili.com 
测试集和测试结果 : github.com
结果总结: 👑Claude-3.7-Sonnet-Thinking, 💸 最经济的做法是把 deepseek r1 的 thinking 交给 Claude-3.5-Sonnet 来实现。