维ABC (@WABC)DeepSeek新模型写代码能力与o1相当 网友:今年编程只剩Tab键 中发帖

DeepSeek版o1,有消息了。还未正式发布,已在代码基准测试LiveCodeBench霸榜前三,表现与OpenAI o1的中档推理设置相当。 注意了,这不是在DeepSeek官方App已经能试玩的DeepSeek-R1-Lite-Preview(轻量预览版)。 

[image]
而是摘掉了轻量版的帽子,称为DeepSeek-R1-Preview(预览版),意味着替换了规模更大的基础模型。
LiveCodeBench团队透露,他们正在与DeepSeek合作评估新模型的能力,在合作过程中,DeepSeek团队还帮他们找出并解决了评分系统的一些bug。
[image]
与此同时,他们还晒出了目前仅有的一张DeepSeek-R1-Preview的思考过程。
[image]
鉴于DeepSeek此前已宣布R1模型将开源,有网友表示,与OpenAI o1编程能力相当的开源模型...