明明如月 (@mingmingruyue)重生之我用 Claude 上 “复刻”了 DeepSeek-R1 效果 中发帖

一、背景
DeepSeek R1 凭借其在复杂推理任务中的卓越表现引发了业界关注。这款模型采用强化学习方法训练,具备处理数万字长思维链的能力,在数学和编程等逻辑任务中的表现可与 OpenAI 的 o1 模型相媲美。更重要的是,它公开了完整的推理过程,保证了技术的透明度。通过算法创新和硬件架构优化,DeepSeek R1 实现了显著的成本降低。该模型还配备了 660B 参数的深度思考模式和联网搜索功能,特别适合私有化部署和实时信息处理场景。
Anthropic 自从去年 6月之前发布了 Claude 3.5 Sonnet 以后没啥动静了,对于当初被 Claude Artifacts 惊艳到而开通了 Claude 会员的同学瞬间感觉自己手中会员不香了。客观来说,Claude 会员确实提供了不少实用功能:可以使用最新的 Claude 3.5 Sonnet、支持自定义 Projects、享受...