欣 郁 (@user1164) 在 未openai挽尊—知识蒸馏可否扩大基座模型的优势? 中发帖
抛开性价比,其实deepseek V3的基础性能很一般,明显不如chatgpt-4.5和grok3。
而deepseek-R1的性能则突飞猛进。
Grok3有自己的推理版本,但不公开,本身也无大控制变量地和R1比。
反正R1已经开源。那么为什么x和openai不直接试着用R1蒸馏出一个grok3-R1 和 chatgpt-4.5-R1?
这样不就可以低成本获得极大性能提升嘛?