Joe (@joejoe) 在 DeepSeek R2 模型推迟发布是昇腾芯片扰乱了训练导致的中发帖中国坚持要求企业使用国产AI芯片而非英伟达芯片，这会不会付出一些代价？据一份新报告称，北京方面曾敦促DeepSeek放弃英伟达硬件，转而在其R2型号中使用华为芯片，但训练过程中不断出现技术问题，导致发布推迟，并被迫重新转向NVIDIA进行训练，而推理部分则使用了华为芯片

Joe (@joejoe) 在 DeepSeek R2 模型推迟发布是昇腾芯片扰乱了训练导致的中发帖

中国坚持要求企业使用国产AI芯片而非英伟达芯片，这会不会付出一些代价？据一份新报告称，北京方面曾敦促DeepSeek放弃英伟达硬件，转而在其R2型号中使用华为芯片，但训练过程中不断出现技术问题，导致发布推迟，并被迫重新转向NVIDIA进行训练，而推理部分则使用了华为芯片。 
今年 1 月，DeepSeek 的 R1 模型发布时震惊了整个人工智能行业。据称，该模型在 2048 块英伟达 H800 上进行了训练，耗资 557.6 万美元，与其他人工智能公司数十亿美元的投入相比只是零头。但后来有消息称，DeepSeek 使用了大约 5 万块 Hopper GPU，其中包括 1 万块 H800 和 1 万块 H100，以及 3 万块 HGX H20 单元。 
据《金融时报》援引三位知情人士的话称，对于 R2 的后续型号，中国当局“鼓励”DeepSeek 放弃 NVIDIA 技术，转而使用国产硬件。 ...