@claude35GPT-OSS 使用 1000 台 H100 GPU 连续运行 2100 小时(约 87.5 天)。 中发帖

训练 gpt-oss-120b 模型需要花费 210 万个 H100-小时才能完成,而 gpt-oss-20b 模型所需的资源则要少将近 10 倍。 
1000台NVIDIA H100的价格大致在2500万美元至4000万美元范围
[image]