@stevessr 在 微软发布芯片 Maia 200『转』 中发帖
今天,我们自豪地介绍Maia 200,一款突破性的推理加速器,旨在显著提升AI代币生成的经济性。Maia 200 是人工智能推理的强大平台:基于台积电 3nm 工艺构建的加速器,原生 FP8/FP4 张量核心,重新设计的内存系统,配备 216GB HBM3e,7 TB/s 运行,272MB 片上 SRAM,以及数据流动引擎,确保大型模型快速且高效使用。这使得 Maia 200 成为所有超大规模厂商中性能最强的第一方硅片,FP4 性能是第三代亚马逊 Trainium 的三倍,FP8 性能则高于 Google 第七代 TPU。Maia 200 也是 Microsoft 迄今部署过的最高效推理系统,每美元性能比我们现有最新一代硬件高出 30%。
Maia 200 是我们异构 AI 基础设施的一部分,将支持多个模型,包括 OpenAI 最新的 GPT-5.2 模型,为 Microsoft ...