云巨头算力战升级!微软新一代3nm AI推理芯片性能提升30%,落地数据中心
- 财经百科
- 2026-01-28
- 4006
据外媒报道,微软发布新一代人工智能芯片Maia 200,这款芯片有望成为英伟达旗舰处理器以及云服务竞争对手亚马逊、谷歌同类产品的替代选择。微软称,这款芯片是为 AI 推理规模化部署打造的高性能核心算力芯片。
2023年,微软曾经发布人工智能芯片 Maia 100,该芯片始终未向云服务客户开放租用服务,如今新一代芯片 Maia 200 正式亮相。微软云与人工智能部门执行副总裁斯科特・格思里周一在博客中表示,这款全新芯片未来将 “面向更广泛的客户开放使用”。

微软表示,Maia 200 在技术上实现了升级,能够以更快的速度、更高的能效运行高性能 AI 模型。这款芯片集成超 1000 亿个晶体管,4 比特精度下的算力可达 10 petaflops 以上,8 比特精度算力约 5 petaflops,相较上一代产品实现大幅提升。
该芯片采用台积电的 3nm制程工艺,每台服务器内部均集成四颗芯片,且通过以太网电缆实现连接,而非InfiniBand带宽标准。同等价格下,这款芯片的性能相较同类产品提升 30%。微软方面表示,单颗Maia 200的高带宽内存配置,均高于亚马逊云科技的第三代训练型人工智能芯片以及谷歌的第七代张量处理单元。
斯科特・格思里还提到,微软可将多达 6144 颗Maia 200芯片互连以实现高性能运算,同时降低能耗与总体拥有成本。微软(Microsoft)表示,新款Maia 200芯片本周已在爱荷华州一处数据中心上线,并计划在亚利桑那州的第2个据点投入使用。
对比英伟达最新发布的旗舰芯片Vera Rubin芯片,微软的Maia 200芯片同样采用3nm,并且采用高频内存,与英伟达的芯片比较,Maia 200采用了HBM3E,属于速度更慢的一代,英伟达的Vera Rubin采用HBM4, 相较于前一代HBM3e,HBM4 在多个关键技术维度上实现了显著升级。
HBM3e接口位宽为1024-bit, HBM4接口位宽提升至 2048-bit, 在相同时钟频率下,理论带宽直接翻倍,为实现高达 22 TB/s 的单堆栈带宽 奠定基础。单颗 HBM4 堆栈可提供更大容量,Vera Rubin GPU 配备 288GB HBM4,显著支持超大规模 AI 模型训练。
微软还表示,除了新款芯片Maia200外,还将提供一套软件工具包,供开发者进行程序设计,其中包括Triton开放原始码软件,由聊天机器人ChatGPT开发者OpenAI大力贡献,能执行与英伟达软件Cuda相同的任务。







