华为昇腾超节点 - 国产AI算力新纪元

核心观点摘要

华为昇腾超节点代表了国产AI算力架构的重大突破

通过创新的高速互联技术解决了大规模AI计算的通信瓶颈，在推理性能上已实现对英伟达H100的超越。在"主权AI"战略和芯片禁运背景下，昇腾超节点凭借技术突破和生态建设，正处于从技术验证到商业化落地的关键阶段，未来有望在国产算力替代浪潮中占据核心地位，带动整个产业链高速发展。

发展历程

2018-2019

华为推出昇腾310芯片（推理场景）和昇腾910芯片（训练场景），在全国建立28个城市的AI计算中心

2022

昇腾整体销售额约为二十多亿

2023

昇腾销售达到约130亿，订单达200亿左右；美国对华芯片出口限制加剧，推动国产替代加速

2024

昇腾预计销售增长到200亿-300亿水平；昇腾910B芯片经过两次提价，市场价格超过10万/颗；互联网大厂开始批量采购

2025-04

华为推出CloudMatrix 384超节点和MindSpore 2.6，大幅提升性能

2025-05

华为正式推出昇腾超节点技术，实现业界最大规模的384卡高速总线互联

2025-07

昇腾384超节点在WAIC上亮相，Decoding吞吐达到2300+Tokens，计算效率超过英伟达H100

2025-09

灵衢(UB Mesh)超节点架构正式发布&开源，远期可到百万卡级别

技术亮点

384卡高速互联

业界最大规模的超节点，解决集群内计算、存储等各资源之间的通信瓶颈

性能超越H100

Decoding吞吐达到2300+Tokens，计算效率超过英伟达H100，单卡decode吞吐1920 tokens/s

创新架构设计

摒弃以CPU为中心的冯·诺依曼架构，将每个网络、存储、GPU都独立作为节点中心

软件生态完善

昇腾CANN 8.0对标英伟达CUDA，新增两百多个基础算式、八十多个融合算式

产业链分析

上游：核心元器件和材料供应

中芯国际（芯片制造）中际旭创（光模块）新易盛（光模块）深南电路（PCB）华丰科技（连接器）锐捷网络（交换机）英维克（液冷系统）

中游：服务器组装和系统集成

超聚变（30-40%份额）华鲲振宇（属四川长虹）神州数码拓维信息浪潮信息

下游：应用和解决方案

科大讯飞（一体机）安恒信息（网络安全）华为云（10%自用）政府智算中心（50-60%应用）互联网企业（20%市场）

核心公司

超聚变

昇腾整机市场领导者，占30-40%份额，在互联网市场表现突出

华鲲振宇（四川长虹）

昇腾整机市场第二大厂商，在政府计算中心项目表现突出

深南电路

主板供应商，为昇腾超节点提供关键主板组件

华丰科技

连接器供应商，在昇腾超节点的铜连接领域有重要地位

中际旭创

光模块供应商，在昇腾384超节点部署的6912个400G光模块中受益

安恒信息

网络安全领域唯一支持华为昇腾GPU算力的公司

未来展望

近期催化剂（未来3-6个月）

昇腾910C芯片发布

新一代昇腾芯片换代在即，将在新一代Atlas 900集群中使用

CloudMatrix 384超节点量产落地

技术从实验室走向商业化，验证技术可行性和市场需求

MindSpore 2.7发布

支持大EP并行能力，实现多模态生成模型Day0迁移

长期发展路径

技术演进

突破高速传输芯片技术，解决训练场景瓶颈，实现万卡甚至百万卡级别集群

市场拓展

从政府智算中心到互联网大厂，再到特定行业深度解决方案

生态建设

完善CANN计算架构、MindSpore框架，构建完整产业生态

股票数据

股票代码	股票名称	相关度	核心逻辑
250918	华为昇腾超节点	核心概念	华为昇腾超节点技术，384卡高速互联，性能超越英伟达H100

潜在风险与挑战

技术风险

国内尚无法制造出类似英伟达NVLink的传输芯片，导致传输速度受限，对训练任务带来较大困难；软件生态与英伟达CUDA相比仍有差距。

商业化风险

昇腾910B市场价格超过10万/颗，成本较高；昇腾384超节点部署3168根光纤和6912个400G光模块，整体系统成本较高。

政策与竞争风险

美国对华芯片出口限制可能进一步加剧；国内AI芯片市场竞争日趋激烈，寒武纪、海光、昆仑芯等竞争对手崛起。

应用场景局限

目前昇腾超节点主要在推理场景有优势，在训练场景仍存在局限，限制了其应用范围；在特定领域如自动驾驶、科学计算等，适配性和优化程度可能不足。