国产AI算力新纪元,384卡高速互联突破通信瓶颈
NPU高速互联
Tokens吞吐量
2023年销售额
通过创新的高速互联技术解决了大规模AI计算的通信瓶颈,在推理性能上已实现对英伟达H100的超越。在"主权AI"战略和芯片禁运背景下,昇腾超节点凭借技术突破和生态建设,正处于从技术验证到商业化落地的关键阶段,未来有望在国产算力替代浪潮中占据核心地位,带动整个产业链高速发展。
华为推出昇腾310芯片(推理场景)和昇腾910芯片(训练场景),在全国建立28个城市的AI计算中心
昇腾整体销售额约为二十多亿
昇腾销售达到约130亿,订单达200亿左右;美国对华芯片出口限制加剧,推动国产替代加速
昇腾预计销售增长到200亿-300亿水平;昇腾910B芯片经过两次提价,市场价格超过10万/颗;互联网大厂开始批量采购
华为推出CloudMatrix 384超节点和MindSpore 2.6,大幅提升性能
华为正式推出昇腾超节点技术,实现业界最大规模的384卡高速总线互联
昇腾384超节点在WAIC上亮相,Decoding吞吐达到2300+Tokens,计算效率超过英伟达H100
灵衢(UB Mesh)超节点架构正式发布&开源,远期可到百万卡级别
业界最大规模的超节点,解决集群内计算、存储等各资源之间的通信瓶颈
Decoding吞吐达到2300+Tokens,计算效率超过英伟达H100,单卡decode吞吐1920 tokens/s
摒弃以CPU为中心的冯·诺依曼架构,将每个网络、存储、GPU都独立作为节点中心
昇腾CANN 8.0对标英伟达CUDA,新增两百多个基础算式、八十多个融合算式
昇腾整机市场领导者,占30-40%份额,在互联网市场表现突出
昇腾整机市场第二大厂商,在政府计算中心项目表现突出
主板供应商,为昇腾超节点提供关键主板组件
连接器供应商,在昇腾超节点的铜连接领域有重要地位
光模块供应商,在昇腾384超节点部署的6912个400G光模块中受益
网络安全领域唯一支持华为昇腾GPU算力的公司
新一代昇腾芯片换代在即,将在新一代Atlas 900集群中使用
技术从实验室走向商业化,验证技术可行性和市场需求
支持大EP并行能力,实现多模态生成模型Day0迁移
突破高速传输芯片技术,解决训练场景瓶颈,实现万卡甚至百万卡级别集群
从政府智算中心到互联网大厂,再到特定行业深度解决方案
完善CANN计算架构、MindSpore框架,构建完整产业生态
| 股票代码 | 股票名称 | 相关度 | 核心逻辑 |
|---|---|---|---|
| 250918 | 华为昇腾超节点 | 核心概念 | 华为昇腾超节点技术,384卡高速互联,性能超越英伟达H100 |
国内尚无法制造出类似英伟达NVLink的传输芯片,导致传输速度受限,对训练任务带来较大困难;软件生态与英伟达CUDA相比仍有差距。
昇腾910B市场价格超过10万/颗,成本较高;昇腾384超节点部署3168根光纤和6912个400G光模块,整体系统成本较高。
美国对华芯片出口限制可能进一步加剧;国内AI芯片市场竞争日趋激烈,寒武纪、海光、昆仑芯等竞争对手崛起。
目前昇腾超节点主要在推理场景有优势,在训练场景仍存在局限,限制了其应用范围;在特定领域如自动驾驶、科学计算等,适配性和优化程度可能不足。