AI算力芯片 深度研究报告

北京价值前沿科技有限公司 AI投研agent:“价小前投研”

本报告为AI合成数据,投资需谨慎。

核心观点摘要

AI算力芯片正处于由全球需求爆发国内供给重构双轮驱动的黄金发展期。其核心逻辑在于,一方面英伟达通过持续的技术迭代 (Blackwell, Rubin) 和强大的CUDA生态定义了全球AI算力的技术范式与天花板;另一方面,地缘政治因素催生了以华为昇腾为核心的、政策与市场双重加持的国产算力体系,形成了独特的“一个世界,两个体系”格局。当前阶段,市场的焦点在于验证国产芯片在真实商业场景下的性能、成本与生态成熟度。

核心驱动力

  • 需求侧 - AI大模型军备竞赛:大模型技术持续演进,算力需求呈指数级增长。全球云厂商资本开支持续上修是需求最直接的体现。
  • 供给侧 - 地缘政治下的“强制替代”:美国出口管制是决定性的外生变量,为国产芯片提供了前所未有的市场准入和试错机会。运营商近300亿规模的集采以国产芯片为主,是这一逻辑的铁证。
  • 经济性驱动 - 成本与效率博弈:全球范围内,云厂商自研ASIC芯片的核心动机是降本增效。谷歌TPU的单位算力成本仅为英伟达H100的70%,驱动GPU与ASIC两种技术路线并行发展。

全球GPU市场格局 (2023)

关键催化剂

  • 近期 (3-6个月):华为昇腾910C规模商用反馈、英伟达Blackwell财报贡献、国产AI芯片公司IPO进展、地方智算中心补贴等政策落地。
  • 长期发展路径:
    • 追赶期 (当前-2026):国产芯片卡位政策市场,向商业市场渗透,完善软件生态。
    • 并存期 (2026-2028):在推理端和特定训练场景实现大规模应用,形成差异化竞争。
    • 融合/对抗期 (2028+):若先进制程突破,有望形成两大生态体系对抗。

潜在风险与挑战

  • 技术风险:CUDA生态壁垒难以逾越;国内先进制程与台积电差距显著,限制性能上限;集群互联效率(NVLink vs 国产方案)差距导致有效算力折扣。
  • 商业化风险:国产芯片的综合TCO(总拥有成本)在商业市场可能不具备优势。英伟达单卡性价比高20%-50%,降价压力不大。
  • 信息交叉验证风险:市场普遍乐观情绪(新闻、研报)与产业实际差距(路演纪要)存在偏差,即“外热内冷”。

产业链深度剖析与投资启示

产业链图谱

  • 上游 (基础支撑): 芯片设计 (景嘉微, 寒武纪), 制造与封装 (中芯国际), 核心材料/组件 (沪电股份, 杰华特)
  • 中游 (算力提供): 芯片厂商 (英伟达, AMD; 华为, 寒武纪, 海光信息)
  • 下游 (算力应用): 服务器/一体机 (中兴通讯, 紫光股份), 云服务/数据中心, AI应用

核心玩家对比

英伟达: 绝对技术和生态霸主,优势在于性能、CUDA生态和供应链掌控力。

华为昇腾: 逻辑最纯粹的国产替代龙头,优势在于全栈自研、政策支持和商业化落地能力。

寒武纪 & 海光信息: 国内追赶者。寒武纪布局云边端一体,海光信息具备"CPU+DCU"协同及兼容"类CUDA"生态优势,但在华为挤压下面临竞争压力。

综合结论与投资启示

AI算力芯片概念正处在基本面驱动主题催化共振的加速阶段。

最具投资价值的细分环节:

  1. 国产算力核心设备商的供应链:特别是华为昇腾链条中技术壁垒高、价值量大的部分(高性能PCB、ABF载板、AI服务器电源模块),业绩确定性最强。
  2. 先进封装与测试:作为产业链共同瓶颈,具备长期成长逻辑。
  3. 光互联:随着集群规模扩大,高速光模块/光芯片需求将持续爆发,是产业链中弹性最高的环节之一。

需重点跟踪的关键指标:

  • 国产芯片出货量与商业客户占比。
  • 国产大模型与国产芯片的适配深度与效率。
  • 台积电CoWoS产能扩张进度。
  • 国内先进制程(如中芯国际)突破进展。
全球市场与头部厂商动态

英伟达(Nvidia): 新产品DGXB200交付顺利;财报展望乐观,推出Spectrum-XGS以太网;Blackwell方案采用台积电CoWoS封装;单卡性价比高20%-50%,降价压力不大;亚马逊拿下OpenAI 380亿算力订单,将供应英伟达芯片。

博通(Broadcom): 全球AI加速芯片两大龙头之一,季报超预期。

谷歌(Google): “捕光者”计划27年将发射Trillium TPU验证分布式训练。

Credo: 受益于亚马逊、微软等AI芯片用量,营收将放量。

国产AI芯片发展与市场格局

总体趋势: 国产大模型与芯片适配盘活存量资产,国产算力替代空间正在打开,产业迈向整体崛起。

华为昇腾: 政府市场份额达80-85%;910C算力接近H100的80-90%,预计明年出货40-60万;软件生态国内最强。

寒武纪: 与昇腾一同进入批量商业化出货;产品在特定算法上优于A100;PyTorch代码迁移便捷。

海光信息: 深算3号性能强于A100,有望实现千卡集群。

中兴通讯: 具备GPU/CPU/DPU全栈设计能力,51.2T交换芯片领先。

阿里平头哥: 自研芯片测试方案与利扬芯片合作,但受限于先进制程供给尚未放量。

摩尔线程 & 沐曦: 已提交IPO申请,专注高性能GPU研发。

未来趋势与市场分析

系统级算力: 单芯片算力提升放缓,系统级节点有望成为AI算力发展的重要方向,为国产GPU提供追赶机遇。

太空算力: 概念兴起,旨在解决AI缺电问题,已有公司发射NVIDIA H100上太空。

集群互联: 单颗芯片性能接近物理极限,通信互联决定集群能力上限。

需求周期: 市场普遍认为25H1推理需求先起,25H2训练需求再起。

国产替代与市场格局

制裁影响: 美国对A800/H800的限制为华为、寒武纪、海光提供了替代机会。英伟达H20等降级版难以满足大模型训练需求。

华为昇腾主导: 占据国内AI服务器芯片约40%份额,训练卡领先。910B对标A100,预计24年底发布的910C对标H系列。24年出货量或翻倍,但受产能限制。

海光&寒武纪追赶: 主要聚焦推理或小模型训练,与华为存在算力差距。海光24年下半年新品算力预计与昇腾910B相当。

技术差距: 国产芯片在生态系统、数据交换带宽、代工能力上与英伟达差距显著。华为昇腾是唯一完全自研架构,但生态尚未成熟。

大厂自研与技术路线

自研驱动力: 降本增效(谷歌TPU v5p能效比优于NVIDIA)和供应链安全是核心驱动。

全球格局: 谷歌(TPU)、微软(Maia100)、亚马逊(Trainium)、Meta(MTIA)均推出自研芯片,但性能仍落后于H100。

国内格局: 百度昆仑芯、阿里含光系列已量产,但高端训练芯片仍依赖英伟达。共性问题是先进制程受限和生态建设滞后。

ASIC vs GPGPU: ASIC在算力密度和能效上具优势,GPGPU在显存带宽和互联技术上领先。推理端需求增长(占英伟达数据中心收入40%)利好ASIC发展。

供应链与产能

产能瓶颈: 台积电CoWoS 2.5D封装是英伟达GPU产能关键,2025年目标月产9万片。CoWoS产能结构性紧缺,优先保障英伟达、AMD。

华为昇腾产业链: 是国产算力卡中唯一具备充足产能的。昇腾芯片功耗激增驱动供电模块价值量提升(杰华特是唯一供应商),PCB层数升级(利好新生科技等)。中芯国际是其核心代工厂。

HBM内存: SK海力士已量产12层HBM3E,是AI芯片关键组件。

市场现状与格局

核心地位: AI算力芯片是"AI时代的引擎",占AI服务器成本主要部分(GPU占比可达72.8%)。

英伟达主导: 2023年英伟达在数据中心GPU出货量中占据98%的市场份额,CUDA生态建立强大壁垒。

ASIC高速成长: 云厂商自研趋势明显,推动定制ASIC市场高速成长,预计2023-2028年复合增速达45%。博通是全球AI ASIC龙头。

市场规模: 预计全球GPU市场规模将从2023年的436亿美元增长至2029年的2742亿美元。

技术类型与对比

GPU vs ASIC: GPU更适用于需要高并行计算能力的训练场景;ASIC能效比最高,单位算力成本更低,更适用于大规模、固定的推理场景。

单位成本对比: 谷歌TPU v5单位算力成本为H100的70%,亚马逊Trainium 2为H100的60%。

核心评测指标: TOPS (算力)、TOPS/W (能效比)、内存带宽、算力利用率。

驱动因素与支撑技术

核心驱动: 大模型发展引爆算力需求;地缘政治催生国产替代黄金期;推理需求加速释放提供广阔空间。

DeepSeek模型推动: 通过MoE架构、FP8等技术实现极高性价比,并已全面适配华为昇腾等20余家国产芯片,推动国产软硬件生态闭环。

支撑技术: HBM (高带宽存储器) 解决内存瓶颈;先进封装 (CoWoS) 是集成HBM与GPU的主流方案;未来技术包括Chiplet、存算一体等。

利扬芯片 (688135) +20.0%

核心结论: 阿里宣布三年3000亿元AI投资计划,利扬芯片作为其AI芯片测试核心供应商,订单弹性被资金瞬间重估,20cm涨停。
驱动概念: 阿里AI投资计划+国产算力芯片测试环节+3nm先进制程测试能力

华正新材 (603186) +10.0%

核心结论: 美国新一轮AI芯片出口管制将华为昇腾推上风口,公司被官方认证为昇腾910C封装基板CCL第一供应商,2026年利润弹性翻倍,机构抢筹导致涨停。
驱动概念: 昇腾国产算力+AI芯片替代+先进封装

拓维信息 (002261) +10.0%

核心结论: 半年报业绩暴增22倍正式落地,叠加昇腾AI算力订单集中确认与政策共振,资金集中回补。
驱动概念: 昇腾AI算力+东数西算二期+国产芯片

川润股份 (002272) +9.98%

核心结论: 网信办通报英伟达H20芯片安全隐患,国产算力替代预期升温,川润股份作为昇腾AI服务器液冷核心配套商被资金抢筹。
驱动概念: 国产算力替代+液冷服务器+昇腾AI

中芯国际 (688981) +14.19%

核心结论: AI算力需求爆发与国产替代加速,中芯国际作为国内芯片制造环节的核心战略地位凸显,叠加板块联动与主力资金大规模流入,引发股价大涨。
驱动概念: 芯片国产替代+AI算力需求+晶圆代工

相关概念股一览

股票名称 股票代码 核心逻辑 技术标签
景嘉微 300474 国产GPU龙头 GPU
寒武纪 688256 领先AI芯片设计公司,思元系列芯片 GPU ASIC
海光信息 688041 国产CPU+GPU龙头 GPU
龙芯中科 688047 自主研发GPU GPU
紫光国微 002049 已突破FPGA高制程技术 FPGA
复旦微电 688385 国产FPGA头部厂商 FPGA
安路科技 688107 国内民用FPGA FPGA
澜起科技 688008 计算类芯片集成 ASIC
紫光股份 000938 自研芯片,服务器龙头 ASIC
华为海思 未上市 自研昇腾系列芯片,国产算力核心 ASIC