MOE模型概念分析报告

概念事件时间线

2023年7月

财通计算机路演

OpenAI被曝GPT-4采用1.8万亿参数MoE架构，首次将MoE推向主流视野

2024年1月

MiniMax发布

国内首个MoE大模型abab6，激活参数仅37B却对标GPT-3.5

2024年5月

华为发布

盘古Ultra MoE（7180亿参数），全流程昇腾训练，打破GPU依赖

2025年2月

字节/腾讯

字节开源COMET技术，MoE训练成本降40%；腾讯混元开源80B参数MoE模型

2025年6月

华为云升级

盘古5.5升级7180亿MoE深度思考模型，昇腾CloudMatrix超节点实现35K tokens/s推理

核心观点摘要

阶段判断

MoE已从"技术验证"进入"规模化落地"阶段，成为大模型降本增效的核心路径

核心驱动力

算力瓶颈倒逼架构创新——通过稀疏激活实现参数规模与计算成本的脱钩

未来潜力

2025年将成为MoE商业化元年，国产芯片+开源生态将重塑全球AI算力格局

核心逻辑与市场认知分析

核心驱动力

            技术突破
            稀疏激活效率：DeepSeek-V3通过Top-2专家路由，激活参数占比仅15.6%却达到70B稠密模型性能
国产算力适配：华为昇腾通过PTX级优化，将MoE训练MFU从30%提升至41%

          

            成本拐点
            训练成本：字节COMET技术使MoE训练效率提升1.7倍，单次训练成本降至560万美元
推理成本：腾讯混元80B MoE模型激活参数13B，推理成本较稠密模型降低83%

          

市场热度与情绪

研报密度

2024Q2以来，12篇头部研报将MoE列为"大模型降本唯一路径"（华泰/东吴/安信）

            情绪分化
            乐观派：认为MoE将复制"光伏单晶替代多晶"路径，2025年渗透率超70%
谨慎派：担忧专家负载不均导致性能波动，需验证长期稳定性

          

预期差分析

          被忽略的关键点
          通信开销陷阱：MoE需All-to-All通信，但华为通过EP32+TP4混合并行将通信开销压至<2%
国产芯片机会：市场低估昇腾910B对MoE的支持，2025年昇腾出货量预计达60万片

        

关键催化剂与未来发展路径

近期催化剂（3-6个月）

时间	事件	影响逻辑
2025Q3	华为昇腾910C发布	支持FP8精度MoE训练，成本再降30%
2025Q3	腾讯混元MoE开源	推动中小厂商采用，加速生态扩散
2025Q4	字节跳动UltraMem架构落地	推理成本降83%，冲击API定价体系

长期发展路径

2025-2026

MoE成为大模型标配（类似Transformer），国产芯片+开源框架主导中低端市场

2027-2028

异构MoE（动态专家数量）+LPU专用芯片成熟，单位算力成本降至当前10%

产业链与核心公司深度剖析

产业链图谱

上游：算力芯片

昇腾910B

寒武纪MLU370

中游：MoE框架

华为盘古MoE

腾讯混元MoE

下游：应用场景

政务AI

社交AI

核心玩家对比

公司	技术路线	进展验证	风险点
华为	昇腾+盘古Ultra MoE	CloudMatrix超节点35K tokens/s	生态封闭，外部适配慢
腾讯	混元80B MoE开源	魔搭社区首发，开发者超1600万	商业化场景待验证
字节	COMET优化+UltraMem	训练成本降40%（已开源）	与英伟达生态竞争
DeepSeek	MLA+MoE	236B模型激活21B（开源）	依赖海外芯片

潜在风险与挑战

技术风险

专家崩塌：负载不均可能导致90%token流向单一专家
长文本瓶颈：当前MoE在百万级上下文下仍存O(n²)复杂度问题

商业化风险

API价格战：可能引发"0.1元/百万tokens"恶性竞争
场景适配：政务/医疗等高合规场景对MoE的可解释性要求未满足

政策与竞争风险

美国制裁：若限制EDA工具用于昇腾芯片设计，国产MoE算力链或中断

综合结论与投资启示

阶段判断

当前处于"技术红利兑现期"，类似2020年光伏PERC电池——成本曲线陡峭下降+渗透率快速提升

投资方向

最确定赛道

国产算力芯片（昇腾/寒武纪）+ MoE框架服务商（华为云/腾讯云）

弹性标的

交换机厂商（瑞斯康达/共进股份）——MoE推动800G光模块需求

预期差机会

边缘端MoE（云天励飞1.8B模型）——未被定价的"AI PC"场景

关键跟踪指标

昇腾910C量产进度

2025Q3若达30万片/季度，将确认国产替代拐点

腾讯混元MoE调用量

若月活超5000万，标志开源生态爆发

字节UltraMem API定价

若低于0.5元/百万tokens，将触发行业洗牌

MoE不是主题炒作，而是AI算力革命的"单晶时刻"。
2025年Q3前是布局窗口期，优先配置国产算力链+MoE框架龙头。

关联股票

股票名称	项目	技术/产品	应用领域/合作方	投资逻辑
云天励飞	边缘端硬件在线微调学习	MoE大模型、1.8B轻量化模型	边缘计算	公司通过能力蒸馏研发的1.8B模型和MoE大模型，边缘应用性能优于同参数模型，支持大模型在边缘设备落地
东方通	深度安全大模型	MoE混合专家模型、LLM+AI Agent框架	网络安全	基于MoE架构的深度安全大模型，在LLM+AI Agent框架下快速部署AI安全能力
汤姆猫	AI情感陪伴机器人	MOE混合专家架构	西湖心辰、豆包、DeepSeek	AI情感陪伴机器人采用MOE架构，整合西湖心辰定制模型及豆包、DeepSeek等模型能力，提升产品性能
瑞斯康达	AI大模型降本	三层交换机、数据中心交换机、OLT	通信设备	MOE技术推动AI大模型降本，公司发布多款交换机产品迎接发展机遇
共进股份	AI大模型降本	园区交换机、SMB交换机	企业网络	MOE技术推动AI大模型降本，公司交换机产品覆盖园区和中小企业市场