美国出口管制推动中国AI芯片产业从英伟达通用GPU转向定制化芯片,催生出一个结构迥异的半导体生态系统。
美国出口管制推动中国AI芯片产业从英伟达通用GPU转向定制化芯片,催生出一个结构迥异的半导体生态系统。

中国AI芯片产业已放弃仿制英伟达通用GPU的努力,转而投向定制化ASIC——牺牲灵活性换取纯粹效率,这一结构性转变因美国持续实施的出口管制(限制中国获取最先进美国处理器)而加速推进。
"具备强大AI工程能力和清晰路线图的企业适合采用ASIC,而运行混合工作负载的公司仍倾向于通用GPU,"Omdia首席分析师苏连杰表示。
根据摩根士丹利5月8日发布的报告,华为技术预计将在2026年占据中国本土AI加速器市场62%的份额,紧随其后的是寒武纪科技,占比14%。百度与阿里巴巴集团各自预计约占5%,属于自研芯片的大型科技企业。华为预计其AI芯片收入将从2025年的75亿美元增长至2026年的约120亿美元。英伟达在中国AI加速器市场的份额已实际归零,首席执行官黄仁勋将这一局面形容为美国的"可怕后果",因为它打破了对英伟达CUDA生态系统的软件依赖。
这种分化对投资者具有长期影响。如果中国AI行业最终标准化采用华为神经处理单元、阿里巴巴并行处理单元和寒武纪领域专用芯片的组合——各自运行独立的软件栈——结果将形成一个碎片化但自给自足的国内生态系统,其底层架构逻辑与英伟达主导的西方截然不同。英伟达历时二十年建立的CUDA锁定效应正面临首次可信挑战。
三种架构,同一方向
中国企业正在推进三种不同的ASIC设计。华为押注神经处理单元,推出昇腾系列,包括已大规模部署的910C和即将推出的昇腾950。寒武纪正通过其思元590和690系列构建领域专用架构。阿里巴巴旗下半导体公司平头哥在上周年度的云计算峰会上发布了镇岳M890并行处理单元,声称性能达到前代产品的三倍。
在GPU方面,由英伟达前中国区高管张建中于2020年创立的摩尔线程,凭借MTT S5000系列等通用芯片引领国内努力。壁仞科技、燧原科技和天垓科技也在参与竞争,但均未达到ASIC领先企业的规模。
中国芯片与英伟达符合出口合规要求的硬件之间的性能差距已显著缩小。摩根士丹利数据显示,华为昇腾950芯片和寒武纪思元690在以每秒令牌数衡量时,性能可比英伟达H20高出50%到150%——H20是英伟达目前获准向中国销售的最强芯片。而据美国外交关系委员会报告,H20本身的性能仅为英伟达H200的约六分之一。
软件栈挑战
硬件性能只是问题的一半。中国芯片产业面临的更深层挑战在于打破英伟达CUDA平台形成的锁定效应——全球数百万AI开发者依赖这一软件层为英伟达硬件编写代码。几乎所有AI框架、每篇研究论文和每个预训练模型都默认CUDA兼容性。
华为正在打造CANN作为替代方案,而摩尔线程则开发了MUSA。深度求索已耗时数月重写核心代码,以适配华为CANN框架,逐步脱离CUDA生态系统。但半导体分析师张海军指出,随着AI模型日益复杂,定制化ASIC与灵活GPU之间的界限"正变得越来越模糊",暗示最终的胜出架构可能融合两者元素。
对于高度商业化的中国AI市场而言——重点在于向数亿用户部署应用,而非进行前沿研究——ASIC路线尤为合理。推理——即大规模运行已训练模型的过程——需要定制化芯片提供的精细化优化。训练新模型仍需GPU的灵活性,但收入来源在于部署。
这种分化的长期影响可能比短期性能基准更为深远。如果中国AI行业标准化采用国产芯片和软件栈,当底层计算架构不兼容时,跨境AI协作将变得更加困难。而缺乏单一主导平台意味着,没有哪家中国芯片制造商能够享受到英伟达CUDA最初之所以如此强大的生态系统锁定效应。
英伟达股价目前约为远期收益的35倍,面临因中国收入流失带来的结构性压力。尽管该公司数据中心业务在全球仍占主导地位——上一财年贡献了620亿美元收入——但其中国业务版图的萎缩消除了一个增长动力,分析师此前曾将其视为多年利好因素。对于投资者而言,问题在于中国正在构建的定制化芯片生态系统能否跟上英伟达主导的西方世界的创新步伐。
本文仅供信息参考,不构成投资建议。