中国"林燦"超算搭载自主设计CPU,自2017年以来首次夺回全球最快超算桂冠。
中国"林燦"超算搭载自主设计CPU,自2017年以来首次夺回全球最快超算桂冠。

中国"林燦"超算搭载自主设计CPU,自2017年以来首次夺回全球最快超算桂冠。
中国"林燦"(LineShine)超算在TOP500基准测试中达到2.198 exaflops的算力,比美国能源部"酋长岩"(El Capitan)系统快22%,这是自2017年以来中国系统首次登顶这一半年度榜单。
田纳西大学教授、TOP500榜单组织者杰克·东加拉(Jack Dongarra)表示:"中国的系统令人印象深刻——他们开发了一台不依赖GPU的机器,这是一种根本不同的方法。"
"林燦"安装在深圳国家超算中心,运行在1379万个核心上,采用定制的304核LX2处理器,主频1.55 GHz,通过专有互联网络连接。该系统功耗42.2兆瓦,能效比达到52.07 gigaflops/瓦。与美国排名靠前的系统——"酋长岩"、"前沿"(Frontier)和"极光"(Aurora)——全部依赖AMD或Nvidia的加速器不同,"林燦"仅使用中央处理器,这一设计选择限制了其在AI导向任务上的表现。
"林燦"的亮相对美国出口管制的有效性构成挑战。自2015年以来,美国一直限制中国获取Intel芯片,后来又将Nvidia的先进GPU纳入管制范围。该系统在未使用公共资金的情况下研发,使其运营商得以向TOP500提交数据。此前,在特朗普和拜登政府多年实施芯片相关限制后,中国于2023年暂停了向TOP500提交。
纯CPU架构的取舍之道
"林燦"依赖CPU而非图形处理器的设计,使其性能因工作负载不同而产生巨大差异。在衡量AI训练关键指标——混合精度性能的HPL-MxP基准测试中,"林燦"以7.92 exaflops排名第四,仅比其标准分数提升3.6倍。相比之下,"酋长岩"在同一基准测试中以16.7 exaflops领先,提升幅度高达9.2倍,这充分体现了其AMD Instinct MI300A加速器在AI类计算中的优势。
这一差距凸显出一个基本现实:TOP500榜单衡量的是传统科学计算能力,而非AI能力。微软、亚马逊和谷歌等云服务商已建成大量以AI为核心的超级计算机,但大多不参与TOP500排名。去年一项由AI政策研究人员进行的研究估计,xAI在田纳西州使用20万枚AI芯片搭建的"巨像"(Colossus)系统,在AI工作负载方面已比"酋长岩"更强大。
加州大学全球冲突与合作研究所高级研究员吉米·古德里奇(Jimmy Goodrich)表示:"中国希望通过忽视细节来说服全世界出口管制是无效的。"
"林燦"对芯片股的影响
"林燦"的亮相使全球exascale级超算增加到五台——中国一台、美国三台、德国一台,这表明中国可以在没有先进美国芯片的情况下建造世界领先的超级计算机。该系统采用了自主研发的处理器、内存、网络和冷却系统,标志着中国推动自主可控的重要里程碑。
对于投资者而言,其影响是微妙的。Nvidia的GPU驱动着大多数领先AI系统,纯CPU超算对其不构成直接竞争威胁,但"出口管制失效"的叙事可能对该股构成压力。AMD的MI300A加速器为"酋长岩"及其他三台排名前十的系统提供动力,其受益于美国政府的持续需求。Intel为"极光"和微软的"鹰"(Eagle)系统提供处理器,在超算领域的敞口有限,但如果中国芯片制造商能够在没有西方工具的情况下生产出有竞争力的设计,Intel的代工雄心可能面临考验。
"林燦"首席设计师卢宇彤表示,该系统旨在支持传统科学模拟和AI工作负载。但行业专家对纯CPU系统能否在性能上与专为训练当今大语言模型而优化的专用AI超算相媲美表示怀疑。
TOP500榜单日益增长的架构多样性——涵盖中国定制化芯片、AMD驱动的美国能源部系统以及欧洲主权计算基础设施——表明,没有任何一条技术路径能够主导顶尖计算领域。对于半导体投资者而言,竞争不再仅仅是谁能打造最快的机器,而是谁的架构能赢得下一波计算需求浪潮。
本文仅供参考,不构成投资建议。