美团开源基于国产芯片的1.6万亿参数AI模型

美团的LongCat-2.0是首个完全在中国国产GPU集群上训练的万亿参数模型，这一里程碑挑战了外界关于中国依赖英伟达硬件的固有认知，并对西方AI实验室的定价形成压力。

美团于6月底宣布发布并开源LongCat-2.0。该模型拥有1.6万亿参数、平均激活参数480亿，原生支持100万token上下文窗口，完全在5万张国产GPU集群上从零训练而成。

"这表明中国AI实验室现在可以在不依赖英伟达硬件的情况下训练前沿规模的模型，"一位因细节尚未公开而要求匿名的知情人士表示。

LongCat-2.0采用混合专家（MoE）架构，每个token激活330亿至560亿参数——这种设计将推理成本控制在接近480亿参数稠密模型的水平，同时保留了1.6万亿参数系统的模型容量。其100万token的上下文窗口与西方前沿实验室提供的最大窗口长度持平。美团尚未披露该模型的基准测试评分、训练成本或推理定价。

此次开源发布使美团直接与智谱AI和月之暗面等中国AI实验室展开竞争。这两家公司旗下的GLM 5.2和Kimi K2.7 Code模型近期已在企业级市场获得广泛应用。与此同时，这一动作也对Anthropic和OpenAI等西方实验室构成压力，后者的定价权在很大程度上依赖于其与开源权重替代方案之间的性能差距。

国产GPU的突破

训练万亿参数模型需要数万张GPU并行运行数周——这项任务通常依赖英伟达H100或B200集群及其专有的NVLink互连技术。美团的5万张GPU集群使用国产加速器，但该公司未具体说明芯片供应商或架构。华为的昇腾910B和910C是最可能的候选方案，因为它们是唯一可实现大规模供应的中国产AI芯片。

这一里程碑之所以重要，是因为美国出口管制（最近一次于2025年1月收紧）限制了对华销售英伟达H100和B200芯片。如果美团能够在国产芯片上训练出具有竞争力的万亿参数模型，这意味着中国实验室已找到绕过方案——这可能加速中国独立于西方供应链的AI发展进程。

对西方实验室的定价压力

LongCat-2.0进入市场之际，中国开源权重模型已开始崭露头角。智谱AI于6月13日以MIT许可证发布的GLM 5.2，每百万输入token收费1.40美元，每百万输出token收费4.40美元——约为Anthropic Opus 4.8价格的三分之一至六分之一。月之暗面于6月12日发布的Kimi K2.7 Code也采取了类似的定价策略。Coinbase于6月27日披露，现已默认让工程师使用这两款模型，AI支出削减了50%。

美团尚未披露LongCat-2.0的定价或基准性能，因此无法进行直接比较。该公司选择以未具体说明的许可证开源该模型，表明其将通过可及性而非专有优势来进行竞争。对美团自身而言，该模型代表了一项战略资产：这家外卖及本地生活服务巨头可在内部将LongCat-2.0部署于推荐系统、物流优化和客服自动化，从而可能减少对第三方AI供应商的依赖。

投资者影响

开源权重AI市场正沿着地缘政治路线分化。西方企业如今面临两难选择：要么使用美国实验室成本更高的前沿模型，要么选择成本更低但存在监管和溯源风险的中国替代方案。美团的加入提供了另一个选项——一家由上市公司在国产硬件上训练、且不受美国出口管制直接影响的模型。

美团股票在香港交易所交易。该公司未在财务披露中单独列示AI支出，但其最新年报显示，2025年度研发支出约为211亿元人民币（约29亿美元）。LongCat-2.0的训练可能消耗了其中很大一部分预算，不过公司尚未披露具体成本。

本文仅供参考，不构成投资建议。