SpaceX将「巨像1号」数据中心租赁给Anthropic，此前2600亿美元的算力战略转型遭遇挫折

SpaceX无法让自己的Colossus 1数据中心正常运转以训练Grok，于是将整个设施以每月12.5亿美元的价格租赁给了Anthropic。

据知情人士透露，位于孟菲斯的SpaceX Colossus 1数据中心原定用于训练该公司最先进的Grok模型。然而，由于SpaceX自己的工程师无法克服延迟和硬件不匹配问题，这座设施反而成为了Anthropic每月12.5亿美元的收入来源。

"SpaceX认为，该设施用于创收比闲置更有价值，"SpaceX首席财务官Bret Johnsen在一份声明中表示。他补充说，公司并未放弃内部AI工作，并保留提前90天通知收回该算力容量的权利。

这座超过300兆瓦的设施拥有超过22万块英伟达GPU，横跨多个芯片代际——包括Hopper和Blackwell系统，以及较旧型号的加速器。这种硬件异构性在分布式训练中造成了瓶颈，较慢的芯片迫使较快的芯片等待。而围绕Blackwell芯片更统一地建造的Colossus 2和3避免了这一问题。Colossus 1与其他两个园区之间的网络连接（相距超过10英里）引入了延迟，使得跨站点训练变得不切实际。

这一租赁安排将SpaceX从AI建设者转变为AI房东。再加上从10月开始与谷歌达成的每月9.2亿美元交易，SpaceX每月从其原本为自己建造的算力基础设施中收取约21.7亿美元——即年化260亿美元。这些合约总价值超过7000亿美元，已成为SpaceX IPO路演的核心亮点，此次IPO目标估值约为7500亿美元。

为什么Colossus 1无法训练Grok

SpaceX在122天内建成了Colossus 1——该公司在IPO路演中宣称这一速度超越了行业平均水平。但速度是有代价的。该设施混合的硬件库存，将较旧的英伟达加速器与较新的Hopper和Blackwell芯片组合在一起，造成了性能不匹配，降低了训练效率。在分布式AI集群中，整个系统的运行速度取决于最慢的组件。

连接Colossus 1与其他两个园区的网络基础设施使问题进一步恶化。训练前沿模型需要节点之间超快速、低延迟的连接。由于Colossus 1距离其他站点超过10英里，较老的网络设备无法维持大规模训练运行所需的同步速度。

结果是：SpaceX最雄心勃勃的AI训练集群实际上被搁置了。该公司没有投资于昂贵的网络升级和硬件标准化，而是选择将这一算力能力外部变现。

意外诞生的260亿美元业务

Anthropic每月支付12.5亿美元（至2029年5月）以获得Colossus 1和Colossus II设施的访问权限——三年合计约450亿美元。这笔交易为Anthropic提供了一条临时生命线，该公司正因Claude、Claude Code和Opus模型系列需求不可预测而苦苦挣扎。用户报告称，由于该公司数月来一直受算力容量限制，高峰时段出现速率限制和性能下降。

这一安排是临时性的：租期为180天，附有90天双方均可取消的条款。马斯克曾表示，如果"算力变得极度紧张"，SpaceX可以收回该算力容量。但Grok的吸引力正在下降——下载量从1月的2000万次降至4月的830万次，付费转化率仅为ChatGPT的五分之一——这使得回收的紧迫性降低。

对于投资者来说，这一战略转向引发了关于SpaceX AI基础设施叙事的疑问。该公司在IPO路演中将数据中心建设作为战略优势进行展示，强调其建设速度和规模。而Colossus 1的技术限制迫使该公司将设施外部租赁——且租给了竞争对手——这一事实使该故事变得复杂。批评者还质疑租赁定价是否高于市场水平，以及交易结构是否涉及马斯克关联实体之间的循环融资。

SpaceX股票在纳斯达克首日开盘价约为150美元，较IPO发行价溢价11%，早盘一度飙升30%，最终收涨19%。该股一度将SpaceX市值推高至2.2万亿美元以上。

AI行业更广泛的经验是：拥有硬件并不等于能够使用它。地理位置、网络和集成复杂性可能使数据中心变成搁浅资产。随着前沿实验室竞相争夺超过10万块GPU的集群，算力的物理约束——而不仅仅是模型架构——正成为最根本的瓶颈。

本文仅供参考，不构成投资建议。