关键要点:
- SpaceX将Colossus 1租赁给Anthropic,原因是延迟和硬件组合问题导致该设施无法用于Grok模型训练
- 该交易每月从Anthropic获得12.5亿美元收入,外加来自谷歌的9.2亿美元,年化总额达260亿美元
- Colossus 1混合搭载了不同代际的英伟达芯片,加上与10英里外其他园区的老旧网络连接,形成了难以克服的瓶颈
关键要点:

SpaceX无法让自己的Colossus 1数据中心正常运转以训练Grok,于是将整个设施以每月12.5亿美元的价格租赁给了Anthropic。
据知情人士透露,位于孟菲斯的SpaceX Colossus 1数据中心原定用于训练该公司最先进的Grok模型。然而,由于SpaceX自己的工程师无法克服延迟和硬件不匹配问题,这座设施反而成为了Anthropic每月12.5亿美元的收入来源。
"SpaceX认为,该设施用于创收比闲置更有价值,"SpaceX首席财务官Bret Johnsen在一份声明中表示。他补充说,公司并未放弃内部AI工作,并保留提前90天通知收回该算力容量的权利。
这座超过300兆瓦的设施拥有超过22万块英伟达GPU,横跨多个芯片代际——包括Hopper和Blackwell系统,以及较旧型号的加速器。这种硬件异构性在分布式训练中造成了瓶颈,较慢的芯片迫使较快的芯片等待。而围绕Blackwell芯片更统一地建造的Colossus 2和3避免了这一问题。Colossus 1与其他两个园区之间的网络连接(相距超过10英里)引入了延迟,使得跨站点训练变得不切实际。
这一租赁安排将SpaceX从AI建设者转变为AI房东。再加上从10月开始与谷歌达成的每月9.2亿美元交易,SpaceX每月从其原本为自己建造的算力基础设施中收取约21.7亿美元——即年化260亿美元。这些合约总价值超过7000亿美元,已成为SpaceX IPO路演的核心亮点,此次IPO目标估值约为7500亿美元。
为什么Colossus 1无法训练Grok
SpaceX在122天内建成了Colossus 1——该公司在IPO路演中宣称这一速度超越了行业平均水平。但速度是有代价的。该设施混合的硬件库存,将较旧的英伟达加速器与较新的Hopper和Blackwell芯片组合在一起,造成了性能不匹配,降低了训练效率。在分布式AI集群中,整个系统的运行速度取决于最慢的组件。
连接Colossus 1与其他两个园区的网络基础设施使问题进一步恶化。训练前沿模型需要节点之间超快速、低延迟的连接。由于Colossus 1距离其他站点超过10英里,较老的网络设备无法维持大规模训练运行所需的同步速度。
结果是:SpaceX最雄心勃勃的AI训练集群实际上被搁置了。该公司没有投资于昂贵的网络升级和硬件标准化,而是选择将这一算力能力外部变现。
意外诞生的260亿美元业务
Anthropic每月支付12.5亿美元(至2029年5月)以获得Colossus 1和Colossus II设施的访问权限——三年合计约450亿美元。这笔交易为Anthropic提供了一条临时生命线,该公司正因Claude、Claude Code和Opus模型系列需求不可预测而苦苦挣扎。用户报告称,由于该公司数月来一直受算力容量限制,高峰时段出现速率限制和性能下降。
这一安排是临时性的:租期为180天,附有90天双方均可取消的条款。马斯克曾表示,如果"算力变得极度紧张",SpaceX可以收回该算力容量。但Grok的吸引力正在下降——下载量从1月的2000万次降至4月的830万次,付费转化率仅为ChatGPT的五分之一——这使得回收的紧迫性降低。
对于投资者来说,这一战略转向引发了关于SpaceX AI基础设施叙事的疑问。该公司在IPO路演中将数据中心建设作为战略优势进行展示,强调其建设速度和规模。而Colossus 1的技术限制迫使该公司将设施外部租赁——且租给了竞争对手——这一事实使该故事变得复杂。批评者还质疑租赁定价是否高于市场水平,以及交易结构是否涉及马斯克关联实体之间的循环融资。
SpaceX股票在纳斯达克首日开盘价约为150美元,较IPO发行价溢价11%,早盘一度飙升30%,最终收涨19%。该股一度将SpaceX市值推高至2.2万亿美元以上。
AI行业更广泛的经验是:拥有硬件并不等于能够使用它。地理位置、网络和集成复杂性可能使数据中心变成搁浅资产。随着前沿实验室竞相争夺超过10万块GPU的集群,算力的物理约束——而不仅仅是模型架构——正成为最根本的瓶颈。
本文仅供参考,不构成投资建议。