AI越便宜,企業在其上的花費就越多——而數字開始證明這一點。
AI越便宜,企業在其上的花費就越多——而數字開始證明這一點。

每代幣AI成本在三年內下降了1000倍,但企業運算消耗卻呈現爆炸性成長——Uber在4月就用光了整個2026年的AI預算,而AT&T現在每天處理270億個代幣,18個月前僅為10億個。
「每次我們以更低的成本獲得同樣的智能單位時,我們並沒有減少消費;我們反而在增加消費,因為我們可以在同樣的預算下解決更複雜的任務,」AI雲端公司Nebius的共同創辦人兼商務總監Roman Chernin表示。
這個現象被稱為Jevons悖論,源自19世紀經濟學家William Stanley Jevons,描述效率提升如何降低成本的同時,反而增加總資源消耗。在本週致《華爾街日報》的一封信中,經濟學家Maury Harris認為,該原則同樣適用於AI運算,其需求的價格彈性可能被證明「高度彈性」。Nebius公司建造大規模GPU集群,其股價在1月的DeepSeek恐慌期間下跌了40%——然而Chernin表示,同一週「可能是銷售業績最好的一週」,因為企業意識到他們負擔得起大規模推理。
這對投資人而言意義重大。高盛估計,年度AI基礎設施支出可能從2026年的7650億美元,上升到2031年的1.6兆美元。但贏家將取決於利用率、融資紀律,以及吸收波動元件成本的能力——記憶體晶片價格在過去一年上漲了六倍,因為AI需求從資料中心擴散到更廣泛的經濟領域。
從實驗性聊天機器人轉向代理型AI系統是主要的推動力。當企業從單輪查詢轉向多步驟自主代理——這些代理會鏈式呼叫、檢索文件並採取行動——代幣消耗會跳升一個數量級或更多。一家大型醫療保險公司在不到一年的時間內,其每月AI代幣消耗從300萬個增加到超過1.5億個。
支出激增正在重塑供應商定價。Anthropic取消了固定費率的企業定價方案,因為發現開發者在每月200美元的方案上燒掉了數千美元的運算費用。OpenAI在同一個月將Codex轉為按代幣計費。所有主要AI供應商都在向計量定價收斂,這形成了Chernin所謂的結構性鎖定:每部署一個新的代理,就會加深對設定費率並控制條件的供應商的依賴。
然而,需求端的情況與1月份籠罩市場的恐慌截然不同。當DeepSeek的發布導致Nebius股價下跌40%以及AI基礎設施類股全面拋售時,企業工程團隊所做的恰恰相反——他們正在擴大規模。更低的成本使之前不經濟的應用變得可行,從內部知識檢索到自動化客戶工作流程。
競爭動態有利於那些在技術堆疊中向上移動的公司。Chernin估計,裸金屬GPU租賃市場在全球範圍內僅服務大約十幾個客戶。託管基礎設施服務數百個客戶。推理平台吸引數千個客戶。他預測,代理型系統將吸引數萬名開發者。
Nebius的Token Factory——一個託管推理平台——體現了這一策略。該服務讓企業無需管理後端基礎設施即可運行開源模型,並應用優化技術保持成本可預測。對企業而言,其價值主張很明確:託管模型處理追蹤成本、維持正常運行時間,以及根據預算和速度需求在不同模型之間分配任務的複雜性。
但託管推理層本身也面臨商品化風險。一項2026年的研究發現,大型語言模型的推理價格在2020年至2026年間下降了約600倍,而OECD的2025年AI市場報告記錄了品質調整後模型價格的急劇下降,因為競爭加劇。這表明,曾經衝擊晶片製造商的利潤壓縮壓力,現在正在向堆疊的上層蔓延。
對投資人而言,關鍵問題是哪家公司能夠建立持久的護城河。Nvidia的本益比約為前瞻盈利的35倍,面臨更便宜的推理減少對其最高利潤率訓練晶片需求的風險。雲端超大规模企業——亞馬遜、微軟、谷歌——受益於運算消耗的增加,但面臨不斷上升的資本需求。而像Nebius這樣的基礎設施提供商必須證明,隨著市場擴張,它們能夠維持利用率和定價能力。
Jevons悖論表明,即使單位價格下降,AI產業的總收入仍將成長。但要抓住這部分收入,僅擁有運算能力是不夠的——還需要軟體、工具以及將原始處理能力轉化為成品的企業關係。
本文僅供資訊參考,不構成投資建議。