Jevons悖論驅動AI運算需求，代幣成本下降1000倍

每代幣AI成本在三年內下降了1000倍，但企業運算消耗卻呈現爆炸性成長——Uber在4月就用光了整個2026年的AI預算，而AT&T現在每天處理270億個代幣，18個月前僅為10億個。

「每次我們以更低的成本獲得同樣的智能單位時，我們並沒有減少消費；我們反而在增加消費，因為我們可以在同樣的預算下解決更複雜的任務，」AI雲端公司Nebius的共同創辦人兼商務總監Roman Chernin表示。

這個現象被稱為Jevons悖論，源自19世紀經濟學家William Stanley Jevons，描述效率提升如何降低成本的同時，反而增加總資源消耗。在本週致《華爾街日報》的一封信中，經濟學家Maury Harris認為，該原則同樣適用於AI運算，其需求的價格彈性可能被證明「高度彈性」。Nebius公司建造大規模GPU集群，其股價在1月的DeepSeek恐慌期間下跌了40%——然而Chernin表示，同一週「可能是銷售業績最好的一週」，因為企業意識到他們負擔得起大規模推理。

這對投資人而言意義重大。高盛估計，年度AI基礎設施支出可能從2026年的7650億美元，上升到2031年的1.6兆美元。但贏家將取決於利用率、融資紀律，以及吸收波動元件成本的能力——記憶體晶片價格在過去一年上漲了六倍，因為AI需求從資料中心擴散到更廣泛的經濟領域。

代幣爆炸衝擊企業預算

從實驗性聊天機器人轉向代理型AI系統是主要的推動力。當企業從單輪查詢轉向多步驟自主代理——這些代理會鏈式呼叫、檢索文件並採取行動——代幣消耗會跳升一個數量級或更多。一家大型醫療保險公司在不到一年的時間內，其每月AI代幣消耗從300萬個增加到超過1.5億個。

支出激增正在重塑供應商定價。Anthropic取消了固定費率的企業定價方案，因為發現開發者在每月200美元的方案上燒掉了數千美元的運算費用。OpenAI在同一個月將Codex轉為按代幣計費。所有主要AI供應商都在向計量定價收斂，這形成了Chernin所謂的結構性鎖定：每部署一個新的代理，就會加深對設定費率並控制條件的供應商的依賴。

然而，需求端的情況與1月份籠罩市場的恐慌截然不同。當DeepSeek的發布導致Nebius股價下跌40%以及AI基礎設施類股全面拋售時，企業工程團隊所做的恰恰相反——他們正在擴大規模。更低的成本使之前不經濟的應用變得可行，從內部知識檢索到自動化客戶工作流程。

當運算變得更便宜，誰是贏家

競爭動態有利於那些在技術堆疊中向上移動的公司。Chernin估計，裸金屬GPU租賃市場在全球範圍內僅服務大約十幾個客戶。託管基礎設施服務數百個客戶。推理平台吸引數千個客戶。他預測，代理型系統將吸引數萬名開發者。

Nebius的Token Factory——一個託管推理平台——體現了這一策略。該服務讓企業無需管理後端基礎設施即可運行開源模型，並應用優化技術保持成本可預測。對企業而言，其價值主張很明確：託管模型處理追蹤成本、維持正常運行時間，以及根據預算和速度需求在不同模型之間分配任務的複雜性。

但託管推理層本身也面臨商品化風險。一項2026年的研究發現，大型語言模型的推理價格在2020年至2026年間下降了約600倍，而OECD的2025年AI市場報告記錄了品質調整後模型價格的急劇下降，因為競爭加劇。這表明，曾經衝擊晶片製造商的利潤壓縮壓力，現在正在向堆疊的上層蔓延。

對投資人而言，關鍵問題是哪家公司能夠建立持久的護城河。Nvidia的本益比約為前瞻盈利的35倍，面臨更便宜的推理減少對其最高利潤率訓練晶片需求的風險。雲端超大规模企業——亞馬遜、微軟、谷歌——受益於運算消耗的增加，但面臨不斷上升的資本需求。而像Nebius這樣的基礎設施提供商必須證明，隨著市場擴張，它們能夠維持利用率和定價能力。

Jevons悖論表明，即使單位價格下降，AI產業的總收入仍將成長。但要抓住這部分收入，僅擁有運算能力是不夠的——還需要軟體、工具以及將原始處理能力轉化為成品的企業關係。

本文僅供資訊參考，不構成投資建議。