推動美光利潤創歷史新高的HBM定價能力,如今正給其最大客戶帶來強烈誘因,促使他們減少對HBM的使用。
推動美光利潤創歷史新高的HBM定價能力,如今正給其最大客戶帶來強烈誘因,促使他們減少對HBM的使用。

高通(Qualcomm)、輝達(Nvidia)、蘋果(Apple)、Cerebras 與 Google 正開發旨在減少對高頻寬記憶體(HBM)依賴的晶片架構與演算法,因為持續的供應緊張正推動 AI 供應鏈成本不斷攀升。
「HBM 供應緊張、價格昂貴,而我們不用它,」Cerebras 執行長安德魯·費爾德曼(Andrew Feldman)在公司上市後的首場財報電話會議上表示,他將這家晶圓級晶片製造商無 HBM 的設計定位為一項競爭優勢。
美光科技(Micron Technology)上週報告稱,供應狀況較三個月前進一步收緊,該公司簽署了 15 項新的長期協議——其中多數為期五年並設有價格下限——並將供貨短缺的前景延長至 2027 年以後。根據行業數據,2024 年全球記憶體銷售額激增 79%,達到 1650 億美元,預計 2025 年將超過 2230 億美元。領先的 HBM 生產商 SK 海力士(SK Hynix)2026 年的全部產能已售罄,且已停止接受主要記憶體產品的新訂單。
這種動態給記憶體製造商帶來了一個悖論:正是那種帶來前所未有利潤率的定價能力,正在資助一波旨在減少 HBM 依賴的客戶主導創新浪潮。若這些努力取得成功,可能限制這個已成為 AI 基礎設施核心的市場的長期成長軌跡。
高通對不同記憶體架構的賭注
高通在 2026 年 6 月的投資者日上,推出了一個名為 Dragonfly 的數據中心平台,其基礎是該公司所謂的高頻寬運算(HBC)。高通並非將處理器與堆疊的 HBM 透過昂貴的矽中介層連接——這是輝達 H100 和 B200 所採用的標準方法——而是將處理核心直接放置在 DRAM 堆疊下方,從而縮短數據需要傳輸的距離。該公司聲稱,與傳統 GPU 配置相比,這種設計每瓦可提供高達八倍的 token 產出,每瓦記憶體頻寬是基於 HBM 的競爭對手的六倍,同時完全消除了中介層。
這項架構的問世,正值 HBM 已成為 AI 供應鏈中供應最受限制的組件之一。根據行業預測,新建記憶體晶圓廠需要 150 億至 200 億美元的投資,且需要數年時間才能投產,這意味著短缺可能至少持續到 2027 年。高通表示,其已獲得實現 2027 財年 50 億美元數據中心銷售收入目標所需的晶圓和記憶體。
輝達與Google走軟體路線
輝達是 HBM 在 AI 加速器領域的最大消費者,該公司也在探索減少記憶體需求的方法。據報導,輝達正在調整其下一代 Vera Rubin 平台的某些元素,以降低整體記憶體需求。輝達的 Grace CPU 和 Vera 架構代表了一種嘗試,旨在優化運算與記憶體之間的平衡,而在這些系統中,HBM 在總物料清單中的占比正不斷上升。
Google 在 3 月發表了關於 TurboQuant 的研究,這是一種模型壓縮方法,能顯著減少 AI 模型的記憶體佔用,同時對效能的影響極小。此消息引發美光股價急劇拋售,股價在單日內下跌近三分之一,之後隨著市場重新評估此類技術影響 HBM 需求的時間表,股價反彈了超過兩倍。這一事件凸顯出,記憶體股票的估值對任何威脅 HBM 在 AI 推理中角色的技術已變得何其敏感。
投資算盤
對記憶體製造商而言,短期前景依然極為強勁。根據 Futurum 分析師羅爾夫·布爾克(Rolf Bulk)的說法,美光的新長期協議即使在合約最低條件下,也將定價鎖定在歷史週期高峰之上。該公司的業績指引暗示,其季度營業利潤將超過先前週期中表現最好的全年營收。
但結構性風險正在積累。蘋果本週在多款 Mac 和 iPad 型號的產品週期之間調漲價格,並明確歸因於記憶體晶片成本上升——此舉顯示終端用戶對更高價格的承受能力是有限的。當全球最大的科技公司正在簽署為期五年、設有價格下限的供應協議時,它們同時也在投入資金給工程團隊,其任務是讓這些協議隨著時間推移變得不再那麼重要。
高通的本益比約為預期盈餘的 18 倍,低於輝達的 35 倍,反映出市場對其打入由既有業者主導的數據中心市場的能力持懷疑態度。如果其 HBC 架構能實現所宣稱的效率提升,僅記憶體採購的節省就可能成為其估值重估的理由。對美光而言,風險在於今天的定價能力正為明天的需求破壞播下種子——這是記憶體行業曾經歷過的模式,但從未有過如此規模的客戶端工程投資驅動。
本文僅供資訊參考,不構成投資建議。