重點摘要:
- OpenAI 與博通發表 Jalapeño,一款歷時九個月開發的客製化 LLM 推理晶片
- 博通執行長表示,該晶片較現有方案降低約 50% 的推理成本
- Jalapeño 系統預計於 2026 年底進行首次大規模部署,規模達吉瓦(GW)等級
重點摘要:

OpenAI 首款客製化晶片與博通共同開發,僅耗時九個月,承諾將推理成本減半,並降低對輝達 GPU 的依賴。
OpenAI 與博通發表了 Jalapeño,一款客製化推理晶片,博通執行長表示該晶片可降低約 50% 的成本,對輝達在 AI 晶片領域的主導地位構成威脅。
「透過自行設計更多軟硬體堆疊,我們能夠以更高的效率提供更多的智能運算,」OpenAI 總裁暨共同創辦人 Greg Brockman 在聲明中表示。「Jalapeño 是我們長期全端基礎設施策略的一部分,旨在讓算力更加充裕。」
這款晶片從初始設計到完成流片僅耗時九個月,是專為大型語言模型推理設計的空白架構(blank-slate architecture),而非對既有 AI 加速器的改良。據 OpenAI 表示,工程樣品已能在生產目標頻率與功耗下運行 GPT-5.3-Codex-Spark,初步測試顯示其每瓦效能「顯著優於」當前最先進的晶片。消息公布後,博通股價一度上漲約 2%,但隨後因整體半導體板塊走弱而下跌約 3%。
該合作標誌著 OpenAI 的戰略轉向。自 2022 年生成式 AI 熱潮興起以來,OpenAI 一直是輝達最大的 GPU 買家之一。如今,在推理運算需求爆炸式增長的背景下,OpenAI 希望透過自行設計晶片來降低採購成本。Jalapeño 系統預計於 2026 年底進行首次部署,並計劃與微軟及其他合作夥伴一同擴展至吉瓦(GW)等級的資料中心。
Jalapeño 是一款專為 LLM 推理設計的特殊應用積體電路(ASIC)。與輝達通用型圖形處理器(GPU)不同——後者可同時處理訓練與推理等多種工作負載——ASIC 犧牲靈活性以換取針對特定任務的效率。OpenAI 表示,該架構減少了資料搬運,並平衡了運算、記憶體與網路資源,使利用率「更接近理論峰值效能」。博通貢獻了其 Tomahawk 網路晶片與晶片實作經驗,而 Celestica 則負責電路板、機櫃與系統整合。
這款晶片是規劃中的多世代運算平台的首款產品。OpenAI 也已與亞馬遜雲端運算服務(AWS)就 Trainium 晶片達成協議,並與超微半導體(AMD)及 Cerebras 展開合作,作為其刻意推動的輝達多元替代策略的一部分。該公司表示,九個月的開發週期可能是高效能半導體領域有史以來最快的 ASIC 開發速度,部分原因在於 OpenAI 自身的模型參與了晶片的設計與優化。
對投資人而言,此舉的影響有利有弊。博通股價自 2022 年底以來已成長近七倍,如今獲得 OpenAI 作為高量客製化晶片客戶,使其 AI 營收來源不再僅限於網路業務。而輝達則以其 GPU 主導 AI 晶片市場,如今面臨最大客戶之一正在為推理領域——AI 運算中成長最快的部分——打造替代方案。OpenAI 未透露該計畫的總成本或單晶片價格,但博通執行長 Hock Tan 形容此次合作「僅是跨世代路線圖的開端」,可望自 2026 年起支援吉瓦等級的資料中心部署。
本文僅供參考,不構成投資建議。