OpenAI 與博通發表 Jalapeño 晶片，推理成本降低 50%

OpenAI 首款客製化晶片與博通共同開發，僅耗時九個月，承諾將推理成本減半，並降低對輝達 GPU 的依賴。

OpenAI 與博通發表了 Jalapeño，一款客製化推理晶片，博通執行長表示該晶片可降低約 50% 的成本，對輝達在 AI 晶片領域的主導地位構成威脅。

「透過自行設計更多軟硬體堆疊，我們能夠以更高的效率提供更多的智能運算，」OpenAI 總裁暨共同創辦人 Greg Brockman 在聲明中表示。「Jalapeño 是我們長期全端基礎設施策略的一部分，旨在讓算力更加充裕。」

這款晶片從初始設計到完成流片僅耗時九個月，是專為大型語言模型推理設計的空白架構（blank-slate architecture），而非對既有 AI 加速器的改良。據 OpenAI 表示，工程樣品已能在生產目標頻率與功耗下運行 GPT-5.3-Codex-Spark，初步測試顯示其每瓦效能「顯著優於」當前最先進的晶片。消息公布後，博通股價一度上漲約 2%，但隨後因整體半導體板塊走弱而下跌約 3%。

該合作標誌著 OpenAI 的戰略轉向。自 2022 年生成式 AI 熱潮興起以來，OpenAI 一直是輝達最大的 GPU 買家之一。如今，在推理運算需求爆炸式增長的背景下，OpenAI 希望透過自行設計晶片來降低採購成本。Jalapeño 系統預計於 2026 年底進行首次部署，並計劃與微軟及其他合作夥伴一同擴展至吉瓦（GW）等級的資料中心。

Jalapeño 是一款專為 LLM 推理設計的特殊應用積體電路（ASIC）。與輝達通用型圖形處理器（GPU）不同——後者可同時處理訓練與推理等多種工作負載——ASIC 犧牲靈活性以換取針對特定任務的效率。OpenAI 表示，該架構減少了資料搬運，並平衡了運算、記憶體與網路資源，使利用率「更接近理論峰值效能」。博通貢獻了其 Tomahawk 網路晶片與晶片實作經驗，而 Celestica 則負責電路板、機櫃與系統整合。

這款晶片是規劃中的多世代運算平台的首款產品。OpenAI 也已與亞馬遜雲端運算服務（AWS）就 Trainium 晶片達成協議，並與超微半導體（AMD）及 Cerebras 展開合作，作為其刻意推動的輝達多元替代策略的一部分。該公司表示，九個月的開發週期可能是高效能半導體領域有史以來最快的 ASIC 開發速度，部分原因在於 OpenAI 自身的模型參與了晶片的設計與優化。

對投資人而言，此舉的影響有利有弊。博通股價自 2022 年底以來已成長近七倍，如今獲得 OpenAI 作為高量客製化晶片客戶，使其 AI 營收來源不再僅限於網路業務。而輝達則以其 GPU 主導 AI 晶片市場，如今面臨最大客戶之一正在為推理領域——AI 運算中成長最快的部分——打造替代方案。OpenAI 未透露該計畫的總成本或單晶片價格，但博通執行長 Hock Tan 形容此次合作「僅是跨世代路線圖的開端」，可望自 2026 年起支援吉瓦等級的資料中心部署。

本文僅供參考，不構成投資建議。