AI 基礎設施領域的協同創新
VDURA 和 超微半導體 (AMD) 宣布推出其首個可擴展的 AMD Instinct™ GPU 參考架構,這是一項旨在優化要求嚴苛的人工智慧 (AI) 和高效能運算 (HPC) 環境性能的重大發展。這份經過驗證的藍圖定義了如何配置計算、儲存和網路,以實現高效、可重複的大規模 GPU 實施。
該架構將 VDURA V5000 儲存平台與 AMD Instinct™ MI300 系列加速器整合,專門設計用於消除性能瓶頸並簡化部署。該系統旨在充分利用 AMD Instinct™ GPU,以效率、可擴展性和操作簡便性為重點,提供持續的性能。它支持每個可擴展單元最多 256 個 AMD Instinct™ GPU,在全快閃佈局中實現了高達 1.4 TB/s 的吞吐量和 4500 萬 IOPS,同時提供約 5 PB 的可用容量。數據持久性通過多級糾刪碼確保,網路選項包括雙平面 400 GbE 和可選的 NDR/NDR200 InfiniBand。
VDURA 首席執行官 Ken Claffey 表示:「發布我們與 AMD Instinct™ MI300 系列加速器的首個可擴展參考架構,彰顯了我們共同致力於引領下一代 AI 基礎設施的決心。」 AMD 在技術評估後選擇了 VDURA,理由是 VDURA 具有針對 GPU 優化的性能、低客戶端開銷以及久經考驗的擴展能力。該解決方案已被美國聯邦系統整合商采用于 AI 超級叢集,這表明它已為任務關鍵型工作負載做好準備,在這些工作負載中,AI 和 HPC 管道日益受到儲存限制。
AMD 借助 Instinct MI350 系列的戰略推進
與 VDURA 的合作與 AMD 積極進軍蓬勃發展的 AI 加速器市場的戰略相符,這尤其體現在其尖端 Instinct MI350 系列圖形處理單元 (GPU) 預期的成功上。AMD 預計 2025 年第三季度的收入將達到約 87 億美元,可能存在 3 億美元的波動,這一預測主要得益於 MI350 系列的預期強勁需求和加速部署。
這一樂觀的指導預示著 AMD 強勁的財務發展軌跡,同比增長約 28%,環比增長 13%。這一增長主要歸因於其數據中心部門的強勁兩位數擴張,其中 Instinct MI350 系列(包括 MI350X 和 MI355X 型號)發揮著關鍵作用。這些 GPU 基於 AMD 先進的 CDNA 4 架構構建,在 Advancing AI 和 Hot Chips 2025 等主要行業活動中正式推出,專門設計用於處理最苛刻的 AI 工作負載,從大型語言模型 (LLM) 訓練到 AI 推理和 HPC。
MI350 系列的關鍵規格彰顯了其強大性能,配備高達 288GB 的 HBM3E 內存和 8 TB/s 的內存頻寬,確保了密集任務的大規模吞吐量。該系列有望實現顯著的性能飛躍,包括 AI 計算任務提高四倍,推理速度比以前型號提高 35 倍。這一積極的路線圖將 AMD 定位為強大的競爭者,而 MI350 系列的成功部署標誌著向以 AI 為中心基礎設施更廣泛技術轉變的關鍵時刻。
市場影響和競爭格局
VDURA-AMD 參考架構的推出以及 MI350 系列的強勁前景表明 AMD 和更廣泛的 AI/HPC 領域存在積極情緒。此次合作通過解決大規模 AI 部署至關重要的儲存瓶頸,可以長期鞏固 AMD 的市場份額和收入,增強其對競爭對手的競爭地位。
對 AI GPU 的 surging 需求是市場爆炸性增長的直接體現。AI GPU 市場預計 2025 年為 216 億美元,預計到 2035 年將飆升至 2655 億美元,複合年增長率 (CAGR) 達到驚人的 28.5%。雲服務提供商正在成為這一擴張的主要驅動力,推動對 GPU 支持的數據中心基礎設施進行大規模投資。AMD 在 AI 推理工作負載方面獲得了顯著的關注,這是一個日益受到行業關注的領域。
然而,競爭格局依然激烈。截至 2025 年第三季度,NVIDIA 仍保持著持久的主導地位,市場份額估計為 80-85%。憑藉其成熟的 CUDA 生態系統和即將推出的 Blackwell 架構,NVIDIA 仍然是 AMD 的一個重要障礙。儘管 AMD 的 ROCm 生態系統取得了快速改進,但其在成熟度和開發人員熟悉度方面仍落後於 CUDA。報告表明,在某些工作負載中,AMD 的 MI350 系列可能會比 NVIDIA 的 B200 提供 30% 的成本優勢,Wedbush 的分析師指出,AMD 即將推出的 MI400 GPU 預計在每美元性能指標上可與 NVIDIA 的 H100 匹敵,這可能會侵蝕 NVIDIA 在成本敏感型客戶中的市場份額。
英特爾 (Intel) 在 AI 加速器市場也面臨日益嚴峻的挑戰。據報導,其 Gaudi 系列因銷售緩慢和“軟體易用性”問題未能達到 2024 年 5 億美元的溫和收入目標。AMD 在 AI GPU、伺服器 CPU (EPYC™) 和客戶端 CPU (Ryzen™) 領域持續獲得市場份額,這進一步使 英特爾 在其傳統優勢領域重新獲得立足點的努力複雜化。更廣泛的影響包括對 台積電 (TSMC) 先進製造工藝的供應鏈依賴,這可能造成潛在的單點故障,以及地緣政治因素,例如美國對中國先進 AI 晶片的出口限制,這些仍然是重大的障礙。
行業展望和未來展望
超微半導體 正處於一個變革時代的風口浪尖,這得益於其戰略合作以及 Instinct MI350 系列 GPU 的預期成功和強勁的收入指導。未來的道路涉及應對激烈的競爭,努力擴展其 AI 生態系統,並戰略性地利用對 AI 基礎設施永不滿足的需求。
VDURA-AMD 參考架構是確保高效、可擴展部署的基礎性一步,可以最大限度地提高 GPU 利用率,降低能源成本,並在 AI 和 HPC 管道日益受儲存容量限制的環境中提高整體效率。公司的短期和長期發展軌跡將由其執行其積極路線圖並鞏固其在人工智慧領域的主導地位的能力決定,這需要密切關注競爭對手的進展和不斷變化的市場動態。