中國 AI 挑戰者 DeepSeek 正在利用技術效率優勢,針對當前 AI 硬體市場策劃長期戰略佈局,並以旗艦模型永久降價 75% 拉開序幕。
中國 AI 挑戰者 DeepSeek 正在利用技術效率優勢,針對當前 AI 硬體市場策劃長期戰略佈局,並以旗艦模型永久降價 75% 拉開序幕。

中國 AI 挑戰者 DeepSeek 正在利用技術效率優勢,針對當前 AI 硬體市場策劃長期戰略佈局,並以旗艦模型永久降價 75% 拉開序幕。
據報導,中國 AI 初創公司 DeepSeek 正利用新一輪 700 億元人民幣融資帶來的 450 億美元投前估值,將其旗艦模型 V4-Pro 的價格永久下調 75%。此舉是一項旨在削減競爭對手優勢並減少對西方高端硬體依賴的戰略舉措。
「我們的原則是不虧損,但也不賺取超額利潤,」DeepSeek 創始人梁文鋒在兩年前曾表示。如今,這一理念正隨著公司在鍵值快取(KV Cache)等領域的技术效率提升而成為現實,從而實現了大幅降低的成本結構。
該公司週六宣佈,V4-Pro API 的價格現在將永久固定在其促銷價,即每百萬 Token 0.025 至 6 元人民幣(約 0.0035 至 0.83 美元),較 24 元的峰值大幅下降。這得益於技術創新將 100 萬 Token 上下文的 KV Cache HBM 記憶體需求降低至僅 5.48GB,而部分競爭對手模型則需要 60GB。
DeepSeek 的戰略不僅限於 API 價格戰,還旨在重構估值達 10 兆美元的硬體供應鏈。透過針對較便宜的 LPDDR 記憶體和 SSD 優化其模型,該公司正在為中國國產晶片開闢一條與英偉達等領導者競爭的可行路徑,有望在由其助力創造的硬體市場中佔據重要份額。
DeepSeek 激進的定價策略是旨在最大限度降低硬體成本的一系列深層技術創新的直接結果。這一戰略的核心在於大幅縮減鍵值快取(KV Cache),即大語言模型中記憶體密集型的組件。透過將 V4 模型的 KV Cache 佔用空間降至競爭對手的不到十分之一,DeepSeek 可以將這些數據從昂貴的高頻寬記憶體(HBM)轉移到更商品化的 SSD 和 NAND 快閃記憶體中。
這種效率在硬體棧中產生了連鎖反應。來自 SGLang 團隊的研究顯示,比 HBM 便宜得多的 LPDDR 記憶體可以作為「權重暫存區」,根據需要串流傳輸模型參數,而 DeepSeek 的混合專家模型(MoE)架構非常適合這種方法。這種方法有效地用大量廉價的系統記憶體替代了昂貴的高性能 GPU 記憶體。對於因 EUV 光刻受限而在生產尖端 GPU 方面面臨挑戰的中國國產晶片產業來說,這是一項關鍵進展。它允許性能較低的處理器透過搭配更多記憶體來保持競爭力,這是一種繞過原始算力不足的「換道超車」策略。
此外,DeepSeek 還投資了跨硬體編譯器框架 TileLang。這一軟體層旨在抽象化硬體差異,使 AI 代碼能夠在各種平台上運行,從而規避將許多開發者鎖定在英偉達硬體生態中的強大「CUDA 護城河」。
根據近期投資者會議的報告,儘管眼前的效果是顛覆了 AI 硬體市場,但創始人梁文鋒表示,最終目標是追求通用人工智慧(AGI)。硬體效率戰略是實現這一長期目標的必要基礎。
實現 AGI 可能需要大規模的訓練,特別是使用強化學習(RL)和遞歸自我提升(RSI)等技術,在這些技術中,AI 透過試錯進行學習和自我完善。這些方法在計算上是天文數字級別的,需要生成數兆個 Token 和海量的「假設」場景建模。透過降低計算的基本成本,DeepSeek 使這些此前難以負擔的訓練運行在經濟上變得可行。從 MoE 模型到 KV Cache 壓縮,每一項創新都匯聚於同一個目標:讓 AGI 訓練的成本低到足以能夠持續追求。
這讓 DeepSeek 的融資和定價策略呈現出新的意義。該公司不僅僅是在銷售 API 接口;它正在構建一個由硬體合作夥伴和投資者(包括寧德時代和官方背景基金)組成的聯盟,以打造一個自給自足的 AI 供應鏈。對於投資者而言,賭注不在於一家軟體公司,而在於一個戰略核心,透過從根本上改變建設成本的經濟方程,它可能會重塑全球 AI 勢力的平衡。這使得 DeepSeek 不僅成為其他 AI 實驗室的直接挑戰者,也成為了包括英偉達在內的整個支撐當前 AI 熱潮的硬體生態系統的挑戰者。
本文僅供參考,不構成投資建議。