重點摘要:
- DeepSeek V4 正式版將於 2026 年 7 月中旬推出,採用尖離峰 API 定價機制
- 尖峰時段(上午 9 點至中午 12 點及下午 2 點至 6 點)收費為一般時段的 2 倍
- 此舉緊接 DSpark 發布,該技術將推理速度提升高達 85%
重點摘要:

DeepSeek 將於 7 月中旬推出 V4 正式版,尖峰時段 API 定價為一般費率的兩倍。
預計於 7 月中旬登場的 DeepSeek V4 正式版,將在尖峰時段向客戶收取雙倍費用——這一定價策略建立在該中國實驗室相較於 Anthropic 和 OpenAI 既有的成本優勢之上。
「尖離峰定價讓我們能在高需求時段更有效率地分配運算容量,」DeepSeek 一位發言人表示,但並未透露正式版每 Token 的基礎費率。
尖峰時段為每日上午 9 點至中午 12 點及下午 2 點至 6 點,費率為離峰價格的 2 倍。德意志銀行分析師 Jim Reid 指出,V4-Pro 模型每次前向傳遞啟動其 1.6 兆總參數中的 490 億個參數,在同等任務下的成本僅約為 Anthropic Claude Fable 5 的 1.5%。
這一定價策略緊接 DeepSeek 於 6 月 27 日發布 DSpark,這是一個投機解碼框架,可在無需硬體升級的情況下,將 V4-Flash 的生成速度提升高達 85%。對於大規模運行 V4 的企業而言,更快的推理速度加上分級定價,可能進一步降低每 Token 成本——在美國模型供應商預期進行 IPO 之前,壓縮其利潤空間。
正式版的發布為一段快速迭代的時期畫下句點。根據內部生產數據,與先前的 MTP-1 基準相比,DeepSeek 的 DSpark 框架將 V4-Flash 的每位用戶生成速度提升 60% 至 85%,V4-Pro 則提升 57% 至 78%。該公司還以 MIT 授權開源了 DeepSpec——投機解碼草稿模型的完整訓練堆疊——使使用 Qwen3 和 Gemma 模型的團隊也能採用該技術。
中國 AI 實驗室持續收緊定價螺絲
DeepSeek 並非唯一挑戰美國定價的業者。前身為智譜 AI 的 Z.ai 本週推出了 GLM5.2——Jefferies 策略師 Christopher Wood 稱該模型「作為企業市場的競爭者,幾乎與 Anthropic 不相上下」,但每 Token 成本僅為其四分之一。摩根士丹利交易員指出,「需求組合正明顯轉向低成本模型。」
尖離峰機制可能進一步擴大 DeepSeek 在離峰時段的成本差距,屆時費率降至尖峰水準的一半。德意志銀行的 Reid 在 6 月 18 日撰文指出,對於大約 90% 的日常任務而言,DeepSeek V4-Pro「以 Anthropic Claude Fable 5 約 1.5% 的成本,就能完成大致相同的工作。」
這對投資人意味著什麼
轉向更便宜模型的趨勢,正威脅著計劃上市的美國 AI 供應商的估值敘事。據《紐約時報》報導,OpenAI 正因科技股 IPO 表現不佳及價格競爭日益激烈而重新考慮其 IPO 時程。Anthropic 面臨類似壓力,因為企業客戶正在評估更低成本的替代方案。
對 GPU 製造商和雲端服務供應商而言,這股趨勢是一把雙面刃。較低的每 Token 成本可能帶動更廣泛的採用——Deloitte 預測,推理工作負載將在 2026 年佔所有 AI 運算的大約三分之二,高於 2023 年的三分之一。但如果企業將工作負載轉移到更便宜或自架的模型,超大規模雲端供應商的營收成長可能放緩。DeepSeek 的尖離峰定價標誌著 AI 價格戰進入新階段,中國實驗室正利用軟體優化和激進定價,從美國既有業者手中奪取市佔率。
本文僅供資訊參考,不構成投資建議。