DeepSeek V4 正式版 7 月登場，尖峰時段定價翻倍

DeepSeek 將於 7 月中旬推出 V4 正式版，尖峰時段 API 定價為一般費率的兩倍。

預計於 7 月中旬登場的 DeepSeek V4 正式版，將在尖峰時段向客戶收取雙倍費用——這一定價策略建立在該中國實驗室相較於 Anthropic 和 OpenAI 既有的成本優勢之上。

「尖離峰定價讓我們能在高需求時段更有效率地分配運算容量，」DeepSeek 一位發言人表示，但並未透露正式版每 Token 的基礎費率。

尖峰時段為每日上午 9 點至中午 12 點及下午 2 點至 6 點，費率為離峰價格的 2 倍。德意志銀行分析師 Jim Reid 指出，V4-Pro 模型每次前向傳遞啟動其 1.6 兆總參數中的 490 億個參數，在同等任務下的成本僅約為 Anthropic Claude Fable 5 的 1.5%。

這一定價策略緊接 DeepSeek 於 6 月 27 日發布 DSpark，這是一個投機解碼框架，可在無需硬體升級的情況下，將 V4-Flash 的生成速度提升高達 85%。對於大規模運行 V4 的企業而言，更快的推理速度加上分級定價，可能進一步降低每 Token 成本——在美國模型供應商預期進行 IPO 之前，壓縮其利潤空間。

正式版的發布為一段快速迭代的時期畫下句點。根據內部生產數據，與先前的 MTP-1 基準相比，DeepSeek 的 DSpark 框架將 V4-Flash 的每位用戶生成速度提升 60% 至 85%，V4-Pro 則提升 57% 至 78%。該公司還以 MIT 授權開源了 DeepSpec——投機解碼草稿模型的完整訓練堆疊——使使用 Qwen3 和 Gemma 模型的團隊也能採用該技術。

中國 AI 實驗室持續收緊定價螺絲

DeepSeek 並非唯一挑戰美國定價的業者。前身為智譜 AI 的 Z.ai 本週推出了 GLM5.2——Jefferies 策略師 Christopher Wood 稱該模型「作為企業市場的競爭者，幾乎與 Anthropic 不相上下」，但每 Token 成本僅為其四分之一。摩根士丹利交易員指出，「需求組合正明顯轉向低成本模型。」

尖離峰機制可能進一步擴大 DeepSeek 在離峰時段的成本差距，屆時費率降至尖峰水準的一半。德意志銀行的 Reid 在 6 月 18 日撰文指出，對於大約 90% 的日常任務而言，DeepSeek V4-Pro「以 Anthropic Claude Fable 5 約 1.5% 的成本，就能完成大致相同的工作。」

這對投資人意味著什麼

轉向更便宜模型的趨勢，正威脅著計劃上市的美國 AI 供應商的估值敘事。據《紐約時報》報導，OpenAI 正因科技股 IPO 表現不佳及價格競爭日益激烈而重新考慮其 IPO 時程。Anthropic 面臨類似壓力，因為企業客戶正在評估更低成本的替代方案。

對 GPU 製造商和雲端服務供應商而言，這股趨勢是一把雙面刃。較低的每 Token 成本可能帶動更廣泛的採用——Deloitte 預測，推理工作負載將在 2026 年佔所有 AI 運算的大約三分之二，高於 2023 年的三分之一。但如果企業將工作負載轉移到更便宜或自架的模型，超大規模雲端供應商的營收成長可能放緩。DeepSeek 的尖離峰定價標誌著 AI 價格戰進入新階段，中國實驗室正利用軟體優化和激進定價，從美國既有業者手中奪取市佔率。

本文僅供資訊參考，不構成投資建議。