DeepSeek V4 officiel : lancement en juillet avec un tarif doublé aux heures de pointe

DeepSeek lancera sa version officielle V4 à la mi-juillet avec un tarif d'API doublé aux heures de pointe.

La version officielle de DeepSeek V4, attendue à la mi-juillet, facturera le double aux clients pendant les heures de pointe — une stratégie tarifaire qui s'appuie sur l'avantage de coût déjà existant du laboratoire chinois face à Anthropic et OpenAI.

« La tarification par créneaux nous permet d'allouer la capacité de calcul plus efficacement pendant les fenêtres de forte demande », a déclaré un porte-parole de DeepSeek, sans divulguer le tarif de base par jeton pour la version officielle.

Les heures de pointe s'étendent de 9 h à 12 h et de 14 h à 18 h chaque jour, avec des tarifs correspondant à 2 fois le prix des heures creuses. Le modèle V4-Pro, qui active 49 milliards de ses 1 600 milliards de paramètres totaux par passage avant, coûte déjà environ 1,5 % du prix de Claude Fable 5 d'Anthropic pour des tâches équivalentes, selon l'analyste de Deutsche Bank, Jim Reid.

Cette décision tarifaire fait suite à la publication par DeepSeek, le 27 juin, de DSpark, un cadre de décodage spéculatif qui augmente la vitesse de génération de V4-Flash jusqu'à 85 % sans mise à niveau matérielle. Pour les entreprises exploitant V4 à grande échelle, une inférence plus rapide combinée à une tarification différenciée pourrait réduire davantage les coûts par jeton — ce qui pèse sur les marges des fournisseurs de modèles américains avant leurs introductions en Bourse attendues.

Le lancement de la version officielle marque l'aboutissement d'une période d'itération rapide. Le cadre DSpark de DeepSeek a amélioré la vitesse de génération par utilisateur de 60 % à 85 % sur V4-Flash et de 57 % à 78 % sur V4-Pro par rapport à la précédente référence MTP-1, selon les données de production internes. L'entreprise a également open-sourcé DeepSpec, l'ensemble complet de formation pour les modèles de décodage spéculatif, sous licence MIT — rendant la technologie accessible aux équipes utilisant les modèles Qwen3 et Gemma.

Les laboratoires d'IA chinois resserrent l'étau sur les prix

DeepSeek n'est pas le seul à défier la tarification américaine. Z.ai, anciennement Zhipu AI, a lancé GLM5.2 cette semaine — un modèle que Christopher Wood, stratège chez Jefferies, a qualifié de « presque égal à Anthropic en tant que concurrent pour le marché des entreprises » pour un quart du coût par jeton. Les traders de Morgan Stanley ont noté que « la composition de la demande se déplace clairement vers les modèles à moindre coût. »

Le mécanisme de tarification par créneaux pourrait creuser davantage l'écart de coût de DeepSeek pendant les heures creuses, lorsque les tarifs tombent à la moitié du niveau de pointe. Pour environ 90 % des tâches courantes, le V4-Pro de DeepSeek « fait à peu près le même travail pour environ 1,5 % du coût » du Claude Fable 5 d'Anthropic, a écrit Jim Reid de Deutsche Bank le 18 juin.

Ce que cela signifie pour les investisseurs

Le virage vers des modèles moins chers menace les récits de valorisation des fournisseurs d'IA américains qui préparent des introductions en Bourse. OpenAI envisagerait de revoir son calendrier d'introduction en Bourse en raison de la sous-performance des introductions technologiques et de la concurrence croissante sur les prix, a rapporté le New York Times. Anthropic fait face à des pressions similaires alors que les clients entreprises évaluent des alternatives à moindre coût.

Pour les fabricants de GPU et les fournisseurs de cloud, la tendance est à double tranchant. La baisse des coûts par jeton pourrait stimuler une adoption plus large — Deloitte prévoit que les charges de travail d'inférence représenteront environ les deux tiers de tous les calculs d'IA en 2026, contre un tiers en 2023. Mais si les entreprises déplacent leurs charges de travail vers des modèles moins chers ou auto-hébergés, la croissance des revenus des fournisseurs de cloud hyperscale pourrait ralentir. La tarification par créneaux de DeepSeek marque une nouvelle phase dans la guerre des prix de l'IA, une phase où les laboratoires chinois utilisent l'optimisation logicielle et des prix agressifs pour conquérir des parts de marché auprès des acteurs américains établis.

Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.