Le challenger chinois de l'IA, DeepSeek, utilise ses gains d'efficacité technique comme une arme pour orchestrer une stratégie à long terme contre le marché actuel du matériel IA, en commençant par une baisse de prix permanente de 75 % sur son modèle phare.
La startup chinoise d'IA DeepSeek tire parti d'une valorisation pré-monétaire signalée de 45 milliards de dollars issue d'un nouveau tour de financement de 70 milliards de yuans pour réduire de manière permanente de 75 % les prix de son modèle phare V4-Pro, un mouvement stratégique conçu pour devancer ses concurrents et réduire la dépendance au matériel occidental haut de gamme.
« Notre principe n'est pas de perdre de l'argent, mais aussi de ne pas faire de profits excessifs », a déclaré le fondateur de DeepSeek, Liang Wenfeng, il y a deux ans, une philosophie qui se matérialise aujourd'hui alors que les gains d'efficacité technique de l'entreprise dans des domaines tels que le cache KV (Key-Value Cache) permettent une structure de coûts considérablement plus basse.
Le prix de l'API V4-Pro sera désormais fixé de manière permanente à son tarif promotionnel, entre 0,025 et 6 yuans par million de tokens (environ 0,0035 $ à 0,83 $), contre un sommet de 24 yuans, a annoncé l'entreprise samedi. Cela est rendu possible par des innovations qui réduisent les besoins en mémoire HBM du cache KV à seulement 5,48 Go pour un contexte d'un million de tokens, une fraction des 60 Go requis par certains modèles concurrents.
La stratégie de DeepSeek s'étend au-delà des guerres de prix des API, visant à reconfigurer une chaîne d'approvisionnement matérielle estimée à 10 billions de dollars. En optimisant ses modèles pour de la mémoire LPDDR et des SSD moins coûteux, l'entreprise crée une voie viable pour que les puces nationales chinoises rivalisent avec des leaders comme Nvidia, capturant potentiellement une part importante du marché matériel qu'elle contribue à créer.
L'échiquier du matériel
La tarification agressive de DeepSeek est la conséquence directe d'une série d'innovations techniques profondes conçues pour minimiser les coûts matériels. Le cœur de cette stratégie réside dans la réduction spectaculaire du cache Key-Value (KV), le composant gourmand en mémoire des grands modèles de langage. En réduisant l'empreinte du cache KV du modèle V4 à moins d'un dixième de celle de ses concurrents, DeepSeek peut décharger ces données de la mémoire à haute bande passante (HBM) coûteuse vers des SSD et du stockage flash NAND plus courants.
Cette efficacité crée un effet d'entraînement à travers toute la pile matérielle. Des recherches de l'équipe SGLang montrent que la mémoire LPDDR, nettement moins chère que la HBM, peut servir de « zone de stockage temporaire des poids » pour diffuser les paramètres du modèle selon les besoins, une méthode pour laquelle l'architecture Mixture-of-Experts (MoE) de DeepSeek est unique. Cette approche remplace efficacement la mémoire GPU coûteuse et performante par de plus grandes quantités de mémoire système moins chère. Pour l'industrie chinoise des puces, confrontée à des limitations dans la production de GPU de pointe en raison des restrictions sur la lithographie EUV, il s'agit d'une avancée critique. Elle permet à des processeurs moins puissants de rester compétitifs en les associant à davantage de mémoire, une stratégie de « changement de voie » pour contourner les déficits de puissance de calcul brute.
De plus, DeepSeek a investi dans TileLang, un framework de compilateur multi-matériel. Cette couche logicielle vise à faire abstraction des différences matérielles, permettant au code IA de s'exécuter sur diverses plateformes et contournant le puissant « fossé CUDA » qui verrouille de nombreux développeurs sur le matériel de Nvidia.
Le chemin vers l'AGI
Bien que l'effet immédiat soit une perturbation du marché du matériel IA, le fondateur Liang Wenfeng a déclaré que l'objectif ultime est la poursuite de l'intelligence artificielle générale (AGI), selon des rapports d'une récente réunion d'investisseurs. La stratégie d'efficacité matérielle est la fondation nécessaire à cet objectif à long terme.
Atteindre l'AGI nécessitera probablement un entraînement à grande échelle, utilisant notamment des techniques telles que l'apprentissage par renforcement (RL) et l'auto-amélioration récursive (RSI), où une IA apprend et se perfectionne par essais et erreurs. Ces méthodes sont astronomiques en termes de calcul, exigeant la génération de billions de tokens et une vaste modélisation de scénarios hypothétiques. En faisant baisser le coût fondamental du calcul, DeepSeek rend ces sessions d'entraînement auparavant inabordables économiquement viables. Chaque innovation, des modèles MoE à la compression du cache KV, converge vers l'objectif unique de rendre l'entraînement à l'AGI assez abordable pour être poursuivi.
Cela place la stratégie de levée de fonds et de tarification de DeepSeek sous un nouveau jour. L'entreprise ne se contente pas de vendre un accès API ; elle construit une coalition de partenaires matériels et d'investisseurs, y compris CATL et des fonds affiliés à l'État, pour construire une chaîne d'approvisionnement IA autosuffisante. Pour les investisseurs, le pari ne porte pas sur une entreprise de logiciels, mais sur un pivot stratégique qui pourrait remodeler l'équilibre mondial des pouvoirs dans l'IA en modifiant fondamentalement l'équation économique de qui peut se permettre de la construire. Cela positionne DeepSeek comme un challenger direct non seulement pour les autres laboratoires d'IA, mais pour l'ensemble de l'écosystème matériel, y compris Nvidia, qui sous-tend le boom actuel de l'IA.
Cet article est à titre informatif uniquement et ne constitue pas un conseil en investissement.