DeepSeek lève 7,4 milliards de dollars et prévoit de doubler ses effectifs après le déclencheur Claude

La levée de fonds de 7,4 milliards de dollars de DeepSeek — le plus grand tour unique jamais réalisé par une start-up chinoise d'IA — a été déclenchée par la prise de conscience de Liang Wenfeng que l'entreprise ne pourrait pas soutenir ses ambitions de recherche sans des réserves massives de capital, après avoir examiné l'aperçu de Claude Mythos d'Anthropic en avril, selon des personnes proches du dossier. La société basée à Hangzhou, valorisée à plus de 50 milliards de dollars dans le cadre de ce tour, prévoit de doubler ses effectifs d'environ 300 personnes dans tous les services.

« L'humanité se trouve actuellement à l'aube de l'AGI », a déclaré DeepSeek dans un communiqué publié sur WeChat. « À mesure que la technologie progresse, nous nous efforçons d'au moins doubler la taille de tous les départements. »

Liang a personnellement contribué à hauteur d'environ 3 milliards de dollars — 200 milliards de yuans — soit environ 40 % du montant total levé, tout en conservant sa participation majoritaire. Le géant d'Internet Tencent et le fabricant de batteries Contemporary Amperex Technology ont participé en tant qu'investisseurs institutionnels, aux côtés du Fonds national chinois d'investissement dans l'industrie de l'intelligence artificielle, signe d'un fort soutien gouvernemental. L'entreprise ouvre immédiatement les candidatures pour 27 types de postes techniques et corporatifs, notamment des ingénieurs de développement, des ingénieurs de données, des chefs de produit IA et du personnel opérationnel, tous les postes étant ouverts aux stagiaires étudiants.

Cette levée de fonds marque un pivot stratégique pour DeepSeek, qui avait fonctionné comme un laboratoire de recherche autofinancé pendant trois ans après l'échec des réunions de Liang avec des investisseurs potentiels en 2023, lorsqu'il leur avait indiqué que l'entreprise n'avait ni feuille de route commerciale ni de produit. Le changement d'approche a été motivé par la pression concurrentielle : Claude Mythos d'Anthropic, dévoilé en avril, a démontré des capacités reposant sur une puissance de calcul et des données massives que Liang a jugées inaccessibles pour DeepSeek sans une base de capital considérablement élargie.

Le compromis des puces Huawei

L'engagement de DeepSeek à adapter ses modèles aux puces domestiques Huawei a eu un coût important. Les systèmes d'entraînement et de déploiement de l'entreprise ont été conçus autour du logiciel CUDA de Nvidia, obligeant les ingénieurs à réécrire les logiciels de bas niveau pour fonctionner efficacement sur du matériel Huawei. Cet effort a entraîné une interruption de 15 mois sans publication de nouveaux modèles — une pause inhabituellement longue à une époque où les plus grands laboratoires lancent de nouveaux modèles tous les deux à trois mois.

Cette interruption a fait manquer à DeepSeek l'essor des outils de codage qui a suivi le lancement de Claude Code par Anthropic au second semestre de l'année dernière. Liang a déclaré aux investisseurs lors de la tournée de levée de fonds que les outils de codage et les chatbots IA sont des étapes temporaires sur la voie de l'intelligence générale artificielle, et que parier massivement sur des produits à court terme détournerait de l'objectif ultime.

Liang estime que les puces Huawei égaleront les performances de Nvidia d'ici quelques années et que DeepSeek devrait achever le travail d'adaptation avant cette échéance. Huawei n'a appris que l'année dernière que DeepSeek testait ses puces en privé, après quoi les deux entreprises ont commencé à travailler directement ensemble.

Gains de parts de marché aux États-Unis

Malgré l'absence de nouveaux modèles, les modèles existants de DeepSeek gagnent du terrain sur le marché américain des développeurs. Son modèle phare V4, publié en avril, a capté 17 % de l'utilisation des tokens sur la plateforme AI Gateway de Vercel en mai, contre moins de 1 % le mois précédent. Cela a fait de DeepSeek le troisième plus grand fournisseur de modèles sur la plateforme, derrière seulement Anthropic et Google.

La variante légère V4 Flash est proposée à un prix 20 à 50 fois inférieur à celui des modèles comparables d'Anthropic, une stratégie de tarification que Liang a déclaré vouloir maintenir. La croissance s'est poursuivie en juin, selon les données de la plateforme.

DeepSeek reste le seul grand laboratoire d'IA à publier entièrement en open source le code sous-jacent de tous ses modèles, une philosophie que Liang a décrite comme essentielle pour empêcher l'IA d'être contrôlée par un petit nombre d'entreprises. La société a mis en place un plan d'actionnariat salarié attribuant des actions à la valorisation de la levée de fonds.

Pour les investisseurs, les implications sont claires. L'expansion agressive de DeepSeek et sa stratégie de prix ultra-bas mettent sous pression les marges des leaders américains de l'IA, notamment OpenAI et Anthropic, tandis que son virage vers les puces domestiques renforce le récit de l'autosuffisance des semi-conducteurs chinois. Nvidia, dont les GPU H100 et Blackwell alimentent la plupart des grands entraînements d'IA, fait face à un risque à long terme si les laboratoires chinois parviennent à se découpler de son écosystème — bien que l'absence de nouveaux modèles pendant 15 mois chez DeepSeek montre la difficulté de cette transition.

Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.