La chaîne d'approvisionnement des puces IA se fracture alors que les coûts amont grimpent de 233 % et que les prix des tokens s'effondrent

L'industrie de l'IA connaît une rare fracture tarifaire structurelle : les coûts matériels en amont explosent tandis que les prix des tokens en aval s'effondrent, les deux tendances s'accélérant au premier semestre 2026.

« La chaîne industrielle de l'IA subit une divergence tarifaire structurelle — les prix des ressources informatiques en amont subissent une inflation tirée par l'offre tandis que les prix de consommation de tokens en aval subissent une déflation concurrentielle », a écrit Zhang Xia, stratège chez China Merchants Securities, dans un rapport du 15 juin.

La divergence est frappante. L'hexafluorure de tungstène, un matériau clé pour la gravure de semi-conducteurs, est monté à 1 670-1 810 yuans le kilogramme, soit une hausse de 232,7 % par rapport à 523 yuans un an plus tôt, après que des fournisseurs sud-coréens ont notifié à Samsung et SK Hynix des augmentations de prix contractuelles de 70 % à 90 % pour 2026. Le stockage, les CPU et les modules optiques prolongent également leur tendance haussière alors que les dépenses d'investissement des hyperscalers s'accélèrent — projetées à 757 milliards de dollars en 2026 et 920 milliards de dollars en 2027, contre 448 milliards de dollars en 2025, selon les estimations du secteur.

La question que se posent désormais les investisseurs : le volume de consommation de tokens en plein essor peut-il compenser suffisamment les baisses de prix pour soutenir la croissance des revenus de l'industrie ?

Les contraintes d'offre alimentent l'inflation en amont

La flambée des prix en amont découle directement d'un déséquilibre entre l'offre et la demande qui ne montre aucun signe d'apaisement. Les dépenses d'investissement des hyperscalers ont plus que quadruplé, passant de 162 milliards de dollars en 2022 à un projet de 757 milliards de dollars en 2026, mais la capacité de production en amont met des années à être mise en service. Samsung et SK Hynix ont tous deux déclaré lors de leurs conférences téléphoniques sur les résultats d'avril-mai 2026 que les pénuries de mémoire liées à l'IA persisteront jusqu'en 2027 et au-delà, les clients principaux verrouillant déjà la capacité pour 2027.

Le plan chinois d'infrastructure de données de 2 000 milliards de yuans, annoncé en janvier 2025, ajoute une couche supplémentaire de demande. Le plan exige qu'au moins 80 % des puces IA proviennent de fournisseurs nationaux tels que Huawei et Cambricon, à l'exclusion de Nvidia et AMD. Sur le total des investissements, environ 780 milliards de yuans — soit 39 % — seront destinés aux puces GPU, ce qui en fait le plus grand bénéficiaire unique. Les équipements d'alimentation et de distribution d'énergie représentent 21 %, soit 420 milliards de yuans, tandis que les modules optiques, les commutateurs et le refroidissement représentent chacun environ 4 %.

Les fabricants de puces nationaux gagnent déjà du terrain. La part de marché des puces IA chinoises a dépassé 52 % au premier semestre 2026, contre 41 % en 2025, dépassant Nvidia pour la première fois. La série Ascend de Huawei a dominé avec 812 000 unités expédiées en 2025, soit près de la moitié de tous les envois de puces nationales, suivie par Pingtouge d'Alibaba avec 265 000 unités, et Baidu Kunlun et Cambricon avec environ 116 000 unités chacun.

La déflation des tokens rencontre le paradoxe de Jevons

En aval, le tableau des prix ne pourrait pas être plus différent. OpenAI envisage d'importantes réductions de prix des tokens pour contrer la tarification agressive d'Anthropic, tandis que Tencent Cloud a déjà réduit ses prix d'entrée de 66,67 %. Claude Fable 5 d'Anthropic, publié le 9 juin, surpasse tous les modèles publics précédents sur les tâches complexes à long contexte, mais est proposé à 10 dollars par million de tokens d'entrée et 50 dollars par million de tokens de sortie — moins de la moitié du coût de son prédécesseur Mythos Preview.

L'indice de dépenses en tokens LLM de Silicon Data, qui suit les dépenses totales du marché en tokens, a enregistré sa première baisse notable depuis février, les entreprises ayant retardé leurs achats en prévision de nouvelles baisses de prix.

Mais la consommation totale explose. Les appels hebdomadaires mondiaux de tokens ont atteint 36 100 milliards au 8 juin, selon les données d'OpenRouter, et continuent de croître de manière exponentielle. En Chine, les utilisateurs d'IA générative sont passés de 249 millions fin 2024 à 515 millions à la mi-2025 — soit environ un doublement — tandis que la consommation quotidienne de tokens est passée d'environ 100 milliards à 1 400 milliards sur la même période, soit une multiplication par 14. L'écart entre la croissance du nombre d'utilisateurs et la croissance de la consommation suggère que le moteur n'est pas les nouveaux utilisateurs mais un engagement plus profond par utilisateur et la pénétration rapide des applications basées sur des agents.

C'est le paradoxe de Jevons en action : à mesure que le coût d'une ressource diminue, la demande totale augmente — souvent suffisamment pour accroître les dépenses totales. Cela s'est produit avec le charbon, l'électricité et la bande passante. La question est de savoir si l'économie des tokens suivra le même schéma.

Implications pour les investissements

Pour les investisseurs, la divergence crée deux opportunités de négociation distinctes. Les fournisseurs de matériel en amont — fabricants de puces, producteurs de mémoire, fabricants de modules optiques et fournisseurs d'équipements électriques — bénéficient de contraintes structurelles d'offre et d'une demande dictée par les politiques qui devraient persister au moins jusqu'en 2027. Le plan d'infrastructure chinois de 2 000 milliards de yuans privilégiant les puces nationales au détriment de Nvidia et AMD est une tendance séculaire pluriannuelle qui redessine la dynamique concurrentielle sur le deuxième marché de l'IA au monde.

En aval, le tableau est plus nuancé. Les entreprises capables de capter le volume explosif de tokens — les fournisseurs de modèles comme DeepSeek et Hunyuan de Tencent, qui figurent parmi les modèles les plus sollicités au monde — peuvent compenser la compression des prix par l'échelle. Les modèles open source représentent désormais près d'un tiers de l'utilisation totale des tokens, les développeurs substituant DeepSeek et Qwen d'Alibaba à certaines API propriétaires.

Les secteurs de l'énergie et du stockage d'énergie apparaissent également comme des bénéficiaires indirects. Les centres de données IA en Chine ont consommé 196 milliards de kilowattheures en 2025, et l'Administration nationale de l'énergie prévoit que ce chiffre atteindra 800 milliards de kilowattheures d'ici 2030, soit environ 6 % de la consommation totale d'électricité du pays. La capacité installée de stockage d'énergie a atteint 136 millions de kilowatts fin 2025, en hausse de 84 % sur un an, l'infrastructure IA devenant un nouveau moteur significatif de la demande.

Le risque clé est de savoir si la croissance de la demande de tokens en aval peut maintenir sa trajectoire exponentielle. Si le paradoxe de Jevons se vérifie, les revenus totaux de l'industrie augmentent. Si les baisses de prix dépassent la croissance du volume, les marges des couches applicatives subissent une pression soutenue. Les deux prochains trimestres de résultats des hyperscalers fourniront le premier véritable test.

Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.