Les prix des serveurs GPU Nvidia fluctuent comme un marché de matières premières, les coûts des composants variant jusqu'à 40 % en une seule semaine.
Les coûts des composants des serveurs GPU Nvidia fluctuent jusqu'à 40 % en une seule semaine, forçant les fournisseurs de cloud Nebius et Amazon Web Services à augmenter leurs tarifs de location de près de 30 %, alors que le marché des infrastructures d'IA fait face à une nouvelle ère de volatilité des prix.
« Tout peut changer complètement en deux à trois semaines — vous ne pouvez tout simplement pas prévoir les prix, vous ne pouvez les verrouiller que dans une fenêtre extrêmement étroite », a déclaré à The Information une personne qui vend des serveurs Nvidia à des fournisseurs de cloud. La source a indiqué que les coûts des plaques de silicium produites par Taiwan Semiconductor Manufacturing Co., du co-encapsulage, du réseau, du refroidissement et — surtout — des composants mémoire sont tous sujets à des fluctuations soudaines.
Un seul rack Grace Blackwell 300, équipé de 72 systèmes de puces à 70 000 dollars chacun, coûte désormais environ 5 millions de dollars. Le futur rack Vera Rubin devrait atteindre environ 7 millions de dollars, selon un cadre client impliqué dans les achats. Les coûts des racks GB300 sont actuellement de 10 % à 15 % au-dessus de la base, avec des augmentations mensuelles se stabilisant autour de 1 % après des périodes plus volatiles plus tôt cette année.
La volatilité transforme le marché des infrastructures d'IA. La tarification de la location de GPU se comporte de plus en plus comme une commodité — liée à l'offre et à la demande plutôt qu'à des contrats fixes — les petits développeurs d'IA en subissant le poids fort, car les fournisseurs de cloud privilégient les grands clients. Nebius a augmenté ses prix de calcul à la demande de 30 % le 1er juin, et Amazon Web Services augmentera les prix des blocs de capacité EC2 d'environ 20 % à compter du 1er juillet.
Le pouvoir de fixation des prix de Nvidia s'accroît alors que ses marges augmentent
La domination de Nvidia sur le marché des puces IA lui confère un levier de tarification extraordinaire. Les marges brutes de l'entreprise ont augmenté de 15 à 20 points de pourcentage au cours des dernières années, reflétant sa capacité à exiger des prix élevés. Un porte-parole de Nvidia a déclaré que la tarification des racks de serveurs dépend des coûts des composants et que l'entreprise travaille en collaboration avec les fournisseurs de serveurs, les prix variant selon les fournisseurs.
Les fabricants de puces mémoire, menés par Micron Technology Inc., exercent une pression tarifaire similaire sur Nvidia et d'autres clients, faisant grimper les coûts sur l'ensemble des produits, des Mac d'Apple aux GPU Nvidia. Cette dynamique illustre comment des chaînes d'approvisionnement concentrées amplifient la volatilité des coûts à travers l'ensemble de la pile.
Les petits développeurs d'IA subissent une pression
La pression sur les prix touche le plus durement les petits développeurs d'IA qui dépendent de la location de GPU à la demande plutôt que de contrats à long terme. Les fournisseurs de cloud testent jusqu'où le marché peut supporter la pénurie actuelle, et certains allouent d'abord les ressources serveurs rares aux grands clients.
Carmen Li, directrice générale de Silicon Data, un fournisseur de données tarifaires, a déclaré que les prix de location des GPU commencent à présenter les mêmes caractéristiques d'offre et de demande que les marchés pétroliers. Les prix de location des puces Blackwell 200 ont augmenté d'environ 20 % depuis le début de l'année, tandis que les puces Nvidia plus anciennes ont connu des augmentations cumulées de plus de 20 % au cours de l'année écoulée avant de se stabiliser au cours des 30 derniers jours.
Un développeur de modèles d'IA a indiqué que les prix avaient doublé sur une période d'un à deux mois avant de reculer au cours des deux dernières semaines — un signe que le marché cherche encore son équilibre. Le nombre de fournisseurs de cloud GPU a explosé, mais la transparence des prix reste faible, la plupart des fournisseurs refusant de publier leurs tarifs réels.
Un investisseur dans un fournisseur de cloud GPU a reconnu le risque : « Pour nos clients principaux, il y a un point de bascule — une fois que l'économie cesse de fonctionner, leur activité n'est plus viable, et nous ne voulons absolument pas franchir cette ligne. »
Les actions Nvidia, qui se négocient à environ 35 fois les bénéfices prévisionnels, ont bénéficié du discours sur le pouvoir de fixation des prix. Mais la hausse du coût des infrastructures d'IA soulève une question fondamentale pour le secteur : à quel moment les coûts de calcul commencent-ils à contraindre l'économie des applications d'IA elles-mêmes ? Pour l'instant, la réponse dépend de quel côté de la chaîne d'approvisionnement on se trouve.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.