OpenAI et Broadcom dévoilent la puce Jalapeño, réduisant les coûts d'inférence de 50 %

La première puce sur mesure d'OpenAI, co-développée avec Broadcom en neuf mois, promet de réduire de moitié les coûts d'inférence et de diminuer la dépendance aux GPU Nvidia.

OpenAI et Broadcom ont dévoilé Jalapeño, une puce d'inférence personnalisée dont le PDG de Broadcom affirme qu'elle réduit les coûts d'environ 50 %, menaçant ainsi la domination de Nvidia dans le secteur des puces IA.

« En concevant davantage de la pile nous-mêmes, nous pouvons fournir plus d'intelligence avec une plus grande efficacité », a déclaré Greg Brockman, président et cofondateur d'OpenAI, dans un communiqué. « Jalapeño fait partie de notre stratégie d'infrastructure full-stack à long terme visant à rendre le calcul plus abondant. »

La puce, développée de la conception initiale au tape-out en neuf mois, est une architecture entièrement nouvelle dédiée à l'inférence de grands modèles de langage, et non une adaptation d'accélérateurs IA antérieurs. Des échantillons d'ingénierie font déjà fonctionner GPT-5.3-Codex-Spark à la fréquence et à la puissance cibles de production, et les premiers tests montrent des performances par watt « substantiellement supérieures » à celles des puces les plus avancées actuellement, selon OpenAI. L'action Broadcom a bondi d'environ 2 % après l'annonce, avant de reculer d'environ 3 % dans le sillage du repli général du secteur des semi-conducteurs.

Ce partenariat marque un tournant stratégique pour OpenAI, qui figure parmi les plus gros acheteurs de GPU Nvidia depuis le début du boom de l'IA générative en 2022. En concevant son propre silicium, OpenAI vise à réduire ses coûts d'approvisionnement à un moment où la demande en calcul d'inférence explose. Le déploiement initial des systèmes basés sur Jalapeño est attendu d'ici fin 2026, avec des projets de passage à l'échelle de centres de données de niveau gigawatt aux côtés de Microsoft et d'autres partenaires.

Jalapeño est un circuit intégré spécifique à une application (ASIC), conçu spécifiquement pour l'inférence de LLM. Contrairement aux processeurs graphiques polyvalents de Nvidia, qui gèrent à la fois l'entraînement et l'inférence sur diverses charges de travail, un ASIC sacrifie la flexibilité au profit de l'efficacité sur des tâches ciblées. OpenAI indique que l'architecture réduit les mouvements de données et équilibre les ressources de calcul, de mémoire et de réseau pour atteindre une utilisation « beaucoup plus proche des performances théoriques de pointe ». Broadcom a apporté son silicium réseau Tomahawk et son expertise en implémentation de puces, tandis que Celestica a assuré l'intégration des cartes, des baies et des systèmes.

La puce est la première d'une plateforme de calcul plurigénérationnelle planifiée. OpenAI a également conclu des accords avec Amazon Web Services pour les puces Trainium, ainsi qu'avec Advanced Micro Devices et Cerebras, dans le cadre d'une stratégie délibérée de diversification vis-à-vis de Nvidia. L'entreprise a indiqué que le cycle de développement de neuf mois pourrait être le développement d'ASIC le plus rapide jamais réalisé dans le domaine des semi-conducteurs haute performance, accéléré en partie par les propres modèles d'OpenAI qui ont contribué à concevoir et optimiser la puce.

Pour les investisseurs, les implications sont à double tranchant. Broadcom, dont l'action a été multipliée par près de sept depuis fin 2022, décroche un client de puces sur mesure à volume élevé en OpenAI, diversifiant ainsi ses revenus IA au-delà de la mise en réseau. Nvidia, qui domine le marché des puces IA avec ses GPU, voit l'un de ses plus gros clients construire une alternative pour l'inférence — le segment à la croissance la plus rapide du calcul IA. OpenAI n'a divulgué ni le coût total du programme ni le prix unitaire de la puce, mais Hock Tan, PDG de Broadcom, a décrit la collaboration comme « le simple début d'une feuille de route plurigénérationnelle » permettant des déploiements de centres de données à l'échelle du gigawatt à partir de 2026.

Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.