El primer chip personalizado de OpenAI, codesarrollado con Broadcom en nueve meses, promete reducir a la mitad los costos de inferencia y disminuir la dependencia de las GPU de Nvidia.
OpenAI y Broadcom presentaron Jalapeño, un chip de inferencia personalizado que, según el director ejecutivo de Broadcom, reduce los costos aproximadamente un 50%, amenazando el dominio de Nvidia en el silicio para IA.
"Al diseñar más partes de la pila nosotros mismos, podemos ofrecer más inteligencia con mayor eficiencia", declaró Greg Brockman, presidente y cofundador de OpenAI, en un comunicado. "Jalapeño es parte de nuestra estrategia de infraestructura integral a largo plazo para hacer que la capacidad computacional sea más abundante".
El chip, desarrollado desde el diseño inicial hasta la fabricación en nueve meses, es una arquitectura creada desde cero para la inferencia de modelos de lenguaje grandes, no una adaptación de aceleradores de IA anteriores. Las muestras de ingeniería ya están ejecutando GPT-5.3-Codex-Spark a la frecuencia y potencia objetivo de producción, y las pruebas iniciales muestran un rendimiento por vatio "sustancialmente mejor" que los chips actuales de última generación, según OpenAI. Las acciones de Broadcom subieron aproximadamente un 2% tras el anuncio, aunque posteriormente cayeron alrededor de un 3% debido al descenso del sector de semiconductores en general.
La asociación marca un cambio estratégico para OpenAI, que ha sido uno de los mayores compradores de GPU de Nvidia desde que comenzó el auge de la IA generativa en 2022. Al diseñar su propio silicio, OpenAI busca reducir los costos de adquisición en un momento en que la demanda de cómputo de inferencia se dispara. Se espera el despliegue inicial de sistemas basados en Jalapeño para finales de 2026, con planes de escalar a centros de datos de nivel de gigavatios junto con Microsoft y otros socios.
Jalapeño es un circuito integrado de aplicación específica (ASIC), diseñado exclusivamente para la inferencia de LLM. A diferencia de las unidades de procesamiento gráfico de propósito general de Nvidia, que manejan entrenamiento e inferencia en diversas cargas de trabajo, un ASIC sacrifica flexibilidad por eficiencia en tareas específicas. OpenAI indicó que la arquitectura reduce el movimiento de datos y equilibra los recursos de cómputo, memoria y redes para lograr una utilización "mucho más cercana al rendimiento máximo teórico". Broadcom aportó su silicio de red Tomahawk y su experiencia en implementación de chips, mientras que Celestica se encargó de la integración de placas, bastidores y sistemas.
El chip es el primero de una plataforma de cómputo planificada para múltiples generaciones. OpenAI también ha cerrado acuerdos con Amazon Web Services para los chips Trainium, así como con Advanced Micro Devices y Cerebras, como parte de una estrategia deliberada para diversificarse y reducir su dependencia de Nvidia. La compañía señaló que el ciclo de desarrollo de nueve meses podría ser el desarrollo de ASIC más rápido jamás logrado en semiconductores de alto rendimiento, acelerado en parte por los propios modelos de OpenAI que ayudaron a diseñar y optimizar el chip.
Para los inversores, las implicaciones son de doble filo. Broadcom, cuyas acciones se han multiplicado casi siete veces desde finales de 2022, asegura en OpenAI un cliente de chips personalizados de alto volumen, diversificando sus ingresos de IA más allá de las redes. Nvidia, que ha dominado el mercado de chips de IA con sus GPU, enfrenta a uno de sus mayores clientes construyendo una alternativa para la inferencia, el segmento de más rápido crecimiento del cómputo de IA. OpenAI no reveló el costo total del programa ni el precio por chip, pero Hock Tan, director ejecutivo de Broadcom, describió la colaboración como "solo el comienzo de una hoja de ruta de múltiples generaciones" que permitirá despliegues de centros de datos a escala de gigavatios a partir de 2026.
Este artículo tiene fines exclusivamente informativos y no constituye asesoramiento de inversión.