La IA de código abierto reduce la brecha a 3 meses: 4 modelos redefinen 2026

Los modelos de IA de código abierto han reducido la brecha de capacidades con los sistemas frontera de código cerrado a apenas tres meses, según un análisis de junio de 2026 de OpenRouter, que señala que cuatro modelos ya compiten con las ofertas de OpenAI y Anthropic a una fracción del costo.

"La brecha entre modelos abiertos y cerrados se ha estabilizado entre 3 y 6 meses durante los últimos 18 meses, y no hay señales de que los laboratorios de código cerrado estén tomando distancia", escribió OpenRouter en su informe, que identificó los cuatro lanzamientos de pesos abiertos más relevantes de 2026.

DeepSeek V4 Flash lidera en eficiencia de costos. El modelo de mezcla de expertos de 284 mil millones de parámetros, lanzado en abril bajo licencia MIT, obtiene un 79% en SWE-bench Verified — a menos de 1.6 puntos de su variante Pro — mientras fija el precio de salida en 28 centavos por millón de tokens, aproximadamente 1/150 del costo de GPT-5.5 de OpenAI. GLM 5.2, lanzado a mediados de junio por la china Z.ai, encabeza la clasificación de código abierto en el Índice de Inteligencia de Artificial Analysis con una puntuación de 51, superado por apenas 5 puntos por el ahora prohibido Fable 5 de Anthropic. El modelo de 744 mil millones de parámetros, entrenado íntegramente en 100.000 chips Huawei Ascend 910B sin hardware de Nvidia, obtuvo 62.1 en SWE-bench Pro, superando el 58.6 de GPT-5.5.

La convergencia tiene implicaciones directas para la inversión. Las empresas que migren flujos de trabajo de programación y agentes desde APIs cerradas a modelos de pesos abiertos pueden reducir los costos de inferencia entre 50 y 150 veces, según las comparaciones de precios de OpenRouter. Esta dinámica amenaza el poder de fijación de precios de OpenAI y Anthropic, mientras beneficia a los proveedores de infraestructura que respaldan despliegues autogestionados — y plantea interrogantes sobre el valor estratégico de los controles de exportación estadounidenses, dado que GLM 5.2 llegó la misma semana en que Washington ordenó a Anthropic restringir el acceso a Fable 5 para ciudadanos extranjeros.

OpenRouter descubrió que DeepSeek V4 Flash se ha convertido en el primer modelo de pesos abiertos que los desarrolladores integran de forma rutinaria directamente en flujos de trabajo de agentes como sustituto directo de los sistemas de Anthropic u OpenAI. Su variante Flash conserva la mayor parte de la capacidad de programación de la versión Pro — 79% frente a 80.6% en SWE-bench Verified — mientras reduce el costo de salida de GPT-5.5 por un factor de 150. DeepSeek hizo permanente en mayo su precio con descuento, consolidando una guerra de precios en el nivel de inteligencia frontera. La contrapartida: el modelo requiere instrucciones inusualmente específicas y tiene un rendimiento deficiente en escritura creativa y control de tono, lo que limita su uso en tareas de generación de contenido.

La llegada de GLM 5.2 tuvo un peso geopolítico. El Departamento de Comercio de EE. UU. ordenó el 12 de junio a Anthropic deshabilitar Fable 5 y Mythos 5 para todos los ciudadanos extranjeros, citando una vulnerabilidad de jailbreak que Anthropic cuestionó. Z.ai lanzó GLM 5.2 bajo licencia MIT cinco días después, ofreciendo a los desarrolladores de todo el mundo un modelo que podían descargar y alojar ellos mismos — inmune a cualquier futura orden de exportación. En Code Arena, la clasificación estilo Elo basada en votos humanos ciegos, GLM 5.2 ocupó el segundo lugar general con 1,595 puntos, primero entre todos los modelos actualmente disponibles desde la eliminación de Fable 5. En Design Arena, obtuvo el primer puesto absoluto. Las brechas que persisten se encuentran en los puntos de referencia de razonamiento más difíciles: en ARC-AGI-2, que evalúa el razonamiento fluido resistente a la contaminación de datos, el mejor modelo chino obtiene un 11.8%, muy por debajo de los principales laboratorios estadounidenses.

MiniMax M3 ocupa un nicho diferente. Es el único modelo entre los cuatro que comprende de forma nativa texto, imágenes, gráficos y video, lo que lo convierte en la opción predeterminada para flujos de trabajo de agentes que requieren lectura de pantalla, automatización de interfaz de usuario o análisis de documentos visuales. Obtiene 44 puntos en el Índice de Inteligencia, igualando a DeepSeek V4 Pro, y aproximadamente iguala a Claude Sonnet 4.6 en tareas de agentes del mundo real. Su precio — 9.8 centavos por millón de tokens de entrada y $1.21 por salida — es inferior al de Gemini Flash de Google en cargas de trabajo multimodales, aunque su licencia comunitaria requiere atribución para uso comercial y autorización por escrito para productos a gran escala.

Nemotron 3 Ultra de NVIDIA representa el contrapeso empresarial estadounidense. El modelo híbrido Mamba-2 y Transformer de 550 mil millones de parámetros, con 48 puntos en el Índice de Inteligencia, va por detrás de GLM 5.2 en puntos de referencia brutos, pero ofrece una eficiencia de despliegue superior en la propia pila de hardware de Nvidia. Nvidia publicó como código abierto no solo los pesos del modelo, sino también los datos de entrenamiento, la receta, las herramientas de evaluación y la infraestructura de aprendizaje por refuerzo bajo la licencia OpenMDW — una estrategia diseñada para impulsar la demanda de sus chips y su ecosistema de software. La precisión NVFP4 del modelo y su soporte de predicción multitoken lo convierten en la opción más práctica para empresas que priorizan la velocidad de despliegue, el control de datos y la estabilidad del proveedor por encima de las puntuaciones máximas en los puntos de referencia.

Para los inversores, la convergencia del código abierto crea una apuesta de doble filo. Empresas como Nvidia se benefician indirectamente, ya que la adopción de pesos abiertos impulsa la demanda de hardware de inferencia — Nemotron es tanto un vehículo de ventas para la pila de IA de Nvidia como un producto independiente. Pero el colapso de precios amenaza los modelos de ingresos de los proveedores de API cerradas: OpenAI y Anthropic enfrentan presión para justificar precios elevados cuando las alternativas abiertas ofrecen un rendimiento de programación comparable a 1/150 del costo. Microsoft, que aloja los modelos de OpenAI en Azure, podría capturar una demanda compensatoria si las empresas que migran a modelos de pesos abiertos eligen Azure para infraestructura gestionada. El riesgo clave: los modelos de código abierto no superan las pruebas empresariales de seguridad y cumplimiento en producción, lo que ralentiza la adopción y preserva el poder de fijación de precios del código cerrado.

Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.