Está surgiendo un nuevo mercado intermediario para las API de modelos de IA, impulsado por un aumento de 1,000 veces en el volumen diario de llamadas de tokens en China a más de 140 billones, creando una red de "venta al por mayor a minorista" para la inteligencia artificial.
La comercialización de la inteligencia artificial está creando una nueva clase de intermediarios, una capa de distribución donde las unidades básicas de inteligencia artificial se compran, enrutan y revenden como una mercancía. Este mercado de la "tokenomics" está siendo impulsado por una explosión de más de 1,000 veces en las llamadas diarias a las API de modelos de IA en China, que pasaron de 100,000 millones a principios de 2024 a más de 140 billones en marzo de 2026, según un informe de Huayuan Securities. Esta nueva capa conecta a los creadores de modelos upstream, como ByteDance y Alibaba, con un ecosistema downstream fragmentado de desarrolladores y empresas, creando una infraestructura de liquidez para el flujo global de tokens de IA.
"La operación de tokens está formando un nuevo mercado intermediario, explorando un modelo de distribución de tokens que conecta a los fabricantes de grandes modelos upstream con desarrolladores, empresas e individuos downstream. Es esencialmente una infraestructura de liquidez para la red global de tokens de venta al por mayor a minorista", afirmó el analista de Huayuan Securities, Chen Liangdong, en el informe.
El crecimiento se ve alimentado por la escala masiva del consumo de IA y la creciente competitividad de los modelos chinos. En el primer trimestre de 2026, los modelos chinos superaron a sus homólogos estadounidenses en volumen de llamadas semanales en OpenRouter, una popular plataforma de enrutamiento, por primera vez. Entre el 16 y el 22 de febrero, los modelos chinos representaron cuatro de los cinco modelos principales por volumen de llamadas, contribuyendo con el 85.7% del total. Plataformas como OpenRouter, cuyos ingresos anualizados se han quintuplicado hasta superar los 50 millones de dólares desde octubre de 2025, y la local Silicon Mobility (硅基流动) están construyendo la infraestructura central para este comercio, ofreciendo API unificadas que permiten a los desarrolladores acceder a cientos de modelos diferentes a través de una sola clave.
Esta nueva economía de tokens refleja la evolución de otras capas tecnológicas, desde la computación en la nube hasta los pagos con criptomonedas, donde la infraestructura y la distribución acaban capturando un valor significativo. A medida que la carrera de la IA pasa del proceso de entrenamiento de modelos, que requiere mucho capital, al desafío operativo de ejecutarlos para miles de millones de usuarios (un proceso conocido como inferencia), la nueva ventaja competitiva se convierte en el coste por respuesta. Con modelos chinos como el M2.5 de MiniMax, que ofrece costes de entrada de solo 0.30 dólares por millón de tokens, en comparación con los 5 dólares de un modelo como Claude 4.6, el incentivo económico para enrutar las cargas de trabajo de forma eficiente está creando una oportunidad de miles de millones de dólares para estos nuevos agentes de IA.
La capa de utilidad para la inteligencia
El negocio de la distribución de tokens no consiste simplemente en revender el acceso a la API con un margen de beneficio. Aunque un margen de reventa base, como la prima del 5.5% de OpenRouter, proporciona un modelo de negocio fundamental, el verdadero valor se está creando más arriba en la cadena. Los actores más sofisticados están desarrollando motores de aceleración de inferencia propios para reducir el coste real de ejecución de un modelo. Silicon Mobility, por ejemplo, afirma que sus tecnologías SiliconLLM y OneDiff pueden mejorar la velocidad de inferencia de los modelos de lenguaje en 10 veces, lo que le permite ofrecer llamadas API a lo que, según dice, es una décima parte del coste estándar del sector.
Este enfoque en la economía unitaria de la inferencia es fundamental a medida que la industria avanza hacia la "IA agéntica" (agentic AI): sistemas autónomos y siempre activos que podrían ser entre 60 y 130 veces más intensivos en energía que las herramientas de IA actuales, según una investigación de Goldman Sachs. Estos agentes, que se encargarán de tareas que van desde los flujos de trabajo empresariales hasta la gestión de dispositivos inteligentes, impulsarán un consumo persistente de tokens de IA similar al de un servicio público. Las plataformas que puedan enrutar, medir y facturar de forma fiable y barata este consumo se están posicionando como las utilidades esenciales para la economía de la IA. Esto es paralelo a la batalla por la infraestructura en las criptomonedas, donde empresas como Circle y Coinbase compiten no solo por la emisión de una stablecoin, sino por la construcción de los raíles de pago y liquidación (como Arc y Base) que controlan su flujo.
Riesgos y recompensas en la cadena de suministro de la IA
Para los inversores, la aparición de esta capa de distribución de tokens abre nuevas vías más allá de simplemente respaldar a los creadores de modelos de alto perfil. El informe Huayuan identifica dos tesis de inversión principales: respaldar a las empresas con capacidades de modelo superiores como Alibaba, Tencent y ByteDance, y respaldar a las empresas con sólidas relaciones con los clientes y escenarios de alto consumo, especialmente en marketing, juegos y comercio electrónico. Empresas como yodo (易点天下) y BlueFocus (蓝色光标) destacan por su potencial para integrar servicios de IA basados en tokens directamente en los flujos de trabajo de sus clientes actuales.
Sin embargo, el modelo no está exento de riesgos. La baja barrera técnica de entrada para la reventa básica de API invita a una competencia intensa, que puede comprimir los márgenes. Los distribuidores también se enfrentan a importantes presiones de capital, ya que a menudo necesitan precomprar capacidad a los proveedores de modelos mientras ofrecen condiciones de pago más flexibles a los clientes downstream, lo que genera una exposición a deudas incobrables. El riesgo más importante es la dependencia de los proveedores de modelos upstream, que controlan los precios y el acceso. Un cambio repentino de política por parte de un proveedor importante podría socavar instantáneamente el negocio de un distribuidor, convirtiéndolo en un segmento de alto crecimiento pero potencialmente volátil de la cadena de valor de la IA.
Este artículo tiene únicamente fines informativos y no constituye asesoramiento de inversión.