El competidor chino de IA DeepSeek está utilizando sus eficiencias técnicas como arma para orquestar una jugada estratégica a largo plazo contra el mercado actual de hardware de IA, comenzando con un recorte de precio permanente del 75% en su modelo estrella.
La startup china de IA DeepSeek está aprovechando una valoración previa reportada de 45.000 millones de dólares de una nueva ronda de financiación de 70.000 millones de yuanes para recortar permanentemente los precios de su modelo insignia V4-Pro en un 75 por ciento, un movimiento estratégico diseñado para socavar a sus competidores y reducir la dependencia del hardware occidental de alta gama.
"Nuestro principio no es perder dinero, pero tampoco obtener beneficios excesivos", dijo el fundador de DeepSeek, Liang Wenfeng, hace dos años, una filosofía que ahora se materializa a medida que las eficiencias técnicas de la empresa en áreas como la caché KV (Key-Value Cache) permiten una estructura de costes drásticamente más baja.
El precio de la API V4-Pro se fijará ahora de forma permanente en su tarifa promocional, entre 0,025 y 6 yuanes por millón de tokens (aproximadamente entre 0,0035 y 0,83 dólares), frente a un máximo de 24 yuanes, anunció la empresa el sábado. Esto es posible gracias a innovaciones que reducen los requisitos de memoria HBM de la caché KV a solo 5,48 GB para un contexto de 1 millón de tokens, una fracción de los 60 GB que requieren algunos modelos rivales.
La estrategia de DeepSeek va más allá de las guerras de precios de las API, con el objetivo de reconfigurar una cadena de suministro de hardware estimada en 10 billones de dólares. Al optimizar sus modelos para memoria LPDDR y SSD más económicos, la empresa está creando un camino viable para que los chips nacionales chinos compitan con líderes como Nvidia, capturando potencialmente una parte significativa del mercado de hardware que ayuda a crear.
El tablero de ajedrez del hardware
La agresiva fijación de precios de DeepSeek es consecuencia directa de una serie de profundas innovaciones técnicas diseñadas para minimizar los costes de hardware. El núcleo de esta estrategia reside en reducir drásticamente la caché Key-Value (KV), el componente que consume mucha memoria de los grandes modelos de lenguaje. Al reducir la huella de la caché KV del modelo V4 a menos de una décima parte de la de sus competidores, DeepSeek puede descargar estos datos de la costosa memoria de alto ancho de banda (HBM) a SSD y almacenamiento flash NAND más comunes.
Esta eficiencia crea un efecto dominó en toda la pila de hardware. Investigaciones del equipo de SGLang muestran que la memoria LPDDR, que es significativamente más barata que la HBM, puede servir como una "zona de almacenamiento temporal de pesos" para transmitir parámetros del modelo según sea necesario, un método para el cual la arquitectura Mixture-of-Experts (MoE) de DeepSeek es idónea. Este enfoque sustituye eficazmente la costosa memoria GPU de alto rendimiento por mayores cantidades de memoria de sistema más barata. Para la industria de chips nacional de China, que se enfrenta a limitaciones en la producción de GPU de vanguardia debido a las restricciones de litografía EUV, este es un avance crítico. Permite que los procesadores menos potentes sigan siendo competitivos al combinarlos con más memoria, una estrategia de "cambio de carril" para evitar los déficits de potencia de cálculo pura.
Además, DeepSeek ha invertido en TileLang, un marco de compilador para múltiples plataformas de hardware. Esta capa de software pretende abstraer las diferencias de hardware, permitiendo que el código de IA se ejecute en varias plataformas y eludiendo el poderoso "foso de CUDA" que bloquea a muchos desarrolladores en el hardware de Nvidia.
El camino hacia la AGI
Si bien el efecto inmediato es una disrupción en el mercado de hardware de IA, el fundador Liang Wenfeng ha afirmado que el objetivo final es la búsqueda de la Inteligencia Artificial General (AGI), según informes de una reciente reunión con inversores. La estrategia de eficiencia de hardware es la base necesaria para este objetivo a largo plazo.
Lograr la AGI probablemente requerirá un entrenamiento a escala masiva, particularmente utilizando técnicas como el Aprendizaje por Refuerzo (RL) y la Automejora Recursiva (RSI), donde una IA aprende y se perfecciona a sí misma mediante el ensayo y error. Estos métodos son astronómicamente costosos en términos de computación, y exigen la generación de billones de tokens y un vasto modelado de escenarios hipotéticos. Al reducir el coste fundamental de la computación, DeepSeek hace que estas ejecuciones de entrenamiento, antes inasequibles, sean económicamente viables. Cada innovación, desde los modelos MoE hasta la compresión de la caché KV, converge en el objetivo único de hacer que el entrenamiento de la AGI sea lo suficientemente asequible como para perseguirlo.
Esto hace que la estrategia de recaudación de fondos y fijación de precios de DeepSeek aparezca bajo una nueva luz. La empresa no se limita a vender acceso a la API; está construyendo una coalición de socios de hardware e inversores, incluidos CATL y fondos afiliados al estado, para construir una cadena de suministro de IA autosuficiente. Para los inversores, la apuesta no es por una empresa de software, sino por una pieza estratégica clave que podría remodelar el equilibrio de poder global en IA al cambiar fundamentalmente la ecuación económica de quién puede permitirse construirla. Esto posiciona a DeepSeek como un competidor directo no solo de otros laboratorios de IA, sino de todo el ecosistema de hardware, incluido Nvidia, que sustenta el actual auge de la IA.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.