Trump y el porqué de las restricciones de chips

- Esteve Almirall
- Barcelona. Jueves, 13 de febrero de 2025. 05:30
- Tiempo de lectura: 4 minutos
En las últimas semanas, hemos sido testigos del terremoto tecnológico que ha supuesto DeepSeek. Una de sus múltiples consecuencias ha sido la migración del modelo a los procesadores Huawei Ascend 910B. Aunque estos no alcanzan el nivel de los de Nvidia, han logrado una reducción de costes del 70%, con solo una pérdida de rendimiento del 5%. Este avance no ha pasado desapercibido.
Rápidamente, algunas plataformas cloud chinas, como siliconflow.cn, han empezado a ofrecer el modelo a precios increíblemente bajos: 0,72 dólares por millón de tokens de entrada y 2,3 dólares por millón de tokens de salida. Si te preguntas por qué el coste de los tokens de salida es mucho mayor, la respuesta es técnica: mientras que los tokens de entrada pueden procesarse en paralelo, los de salida no, lo que incrementa los tiempos y, por ende, los costes.
Este desarrollo nos lleva a una cuestión central que se ha discutido durante años: ¿son realmente efectivas las restricciones a la venta de chips o, por el contrario, terminan siendo contraproducentes?
Restricciones que impulsan la innovación
El caso de los chips Ascend 910B nos muestra un efecto paradójico. Sin las restricciones impuestas por Estados Unidos, probablemente estos procesadores no habrían sido desarrollados. Por un lado, hasta hace poco el diseño de chips no era una prioridad estratégica para el gobierno chino. Por otro lado, es difícil controlar completamente el acceso a tecnología avanzada: las empresas pueden recurrir a terceros países o alquilar tiempo de procesamiento en plataformas globales, como Oracle.
De hecho, ByteDance (la empresa matriz de TikTok) es actualmente el mayor consumidor de tiempo de computación en plataformas cloud de IA, más que cualquier otro cliente. Este incremento en la demanda, paradójicamente, ha sido provocado en gran parte por las restricciones.
Sin embargo, estas sanciones tienen efectos colaterales. La reciente ampliación de restricciones de la administración Trump, tras el éxito de DeepSeek, ha incluido a países aliados como Portugal o Singapur, algo que parece carente de lógica estratégica. Esto podría frenar sus capacidades en IA generativa. Además, las restricciones afectan negativamente a los beneficios de los fabricantes de chips, como Nvidia, y a toda su cadena de suministro.
¿Qué busca Trump con estas restricciones?
Ante la evidencia de su limitada efectividad, es legítimo preguntarnos por qué estas medidas siguen en pie. A primera vista, podríamos atribuirlas al populismo de Trump, que utiliza tácticas como “castigar al adversario” para generar impacto político inmediato. Sin embargo, el equipo asesor de Trump es muy competente y sus decisiones suelen tener una lógica más profunda, aunque a menudo queden camufladas tras titulares estridentes.
Una posibilidad es que el verdadero objetivo sea ralentizar el desarrollo de la IA generativa en China. Sin embargo, el éxito de DeepSeek parece contradecir este planteamiento: entrenar su modelo ha costado alrededor de 5,5 millones de dólares, muy por debajo de los 200 millones que costó GPT-4. Eso sí, conviene recordar que el contexto ha cambiado: las tecnologías han mejorado y los objetivos actuales son distintos.
Entonces, ¿cuál podría ser el razonamiento detrás de estas restricciones?
Del pre-training al post-training
La clave puede estar en cómo ha evolucionado el uso de GPUs en el desarrollo de IA. Tradicionalmente, gran parte del consumo de recursos se destinaba al pre-training, es decir, al entrenamiento inicial del modelo utilizando todos los datos disponibles. Sin embargo, este proceso ha alcanzado cierto grado de eficiencia: la cantidad de datos útiles está prácticamente agotada y los modelos actuales requieren menos GPU para esta fase.
Ahora, la acción se ha desplazado hacia el post-training, que consiste en ajustar las respuestas del modelo mediante técnicas avanzadas de aprendizaje por refuerzo (Reinforcement Learning). Esta fase es muy intensiva en recursos y aventuramos que debido a su desarrollo lo sea aún más en el futuro.
Las sanciones probablemente reducirán el desarrollo de GPUs de alto rendimiento en China. Sin embargo, ¿es eso suficiente para explicarlas?
De hecho, lejos de reducirse, el consumo de GPUs se disparará en los próximos años. Actualmente, el mayor centro de IA del mundo es el de xAI (fundado por Elon Musk) en Minnesota, con 100.000 Nvidia H100. Sin embargo, ya se han anunciado centros con 200.000, 600.000 e incluso se proyectan instalaciones con un millón de tarjetas, incluyendo alternativas como las TPUs de Google, los chips Trainium de AWS o Maia de Microsoft.
De todas formas, este argumento abundaría en la idea de que una restricción por parte del gobierno americano forzará a China al desarrollo de procesadores propios.
Los chips no son software
El desarrollo de microprocesadores es significativamente más complicado que el de software. Mientras que las técnicas más avanzadas de IA generativa están ampliamente documentadas en publicaciones científicas, artículos de arXiv o incluso vídeos de YouTube, la ingeniería de chips es un mundo mucho más cerrado. La experiencia y el conocimiento necesarios para diseñar hardware de alto rendimiento solo se adquieren tras décadas de especialización en la propia industria.
Tenemos aquí una primera explicación, las sanciones si reducirán efectivamente el desarrollo de GPUs de alto rendimiento en China. ¿Es esto suficiente para explicarlas?
El plazo como factor estratégico
En condiciones normales, podríamos asumir que, en un plazo de diez años, China será capaz de alcanzar desarrollos tecnológicos equivalentes a los de Occidente. Con técnicas de programación a bajo nivel, como las aplicadas por DeepSeek, es factible que logren optimizar el rendimiento de sus procesadores hasta un punto en el que las sanciones pierdan relevancia estratégica.
Sin embargo, consideremos un enfoque más amplio, uno que tenga en cuenta el ecosistema tecnológico asociado. La IA generativa es una tecnología de propósito general, lo que significa que su impacto se extenderá a múltiples sectores, incluidos la investigación, la robótica, las finanzas, la medicina, la educación y, por supuesto, el ámbito militar. Aunque el cálculo económico de la productividad pueda enmascarar este efecto, a largo plazo –en un horizonte de una década– la existencia de sanciones perdería fuerza, pues China tendría margen para ponerse al día (catch-up).
Ahora bien, ¿qué ocurriría si en lugar de una década, este impacto disruptivo se materializara en un periodo mucho más corto, digamos cinco años o incluso menos? En este escenario, se desencadenaría un efecto dominó que impulsaría un progreso acelerado en diversas industrias, especialmente en Occidente. China, en cambio, quedaría rezagada en sectores estratégicos como la producción de microprocesadores, la IA generativa y aplicaciones militares avanzadas, como los drones autónomos.
El escenario de una disrupción tecnológica profunda a corto plazo es coherente con las enormes inversiones y desarrollos que estamos observando
Desde esta perspectiva, las sanciones draconianas adquirirían sentido. A pesar de los sacrificios económicos que puedan implicar en el corto plazo –incluyendo la reducción de beneficios para una parte significativa de la industria tecnológica occidental–, estas restricciones permitirían que Occidente recuperara y consolidara su ventaja tecnológica en este periodo de aceleración.
Todo apunta a que, en el ámbito de los modelos de IA generativa, nos encontramos precisamente en un escenario como este. El desarrollo ha pasado del pre-training al post-training, un área en la que apenas hemos comenzado a explorar el potencial real. Muchos expertos opinan –aunque reconocen que es pura especulación– que, en relativamente poco tiempo, los modelos de IA generativa superarán ampliamente las capacidades humanas en la resolución de problemas concretos.
Además, a medida que estos sistemas puedan interactuar directamente con el entorno físico a través de robots, drones o vehículos autónomos, la distancia entre sus capacidades y las humanas no dejará de aumentar. Este crecimiento exponencial, si se produce en un periodo breve, podría redefinir las relaciones de poder tecnológico a escala global.