IA Hartos

IA Tips | El poder de la geopolítica en la IA: conoce los nuevos modelos chinos

Esteve Almirall desgrana los mejores modelos de IA procedentes de China que ya hacen la competencia a ChatGPT

IA Tips | El poder de la geopolítica en la IA: conoce los nuevos modelos chinos

Esteve Almirall
Foto: Carlos Baglietto
Barcelona. Domingo, 19 de enero de 2025. 05:30
Tiempo de lectura: 2 minutos

IA generativa y la condición geopolítica. Hasta ahora estaba en manos de empresas americanas, pero los modelos chinos empiezan a salir y hacen cosas interesantes como DeepSeek que es similar a ChatGPT y es más barato e igual de bueno. También hace cosas igual de interesantes como O1. Pero también tenemos Alibaba o Ruyi Digital. Todos estos modelos empezarán a hacerse un lugar y comportará una presión geopolítica entre los Estados Unidos y China. ¿Qué hará Europa? Esta es la gran pregunta para resolver.

Los fabricantes de IA chinos han aprendido a crear modelos de IA potentes que funcionan poco antes de la competencia más avanzada de los EE.UU. mientras utilizan mucho menos dinero, chips y potencia. Las políticas norteamericanas que restringen el flujo de semiconductores y conocimientos de IA de gama alto mando en China pueden haber ayudado a mantener una breve ventaja en los Estados Unidos a los límites exteriores de la curva de rendimiento de la IA, pero también han acelerado el progreso chino en la construcción de alta calidad.

La potencia china

A finales de diciembre, DeepSeek, con sede en Guangzhou, lanzó V3, un modelo de lenguaje grande de código abierto, cuyo rendimiento en varias pruebas de referencia lo sitúa en la misma liga que el 4 o de OpenAI y el Claude 3.5 Sonnet de Anthropic. Estos son los modelos de IA más avanzados que estas empresas ofrecen actualmente al público amplio, a pesar de que tanto OpenAI como Anthropic tienen modelos de nueva generación a su proyecto. V3 costó a DeepSeek aproximadamente 5,6 millones de dólares, según la compañía.

Según los informes, OpenAI, Google y Anthropic han gastado centenares de millones de dólares para construir y entrenar sus modelos actuales, y esperan gastar miles de millones en el futuro. El pionero de la inteligencia artificial Andrej Karpathy calificó la inversión de DeepSeek como "una broma de presupuesto" y describió el resultado como "una muestra mucho impresionando de investigación e ingeniería con limitaciones de recursos". Entre líneas: en una entrevista el año pasado, el director general de DeepSeek, Liang Wenfeng, dijo: "El dinero nunca ha sido el problema para nosotros; las prohibiciones de envíos de chips avanzados son el problema".

El modelo V3 se entrenó con chips Nvidia H800, una versión menos potente de un chip que los Estados Unidos prohibieron para exportar a China en el 2022. La exportación del H800 se prohibió cuando los Estados Unidos volvieron a reforzar los controles el año siguiente. Algunos funcionarios norteamericanos han argumentado para restringir todavía más el acceso de China en los chips avanzados de IA con la esperanza de frenar el desarrollo de la tecnología del país. El lunes, la administración de Biden anunció otra gran ronda de controles en las exportaciones destinadas a sofocar el suministro de chips en la China a través de países terceros.

En definitiva, avances como la V3 y el nuevo modelo de "razonamiento" de OpenAI, o3, han dado peso a las afirmaciones recientes del CEO de OpenAI, Sam Altman, y otros líderes del sector que predicen que la industria se está cerrando rápidamente a la inteligencia general artificial (AGI).

Más