DeepSeek: el día después y el futuro
![DeepSeek: el día después y el futuro DeepSeek: el día después y el futuro](https://www.elnacional.cat/oneconomia/uploads/s1/49/62/02/38/esteve-almirall.png)
- Esteve Almirall
- Barcelona. Jueves, 6 de febrero de 2025. 05:30
- Tiempo de lectura: 4 minutos
Hace días que no se habla de otra cosa que de DeepSeek y de lo que implica para el futuro del mundo. El impacto ha sido tan profundo que los mercados han llegado a perder más de 1.000 millones de dólares, y el tema ha aparecido incluso en los discursos del presidente Trump.
En ON ECONOMIA, ya hablamos de DeepSeek el pasado diciembre y también este enero. La versión anterior ya era comparable a GPT-4, pero ha sido con la aparición de la nueva versión R1, al nivel del modelo o1 de OpenAI, cuando se ha desatado una ola de expectación. A esto se suma un informe que detalla su arquitectura y unos costos de entrenamiento sorprendentemente bajos en comparación con los modelos norteamericanos, lo que ha llevado a cuestionar las inversiones multimillonarias en IA y a revisar las perspectivas de empresas como Nvidia, hasta ahora una de las grandes estrellas del mercado. Y, para complicarlo más, este modelo ha sido desarrollado por una pequeña empresa china con menos de 150 empleados y solo dos años de trayectoria en la creación de modelos de inteligencia artificial generativa.
Este terremoto ha tenido dos grandes frentes: interno en las empresas tecnológicas y político.
DeepSeek es un modelo desarrollado por una pequeña empresa china, con menos de 150 empleados y solo dos años de trayectoria en IA generativa
A nivel empresarial, corporaciones como Meta, OpenAI, AWS, Azure o X han iniciado una profunda reflexión: ¿cómo es posible que un pequeño grupo de ingenieros jóvenes, sin salir de China, haya logrado estos resultados con solo una fracción de los recursos?
A nivel político, las directrices sobre el desarrollo de la IA han quedado en entredicho. Hasta ahora, las estrategias se basaban en la construcción de grandes centros de IA, a menudo con mini-centrales nucleares para abastecerlos de energía. Un ejemplo es el proyecto Stargate, con una inversión de 500.000 millones de dólares. Sin embargo, DeepSeek es open source, ha costado alrededor de 5 millones de dólares y ha desencadenado una serie de fenómenos acelerados.
Fenómenos destacados tras el lanzamiento de DeepSeek
- Comienzan a aparecer tutoriales y vídeos en YouTube explicando cómo instalar DeepSeek en máquinas privadas.
- Aparece el primer tutorial para ejecutar el modelo con un rendimiento razonable en un ordenador de solo 6.000 dólares.
- Todo el mundo habla de la paradoja de Jevons (cuando el coste de un bien disminuye, especialmente si la demanda es elástica, el consumo se incrementa).
- Su aplicación supera en descargas a la de OpenAI.
- Plataformas de cloud, como Microsoft Azure y Amazon AWS, lo incorporan a su oferta.
- OpenAI acusa a DeepSeek de haber utilizado sus modelos durante el entrenamiento.
- Surge un nuevo tutorial que muestra cómo instalarlo en un PC que ahora solo cuesta 2.000 dólares.
- OpenAI reduce los precios de sus modelos.
- DeepSeek optimiza su modelo para los procesadores Huawei Ascend 910B, con solo un 5% de pérdida en rendimiento pero una reducción del 70% en los costos.
- La plataforma china siliconflow.cn ofrece DeepSeek a precios sorprendentemente bajos (0,72 dólares por millón de tokens de entrada y 2,3 dólares por millón de tokens de salida).
- Aparecen múltiples instalaciones tanto para uso privado como empresarial, así como integraciones en sistemas de agentes.
- DeepSeek lanza Janus Pro, un sistema de texto a imagen que mejora las capacidades de modelos como DALLE de OpenAI.
- Alibaba presenta su modelo Qwen 2.5 Max, afirmando que supera a DeepSeek R1.
- OpenAI responde con el lanzamiento de o3 mini, una versión mejorada de sus modelos o1 y DeepSeek.
Impacto en la industria
DeepSeek es un poderoso ejemplo del potencial del open source. La apertura del código favorece la adopción, la innovación y la mejora continua de los productos. Las implicaciones para la industria son evidentes, y una de las empresas más afectadas ha sido Nvidia, que ha sufrido una de las mayores caídas de valor de su historia.
![Nvidia stock Nvidia stock](/uploads/s1/50/98/46/02/nvidia-stock.jpeg)
Esto plantea una pregunta crucial: ¿la reducción de costos en la IA generativa disminuirá los beneficios de Nvidia? La respuesta depende de la elasticidad de la demanda. Si la tecnología se hace más accesible, el número de usuarios y aplicaciones podría crecer exponencialmente. Nvidia podría vender menos chips a las grandes plataformas de cloud, pero compensarlo con un aumento en el volumen de ventas a empresas y particulares. Esta dinámica es especialmente relevante para una tecnología de propósito general como la IA generativa, llamada a transformar sectores como el legal, el médico, el financiero, el educativo y, en general, toda la economía.
Perspectivas de innovación y adopción
El abaratamiento de la tecnología abre la puerta a una exploración más amplia y rápida. Ahora es más asequible que nunca realizar investigación en IA generativa, lo que favorecerá la aparición de nuevas aplicaciones y avances tecnológicos constantes.
¿Nos abre también la puerta a mejoras sustanciales en el rendimiento?
La mayoría de las novedades que incorpora DeepSeek son mejoras de ingeniería ya conocidas, tanto en hardware como en software, que hacen el modelo mucho más eficiente. Sin embargo, algunas innovaciones, como el uso de entrenamiento supervisado con una gran cantidad de ejemplos de razonamiento (600.000), podrían abrir caminos hacia modelos mucho más avanzados.
La mayoría de las novedades que incorpora DeepSeek son mejoras de ingeniería ya conocidas, tanto a nivel de hardware como de software
Esta mejora en la eficiencia operativa permite explorar enfoques que antes eran inviables debido a los altos costos. Además, la intensa competencia generada por DeepSeek hará que los actuales límites de rendimiento y capacidad sean rápidamente superados.
Por otro lado, se han producido tres cambios estructurales significativos en términos de innovación:
- Democratización del mercado: El desarrollo de modelos eficientes ya no está restringido a unas pocas grandes corporaciones. Ahora es posible competir con recursos mucho menores.
- Ampliación del espacio de exploración: Con la reducción de costos, más investigadores podrán experimentar e innovar en IA, acelerando el ritmo de progreso. Veremos, como ocurre en toda ingeniería en sus primeras etapas, avances rápidos, constantes y notables (también en la ciencia, que es cada vez más computacional).
- Incremento de la adopción: Los nuevos precios hacen que muchas más organizaciones puedan incorporar la IA generativa en sus procesos, adaptándola a múltiples modelos de negocio.
A menudo, la sociedad necesita constatar que algo es factible para adoptarlo plenamente. Este fenómeno, muy humano, explica la importancia de las best practices en el mundo del management.
La intensa competencia que ha generado DeepSeek hará que los límites actuales de rendimiento y capacidad sean rápidamente superados
DeepSeek no ha aportado muchas innovaciones revolucionarias, aunque algunas son destacables. Sin embargo, su verdadero mérito radica en demostrar que la combinación de estas técnicas, bien aplicadas, puede generar modelos con rendimientos iguales o superiores a los de los mejores profesionales, y con costos sorprendentemente bajos. Esto abre la puerta a la creación de nuevos modelos de negocio y a una adopción masiva de la tecnología, ampliando significativamente su impacto en múltiples sectores.
Esta situación obliga tanto a las organizaciones como a los gobiernos a revisar sus políticas de IA e innovación, ya que, una vez más, el panorama ha cambiado y la dirección a seguir es otra.
Como siempre, el recurso más escaso y determinante es el talento, especialmente el talento formado y capacitado para liderar estos cambios, reorientar las estrategias y construir un futuro diferente y más competitivo en un mundo cada vez más impulsado por la tecnología.