Se ha informado de que Meta está en modo de pánico total a través de DeepSeek, un proyecto de IA chino de bajo coste que está haciendo destellos en el mundo de la tecnología. Según una publicación en TeamBlind de un empleado anónimo de Meta, los ingenieros de la empresa están luchando por hacer ingeniería inversa de los avances de DeepSeek, especialmente después del lanzamiento de su tercera versión, DeepSeek v3, que ha superado el Llama 4 de Meta en puntos de referencia clave. Todos los equipos de IA de gran tecnología tendrían que estar preocupados. La gente de DeepSeek solo mostró en el mundo como hacer lo mismo que hacen estos equipos, pero con un coste de un 99% más bajo y publicó todo el código y los pesos como código abierto gratuito.
La cronología de los hechos
A finales del año pasado, empezó a destacar DeepSeek, una startup china de IA que sorprendió el sector con el lanzamiento de un modelo de IA de código abierto con 685.000 millones de parámetros. Lo que fue titular no fue solo su escalera, sino su rendimiento: superó los últimos modelos de OpenAI y Meta mientras se desarrollaba a una fracción del coste. DeepSeek llamó la atención por primera vez después de que un informe de la CNBC revelara que su modelo DeepSeek V3 había superado el Llama 3.1 de Meta, el GPT-4o de OpenAI y el Qwen 2.5 de Alibaba en puntos de referencia de terceros.
DeepSeek v3 se entrenó con un presupuesto de solo 5,6 millones de dólares, un presupuesto del cual Meta gasta para todos sus proyectos de IA. Eso ha provocado frustración interna, especialmente con el equipo de dirección de Meta, que ahora se ve presionada para justificar sus presupuestos. Algunas personas incluso han señalado que los sueldos de ciertos líderes de IA en Meta superan todo el presupuesto de formación de DeepSeek.
Solo un mes después de lanzar DeepSeek V3, la compañía subió todavía más el listón con el lanzamiento de DeepSeek-R1, un modelo de razonamiento posicionado como una alternativa creíble al modelo o1 de OpenAI. Con licencia del MIT, DeepSeek-R1 permite a los desarrolladores destilar y comercializar sus capacidades libremente. Esta accesibilidad lo ha convertido en una opción atractiva para equipos y desarrolladores más pequeños que trabajan con presupuestos ajustados que todavía necesitan soluciones de IA de alto rendimiento.
Sobre DeepSeek r1, se rumorea que incluye innovaciones que podrían interrumpir la industria de la IA. Aunque los detalles específicos permanecen en secreto, otros expertos aseguran que este desarrollo ha sacudido no solo Meta, sino también rivales como Google, OpenAI y Anthropic. El enfoque único de DeepSeek para el aprendizaje de refuerzo y otras técnicas de IA está forzando a los competidores a repensar sus estrategias. Los empleados de Meta hablan en línea sobre el caos de la división de IA generativa de la empresa. El OP incluso la describió como una situación de "demasiados cocineros", con prioridades conflictivas entre los equipos de ingeniería y de producto.