Meta AI entra en pànic amb la xinesa DeepSeek: més barata, fàcil i potent

S'ha informat que Meta està en mode de pànic total a través de DeepSeek, un projecte d'IA xinès de baix cost que està creant un gram impacte en el món de la tecnologia. Segons una publicació a TeamBlind d'un empleat anònim de Meta, els enginyers de l'empresa estan lluitant per fer enginyeria inversa dels avenços de DeepSeek, especialment després del llançament de la seva tercera versió, DeepSeek v3, que ha superat el Llama 4 de Meta en punts de referència clau. Tots els equips d'IA de gran tecnologia haurien d'estar preocupats. La gent de DeepSeek només va mostrar al món com fer el mateix que fan aquests equips, però amb un cost d'un 99% més baix i va publicar tot el codi i els pesos com a codi obert gratuït.

La cronologia dels fets

A finals de l'any passat, va començar a treure el cap DeepSeek, una startup xinesa d'IA que va sorprendre el sector amb el llançament d'un model d'IA de codi obert amb 685.000 milions de paràmetres. El que va ser titular no va ser només la seva escala, sinó el seu rendiment: va superar els últims models d'OpenAI i Meta mentre es desenvolupava a una fracció del cost. DeepSeek va cridar l'atenció per primera vegada després que un informe de la CNBC revelés que el seu model DeepSeek V3 havia superat el Llama 3.1 de Meta, el GPT-4o d'OpenAI i el Qwen 2.5 d'Alibaba en punts de referència de tercers.

DeepSeek v3 es va entrenar amb un pressupost de només 5,6 milions de dòlars, un pressupost del qual Meta gasta per tots els seus projectes d'IA. Això ha provocat frustració interna, especialment amb l'equip de direcció de Meta, que ara es veu pressionat per justificar els seus pressupostos. Algunes persones fins i tot han assenyalat que els sous de certs líders d'IA a Meta superen tot el pressupost de formació de DeepSeek.

Només un mes després de llançar DeepSeek V3, la companyia va pujar encara més el llistó amb el llançament de DeepSeek-R1, un model de raonament posicionat com una alternativa creïble al model o1 d'OpenAI. Amb llicència del MIT, DeepSeek-R1 permet als desenvolupadors destil·lar i comercialitzar les seves capacitats lliurement. Aquesta accessibilitat l'ha convertit en una opció atractiva per a equips i desenvolupadors més petits que treballen amb pressupostos ajustats que encara necessiten solucions d'IA d'alt rendiment.

Sobre DeepSeek r1, es rumoreja que inclou innovacions que podrien interrompre la indústria de la IA. Tot i que els detalls específics romanen en secret, altres experts asseguren que aquest desenvolupament ha sacsejat no només Meta, sinó també rivals com Google, OpenAI i Anthropic. L'enfocament únic de DeepSeek per a l'aprenentatge de reforç i altres tècniques d'IA està forçant els competidors a repensar les seves estratègies. Els empleats de Meta parlen en línia sobre el caos de la divisió d'IA generativa de l'empresa. L'OP fins i tot la va descriure com una situació de "massa cuiners", amb prioritats conflictives entre els equips d'enginyeria i de producte.

Més

Meta AI entra en pànic amb la xinesa DeepSeek: més barata, fàcil i potent

Empleats del gegant de Marc Zuckerberg admeten la seva preocupació per la competència ferotge xinesa

La cronologia dels fets