El Consell Editorial d'ON-IA analitza l'impacte de DeepSeek: què hem après?

El Consell Editorial d'ON-IA analitza la setmana en clau xinesa amb la irrupció de DeepSeek, una eina d'intel·ligència artificial xinesa que el professor d'Esade, Esteve Almirall, ja va avançar el passat mes de desembre en el seu IA Tips sobre estratègia geopolítica que generaria impacte a curt termini. A continuació, compartim amb vosaltres les reflexions del nostre comitè d'experts.

Ariadna Font Llitjós, CEO d'Alinia AI

Nosaltres estem analitzant l’article científic que han tret. Potser només cal afegir que es tracta de 2 models: DeepSeek V3 i DeepSeek R1. El primer V3, llançat a finals de desembre, és un model de llenguatge “estàndard” com GPT-4, mentre que el segon R1, llançat fa només uns dies, és un model de raonament com o1.

Tots dos models de DeepSeek són impressionants, però per diferents motius. V3, que té un rendiment comparable al de GPT-4, sembla haver estat entrenat amb només un 5% del càlcul GPU necessari per a GPT-4. Això és interessant perquè és sorprenent que sigui possible i perquè demostra que la necessitat és la mare de la invenció, donades les limitacions de la Xina en l’accés a GPUs.

R1, en canvi, és interessant perquè és un model de raonament altament eficient, comparable a l’o1 d’OpenAI. No obstant això, té dues propietats extremadament interessants. D'una banda, es publica sota la molt permissiva llicència MIT. De l'altra, revela completament els passos de raonament, cosa que no passa amb altres models de raonament. Aquests llançaments acceleraran encara més el moviment d’IA de codi obert. Els models oberts igualen les condicions i permeten que tothom tingui veu en cap a on es dirigeixen les coses.

Pel que fa a l’alienació d’aquests models (alignment), que és el que fem a Alinia AI, naturalment estan alineats als valors xinesos i, per tant, des d’un punt de vista occidental diem que estan censurats. Ara bé, és important entendre que tots els models ho estan, però cada model està alineat amb els valors de la cultura, i empresa que els crea. Tant els models GPT com Gemini han estat alineats per no contestar certes preguntes que els EUA o Google considera delicades com ara contractes militars governamentals o temes polítics. Per tot plegat, aquests avenços recalquen encara més la necessitat que les empreses i governs tinguin i controlin la seva pròpia capa d’alienació. Perquè independentment del(s) model(s) que hi hagi per sota, sempre hi haurà la necessitat de poder contestar o operar des d’una visió pròpia, d’acord amb els valors propis i sovint locals.

Esteve Almirall, professor d'ESADE

Hi ha força detalls de DeepSeek que no han estat publicats i fa la reproducció molt difícil. DeepSeek té 670B de paràmetres, però una consulta típica només n’activa 37B i els normals els activen tots. Respecte al preu, és 50 vegades més barat que o1 (els d’OpenAI estan abaixant preus), és una mica pitjor, però per moltes coses va igual.

Si no entres en l'àmbit de les preguntes polítiques pot ser eficient, però si no és una altra cosa. Hi ha ja molts sistemes que l’estan fent servir. El més normal és que la resta vulguin per copiar l’estratègia, especialment Meta i Google que són els més afectats i Anthropic que ho té molt bé perquè fa servir algunes estratègies similars. Però OpenAI, també. En darrer terme, cal tenir en compte que les xarxes socials, la premsa, els models d'IA, absolutament tot a la Xina, passa per una censura. És un aspecte conegut sobradament per a tothom. Ara bé, no és cert que aquí es parli majoritàriament de biaix dels models americans i pràcticament res dels xinesos. Hem de ser més curosos i crítics a parts iguals.

Esther Checa, Global Head of Innovation t2ó One

Crec que hauríem de ser més mesurats i equilibrats quan es parlin de les bondats de tot el que vivim, i posar en relleu aspectes com aquests. Aquests models tenen el poder de reconfigurar el que aprendrem com a societat, allò que no s'expliqui, no existirà. "Ens hauria de fer una mica de vergonya aplaudir sense filtres DeepSeek, o potser ni pensem per la urgència de parlar. Aquesta companyia està rebent titulars com 'DeepSeek sacseja els mercats' 'DeepSeek amenaça la primacia de la IA', entre d'altres. Això no obstant, en entrar en aquest xatbot i realitzar 'preguntes incòmodes' simples, té com a resposta un no que resulta extremadament vergonyós". I afegeix: Líders d'opinió com Yann LeCun també s'han fet ressò de les bondats dels LLM codi obert, amb una clara picada d'ullet a DeepSeek, però hauria estat una meravella que hagués traslladat aquestes 'limitacions'. Cal recordar que fa uns mesos Google va haver de recular i donar una pausa a l'evolució de Gemini per la generació d'imatges de persones en 'resultats incoherents'.

Aleix Valls, fundador de Liquid Lab

DeepSeek ha fet vàlid una vegada més que la necessitat és la mare de la innovació. Una empresa emergent xinesa, amb només 6 milions de dòlars i accés limitat a tecnologia d'última generació a causa de restriccions nord-americanes, ha aconseguit superar allò que semblava impossible: construir un model d'IA que rivalitza amb els millors d'OpenAI, però a una fracció del cost.

Mentre a Europa seguim debatent sobre la manca d'accés a fons, xips d'última generació i altres barreres, DeepSeek ha deixat clar que no són recursos infinits ni accés privilegiat. El seu avantatge no va ser econòmic ni tecnològic, va ser voluntat de ser els millors. En lloc de lamentar-se per no tenir els xips més avançats, van fer servir Nvidia H800 (una versió limitada) i van aprofitar al màxim el seu enginy i creativitat. Amb això, no només van igualar els resultats de models com GPT-4, sinó que ho van fer:

Amb un cost d'entrenament de $6M enfront dels $600M+ d'OpenAI. Amb un model codi font obert accessible per a tothom. A un cost d'ús de <$4 per milió de tokens davant els $100+ d'OpenAI. Això no és només un èxit tècnic, és un canvi de paradigma. Europa, amb el seu enorme potencial, per què no estem liderant aquests avenços? No ens manquen fons ni talent, ens manca la voluntat d'arriscar, innovar i aprendre de les nostres limitacions. DeepSeek ens deixa una lliçó clara: la innovació no neix del confort, sinó de la necessitat i la determinació de trobar solucions on altres només veuen problemes.

Més

El Consell Editorial d'ON-IA analitza l'impacte de DeepSeek: què hem après?

Ariadna Font, Esteve Almirall, Esther Checa i Aleix Valls analitzen la setmana xinesa de DeepSeek

Ariadna Font Llitjós, CEO d'Alinia AI

Esteve Almirall, professor d'ESADE

Esther Checa, Global Head of Innovation t2ó One

Aleix Valls, fundador de Liquid Lab