En aquesta quarta entrega dels seminaris web d'Aleix Valls, et desgranem punt per punt què és DeepSeek. Des d'ON-IA et recomanem tenir l'ull posat a DeepSeek-R1, un dels diversos models d'IA altament avançats que surten de la Xina, unint-se als desenvolupats per laboratoris com Alibaba i Moonshot AI. R1 també impulsa el xatbot homònim de DeepSeek, que es va disparar al primer lloc a l'App Store d'Apple després del seu llançament, destronant ChatGPT.

Per què tothom en parla?

El salt de DeepSeek al focus internacional ha portat a alguns a qüestionar la decisió de les empreses tecnològiques de Silicon Valley d'enfonsar desenes de milers de milions de dòlars en la construcció de la seva infraestructura d'IA, i la notícia va provocar que les accions de fabricants de xips d'IA com Nvidia i Broadcom caiguessin en picat. Així i tot, alguns dels principals rivals nord-americans de la companyia han qualificat el seu últim model d'" impressionant" i" un excel·lent avenç de la IA" i, segons es diu, estan lluitant per esbrinar com es va aconseguir. Fins i tot el president Donald Trump, que s'ha convertit en la seva missió per avançar contra la Xina en IA, va qualificar l'èxit de DeepSeek de "desenvolupament positiu" i ho va descriure com una "tonada d'atenció" perquè les indústries nord-americanes millorin el seu avantatge competitiu.

De fet, el llançament de DeepSeek-R1 sembla estar portant la indústria de la IA generativa a una nova era de brinkmanship, on les empreses més riques amb els models més grans ja no poden guanyar per defecte. Què és DeepSeek-R1? DeepSeek-R1 és un model de llenguatge de codi obert desenvolupat per DeepSeek, una empresa emergent xinesa fundada el 2023 per Liang Wenfeng, que també va cofundar el fons de cobertura quantitatiu High-Flyer. S'ha informat que l'empresa va sorgir de la unitat d'investigació d'IA d'High-Flyer per centrar-se en el desenvolupament de grans models de llenguatge que aconsegueixin la intel·ligència general artificial (AGI), un punt de referència on la IA és capaç de coincidir amb l'intel·lecte humà, en el qual també estan treballant OpenAI i altres principals empreses d'IA. Però a diferència de moltes d'aquestes empreses, tots els models de DeepSeek són de codi obert, és a dir, els seus pesos i mètodes d'entrenament estan disponibles gratuïtament perquè el públic els examini, els utilitzi i els aprofiti. R1 és l'últim dels diversos models d'IA que DeepSeek ha fet públic.

L'evolució xinesa

El seu primer producte va ser l'eina de codificació DeepSeek Coder, seguida de la sèrie de models V2, que va cridar l'atenció pel seu fort rendiment i baix cost, provocant una guerra de preus al mercat xinès de models d'IA. El seu model V3, la base sobre la qual es construeix R1, també va captar cert interès, però les seves restriccions sobre temes delicats relacionats amb el govern xinès van plantejar preguntes sobre la seva viabilitat com a veritable competidor de la indústria. Llavors, l'empresa va presentar el seu nou model, R1, afirmant que coincideix amb el rendiment dels millors models d'IA del món mentre confia en un maquinari relativament modest. En total, els analistes de Jeffries han estimat que DeepSeek va gastar 5,6 milions de dòlars per entrenar R1, una caiguda de la galleda en comparació amb els centenars de milions, o fins i tot milers de milions, de dòlars que moltes empreses nord-americanes aboquen als seus models d'IA. No obstant això, des d'aleshores, aquesta xifra ha estat objecte d'escrutini per part d'altres analistes que afirmen que només té en compte la formació del xatbot, no les despeses addicionals com la investigació i els experiments en fase inicial. Consulteu un altre model de codi obert Grok:

Segons DeepSeek, R1 destaca en una àmplia gamma de tasques basades en text tant en anglès com en xinès, com ara: - Escriptura creativa Resposta a preguntes generals Edició Resum Més concretament, la companyia diu que el model funciona especialment bé en tasques "intensives de raonament" que impliquen "problemes ben definits amb solucions clares". 

- Desenvolupament de programari: R1 podria ajudar els desenvolupadors generant fragments de codi, depurant el codi existent i proporcionant explicacions per a conceptes de codificació complexos.

- Matemàtiques: la capacitat de R1 per resoldre i explicar problemes matemàtics complexos es podria utilitzar per proporcionar suport a la investigació i l'educació en camps matemàtics.

- Creació, edició i resum de continguts: R1 és bo per generar contingut escrit d'alta qualitat, així com per editar i resumir contingut existent, que podria ser útil en indústries que van des del màrqueting fins a la llei.

- Servei d'atenció al client: R1 es pot utilitzar per alimentar un xatbot d'atenció al client, on pot conversar amb els usuaris i respondre les seves preguntes en lloc d'un agent humà.

- Anàlisi de dades: R1 pot analitzar grans conjunts de dades, extreure coneixements significatius i generar informes exhaustius basats en el que troba, que es podrien utilitzar per ajudar les empreses a prendre decisions més informades.

- Educació: R1 es podria utilitzar com una mena de tutor digital, desglossant assignatures complexes en explicacions clares, responent preguntes i oferint lliçons personalitzades sobre diverses assignatures.

- Limitacions de DeepSeek-R1 DeepSeek-R1 comparteix limitacions similars a qualsevol altre model d'idioma. Pot cometre errors, generar resultats esbiaixats i ser difícil d'entendre completament, encara que sigui tècnicament de codi obert.

DeepSeek també diu que el model té tendència a "barrejar idiomes", especialment quan les indicacions estan en idiomes diferents del xinès i l'anglès. Per exemple, R1 pot utilitzar l'anglès en el seu raonament i resposta, fins i tot si el missatge està en un idioma completament diferent. I el model lluita amb la indicació de pocs trets, que implica proporcionar uns quants exemples per guiar la seva resposta. En lloc d'això, s'aconsella als usuaris que utilitzin indicacions de tir zero més senzilles, especificant directament la sortida prevista sense exemples, per obtenir millors resultats.