Fa dies que no es parla d’altra cosa que de DeepSeek i del que suposa pel futur del món. L’impacte ha estat tan profund que els mercats han arribat a perdre més de 1.000 milions de dòlars, i el tema ha estat present fins i tot en els discursos del president Trump.

A ON ECONOMIA ja vam parlar de DeepSeek el desembre passat i aquest gener. La versió anterior ja era comparable a GPT-4, però ha estat amb l’aparició de la nova versió R1, a l’altura del model o1 d’OpenAI, que s’ha desencadenat una onada d’expectació. A això s’hi ha sumat un report que detalla la seva arquitectura i uns costos d’entrenament sorprenentment baixos en comparació amb els models nord-americans, fet que ha portat a qüestionar les inversions multimilionàries en IA i a revisar les perspectives d’empreses com Nvidia, que fins ara eren les grans estrelles del mercat. I, per acabar-ho de complicar, es tracta d’un model desenvolupat per una petita empresa xinesa, amb menys de 150 empleats i una trajectòria de només dos anys en la creació de models d’intel·ligència artificial generativa.

El sotrac ha tingut dos grans fronts: l’intern a les empreses tecnològiques i el polític.

DeepSeek és un model desenvolupat per una petita empresa xinesa, amb menys de 150 empleats i només dos anys de trajectòria en IA generativa

A nivell empresarial, corporacions com Meta, OpenAI, AWS, Azure o X han iniciat una profunda reflexió: com és possible que un petit grup d’enginyers joves, sense sortir de la Xina, hagi aconseguit aquests resultats amb només una fracció dels nostres recursos?

A escala política, les directrius per al desenvolupament de la IA han quedat en entredit. Fins ara, les estratègies es basaven en la construcció de grans centres d’IA, sovint amb mini-centrals nuclears per subministrar-los energia. Un exemple és el projecte Stargate, una inversió de 500.000 milions de dòlars. DeepSeek, però, és open source, ha costat al voltant de 5 milions de dòlars i  això ha accelerat una sèrie de fenòmens.

Fenòmens destacats després del llançament de DeepSeek

  • Comencen a aparèixer tutorials i vídeos a YouTube explicant com instal·lar DeepSeek en màquines privades.
  • Surt el primer tutorial per executar el model amb un rendiment raonable en un ordinador de només 6.000 dòlars.
  • Tothom parla de la Jevons paradox (quan baixa el cost d’un bé especialment si la demanda és elàstica s’incrementa el consum).
  • La seva aplicació supera les descàrregues de l’app d’OpenAI.
  • Plataformes de cloud com Microsoft Azure i Amazon AWS l’incorporen a la seva oferta.
  • OpenAI acusa DeepSeek d’haver utilitzat els seus models durant l’entrenament.
  • Apareix un tutorial de com instal·lar-ho en un PC que ara ja només costa $2,000.
  • OpenAI abaixa preus dels seus models.
  • DeepSeek optimitza el model per als processadors Huawei Ascend 910B, amb només un 5% de pèrdua de rendiment però amb una reducció del 70% en els costos.
  • La plataforma xinesa siliconflow.cn ofereix DeepSeek a uns preus sorprenentment baixos (0,72 dòlars per milió de tokens d’entrada i 2,3 dòlars per milió de tokens de sortida).
  • Apareixen múltiples instal·lacions tant per a ús privat com empresarial, així com integracions en sistemes d’agents.
  • DeepSeek llança Janus Pro, un sistema de text-a-imatge que millora les capacitats de models com DALLE d’OpenAI.
  • Alibaba presenta el seu model Qwen 2.5 Max, afirmant que supera DeepSeek R1.
  • OpenAI respon amb el llançament d’o3 mini, una versió millorada dels seus models o1 i DeepSeek R1.

L’impacte sobre la indústria

DeepSeek és un exemple poderós del potencial de l’open source. L’obertura del codi afavoreix l’adopció, la innovació i la millora contínua dels productes. Les implicacions per a la indústria són clares, i un dels casos més afectats ha estat Nvidia, que ha patit una de les majors caigudes de valor en la seva història.

Nvidia stock

Aquesta situació planteja una pregunta crucial: amb la reducció de costos en la IA generativa, es reduiran els beneficis de Nvidia? La resposta depèn de l’elasticitat de la demanda. Si la tecnologia es fa més accessible, el nombre d’usuaris i aplicacions pot créixer exponencialment. Nvidia podria vendre menys xips a les grans plataformes de cloud, però podria compensar-ho amb un increment del volum de vendes a empreses i particulars. Aquesta dinàmica és especialment rellevant per a una tecnologia de propòsit general com la IA generativa, cridada a transformar àmbits com el legal, el mèdic, el financer, l’educatiu i, en general, tota l’economia.

Perspectives d’innovació i adopció

L’abaratiment de la tecnologia obre la porta a una exploració més àmplia i ràpida. Ara és més assequible que mai fer recerca en IA generativa, i això afavorirà l’aparició de noves aplicacions i avenços tecnològics constants.

Ens obre també la porta a millores de rendiment substancials?

La majoria de les novetats que incorpora DeepSeek són millores d'enginyeria ja conegudes, tant a nivell de hardware com de software, que fan el model molt més eficient. No obstant això, hi ha algunes innovacions destacables, com l’ús d’entrenament supervisat amb una gran quantitat d'exemples de raonament (600.000), que podrien obrir camins cap a models molt més avançats.

La majoria de les novetats que incorpora DeepSeek són millores d'enginyeria ja conegudes, tant a nivell de hardware com de software

Aquesta millora en l’eficiència operativa permet explorar enfocaments que abans eren inviables a causa dels alts costos associats. A més, la intensa competència que ha generat DeepSeek farà que els límits actuals de rendiment i capacitat siguin ràpidament superats.

D’altra banda, s’han produït tres canvis estructurals significatius en termes d’innovació:

  1. Democratització del mercat: El desenvolupament de models eficients ja no està restringit a unes poques grans corporacions. Ara es pot competir amb recursos molt menors.
  2. Ampliació de l’espai d’exploració: Amb la reducció de costos, més investigadors i innovadors podran experimentar i innovar en IA, accelerant el ritme de progrés. Tindrem, com en tota enginyeria en el seus moments inicials, progressos ràpids, constants i notables (també en ciència que cada vegada és més computacional).
  3. Increment de l’adopció: Els nous preus fan que moltes més organitzacions puguin incorporar la IA generativa als seus processos i encaixi en molts més models de negoci.

Sovint, la societat necessita una constatació de què quelcom és factible per adoptar plenament una tecnologia. És un fenomen molt humà que explica la importància de les best practices en el món del management.

La intensa competència que ha generat DeepSeek farà que els límits actuals de rendiment i capacitat siguin ràpidament superats

DeepSeek no ha aportat moltes innovacions revolucionàries, tot i que algunes sí són destacables. Però el seu veritable mèrit és demostrar que la combinació d'aquestes tècniques, ben aplicades, pot donar lloc a models amb rendiments iguals o superiors als dels millors professionals, i amb costos totals i marginals sorprenentment baixos. Això obre les portes a la creació de nous models de negoci i a una adopció massiva de la tecnologia, ampliant considerablement el seu impacte en múltiples sectors.

Aquesta situació obliga tant les organitzacions com els governs a revisar les seves polítiques d’IA i d’innovació, ja que un cop més tot ha canviat i la direcció a seguir és una altra. La disrupció generada per DeepSeek posa de manifest la necessitat d’adaptar les estratègies a aquest nou escenari.

Com sempre, el recurs més escàs i determinant és el talent, especialment el talent format i capacitat per liderar aquests canvis, reorientar les estratègies i construir un futur diferent i més competitiu en un món cada cop més impulsat per la tecnologia.