En les darreres setmanes, hem estat testimonis del terratrèmol tecnològic que ha suposat DeepSeek. Una de les seves múltiples conseqüències ha estat la migració del model als processadors Huawei Ascend 910B. Tot i que aquests no arriben al nivell dels de Nvidia, han aconseguit una reducció de costos del 70%, amb només una pèrdua de rendiment del 5%. Aquest avanç no ha passat desapercebut.

Ràpidament, algunes plataformes de cloud xineses, com siliconflow.cn, han començat a oferir el model a preus sorprenentment baixos: 0,72 dòlars per milió de tokens d’entrada i 2,3 dòlars per milió de tokens de sortida. Si et preguntes per què el cost dels tokens de sortida és molt més elevat, la resposta és tècnica: mentre que els tokens d’entrada es poden processar en paral·lel, els de sortida no, fet que incrementa els temps de càlcul i, per tant, els costos.

Aquest desenvolupament ens porta a una qüestió clau que s’ha debatut durant anys: ¿són realment efectives les restriccions a la venda de xips o, per contra, acaben sent contraproduents?

Restriccions que impulsen la innovació

El cas dels xips Ascend 910B ens mostra un efecte paradoxal. Sense les restriccions imposades pels Estats Units, probablement aquests processadors no haurien estat desenvolupats. Per una banda, fins fa poc el disseny de xips no era una prioritat estratègica per al govern xinès. Per l’altra, és difícil controlar completament l’accés a la tecnologia avançada: les empreses poden recórrer a tercers països o llogar temps de computació en plataformes globals, com Oracle.

De fet, ByteDance (la matriu de TikTok) és actualment el consumidor més gran de temps de computació en plataformes de cloud per a IA, per davant de qualsevol altre client. Aquest increment en la demanda, paradoxalment, ha estat provocat en gran part per les restriccions.

Tanmateix, aquestes sancions tenen efectes col·laterals. La recent ampliació de restriccions de l'administració Trump, arran de l'èxit de DeepSeek, ha inclòs països aliats com Portugal o Singapur, una decisió que sembla mancada de lògica estratègica. Això podria frenar les seves capacitats en IA generativa. A més, les restriccions afecten negativament els beneficis dels fabricants de xips, com Nvidia, i de tota la seva cadena de subministrament.

Què busca Trump amb aquestes restriccions?

Davant l’evidència de la seva limitada efectivitat, és legítim preguntar-nos per què aquestes mesures continuen vigents. A primer cop d’ull, podríem atribuir-les al populisme de Trump, que utilitza tàctiques com "castigar l'adversari" per generar impacte polític immediat. Tanmateix, el seu equip d’assessors és competent i les seves decisions solen tenir una lògica més profunda, encara que sovint quedi camuflada darrere de titulars cridaners.

Una possibilitat és que l’autèntic objectiu sigui alentir el desenvolupament de la IA generativa a la Xina. No obstant això, l’èxit de DeepSeek sembla contradir aquest plantejament: entrenar el seu model ha costat uns 5,5 milions de dòlars, molt per sota dels 200 milions que va costar GPT-4. Cal tenir en compte, però, que el context ha canviat: les tecnologies han millorat i els objectius actuals són diferents.

Aleshores, quina podria ser la raó d'aquestes restriccions?

Del pre-training al post-training

La clau pot estar en l'evolució de l'ús de les GPUs en el desenvolupament de la IA. Tradicionalment, gran part del consum de recursos es destinava al pre-training, és a dir, a l’entrenament inicial del model utilitzant totes les dades disponibles. No obstant això, aquest procés ha assolit un cert grau d’eficiència: la quantitat de dades útils està pràcticament esgotada i els models actuals requereixen menys GPU per a aquesta fase.

Ara, l’atenció s’ha desplaçat cap al post-training, que consisteix a ajustar les respostes del model mitjançant tècniques avançades d’aprenentatge per reforç (Reinforcement Learning). Aquesta fase és molt intensiva en recursos, i el seu desenvolupament probablement incrementarà encara més aquest consum en el futur.

Les sancions probablement reduiran el desenvolupament de GPUs d’alt rendiment a la Xina. Però, ¿n'hi ha prou amb això per justificar-les?

De fet, lluny de reduir-se, el consum de GPUs es dispararà en els pròxims anys. Actualment, el centre d’IA més gran del món és el de xAI (fundat per Elon Musk) a Minnesota, amb 100.000 unitats Nvidia H100. Tanmateix, ja s’han anunciat centres amb 200.000, 600.000 i fins i tot es projecten instal·lacions amb un milió de targetes, incloent-hi alternatives com les TPUs de Google, els xips Trainium d’AWS o Maia de Microsoft.

Aquest argument reforça la idea que les restriccions forçaran la Xina a desenvolupar els seus propis processadors avançats.

Els xips no són programari

El desenvolupament de microprocessadors és significativament més complex que el del programari. Mentre que les tècniques més avançades de la IA generativa estan àmpliament documentades en publicacions científiques, articles d’arXiv o fins i tot vídeos de YouTube, l’enginyeria de xips és un món molt més opac. L'experiència i el coneixement necessaris per dissenyar hardware d’alt rendiment només s’assoleixen després de dècades d’especialització en la mateixa indústria.

Aquí tenim una primera explicació: les sancions probablement sí que reduiran el desenvolupament de GPUs d’alt rendiment a la Xina. Però, ¿n'hi ha prou amb això per justificar-les?

El termini com a factor estratègic

En condicions normals, podríem assumir que, en un termini de deu anys, la Xina serà capaç d’assolir desenvolupaments tecnològics equivalents als d’Occident. Amb tècniques de programació a baix nivell, com les aplicades per DeepSeek, és factible que puguin optimitzar el rendiment dels seus processadors fins al punt que les sancions perdin rellevància estratègica.

Tanmateix, considerem un enfocament més ampli, que tingui en compte l’ecosistema tecnològic associat. La IA generativa és una tecnologia de propòsit general, fet que implica que el seu impacte s’estendrà a múltiples sectors, inclosos la recerca, la robòtica, les finances, la medicina, l’educació i, evidentment, el militar. Tot i que el càlcul econòmic de la productivitat pot emmascarar aquest efecte, a llarg termini –en un horitzó d’una dècada– l’existència de sancions acabaria perdent força, ja que la Xina tindria marge per posar-se al dia (catch-up).

Ara bé, què passaria si, en lloc d’una dècada, aquest impacte disruptiu es materialitzés en un període molt més curt, diguem cinc anys o fins i tot menys? En aquest escenari, es desencadenaria un efecte dominó que impulsaria un progrés accelerat en diverses indústries, especialment a Occident. La Xina, en canvi, quedaria endarrerida en sectors estratègics com la producció de microprocessadors, la IA generativa i les aplicacions militars avançades, com els drons autònoms.

L’escenari d’una disrupció tecnològica profunda a curt termini és coherent amb les enormes inversions i desenvolupaments que estem observant

Des d’aquesta perspectiva, les sancions draconianes adquiririen sentit. Malgrat els sacrificis econòmics que puguin comportar a curt termini –com la reducció de beneficis per a una part important de la indústria tecnològica occidental–, aquestes restriccions podrien permetre que Occident recuperés i consolidés el seu avantatge tecnològic en aquest període d’acceleració.

Tot apunta al fet que, en l’àmbit dels models d’IA generativa, ens trobem precisament en un escenari d’aquest tipus. El desenvolupament ha passat del pre-training al post-training, un camp en el qual encara no hem fet més que esgarrapar la superfície del seu veritable potencial. Molts experts opinen –tot i que reconeixen que és pura especulació– que, en un període relativament curt, els models d’IA generativa superaran àmpliament les capacitats humanes en la resolució de problemes concrets.

A més, a mesura que aquests sistemes puguin interactuar directament amb l’entorn físic a través de robots, drons o vehicles autònoms, la distància entre les seves capacitats i les humanes no farà més que augmentar. Aquest creixement exponencial, si es produeix en un període breu, podria redefinir les relacions de poder tecnològic a escala global.

Preparant-nos per a una transformació profunda

Desconeixem tots els factors que han portat l’administració nord-americana a implementar aquestes restriccions. És probable que al darrere hi hagi una combinació de motius polítics, econòmics i estratègics. No obstant això, l’escenari d’una disrupció tecnològica profunda a curt termini és coherent amb les enormes inversions i els desenvolupaments en les línies de recerca que estem observant.

Si aquest és el rerefons de les sancions, hauríem de tenir-lo en compte a l’hora de definir les nostres polítiques d’investigació, innovació i industrial. Tant a nivell europeu i nacional com en les nostres pròpies organitzacions, cal que ens preparem per al que podria ser una de les transformacions més profundes que mai hagi experimentat la humanitat.