Aquests dies hem assistit a la presentació de Gemini, el nou producte de la intel·ligència artificial (IA) generativa de Google. Es presenta en tres variants, nano, pro i ultra. La nano està pensada per ser usada en dispositius mòbils, la pro sembla que serà l'estàndard i l'ultra és la que té un millor rendiment. Aquesta darrera és comparable al GPT-4, marginalment millor en ben bé tot i especialment millor en comprendre vídeo i àudio.

La gran diferència de Gemini és que és multimodal des de l’inici, no és una evolució del model com en el cas d’OpenAI i això li dona unes capacitats úniques.

Aquest no és sinó un exemple de la tempesta que l’anunci de ChatGPT ara fa un any va desfermar. Ara bé, no només hi ha la guerra dels grans models, hi ha moltes més guerres, set en concret, que tindran implicacions profundes en definir guanyadors i perdedors que aquesta tecnologia, destinada a canviar-ho tot, crearà.

1. La guerra dels grans models

Ara fa un any, ChatGPT vingut pràcticament del no-res, va redefinir el camp de la IA erigint-se en el líder, indiscutible i indiscutit de la generativa. Això va desfermar les hostilitats amb els anteriors líders, Google, Microsoft, Meta, Amazon, Tesla i també Apple.

Tots van optar per estratègies ben diferents a l'hora de competir. Meta ho va fer per l’Open Source, creant i lliurant models molt potents com Llama2. Microsoft es va aliar amb OpenAI i va incorporar la seva tecnologia als seus productes. Amazon va trigar i finalment es va aliar amb la segona start-up més important després d’OpenAI, Anthropic, i ara es presenta com la plataforma (AWS Bedrock) on entrenar i posar en producció els teus models. Apple va optar per no participar i fer desenvolupaments interns que posteriorment seran incorporats a Siri. Tesla va crear una nova empresa, XAI, que ha construït un dels superordinadors més grans del món i un model —Grok-—que ha incorporat a X (Twitter). Google va optar per competir frontalment amb OpenAI, després d’un any han tret el Gemini, en tres versions, l'ultra (disponible durant el 2024) és marginalment millor que GPT4, sembla.

Ara bé, la guerra dels grans models no ha fet més que començar! El 2024 veurem moltes més batalles i això els farà evolucionar molt de pressa.

2. La guerra de la innovació

Paral·lelament a aquests nous descobriments assistim a la guerra de la innovació. A l’aplicació d’aquestes propostes a temes concrets capturant valor. El ChatGPT ja és una nova categoria de producte que ja ha aconseguit un mercat de més de 100M d’usuaris. Dos dels altres usos genèrics són el copilot de Microsoft Office i els copilots per programació com el de Github.

Però, juntament amb aquests ens trobem la seva adopció per part de les empreses, transformant les seves activitats. Les pioneres van ser PwC en legal, Bain en consultoria, Stripe en serveis al client i un llarg nombre d’empreses –—fins i tot McDonald's i CaixaBank— que busquen incloure la IA generativa en les seves activitats ja sigui substituint funcions, ja augmentant la productivitat de les existents. On això ja és una realitat plena és en el camp del desenvolupament de software a on pràcticament tothom fa servir copilots.

Els nous camps de batalla se situen en Business Intelligence on la interacció està migrant a xats intel·ligents, i customer service, primer intern i després al públic en general. En la innovació és on veurem més sorpreses, això sí, a diferents velocitats i graus d’adopció.

3. La guerra del Cloud

Els proveïdors de Cloud estaven centrats en el transaccional, petites operacions, molt curtes però moltes. Havien invertit molt en processadors barats que consumeixen poca energia. De sobte, tot això ha canviat, la computació torna a ser important i calen processadors potents que executen bàsicament el mateix model, el GPT-4 per exemple.

Això ha obligat a redefinir totes les arquitectures de Cloud i ha agafat a alguns d’ells —com AWS— amb el peu canviat i han trigat a respondre. Altres com Azure (Microsoft) han aprofitat la disrupció per avançar posicions. A Google, encara se l’espera, però s’hi està posant.  

4. La guerra dels Chips

Nvidia s’ha convertit de sobte en una empresa valorada en $1T (un trilió americà de dòlars) i les seves accions han pujat un 180% en el que portem va d’any. Però no s’acaba aquí. AMD, Nvidia i Intel, tots han tret tot un seguit de microprocessadors nous com H100 o el GC200 de Nvidia, competint per aquest nou mercat. L’escassetat d’aquest processadors ha estat i és un fet palès.

També han guanyat els fabricants de processadors d’alta gama com la taiwanesa TSMC i fabricants d’equipament com ASML (litografia ultraviolada).

Els proveïdors de Cloud que ja dissenyaven microprocessadors com AWS i Google Cloud n’han tret noves versions i els que no, com Microsoft, ho han començat a fer (amb el Maia).

El marge és molt alt, una targeta Nvidia A100 pot tenir un preu de 30.000 dòlars quan el seu cost de fabricació està estimat en uns 3.000, la guerra està servida!

5. La guerra dels frameworks de la IA

Fins a l’arribada del ChatGPT la sensació és que sobrava capacitat de computació. Els ordinadors eren sovint més potents del que es necessitava. Això havia fet que els llenguatges més populars fossin molt lents (com el Python) i que els frameworks d’IA (Jax/TensorFlow, Pytorch...) estiguessin molt poc optimitzats, i res d’això semblés important.

Tot això ha canviat radicalment amb la IA generativa. De sobte, l’eficiència era de nou molt important i van anar apareixent noves versions de llenguatges i frameworks que primaven l’eficiència. Entre ells cal destacar Modular, que aporta un nou compilador de Python amb extensions i un entorn per programar IA que promet ser molt més eficient que els actuals permetent fer-ho tot en mojo, un superset de Python, sense haver de recórrer com es fa ara a C++ i Cuda, augmentant d’aquesta manera enormement la productivitat i la velocitat.  

6. La guerra de la regulació

Després del recent acord del tríleg a Europa, Thierry Breton treia pit a X dient que Europa era el primer continent a tenir una regulació extensiva d’IA. Bé, no és cert, l’Executive Order de la IA de Biden i les guideliness xineses, així com els acords de la UK van ser primer i la regulació Europea no estarà en vigor fins a alguna data del 2026 amb decalatges de 6 i 12 mesos pels reglaments.

De totes maneres, el post a X evidencia el nivell de competició entre els reguladors mundials a l’hora de ser els primers a obtenir el titular de premsa.

Fins i tot s’ha configurat un terme, ser campions en regulació, si és que regular quelcom que han fet en altres continents fos un mèrit. Aquesta tensió en la regulació ha portat a posicions extremes i una gran polarització exigint prohibir parts de la IA en nom d’un suposat risc sistèmic. De fet, fins ara, un any després no sembla que la IA generativa hagi acabat amb la democràcia, ni capgirat cap elecció, ni suposi la fi de la humanitat com molts aventuraven ara fa un any.

7. La guerra global

La IA en general i la generativa en particular són tecnologies de propòsit general que permeten avançar en pràcticament qualsevol àrea, incloent-hi la militar. És per això que són estratègicament importants per tots els estats i organitzacions.

Ser capdavanter en IA, no dependre d’altres per desenvolupar la tecnologia i aplicar-la, pot definir guanyadors i perdedors en molts camps, militar inclòs. No és d’estranyar doncs que els estats hi hagin abocat bilions i facin tots els esforços que estan al seu abast per aconseguir i mantenir el lideratge o almenys per no ser dependents d’altres. Tant els EUA, com la Xina, com GB, com força països europeus tenen plans de xoc en marxa amb quantitats ingents de diners tant en infraestructures de computació per no dependre dels proveïdors de cloud americans, com en adquisició i creació de talent com en projectes concrets. Europa, focalitzada en la regulació, està notablement absent d’aquesta setena guerra, sens dubte la més important de totes i probablement la més important d’aquest segle.