Fa pocs dies, en una conferència per a estudiants a Carnegie Mellon, Sundar Pichai va compartir una dada sorprenent: el cost dels models de Google ha caigut dràsticament en els darrers 18 mesos. Fa un any i mig, processar un milió de tokens costava 4 dòlars; avui, aquest mateix procés costa només 0,13 dòlars, una reducció del 98%.

Cost google models

Si mirem els preus d'OpenAI o Anthropic, observem una tendència similar. Això no és exclusiu de Google, sinó un reflex d'un fenomen generalitzat en el sector. Aquesta reducció en el cost és crucial, especialment perquè aquestes empreses estan generant ingressos significatius amb l’ús dels seus models per part d'altres organitzacions, i OpenAI i Anthropic en són un clar exemple.

Aquest fenomen tot just comença. No fa tant, Jensen Huang, el CEO de Nvidia, va explicar com la seva empresa ha multiplicat per 1.000 la potència de computació dels seus processadors en només 8 anys, superant amb escreix la Llei de Moore, que preveia un augment de la potència cada dos anys. A més, Huang va afirmar que encara hi ha marge per mantenir aquest ritme de millora en el futur immediat, mentre presentava la nova família de GPUs, Rubin.

Simultàniament, veiem grans avenços en el camp del software. Fins ara, només el llenguatge Julia s'acostava a les velocitats del C++, però ara també tenim Mojo, una variació de Python que fins i tot supera el C++ en rendiment.

Tot això ens porta a una conclusió evident: la computació per a tasques habituals que no impliquen I.A. generativa està a punt d’arribar a un cost marginal gairebé zero.

Ben aviat tindrem la capacitat de fer tasques que considerem intel·ligents a un cost marginal gairebé zero

Aquesta cursa desenfrenada, impulsada per la I.A. generativa, està transformant els nostres ordinadors, telèfons i altres dispositius en eines de càlcul amb una potència inimaginable fa només uns anys. Les grans empreses tecnològiques són especialistes en computació massiva; aquest és el seu negoci principal. Guanyen poc per cada anunci, però poden gestionar recerques massives a la web o mantenir en funcionament sistemes de comunicació globals com WhatsApp a un cost molt baix. Ningú més ho fa a aquesta escala. El seu objectiu ara és aconseguir el mateix amb la I.A. generativa.

Ho aconseguiran? Cada dia hi ha menys dubtes no només sobre si ho faran, sinó sobre quan ho faran. El seu model de negoci es basa en sistemes altament optimitzats amb costos marginals pròxims a zero.

En els darrers dies també hem vist la nova generació de models d'OpenAI, coneguda com l’o-1, amb diverses variants. Aquest model té un rendiment comparable al d’un estudiant de doctorat en camps com matemàtiques, informàtica, genètica, física, i fins i tot economia. Tot i que no està entrenat en tots els camps, és una finestra cap al futur. Terence Tao, un dels matemàtics més destacats del món, l'ha descrit com un estudiant de màster o doctorat mediocre en matemàtiques, però no totalment incompetent, i preveu que en un parell d’iteracions es podria convertir en un estudiant excel·lent. Un expert de JP Morgan, que va participar en les primeres proves, va assenyalar que aquest model és capaç d’adaptar un contracte de centenars de pàgines als nous requisits de compliment normatiu en qüestió de minuts, una tasca que per a un expert legal podria requerir hores. L'economista Tyler Cowen també ha posat a prova el model amb preguntes pròpies d’un doctorat en economia, obtenint respostes molt convincents.

La cursa desenfrenada impulsada per la IA generativa està transformant els nostres ordinadors, telèfons i altres dispositius en eines de càlcul amb una potència inimaginable

La conclusió sembla inevitable: ben aviat tindrem la capacitat de fer tasques que considerem intel·ligents a un cost marginal gairebé zero.

No només això, fa uns dies (6-9-24) es va publicar un article de Si, Yang i Hashimoto, de la Universitat de Stanford, titulat Can LLMs Generate Novel Research Ideas?, on es comparaven les idees de recerca generades per grans models de llenguatge (LLMs) amb les dels acadèmics. Sorprenentment, les idees dels LLMs van resultar ser superiors.

A tot això s'hi suma la caiguda en el cost de l'energia gràcies al boom de la computació i als vehicles elèctrics, impulsats per la instal·lació massiva d’energia solar i microcentrals nuclears a la Xina. Això fa que en alguns dies el cost de l'energia sigui fins i tot negatiu.

Així, la humanitat s’enfronta a un nou escenari: energia i “intel·ligència” a un cost proper a zero. Però com es distribuiran aquests beneficis, i a qui arribaran, serà una qüestió política. Al final, només els països amb sobirania tecnològica tindran la capacitat de triar; els dependents no tindran aquesta opció.