Vivim un moment crucial en l’evolució de la tecnologia, impulsat per la intel·ligència artificial generativa. La seva disrupció ens està obrint portes que, encara que a primer cop d'ull puguin semblar petites, tenen el potencial de transformar radicalment la nostra vida quotidiana. Entre les promeses més emocionants d'aquesta transformació es troba una revolució en la manera com interactuem amb la tecnologia: la interfície d'usuari.

Des de la dècada dels 60, la interfície d'usuari ha evolucionat poc en els seus fonaments. Va ser al laboratori de Xerox, a Palo Alto, on Alan Kay i el seu equip van dissenyar el concepte de finestres, carpetes, ratolí i escriptori, inspirant-se en l'entorn d'oficina de l'època. Aquest esquema visual va ser popularitzat als anys 80 pel Macintosh d'Apple, i des d'aleshores es va convertir en l'estàndard gairebé universal. No només va canviar la manera en què utilitzàvem els ordinadors, sinó que va definir com interactuem amb una gran varietat de dispositius. Des dels ordinadors fins als telèfons, passant per televisors, automòbils i fins i tot electrodomèstics com neveres i forns, la interfície gràfica d'usuari s'ha tornat omnipresent.

El paradigma visual que ha dominat la tecnologia durant més de sis dècades està mostrant signes d'esgotament

L’arribada d'internet i l'auge del cercador com a principal eina de treball només van reforçar aquest esquema visual. Les metàfores de carpetes, finestres i pestanyes es van ampliar per cobrir les nostres necessitats de comunicació, organització i interacció. Ara, quan naveguem per la xarxa, no només fem cerques o llegim notícies, sinó que gestionem les nostres xarxes socials i realitzem tràmits, tot a través d'aquesta mateixa interfície. Tanmateix, aquest paradigma visual, que ha dominat la tecnologia durant més de sis dècades, està mostrant signes d'esgotament.

Avui, gràcies a la intel·ligència artificial generativa i als models de llenguatge natural, estem a les portes d'una nova era en la qual la tecnologia i els humans poden interactuar de forma més intuïtiva i directa, sense necessitat de metàfores visuals. Estem tornant a la forma de comunicació més natural i universal per als humans: el llenguatge. Amb els avenços en el processament de llenguatge natural, finalment podrem substituir el ratolí, les carpetes i les finestres per una interacció basada en paraules i conversació.

Aquesta revolució ja ha fet els seus primers passos en forma d’assistents virtuals com Siri, Alexa i Google Assistant. Encara que aquestes tecnologies han mostrat cert èxit, fins ara han funcionat de manera limitada i molts usuaris només les utilitzen per a tasques senzilles, com posar alarmes o cercar el temps. Tanmateix, amb els avenços en models de llenguatge natural, aquests assistents aviat podran entendre i executar les nostres instruccions de manera molt més eficaç, obrint un ventall de possibilitats en la nostra vida diària.

Anem cap a una era en què podrem parlar a la tecnologia com ho fem amb una altra persona. La interfície d'usuari ja no dependrà de metàfores visuals

Imaginem, per exemple, un automòbil en el qual podem parlar directament amb el sistema, sense necessitat de manipular botons o perdre temps cercant funcions mentre conduïm. Per a aquells que lloguen un cotxe, ja no seria necessari aprendre a manejar una interfície diferent cada vegada. També podríem acomiadar-nos del comandament a distància i de la incomoditat de teclejar en un teclat diminut per cercar alguna cosa al nostre televisor. Amb un sistema d’intel·ligència artificial avançat, la televisió respondria a les nostres ordres de veu de manera fluida i sense intermediaris, convertint-se en un veritable centre d’entreteniment intel·ligent.

Tanmateix, el camí cap a aquesta nova era no està exempt de desafiaments. Un dels principals obstacles és la necessitat que els dispositius processin aquestes instruccions de llenguatge natural de manera local, sense dependre tant del núvol per no perdre velocitat o privadesa. Els cotxes d'alta gamma, com els de Tesla, compten amb la potència de processament suficient per realitzar aquestes tasques de manera autònoma. Tanmateix, altres dispositius de menor capacitat, com els nostres televisors, cafeteres, microones o frigorífics, encara no disposen de la infraestructura necessària.

Per aquesta raó, és probable que entrem en un període de transició en el qual necessitem “hubs” domèstics que actuïn com a cervells centrals de les nostres llars. Aquests centres de control —com Google Home, Amazon Echo i Apple HomePod— ja estan començant a complir aquesta funció, connectant i coordinant els diferents dispositius a les nostres llars. Aquests “hubs” podrien no només interpretar les nostres ordres, sinó també enviar instruccions a altres dispositius que no puguin processar llenguatge natural per si mateixos.

La transformació de la interfície d'usuari cap a un model de llenguatge és, en última instància, un retorn a la nostra essència humana

Però l'objectiu final és clar: deixar enrere les carpetes, els ratolins, els clics i els menús. Ens dirigim cap a una era en què podrem parlar a la tecnologia com ho faríem amb una altra persona, una era en què la interfície d'usuari ja no dependrà de metàfores visuals, sinó de la nostra forma més natural de comunicar-nos: el llenguatge.

Aquesta transformació de la interfície d'usuari és, en última instància, un retorn a la nostra essència humana. El llenguatge és l'eina que ens defineix com a espècie, el pont que uneix el nostre pensament amb l'acció. En eliminar les barreres tecnològiques de la interfície actual, estem permetent que la comunicació entre humans i màquines flueixi de manera més directa, sense necessitat d'intermediaris.

Així, la intel·ligència artificial generativa no només representa un avenç tècnic, sinó un canvi profund en com entenem i gestionem la tecnologia en les nostres vides. En el futur, potser no recordarem quan vam deixar de fer clic per començar a parlar; finalment deixarem enrere les carpetes, els ratolins i els clics, i ens farem entendre com ho fan els humans: parlant.