Hola, soc Esther Checa i avui m'agradaria explicar què és el projecte Jarvis de Google. Aquest projecte és un canvi de paradigma sobre com aquesta companyia entén l'evolució de la IA. A diferència dels assistents de veu que tenim avui dia, on la forma en què ens hi relacionem és mitjançant comandos específics, Jarvis està dissenyat per funcionar en un navegador i operar de manera autònoma, navegant pel web, i anar prenent decisions.

Per què és important?

L'impacte d'aquest projecte podria provocar una accessibilitat més gran a la IA, simplificant l'ús d'aquesta tecnologia per a usuaris sense coneixements tècnics; i un estalvi de temps i esforç a causa de l'automatització de tasques quotidianes.

Desenvolupament del tema

Què pot fer Jarvis? S'espera que pugui automatitzar tasques basades en el web, com podrien ser realització recerques, recopilar informació, completar formularis, comprar online o reservar vols, entre d'altres, i això es podrà fer amb simples comandos; i un altre dels aspectes a tenir en compte, és que podrà controlar l'ordinador. Probablement en un futur proper, podrà fins i tot interactuar amb el sistema operatiu, obrint aplicacions, organitzant la pantalla i optimitzant els nostres fluxos de treball.

Jarvis funcionarà amb una versió futura del gran model de llenguatge d'IA de Google conegut com a Gemini, i operarà principalment sobre el seu navegador Chrome. Aquesta forma d'interactuar amb els nostres dispositius ja ho vam poder veure amb el funcionament de Rabbit r1, un revolucionari dispositiu impulsat per intel·ligència artificial, i presentat en el CES de Las Vegas.

Què estan fent les principals empreses d'IA?

Les grans empreses, amb l'objectiu d'impulsar aquest tipus d'automatitzacions dins dels nostres dispositius, duu a terme diferents accions. En el cas d'Anthropic a través del seu model Claude 3.5 Sonnet ha llançat una nova funció denominada 'ús de computadora', és una versió beta pública que permet controlar l'ordinador mirant la pantalla; Microsoft, a través de Copilot Vision, permetrà a l'usuari parlar amb ell sobre les pàgines web que estigui navegant; i en el cas d'Open AI també està treballant en programari d'agent per automatitzar tasques complexes i fer-se càrrec del dispositiu de l'usuari. Per exemple, l'usuari podrà demanar que transferís dades d'un document a un full de càlcul per a la seva anàlisi; o que completi automàticament informes de despesa, i inclogui aquests en un programari de comptabilitat.

Aquest tipus de sol·licituds que els usuaris podran fer a l'agent, es tradueixen que aquest pugui executar els clics, moviments del cursor, l'escriptura de text o un altre tipus d'accions que realitzem les persones quan interactuem amb les diferents aplicacions.

Conclusions

El projecte Jarvis podria marcar un abans i un després en l'evolució de la IA, fent-la ser més accessible i intuïtiva, impulsant el desenvolupament de tecnologies autònomes en diversos camps. (agafar el segon enregistrament d'aquest paràgraf). S'espera que aquest llançament sigui el desembre, subjecte a canvis, ja que actualment està sent avaluat per un grup petit d'avaluadors per ajudar la companyia a solucionar errors.