A Google no paren, almenys en el que a IA es refereix: al desembre li van canviar el nom a la seva eina d'IA generativa, que ara es diu Gemini. Allò de Bard, sembla, no va funcionar, potser per les connotacions trobadoresques del terme. Ara, amb el nou nom, que evoca entorns més tecnològics, assentat ja, llancen –en proves- l'actualització 1.5 Pro.

bard IA de google / Europa Press
 

Què ofereixen?

De moment, només té accés un grup escollit de desenvolupadors, però ja es pot avançar que destaca per la seva gran capacitat de procés: pot amb una hora de vídeo, onze d'àudio, 700.000 paraules o fins a 30.000 línies de codi. Funciona amb xarxes neuronals que s'activen en funció de l'activitat que l'usuari exigeix a l'eina. Cada xarxa s'especialitza en una tasca i incrementa la seva capacitat així que|tal com més tasques se li encarreguen.

Comprensió de contextos

Gemini 1.5 destaca, altres per la seva capacitat de comprensió de contextos llargs. Així, la seva finestra de context estàndard de 128.000 tokens, però els desenvolupadors tindran la possibilitat d'emprar una finestra contextual de fins a un milió de tokens si disposen d'eines com AI Studio o Vertex AI. Superarà Gemini OpenAI? Veurem, però de moment tenen ja una nova eina: Sora, que converteix text en vídeo.