En Google no paran, al menos en lo que a IA se refiere: en diciembre le cambiaron el nombre a su herramienta de IA generativa, que ahora se llama Gemini. Lo de Bard, parece, no funcionó, quizá por las connotaciones juglarescas del término. Ahora, con el nuevo nombre, que evoca entornos más tecnológicos, asentado ya, lanzan –en pruebas- la actualización 1.5 Pro.
¿Qué ofrecen?
De momento, sólo tiene acceso un grupo escogido de desarrolladores, pero ya se puede adelantar que destaca por su gran capacidad de proceso: puede con una hora de vídeo, once de audio, 700.000 palabras o hasta 30.000 líneas de código. Funciona con redes neuronales que se activan en función de la actividad que el usuario exige a la herramienta. Cada red se especializa en una tarea e incrementa su capacidad conforme más tareas se le encargan.
Comprensión de contextos
Gemini 1.5 destaca, demás por su capacidad de comprensión de contextos largos. Así, su ventana de contexto estándar de 128.000 tokens, pero los desarrolladores van a tener la posibilidad de manejar una ventana contextual de hasta un millón de tokens si disponen de herramientas como AI Studio o Vertex AI. ¿Superará Gemini a OpenAI? Veremos, pero de momento tienen ya una nueva herramienta: Sora, que convierte texto en vídeo.