Hola, soy Esther Checa y hoy me gustaría explicar qué es el proyecto Jarvis de Google. Este proyecto es un cambio de paradigma sobre cómo esta compañía entiende la evolución de la IA. A diferencia de los asistentes de voz que tenemos hoy en día, donde la forma en la que nos relacionamos con ellos es mediante comandos específicos, Jarvis está diseñado para funcionar en un navegador y operar de manera autónoma, navegando por la web, e ir tomando decisiones.
¿Por qué es importante?
El impacto de este proyecto podría provocar una mayor accesibilidad a la IA, simplificando el uso de esta tecnología para usuarios sin conocimientos técnicos; y un ahorro de tiempo y esfuerzo debido a la automatización de tareas cotidianas.
Desarrollo del tema
¿Qué puede hacer Jarvis? Se espera que pueda automatizar tareas basadas en la web, como podrían ser realización búsquedas, recopilar información, completar formularios, comprar online o reservar vuelos, entre otros, y esto se podrá hacer con simples comandos; y otro de los aspectos a tener en cuenta, es que podrá controlar el ordenador. Probablemente en un futuro cercano, podrá incluso interactuar con el sistema operativo, abriendo aplicaciones, organizando la pantalla y optimizando nuestros flujos de trabajo.
Jarvis funcionará con una versión futura del gran modelo de lenguaje de IA de Google conocido como Gemini, y operará principalmente sobre su navegador Chrome. Esta forma de interactuar con nuestros dispositivos ya lo pudimos ver con el funcionamiento de Rabbit r1 , un revolucionario dispositivo impulsado por inteligencia artificial, y presentado en el CES de Las Vegas.
¿Qué están haciendo las principales empresas de IA?
Las grandes empresas, con el objetivo de impulsar este tipo de automatizaciones dentro de nuestros dispositivos, lleva a cabo diferentes acciones. En el caso de Anthropic a través de su modelo Claude 3.5 Sonnet ha lanzado una nueva función denominada ‘uso de computadora’, es una versión beta pública que permite controlar el ordenador mirando la pantalla; Microsoft, a través de Copilot Vision, permitirá al usuario hablar con él sobre las páginas web que esté navegando; y en el caso de Open AI también está trabajando en software de agente para automatizar tareas complejas y hacerse cargo del dispositivo del usuario. Por ejemplo, el usuario podrá pedir que transfiriera datos de un documento a una hoja de cálculo para su análisis; o que complete automáticamente informes de gasto, e incluya éstos en un software de contabilidad.
Este tipo de solicitudes que los usuarios podrán hacer al agente, se traducen en que éste pueda ejecutar los clics, movimientos del cursor, la escritura de texto u otro tipo de acciones que realizamos las personas cuando interactuamos con las diferentes aplicaciones.
Conclusiones
El proyecto Jarvis podría marcar un antes y un después en la evolución de la IA, haciéndola ser más accesible e intuitiva, impulsando el desarrollo de tecnologías autónomas en diversos campos. (coger la segunda grabación de este párrafo). Se espera que este lanzamiento sea en diciembre, sujeto a cambios, ya que actualmente está siendo evaluado por un grupo pequeño de evaluadores para ayudar a la compañía a solucionar errores.