Google ha presentado este martes VEO, su última herramienta de Inteligencia Artificial generativa de vídeo que permite crear vídeos de alta definición con una resolución de 1090p "en una amplia gama de estilos cinematográficos y visuales que pueden ir más allá de un minuto", según reza el gigante tecnológico en su propia web. También ha puesto de largo Image 3, una herramienta de transformación de voz en imagen que mejora la definición y prestaciones ofrecidas hasta la fecha.
"Con una comprensión avanzada del lenguaje natural y la semántica visual, (VEO) genera un video que representa de cerca la visión creativa del usuario, capturando con precisión el tono de una indicación y mostrando detalles en indicaciones más largas", explica el comunicado de la empresa, que habla de un "control creativo sin precedentes". El modelo, añaden, "entiende términos cinematográficos como timelapse o fotos aéreas de un paisaje", con un metraje "coherente" y con movimientos realistas que consiguen un aspecto muy parecido a paisajes reales y animales o personas de carne y hueso.
En el lanzamiento, Google ha mostrado un vídeo realizado de la mano del cineasta Donald Glover, también conocido como músico como Childish Gambino, que con su estudio creativo Gilga ha realizado un vídeo con esta herramienta (arriba).
VEO nace del desarrollo de vídeo por IA creado previamente por Google a través de Generative Query Network, DVD-Gan, Imagen-Video, Phenaki, WALT, VideoPoet y Lumiere y combina arquitectura, leyes de escala y otras técnicas para mejorar la calidad y la resolución. Por ahora, la herramienta tan solo está disponible para creadores que lo quieran utilizar de manera privada uniéndose a una lista de espera.
También está disponible solo por esta vía Image 3, la herramienta presentada por Google de manera simultánea a VEO, en esta ocasión para generar imágenes con Inteligencia Artificial a partir de voz y con una elevada fidelidad a la realidad.