Veo, el LLM de Google para las salidas de texto a vídeo e imagen en vídeo, estará disponible en vista previa privada para los clientes de Google Cloud a través de Vertex AI. También estamos eliminando la lista de permisos para Imagen 3 a Vertex AI, que estará disponible para todos los clientes de todo el mundo a partir de la semana que viene.
¿Qué es Veo?
Lanzado a Y/O este año, Veo es el modelo de generación de vídeo de Google que se anuncia como el más capaz hasta ahora que presenta el DeepMind de Google. Con una comprensión avanzada del lenguaje natural y la semántica visual, genera un vídeo que representa de cerca la visión creativa del usuario. Con 24 o 30 fps, Veo crea imágenes coherentes e incoherentes, de manera que las personas, los animales y los objetos se mueven de manera realista a lo largo de las fotografías.
En particular, Veo puede generar un vídeo con una imagen como entrada junto con el mensaje de texto. Al proporcionar una imagen de referencia en combinación con una indicación de texto, Veo condiciona a que genere un vídeo que siga el estilo de la imagen y las instrucciones del indicador del usuario. Google Cloud es el primer hiperescalador que ofrece un modelo de imagen en vídeo a sus clientes.
¿Qué es Imagen?
Imagen 3 es el modelo de texto en imagen de más alta calidad. Genera un nivel de detalle increíble, produciendo imágenes fotorealistes y realistas, con muchos menos artefactos visuales que distraen que nuestros modelos anteriores. Imagen 3 estará disponible para todos los clientes de Vertex AI a partir de la semana que viene.
¿Cómo pueden los clientes de Google Cloud utilizar a Veo i Imagen en Vertex AI?
Algunos casos de uso:
- Los anunciantes pueden generar imágenes y vídeos de un producto u objeto específico en un entorno diferente, conservando su forma y características. Eso es ideal para los anuncios de display.
- Los minoristas pueden crear un clip que muestre una prenda de ropa, ropa o accesorio específico sobre una persona, solo empezando con una imagen de este artículo.
- Los vendedores empresariales pueden crear activos para bloques, acontecimientos y otros contenidos relacionados con el marketing para utilizarlos a las redes sociales y otras superficies en línea.
- Los cineastas pueden añadir movimiento de cámara a partir de una imagen para mejorar la historia y atraer la audiencia a la narración.
Según informan, Veo e Imagen 3 en Vertex AI priorizan la seguridad y la responsabilidad con precauciones integradas como la marca de agua digital, los filtros de seguridad, el gobierno de los datos y la indemnización de los derechos de autor. Algunos aspectos a tener en cuenta son:
- Marca de agua digital: SynthID de Google DeepMind incrusta marcas de agua invisibles a cada imagen y marco que producen Imagen 3 y Veo, ayudando a disminuir la información errónea y los problemas de atribución errónea.
- Filtros de seguridad: Veo e Imagen 3 tienen medidas de seguridad integradas para protegerse de la creación de contenido nocivo y se adhieren a los principios de IA responsable de Google. Seguiremos invirtiendo en nuevas técnicas para mejorar las protecciones de seguridad y privacidad de nuestros modelos.
- Gobierno de datos: no utilicemos los datos de los clientes para entrenar nuestros modelos, de acuerdo con el gobierno de datos y los controles de privacidad integrados de Google Cloud. Vuestros datos de cliente solo se procesan según vuestras instrucciones.
¿Por qué Vertex AI es tan única?
Vertex AI es la plataforma unificada de aprendizaje automático (ML) de Google Cloud. Está diseñado para ayudar a los desarrolladores y los científicos de datos a crear, desplegar y gestionar modelos de ML de manera más eficiente. Ofreciendo más de 160 modelos de código abierto, de terceros y de terceros, Vertex AI ofrece un conjunto completo de herramientas que racionalizan todo el flujo de trabajo de ML, desde la preparación de datos y el desarrollo de modelos hasta el despliegue y la supervisión. Algunos ejemplos de cómo los clientes utilizan Vertex AI incluyen:
- Snap: Snap está impulsando experiencias clave dentro de su chatbot "My AI" con Gemin en Vertex AI e Imagen. Estos casos de uso han aumentado el tráfico a través de la aplicación Snapchat: el chatbot "My AI" consiguió un compromiso 2,5 veces más grande en los EE.UU. después de implementar las capacidades de Gemini mediante Vertex AI.
- PUMA: PUMA está utilizando Imagen 2 en Vertex AI para crear imágenes de producto dinámicas y personalizadas que mejoran los porcentajes de clics y aceleran el tiempo de lanzamiento en el mercado de las campañas digitales de PUMA a nivel mundial.
- Warner Brothers: para mantener altos niveles de precisión, la solución de subtítulos de Warner Bros Discovery incorpora un flujo de trabajo que utiliza la plataforma Vertex AI de Google Cloud para optimizar los subtítulos, junto con la supervisión humana para garantizar la calidad.
- Mercedes: Mercedes está ampliando su uso de Google Cloud AI para hacer que su experiencia de centro de llamadas sea más fluida y útil, y está aprovechando las herramientas de IA y de generación de IA, como Vertex AI y los modelos Gemine de Google, para hacer que sus campañas de marketing sean más personalizadas y relevantes para los clientes. por todo el mundo.