OpenAI presenta 'Sora', un modelo que transforma texto en video

La empresa OpenAI, uno de los líderes en inteligencia artificial generativa, presentó este jueves su modelo 'Sora' que acepta instrucciones en texto y las convierte en escenas de video, realistas, con múltiples caracteres y movimientos específicos. Según la firma, establecida en 2015 y dirigida por Sam Altman, que ha desarrollado ChatGPT y el generador de imágenes fijas DALL-E, 'Sora' es capaz de crear "escenas complejas con detalles del componente principal y el trasfondo".

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024

La compañía también indicó que su modelo puede "entender cómo existen los objetos en el mundo físico" y tiene la capacidad de "interpretar acertadamente las instrucciones y de generar caracteres convincentes que expresan emociones vibrantes".

Todavía no está a la disposición del público

'Sora' es el término en japones para "cielo" y la compañía todavía no la ha puesto a disposición del público porque sigue analizándola para comprender los peligros del sistema, según indicó el diario The New York Times. En cambio OpenAI ha compartido la tecnología con un pequeño grupo de académicos y otros investigadores externos cuya tarea es detectar las maneras en las cuales 'Sora' podría usarse con fines maliciosos.

"Un resultado convincente"

Steven Levy, de la revista Wired, describió su experiencia cuando OpenAi le permitió ver, aunque no operar, el modelo 'Sora' en respuesta a la instrucción en texto para crear una escena de la ciudad de Tokio captada por una cámara que se mueve por las calles, sigue a algunas personas en un día con nieve.

My view on Sora, @openai's new text-to-video engine. Most impressive is that without specific training it is learning the cinematic arts. https://t.co/HdfuF9cg85
— Steven Levy (@StevenLevy) February 15, 2024

"El resultado es una vista convincente de lo que es, sin duda, Tokio en ese momento, cuando coexisten los copos de nieve y los capullos de cerezos" escribió Levy. "La cámara virtual, colocada en un robot volador (dron), sigue a una pareja que camina por el paisaje".

La firma indica que 'Sora' permite la creación de muchos mundos, con escenas realistas o fantásticas, tridimensionales, con movimientos fluidos, y aún en las escenas que no existen en el mundo real, el modelo aplica las reglas físicas correctas. De este modo, OpenAI, que revolucionó el emergente sector de los servicios de IA regenerativa, dispondrá de un conjunto de servicios que van desde la generación de texto, imagen estática y video.

Demanda por plagio contra OpenAI

La actriz Sarah Silverman y un grupo de autores han visto desestimada una querella por infracción de derechos de autor que entablaron contra la firma OpenAI, informó este martes el medio especializado The Hollywood Reporter. Los demandantes, que además de Silverman incluye a autores como Christopher Golden y Ta-Nehisi Coates, no lograron demostrar similitud entre la producción hecha por ChatGPT, la herramienta a base de inteligencia artificial de OpenAI, y los libros escritos por los querellantes, según una moción de la jueza federal Araceli Martínez-Olguín.

La magistrada señaló que los denunciantes tienen hasta el próximo 13 de marzo para poder presentar evidencia que demuestre una "similitud sustancial entre los resultados y los materiales protegidos por los derechos de autor", según el escrito ingresado en la corte el lunes.

Más

OpenAI presenta 'Sora', un modelo que transforma texto en video

'Sora' es el término en japones para "cielo" y la compañía todavía no la ha puesto a disposición del público

Todavía no está a la disposición del público

"Un resultado convincente"

Demanda por plagio contra OpenAI