L'empresa OpenAI, un dels líders en intel·ligència artificial generativa, va presentar aquest dijous el seu model 'Sora' que accepta instruccions en text i les converteix en escenes de vídeo, realistes, amb múltiples caràcters i moviments específics. Segons la firma, establerta el 2015 i dirigida per Sam Altman, que ha desenvolupat ChatGPT i el generador d'imatges fixes DALL-E, 'Sora' és capaç de crear "escenes complexes amb detalls del component principal i el rerefons".
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: "Beautiful, snowy… pic.twitter.com/ruTEWn87vf
La companyia també va indicar que el seu model pot "entendre com existeixen els objectes al món físic" i té la capacitat d'"interpretar encertadament les instruccions i de generar caràcters convincents que expressen emocions vibrants".
Encara no està a la disposició del públic
'Sora' és el terme en japones per a "cel" i la companyia encara no l'ha posat a disposició del públic perquè continua analitzant-la per comprendre els perills del sistema, segons va indicar el diari The New York Times. En canvi OpenAI ha compartit la tecnologia amb un petit grup d'acadèmics i altres investigadors externs la tasca dels quals és detectar les maneres en les quals 'Sora' podria utilitzar-se amb finalitats malicioses.
"Un resultat convincent"
Steven Levy, de la revista Wired, va descriure la seva experiència quan OpenAi li va permetre veure, encara que no operar, el model 'Sora' en resposta a la instrucció en text per crear una escena de la ciutat de Tòquio captada per una càmera que es mou pels carrers, segueix algunes persones un dia amb neu.
My view on Sora, @openai's new text-to-video engine. Most impressive is that without specific training it is learning the cinematic arts. https://t.co/HdfuF9cg85
— Steven Levy (@StevenLevy) February 15, 2024
"El resultat és una vista convincent del que és, sens dubte, Tòquio en aquell moment, quan coexisteixen els flocs de neu i els capolls de cirerers" va escriure Levy. "La càmera virtual, col·locada en un robot volador (dron), segueix a una parella que camina pel paisatge".
La firma indica que 'Sora' permet la creació de molts mons, amb escenes realistes o fantàstiques, tridimensionals, amb moviments fluids, i encara en les escenes que no hi ha al món real, el model aplica les regles físiques correctes. D'aquesta manera, OpenAI, que va revolucionar l'emergent sector dels serveis d'IA regenerativa, disposarà d'un conjunt de serveis que van des de la generació de text, imatge estàtica i vídeo.
Demanda per plagi contra OpenAI
L'actriu Sarah Silverman i un grup d'autors han vist desestimada una querella per infracció de drets d'autor que van entaular contra la firma OpenAI, va informar aquest dimarts el mitjà especialitzat The Hollywood Reporter. Els demandants, que a més de Silverman inclou autors com Christopher Golden i Ta-Nehisi Coates, no van aconseguir demostrar similitud entre la producció feta per ChatGPT, l'eina a base d'intel·ligència artificial de OpenAI, i els llibres escrits pels querellants, segons una moció de la jutgessa federal Araceli Martínez-Olguín.
La magistrada va assenyalar que els denunciants tenen fins al proper 13 de març per poder presentar evidència que demostri una "similitud substancial entre els resultats i els materials protegits pels drets d'autor", segons l'escrit ingressat a la cort dilluns.