El tribunal del Districte Sud de Nova York, en el cas Raw Story Media, Inc. i Alternet Media, Inc. contra OpenAI, Inc. i les seves subsidiàries ha donat la raó a OpenAI. Els demandants, empreses de mitjans, van al·legar que OpenAI va infringir la Digital Millennium Copyright Act (DMCA), llei de propietat intel·lectual americana, en utilitzar les seves obres protegides per drets d'autor per entrenar el seu model ChatGPT, suposadament eliminant informació de gestió de drets d'autor (CMI en anglès) sense autorització.
Desestimació i decisió a favor d'OpenAI
El tribunal va desestimar la demanda dels demandants en la seva totalitat, indicant que els demandants mancaven de legitimació activa segons la Constitució dels EUA en no haver demostrat un perjudici concret i immediat, requisit perquè el tribunal acceptés a tràmit el cas.
Segons el tribunal, els demandants no van poder provar que OpenAI hagués ja distribuït continguts de ChatGPT que reprodueixin les seves obres protegides sense la informació de drets d'autor. Per al tribunal, al·legar el simple ús dels seus textos en entrenament no és suficient en el marc jurídic americà. A més els demandants tampoc no van demostrar que existeixi un risc significatiu que ChatGPT generi respostes que reprodueixin els seus articles o infringeixin els seus drets d'autor.
La pretensió dels demandants
Els demandants van al·legar infracció de la DMCA per part de OpenAI en extreure aquesta suposadament els continguts dels seus articles i eliminar la informació de gestió de drets (la CMI és informació rellevant com el nom de l'autor, el títol, els drets d'autor, i els termes d'ús) dels esmentats articles i utilitzar-los per entrenar el model sense compensació ni autorització dels seus autors.
Segons els demandants, aquesta eliminació va impossibilitar que ChatGPT proporcionés informació sobre els autors o l'origen dels textos i d'altra banda va facilitar que el model generés respostes que inclouen contingut basat en les seves obres sense reconèixer la seva autoria ni els seus drets, violant el dret exclusiu del titular de controlar com es presenta i utilitza la seva obra.
Van sol·licitar danys i perjudicis i l'eliminació de les seves obres per part de OpenAI
No obstant això, la DMCA exigeix, perquè hi hagi infracció, que l'infractor conegués que es va eliminar la CMI sense autorització i, a més, que sabia o tenia motius raonables per saber que això facilitaria una infracció de drets d'autor. I el tribunal va concloure que els demandants no van poder acreditar a tot això. No van demostrar que les obres sense CMI s'haguessin distribuït públicament com a resultat de l'ús de ChatGPT. El tribunal va desestimar la demanda, sense perjudici de possibles apel·lacions dels demandants, que podrien modificar la seva pretensió i la base jurídica de la mateixa, en particular, acreditant la causació de danys.
Els demandants (Raw Story Media i Alternet Media) van afirmar que OpenAI va utilitzar milers de les seves obres periodístiques, protegides per drets d'autor, com a part dels conjunts de dades per a l'entrenament de ChatGPT. Aquests conjunts de dades (datasets) inclouen col·leccions com WebText, WebText2 i Common Crawl, que contenen textos recopilats d'internet (molts d'ells d'accés públic, però no necessàriament d'ús lliure o exempt de drets d'autor). Aquest ús per part de les tecnològiques per entrenar els seus grans models de llenguatge (LLMs), l'anomenat web scraping, és un problema de dimensions colossals a aquestes altures després de la publicació i comercialització dels esmentats sistemes.
Conclusions
En aquest cas, el tribunal estableix un precedent quant a l'ús d'obres protegides per entrenar models d'intel·ligència artificial, particularment respecte al marc de la DMCA. Els demandants no van poder provar que el mer ús de les seves obres en l'entrenament de ChatGPT, sense més ni més, constitueixi un perjudici concret que meriti danys sota la legislació actual. El jutge mateix va suggerir que el problema real no és l'eliminació de la CMI en si, sinó l'ús de les obres protegides sense llicència o compensació, una cosa que els demandants van esmentar només de manera tangencial.
El tribunal no va examinar si OpenAI va violar drets d'autor en utilitzar obres protegides per entrenar els seus models, ja que aquesta qüestió no formava part de la demanda principal. El cas reflecteix la necessitat d'una regulació més específica, o una revisió detallada de l'actual marc jurídic, per abordar qüestions relacionades amb la IA i els drets d'autor.
Implicacions legals a futur
Aquesta sentència aclareix que l'ús d'obres protegides per entrenar IA no necessàriament infringeix la DMCA, especialment si no es demostra que les obres sense la informació sobre els drets d'autor es distribuïssin o causessin un dany a l'autor de l'obra. Els demandants poden intentar reformular els seus arguments sobre la base d'una altra normativa, però hauran d'acreditar un vincle més clar entre el dany sofert i les actuacions de OpenAI.