El tribunal del Distrito Sur de Nueva York, en el caso Raw Story Media, Inc. y Alternet Media, Inc. contra OpenAI, Inc. y sus subsidiarias ha dado la razón a OpenAI. Los demandantes, empresas de medios, alegaron que OpenAI infringió la Digital Millennium Copyright Act (DMCA), ley de propiedad intelectual americana, al usar sus obras protegidas por derechos de autor para entrenar su modelo ChatGPT, supuestamente eliminando información de gestión de derechos de autor (CMI en inglés) sin autorización.

Desestimación y fallo a favor de OpenAI

El tribunal desestimó la demanda de los demandantes en su totalidad, indicando que los demandantes carecían de legitimación activa según la Constitución de los EE.UU. al no haber demostrado un perjuicio concreto e inmediato, requisito para que el tribunal aceptara a trámite el caso.

Según el tribunal, los demandantes no pudieron probar que OpenAI hubiera ya distribuido contenidos de ChatGPT que reproduzcan sus obras protegidas sin la información de derechos de autor. Para el tribunal, alegar el simple uso de sus textos en entrenamiento no es suficiente en el marco jurídico americano. Además los demandantes tampoco demostraron que exista un riesgo significativo de que ChatGPT genere respuestas que reproduzcan sus artículos o infrinjan sus derechos de autor.

La pretensión de los demandantes

Los demandantes alegaron infracción de la DMCA por parte de OpenAI al extraer ésta supuestamente los contenidos de sus artículos y eliminar la información de gestión de derechos (la CMI es información relevante como el nombre del autor, el título, los derechos de autor, y los términos de uso) de dichos artículos y utilizarlos para entrenar el modelo sin compensación ni autorización de sus autores.

Según los demandantes, esta eliminación imposibilitó que ChatGPT proporcionara información sobre los autores o el origen de los textos y por otro lado facilitó que el modelo generara respuestas que incluyen contenido basado en sus obras sin reconocer su autoría ni sus derechos, violando el derecho exclusivo del titular de controlar cómo se presenta y utiliza su obra.

Solicitaron daños y perjuicios y la eliminación de sus obras por parte de OpenAI

No obstante, la DMCA exige, para que haya infracción, que el infractor conociera que se eliminó la CMI sin autorización y, además, que sabía o tenía motivos razonables para saber que esto facilitaría una infracción de derechos de autor. Y el tribunal concluyó que los demandantes no pudieron acreditar todo ello. No demostraron que las obras sin CMI se hubieran distribuido públicamente como resultado del uso de ChatGPT. El tribunal desestimó la demanda, sin perjuicio de posibles apelaciones de los demandantes, que podrían modificar su pretensión y la base jurídica de la misma, en particular, acreditando la causación de daños.

Los demandantes (Raw Story Media y Alternet Media) afirmaron que OpenAI utilizó miles de sus obras periodísticas, protegidas por derechos de autor, como parte de los conjuntos de datos para el entrenamiento de ChatGPT. Estos conjuntos de datos (datasets) incluyen colecciones como WebText, WebText2 y Common Crawl, que contienen textos recopilados de internet (muchos de ellos de acceso público, pero no necesariamente de uso libre o exento de derechos de autor). Este uso por parte de las tecnológicas para entrenar sus grandes modelos de lenguaje (LLMs), el llamado web scraping, es un problema de dimensiones colosales a estas alturas tras la publicación y comercialización de dichos sistemas.

Conclusiones

En este caso, el tribunal establece un precedente en cuanto al uso de obras protegidas para entrenar modelos de inteligencia artificial, particularmente en lo que respecta al marco de la DMCA. Los demandantes no pudieron probar que el mero uso de sus obras en el entrenamiento de ChatGPT, sin más, constituya un perjuicio concreto que amerite daños bajo la legislación actual. El juez mismo sugirió que el problema real no es la eliminación de la CMI en sí, sino el uso de las obras protegidas sin licencia o compensación, algo que los demandantes mencionaron sólo de manera tangencial.

El tribunal no examinó si OpenAI violó derechos de autor al usar obras protegidas para entrenar sus modelos, ya que esa cuestión no formaba parte de la demanda principal. El caso refleja la necesidad de una regulación más específica, o una revisión pormenorizada del actual marco jurídico, para abordar cuestiones relacionadas con la IA y los derechos de autor.

Implicaciones legales a futuro

Esta sentencia aclara que el uso de obras protegidas para entrenar IA no necesariamente infringe la DMCA, especialmente si no se demuestra que las obras sin la información sobre los derechos de autor se distribuyeran o causaran un daño al autor de la obra. Los demandantes pueden intentar reformular sus argumentos sobre la base de otra normativa, pero deberán acreditar un vínculo más claro entre el daño sufrido y las actuaciones de OpenAI.