JUSTICIA

Fallo y polémica: una IA podrá entrenar a sus algoritmos con libros sin pagar derecho de autor

Anthropic cargó millones de ebooks para entrenar a sus algoritmos y la Justicia dijo que no infringe el copyright

BAE Negocios

Un fallo judicial en Estados Unidos encendió el debate sobre el uso de obras con derechos de autor para entrenar inteligencia artificial. La empresa Anthropic, desarrolladora del modelo Claude, fue autorizada a utilizar libros adquiridos legalmente para alimentar sus sistemas de IA, incluso sin contar con el permiso explícito de los autores. Sin embargo, también deberá enfrentar un juicio por haber descargado millones de libros pirateados.

La decisión fue tomada por el juez federal William Alsup, del Distrito Norte de California, quien estableció que el entrenamiento de IA con libros comprados de forma legítima, aunque digitalizados posteriormente, constituye un "uso transformador" y, por lo tanto, no infringe el copyright.

El entrenamiento de los modelos de inteligencia artificial requiere grandes volúmenes de datos. Ante esa necesidad, empresas como Anthropic recurren a diversas fuentes, muchas veces extraídas de Internet, lo que genera controversias legales sobre el uso de contenido protegido por derechos de autor.

Qué pasa con el copyright con la IA

La demanda original fue presentada en agosto de 2023 por un grupo de autores, entre ellos Andrea Bartz, Charles Graeber y Kirk Wallace Johnson. Acusaron a Anthropic de usar sin autorización cientos de miles de libros protegidos, tanto físicos como digitales, muchos de ellos pertenecientes a una base de datos ilegal conocida como Books3.

Según los demandantes, Anthropic incorporó materiales extraídos del conjunto de datos The Pile, que incluye una colección de libros electrónicos pirateados. La acusación sostenía que esta práctica constituía una apropiación indebida de propiedad intelectual en beneficio del entrenamiento de sus modelos.

No obstante, el juez Alsup falló que, cuando se trata de libros comprados legalmente, la empresa puede utilizarlos para entrenamiento de IA sin requerir la autorización individual de los autores. El fundamento principal del fallo es que la función de la IA es "altamente transformadora" y que el derecho de autor no debe servir para proteger a los escritores de la competencia legítima.

En ese sentido, Alsup destacó que "la Ley de Derechos de Autor busca promover las obras originales de autoría, no evitar el avance tecnológico ni bloquear el progreso de herramientas que pueden redefinir industrias".

Sin embargo, no todo fue respaldo para la empresa. El magistrado ordenó que Anthropic deberá ir a juicio por el uso de libros descargados ilegalmente. La compañía habría obtenido al menos siete millones de libros desde fuentes piratas, lo que plantea serias dudas sobre su proceder y respeto por la propiedad intelectual.

El juez cuestionó duramente la decisión de recurrir a copias ilegales cuando existían métodos legítimos de acceso. Además, estableció que este nuevo proceso judicial deberá determinar el alcance de los daños ocasionados y posibles sanciones económicas.

 

Según trascendió, la multa por la descarga de cada obra protegida podría alcanzar los 750 dólares por libro, lo que abriría la puerta a un reclamo multimillonario por parte de los autores afectados.

El caso Anthropic marca un precedente clave en el debate global sobre el uso de datos en la inteligencia artificial. El fallo reconoce el valor transformador de esta tecnología, pero también subraya los límites legales y éticos que las empresas del sector deberán respetar.

El futuro de la industria de IA dependerá, en gran parte, de cómo se resuelvan estos conflictos entre innovación tecnológica y derechos de autor, una tensión que no deja de crecer con el avance de los grandes modelos de lenguaje.

 

Esta nota habla de: