IA y Copyright: ¿Es legal entrenar inteligencia artificial con obras protegidas?

Diagrama de entrenamiento de IA con datasets protegidos

La inteligencia artificial (“IA”) no solo está cambiando cómo se crean obras, está redefiniendo cómo se utilizan las obras existentes. Uno de los temas más controvertidos hoy en el derecho de autor es el siguiente: ¿Es legal utilizar obras protegidas por copyright para entrenar modelos de inteligencia artificial?

Este debate se encuentra en el centro de litigios millonarios entre empresas tecnológicas, editoriales, artistas y titulares de derechos.

En este artículo analizamos los principales conflictos, los casos más relevantes y hacia dónde se dirige la ley.

Uso de Obras Protegidas por Copyright en el Entrenamiento de IA

Los modelos de IA requieren grandes volúmenes de datos para entrenarse. Estos datos incluyen textos, imágenes, música, videos. Y en muchos casos, estos materiales están protegidos por derechos de autor.

El entrenamiento de modelos de IA suele implicar una copia masiva de obras, almacenamiento en datasets, y el procesamiento para generar nuevos outputs. Bajo el Copyright Act, esto puede activar derechos exclusivos como reproducción, distribución, creación de obras derivadas y otros.

El núcleo del conflicto es si el entrenamiento constituye una infracción, o un uso legítimo (fair use).

Factores Clave en el Análisis

Los tribunales están evaluando principalmente:

  1. Naturaleza del uso - ¿El training es transformativo? Es decir: ¿crea algo nuevo? ¿o simplemente replica contenido existente?

  2. Origen de los datos - Este es uno de los factores más importantes: datos licenciados conllevan menor riesgo; datos públicos conllevan un riesgo intermedio; y datos pirateados tienen alto riesgo legal.

  3. Impacto en el mercado - ¿El modelo de IA sustituye el mercado original de la obra? Este factor es crítico en el análisis de fair use.

  4. Nivel de similitud del output - Si el sistema produce resultados sustancialmente similares o identificables, el riesgo de infracción aumenta significativamente.

Causas de Acción Comunes

Las demandas en este espacio suelen incluir las siguientes causes de acción:

  • infracción de copyright (17 U.S.C. § 501)

  • contributory infringement

  • vicarious infringement

  • violaciones bajo el DMCA (§ 1202 – información de gestión de derechos)

  • competencia desleal

  • enriquecimiento injusto

  • otros

Defensa Principal: Fair Use

Las empresas de IA —incluyendo OpenAI— han defendido que el training está protegido por fair use, argumentando que: (1) el uso es transformativo; (2) los modelos no almacenan obras completas; (3) los outputs no replican obras específicas.

La tendencia judicial emergente sugiere que el entrenamiento de IA no es ilegal per se, pero tampoco está completamente protegido. El análisis parece dirigirse hacia un estándar basado en los siguientes factores: carácter transformativo, origen legítimo de los datos e impacto en el mercado.

Casos Notables

(1) The New York Times v. Microsoft / OpenAI

The New York Times demandó a Microsoft y OpenAI alegando uso no autorizado de millones de artículos. La alegación clave del demandante es que los sistemas de IA reproducen contenido, compiten directamente con el periodismo y afectan el modelo de suscripción. Este caso es particularmente importante porque involucra contenido informativo en tiempo real, e impacta mercados activos de licencias para este tipo de contenido (editorial, noticias, periódicos).

(2) Kadrey v. Meta

Este es un caso contra Meta Platforms por el uso de libros en el entrenamiento de Llama. Ha habido un fallo clave en este caso (aunque el mismo no ha concluido del todo). Meta obtuvo un fallo favorable de fair use, en donde el tribual encontró que algunos usos de las obras están protegidos por esa doctrina. No obstante, permanecen disputas sobre piratería. Esto demuestra que el origen de los datos sigue siendo un punto crítico en determinar si se hallará violación o no a derechos de autor.

(3) Bartz v. Anthropic

Este caso es contra Anthropic por uso de libros pirateados. En 2025, el tribunal sostuvo que realizar training con libros adquiridos legalmente puede considerarse como fair use. Sin embargo, uso de copias pirateadas para entrenar modelos de IA no es justificable bajo la ley. El impacto de este caso, es que es uno de los primeros fallos que valida parcialmente el training como posible “fair use”, dentro de ciertas circunstancias; pero excluye explícitamente la piratería.

(4) Thomson Reuters v. Ross Intelligence

Este caso es entre Thomson Reuters (proveedores de Westlaw) y Ross Intelligence, por el uso de Ross (una plataforma de IA) de los resumenes y textos disponibles en las plataformas de Thomson Reuters. En una decisión de 2025, el tribunal rechazó la defensa de fair use de Ross. Determinó que el uso no era transformativo, era comercial y sustituía el mercado de Westlaw. Este caso es clave porque demuestra que no todo training será considerado lícito.

(5) Casos en la Industria Musical

La industria musical es uno de los sectores más afectados por estos litigios de IA. Plataformas como Suno AI y Udio han generado controversia por el uso de grabaciones protegidas. Algunas demandas relevantes son: UMG v. Suno, y UMG v. Udio. Universal Music Group, junto con otras disqueras, alegan copia masiva de grabaciones, generación de contenido similar y competencia directa con artistas

La tendencia de la industria es litigio primero, licenciamiento después. Algunas demandas han resultado en: acuerdos, licencias y colaboración con empresas de IA. Lo que quiere decir, que la estrategia de algunos demandantes no es necesariamente llegar hasta juicio para encontrar a las compañías de IA responsables de violación a sus derechos. Sino, de iniciar demandas para luego extraer concesiones contractuales y de licencias, para el usos de las obras musicales en las plataformas de IA, mediante acuerdos específicos.

El impacto no es teórico, es altamente cuantificable. Según reportes de Reuters, en 2025 se subieron a las plataformas digitales de distribución (DSPs) como Spotify y Apple Music, alrededor de 20,000 canciones creadas con IA por día. En 2026, ese número ha subido a 60,000 canciones por día.

Estado Actual de la Ley

El informe Copyright and Artificial Intelligence (Parte 3) no ofrece una respuesta definitiva a este conflicto, pero identifica factores clave para determinar cuándo hay violación a derechos de autor en el entrenamiento de modelos de IA. Por ejemplo, según los casos discutidos, es más probable que exista una violación, si aplican las siguientes circunstancias, tomadas en conjunto, y caso a caso:

  • Si el carácter no es transformativo;

  • Si origen de los datos no es lícito;

  • Si hay daño al mercado de los derechos originales.

MÁS RECURSOS PARA TI 👇👇👇

📚 Si te interesa aprender más sobre la inteligencia artificial, y cómo afecta a creadores, talentos y empresas, explora nuestro blog con análisis sobre IA y asuntos legales.

🔎 Si deseas conocer más sobre nuestros servicios legales para proyectos digitales y negocios creativos aquí.

🧠 Si estás comenzando o manejando un proyecto de inteligencia artificial, y tienes preguntas legales, puedes agendar una consulta con nuestro equipo.

🖋️ Para consultas generales sobre nuestra firma y servicios, puede escribirnos directamente aquí.

⚖️ Para conocer más sobre nuestro trabajo asesorando negocios y emprendedores digitales, visita la página principal de Starving Artists.

Este artículo se provee únicamente con fines informativos y no constituye asesoramiento legal, consejo, ni representación legal.

Next
Next

¿Quién es el Dueño de las Obras creadas con Inteligencia Artificial? Autoría, Copyright y el nuevo Paradigma Legal