IA y Copyright: ¿Es legal entrenar inteligencia artificial con obras protegidas?
La inteligencia artificial (“IA”) no solo está cambiando cómo se crean obras, está redefiniendo cómo se utilizan las obras existentes. Uno de los temas más controvertidos hoy en el derecho de autor es el siguiente: ¿Es legal utilizar obras protegidas por copyright para entrenar modelos de inteligencia artificial?
Este tipo de conflictos legales se relaciona directamente con áreas como propiedad intelectual y copyright, al igual que licenciamiento de contenido digital, que son fundamentales en proyectos tecnológicos y creativos.
Este debate se encuentra en el centro de litigios millonarios entre empresas tecnológicas, editoriales, artistas y titulares de derechos.
En este artículo analizamos los principales conflictos, los casos más relevantes y hacia dónde se dirige la ley.
Uso de Obras Protegidas por Copyright en el Entrenamiento de IA
Los modelos de IA requieren grandes volúmenes de datos para entrenarse. Estos datos incluyen textos, imágenes, música, videos. Y en muchos casos, estos materiales están protegidos por derechos de autor.
El entrenamiento de modelos de IA suele implicar una copia masiva de obras, almacenamiento en datasets, y el procesamiento para generar nuevos outputs. Bajo el Copyright Act, esto puede activar derechos exclusivos como reproducción, distribución, creación de obras derivadas y otros.
El núcleo del conflicto es si el entrenamiento constituye una infracción, o un uso legítimo (fair use).
En la práctica, algunas empresas están optando por estructurar acuerdos de licencia para mitigar riesgos legales asociados al uso de contenido protegido.
Factores Clave en el Análisis
Los tribunales están evaluando principalmente:
Naturaleza del uso - ¿El training es transformativo? Es decir: ¿crea algo nuevo? ¿o simplemente replica contenido existente?
Origen de los datos - Este es uno de los factores más importantes: datos licenciados conllevan menor riesgo; datos públicos conllevan un riesgo intermedio; y datos pirateados tienen alto riesgo legal.
Impacto en el mercado - ¿El modelo de IA sustituye el mercado original de la obra? Este factor es crítico en el análisis de fair use.
Nivel de similitud del output - Si el sistema produce resultados sustancialmente similares o identificables, el riesgo de infracción aumenta significativamente.
Causas de Acción Comunes
Las demandas en este espacio suelen incluir las siguientes causes de acción:
infracción de copyright (17 U.S.C. § 501)
contributory infringement
vicarious infringement
violaciones bajo el DMCA (§ 1202 – información de gestión de derechos)
competencia desleal
enriquecimiento injusto
otros
Defensa Principal: Fair Use
Las empresas de IA —incluyendo OpenAI— han defendido que el training está protegido por la defensa de fair use, argumentando que: (1) el uso es transformativo; (2) los modelos no almacenan obras completas; (3) los outputs no replican obras específicas.
La tendencia judicial emergente sugiere que el entrenamiento de IA no es ilegal per se, pero tampoco está completamente protegido. El análisis parece dirigirse hacia un estándar basado en los siguientes factores: carácter transformativo, origen legítimo de los datos e impacto en el mercado.
Casos Notables
(1) The New York Times v. Microsoft / OpenAI
The New York Times demandó a Microsoft y OpenAI alegando uso no autorizado de millones de artículos. La alegación clave del demandante es que los sistemas de IA reproducen contenido, compiten directamente con el periodismo y afectan el modelo de suscripción. Este caso es particularmente importante porque involucra contenido informativo en tiempo real, e impacta mercados activos de licencias para este tipo de contenido (editorial, noticias, periódicos).
(2) Kadrey v. Meta
Este es un caso contra Meta Platforms por el uso de libros en el entrenamiento de Llama. Ha habido un fallo clave en este caso (aunque el mismo no ha concluido del todo). Meta obtuvo un fallo favorable de fair use, en donde el tribual encontró que algunos usos de las obras están protegidos por esa doctrina. No obstante, permanecen disputas sobre piratería. Esto demuestra que el origen de los datos sigue siendo un punto crítico en determinar si se hallará violación o no a derechos de autor.
(3) Bartz v. Anthropic
Este caso es contra Anthropic por uso de libros pirateados. En 2025, el tribunal sostuvo que realizar training con libros adquiridos legalmente puede considerarse como fair use. Sin embargo, uso de copias pirateadas para entrenar modelos de IA no es justificable bajo la ley. El impacto de este caso, es que es uno de los primeros fallos que valida parcialmente el training como posible “fair use”, dentro de ciertas circunstancias; pero excluye explícitamente la piratería.
(4) Thomson Reuters v. Ross Intelligence
Este caso es entre Thomson Reuters (proveedores de Westlaw) y Ross Intelligence, por el uso de Ross (una plataforma de IA) de los resumenes y textos disponibles en las plataformas de Thomson Reuters. En una decisión de 2025, el tribunal rechazó la defensa de fair use de Ross. Determinó que el uso no era transformativo, era comercial y sustituía el mercado de Westlaw. Este caso es clave porque demuestra que no todo training será considerado lícito.
(5) Casos en la Industria Musical
La industria musical es uno de los sectores más afectados por estos litigios de IA. Plataformas como Suno AI y Udio han generado controversia por el uso de grabaciones protegidas. Algunas demandas relevantes son: UMG v. Suno, y UMG v. Udio. Universal Music Group, junto con otras disqueras, alegan copia masiva de grabaciones, generación de contenido similar y competencia directa con artistas
La tendencia de la industria es litigio primero, licenciamiento después. Algunas demandas han resultado en: acuerdos, licencias y colaboración con empresas de IA. Lo que quiere decir, que la estrategia de algunos demandantes no es necesariamente llegar hasta juicio para encontrar a las compañías de IA responsables de violación a sus derechos. Sino, de iniciar demandas para luego extraer concesiones contractuales y de licencias, para el usos de las obras musicales en las plataformas de IA, mediante acuerdos específicos.
El impacto no es teórico, es altamente cuantificable. Según reportes de Reuters, en 2025 se subieron a las plataformas digitales de distribución (DSPs) como Spotify y Apple Music, alrededor de 20,000 canciones creadas con IA por día. En 2026, ese número ha subido a 60,000 canciones por día.
Estado Actual de la Ley
El informe Copyright and Artificial Intelligence (Parte 3) no ofrece una respuesta definitiva a este conflicto, pero identifica factores clave para determinar cuándo hay violación a derechos de autor en el entrenamiento de modelos de IA. Por ejemplo, según los casos discutidos, es más probable que exista una violación, si aplican las siguientes circunstancias, tomadas en conjunto, y caso a caso:
Si el carácter no es transformativo;
Si origen de los datos no es lícito;
Si hay daño al mercado de los derechos originales.
MÁS RECURSOS PARA TI 👇👇👇
📚 Guías Relacionadas sobre IA, Copyright y Negocios Digitales
Si estás trabajando con inteligencia artificial, contenido digital o propiedad intelectual, estos recursos te pueden ayudar:
🔎 Servicios Legales en Inteligencia Artificial y Propiedad Intelectual
👉 Conoce cómo asesoramos a empresas, startups y creadores en: propiedad intelectual, contratos, licencias y estrategias legales en tecnología y contenido digital
🧠 Consulta con un Abogado de Propiedad Intelectual y Tecnología
Si estás desarrollando un modelo de IA o enfrentando riesgos legales relacionados con copyright:
👉 Agenda una consulta con un abogado en propiedad intelectual, tecnología y entretenimiento
📩 Contacto
Para preguntas generales sobre nuestra firma o servicios:
Somos abogados de entretenimiento en Miami, Florida, Puerto Rico y nacional para asuntos selectos (SED Law, PLLC).
Este artículo se provee únicamente con fines informativos y no constituye asesoramiento legal, consejo, ni representación legal.