Millones de canciones con copyright entrenan IAs sin permiso

Una investigación de The Atlantic revela cuatro bases de datos masivas, usadas por gigantes como Google, que contienen millones de pistas musicales protegidas. Artistas de todo el mundo, desde Lady Gaga hasta el Wu-Tang Clan, están en la lista.

4 min de lecturaEquipo editorial NOVUS
Millones de canciones con copyright entrenan IAs sin permiso
En corto

Una investigación de The Atlantic destapó el uso de al menos cuatro grandes bases de datos musicales, con millones de canciones protegidas, para entrenar modelos de IA sin el consentimiento de los artistas. Empresas como Google y Stability han admitido su uso, lo que agudiza el debate sobre derechos de autor en la era de la IA.

12 millonesPistas en el mayor dataset
Miles de vecesDescargas de los datasets
Google y StabilityEmpresas que admitieron su uso
Qué significa para ti

Si eres músico o creador, puedes usar la herramienta "AI Watchdog" de The Atlantic para verificar si tu trabajo fue incluido en estas bases de datos de entrenamiento para IA.

Millones de canciones protegidas por derechos de autor han sido utilizadas para entrenar modelos de inteligencia artificial sin el conocimiento ni el consentimiento de los artistas. Una investigación del periodista Alex Reisner para The Atlantic sacó a la luz cuatro grandes archivos musicales usados para este fin. Según los reportes de TecnoAndroid y The Verge, dos de estos repositorios son enormes, con 12 y 9 millones de pistas respectivamente, mientras que los otros dos superan las 100.000 canciones cada uno. Estos conjuntos de datos han sido descargados miles de veces.

El método para obtener la música a menudo viola las condiciones de servicio de las plataformas de streaming. Tres de los cuatro datasets identificados consisten en listas de enlaces a canciones en YouTube o Spotify. Los desarrolladores utilizan herramientas automatizadas para descargar el audio, eludiendo sistemas como inicios de sesión o publicidad que generan ingresos para los creadores, según detalla la investigación. Empresas como Google y Stability han confirmado en sus propios documentos de investigación el uso de estos archivos.

La variedad de artistas afectados es inmensa, abarcando desde estrellas del pop como Lady Gaga y Bruce Springsteen hasta bandas como Radiohead y el Wu-Tang Clan. Para ofrecer transparencia sobre este proceso, The Atlantic ha creado una herramienta pública llamada "AI Watchdog". Esta base de datos permite a cualquier persona buscar por autor o título para verificar si sus obras, ya sean canciones o libros, han sido incluidas en los materiales de entrenamiento de los modelos de IA.

Esta práctica plantea serias dudas sobre la compensación justa y el respeto a la propiedad intelectual en la era de la IA. Para los artistas de América Latina y el Sur Global, donde los mecanismos de protección de derechos pueden ser más débiles, el uso no autorizado de su trabajo para alimentar sistemas de IA representa una amenaza directa a sus medios de vida. Este escenario evidencia cómo la tecnología puede concentrar el valor y el poder en las grandes corporaciones que desarrollan los modelos, a menudo a expensas de los creadores individuales.

Cómo lo sabemos

Esta nota se verificó con 2 fuentes independientes y fechadas antes de publicarse. El modelo redacta; los hechos vienen de las fuentes.

Hecho con IA · verificado y revisado por un humanoRevisión humana: Francisco Devia · 24 de junio de 2026Nuestro método de verificación →
Comparte
XLinkedInWhatsApp