Anna’s Archive, una plataforma de «preservación de contenido digital», asegura haber recopilado el 99,6% del catálogo escuchado, que equivale a unos 300 TB de música
Anna’s Archive, un grupo de activistas especializado en la preservación de activos digitales como libros o artículos académicos, ha conseguido algo que parecía imposible: descargarse toda la música de Spotify. Sus responsables han anunciado esta semana que han extraído y archivado prácticamente el 99,6% del catálogo musical de la compañía, unos 86 millones de archivos de audio y metadatos de más de 256 millones de pistas que se han convertido en lo que describen como «el primer archivo de preservación musical completamente abierto del mundo».
El volumen total de datos asciende a casi 300 terabytes y está disponible a través de torrents que ya circulan por la red organizados según la popularidad de las canciones. Según Anna’s Archive, que ha sido denunciado y bloqueado por varios gobiernos anteriormente debido a la difusión de material bajo copyright, el archivo cubre la inmensa mayoría de las canciones más reproducidas en la conocida plataforma de música por streaming.
Spotify ha confirmado el incidente en un comunicado enviado a varios medios especializados. «Nuestra investigación ha identificado a un grupo que ha extraído metadatos públicos y utilizado tácticas ilícitas para eludir los sistemas de protección y acceder a algunos de los archivos de audio de nuestra plataforma», declaró la compañía. La compañía no confirma la escala del ataque descrita por Anna’s Archive pero sus responsables insisten en haber capturado la práctica totalidad del catálogo disponible hasta julio de 2025.
Anna’s Archive ha justificado la operación como un proyecto de preservación cultural. «Nuestra misión es preservar el conocimiento y la cultura de la humanidad», explican en su blog. La organización argumenta que grandes cantidades de música menos conocida podrían desaparecer si las plataformas de streaming pierden licencias o cierran.
Los archivos de audio de las canciones más populares se han capturado en su formato original, sin recodificación. Para las pistas menos populares, el grupo ha recodificado el audio con el codec OGG Opus a 75 kbps para reducir el espacio de almacenamiento. Los metadatos incluyen 186 millones de códigos ISRC únicos, lo que convierte este archivo en la base de datos musical abierta más grande jamás creada, muy por encima de los cinco millones de registros de MusicBrainz, la mayor alternativa legal.
Por el momento, sólo los metadatos están completamente disponibles. Los archivos de música se están liberando en bloques como torrents (un sistema de descarga de archivos P2P) de forma gradual, comenzando por las pistas más reproducidas. Sobra decir que esta extracción masiva de archivos de audio y su redistribución mediante torrents viola los términos de servicio de Spotify y las leyes de propiedad intelectual de la mayoría de países
Anna’s Archive ya se enfrentaba a batallas legales en varios frentes por la facilidad con la que permite descargar libros electrónicos y publicaciones científicas. Bélgica, por ejemplo, multó a la plataforma en julio de 2025 con 500.000 euros y Alemania bloquea los dominios principales del sitio desde en octubre de 2025.
Algunos analistas advierten que este nuevo archivo podría utilizarse para entrenar modelos de inteligencia artificial generativa de música sin el consentimiento de los artistas, lo que socavaría las negociaciones en curso entre la industria musical y las empresas de IA. La base de datos, con metadatos estructurados que incluyen información de artistas, géneros, tempo y puntuaciones de popularidad, constituye exactamente el tipo de conjunto de datos que las empresas de IA necesitan para desarrollar modelos de nueva generación.
