Anna's Archive pirateou o Spotify

A 'biblioteca cinza' Anna's Archive anunciou no final de 2025, como quem não quer nada, que baixou 300tb de músicas e metadados do Spotify e pretende liberá-los. Vamos falar sobre.

https://annas-archive.li/blog/backing-up-spotify.html

Fizemos backup do Spotify (metadados e arquivos de música). Ele está distribuído em torrents em massa (~300 TB), agrupados por popularidade.

Esta versão inclui o maior banco de dados de metadados musicais disponível publicamente, com 256 milhões de faixas e 186 milhões de ISRCs únicos.

É o primeiro "arquivo de preservação" de música do mundo totalmente aberto (o que significa que pode ser facilmente replicado por qualquer pessoa com espaço em disco suficiente), com 86 milhões de arquivos de música, representando cerca de 99,6% das reproduções.

  • No blog eles explicam que o site geralmente foca na preservação de conteúdo de texto, mas a missão do site é preservar todos tipos de mídia e recentemente encontraram uma maneira de fazer a raspagem do Spotify
  • Foco em preservação de uma lista 'oficial' de todas as músicas e não na maior qualidade de áudio e nem nos artistas mais populares.
  • Para popularidade > 0, obtivemos quase todas as faixas da plataforma. A qualidade é a original OGG Vorbis a 160 kbps.

  • Para popularidade = 0 o áudio é recodificado para OGG Opus a 75 kbps — soando igual para a maioria das pessoas, mas perceptível para um especialista.

    ...

  • Este é, de longe, o maior banco de dados de metadados musicais disponível publicamente. Para efeito de comparação, temos 256 milhões de faixas, enquanto outros têm entre 50 e 150 milhões. Nossos dados são bem anotados: o MusicBrainz possui 5 milhões de ISRCs únicos, enquanto nosso banco de dados possui 186 milhões.

  • Este é o primeiro "arquivo de preservação" de música do mundo que é totalmente aberto (o que significa que pode ser facilmente replicado por qualquer pessoa com espaço em disco suficiente).

O que é o Anna's Archive?

https://en.wikipedia.org/wiki/Anna%27s_Archive

  • O 'Acervo da Anna' é um agregador de 'bibliotecas cinzas' que auxilia na busca de torrents para livros, artigos e todo tipo de conteúdo
  • Surgiu logo após o z-library ser retirado do ar em 2022
  • O site aceita doações e pagamentos (em dinheiro e em mais arquivos) pela disponibilização do conteúdo. Por exemplo o site afirma fornecer material para treinamentos de LLM, principalmente de empresas chinesas
  • Além disso nós sabemos por fontes oficiais (e outras nem tanto) que toneladas de material pirateado, principalmente livros e artigos científicos, foram usados para treinar TODOS os LLM
  • A imagem que se pinta é que a 'Anna' é uma pessoa que valoriza o livre acesso ao conhecimento acima de tudo

O contra ataque da indústria da música

https://canaltech.com.br/seguranca/de-surpresa-repositorio-clandestino-annas-archive-perde-dominio-org/

A biblioteca digital cinza Anna’s Archive perdeu o seu domínio principal, de final .org, após uma suspensão no status serverHold, ação tipicamente tomada por quem registrou o domínio. Recentemente, a plataforma anunciou que fez o backup do Spotify, mas não há indícios de que isso teria sido o motivador por trás da suspensão. Ainda é possível acessar o site por domínios alternativos.

Em comunicado publicado no reddit, o usuário AnnaArchivist, que fala pela organização, afirmou que o site continua resiliente, funcionando em outros domínios, inclusive adicionando mais alguns nas últimas horas. É possível verificar quais na página da Wikipédia da ferramenta, que também diz que “isso infelizmente acontece com bibliotecas cinzas regularmente”. Domínios alternativos incluem .li, .se e outras variantes.

https://www.androidauthority.com/spotify-vs-annas-archive-3634415/

Conforme noticiado inicialmente pela Ars Technica, o Spotify, juntamente com as principais gravadoras Sony, Warner e Universal Music Group, entrou com um processo silencioso contra o Anna's Archive no final de dezembro. O caso foi mantido em sigilo, permitindo que as empresas agissem antes mesmo que o site soubesse o que estava acontecendo.

Em 2 de janeiro, um juiz americano concedeu uma liminar que obrigou os principais provedores de infraestrutura da internet a interromperem o acesso do Anna's Archive. Isso incluiu o Public Interest Registry, que administra os domínios .org, e o Cloudflare, do qual o site dependia para se manter online. Como resultado, o domínio .org do Anna's Archive saiu do ar antes mesmo que os proprietários do site fossem notificados.

Conclusão... isso é bom?

  • Depende, mas vamos conversar...

Bônus

https://everynoise.com/