Ad imageAd image

6 TB muzyki ze Spotify w sieci torrent: Anna’s Archive podnosi stawkę w wojnie o streaming

Czas czytania 6 min

kolejny etap głośnego wycieku danych muzycznych ze Spotify, który został ponownie udostępniony przez projekt Anna’s Archive w formie ogromnej paczki torrentów. Chodzi o 6 TB plików audio – ok. 2,8 mln utworów – będących pierwszą „falą” znacznie większego zbioru, który według administratorów ma obejmować nawet 86 mln tracków o łącznej wielkości ok. 300 TB. Wyjaśniona jest techniczna struktura tych danych (identyfikatory Spotify, kontener z Ogg Opus, dodatkowy plik metadanych ~30 GB), a także kontekst prawny: nakazy sądowe w USA, działania RIAA i dużych wytwórni (Universal, Warner, Sony) oraz próby blokowania domen przez dostawców takich jak Cloudflare. Artykuł podkreśla też, że społeczność (m.in. na Reddit /r/DataHoarder) potwierdza autentyczność plików, a milczenie Spotify ogranicza się do ogólnych odniesień do trwających postępowań prawnych i problemu masowego scrapowania danych.

Wstęp: największy piracki „shadow backup” Spotify?

Anna’s Archive od dawna zasłynęło jako repozytorium trudno dostępnych i często kontrowersyjnych danych, ale teraz wchodzi w zupełnie nowy wymiar, uderzając w samą esencję muzycznego streamingu. Najnowsza porcja torrentów obejmuje około 6 TB muzyki wyciągniętej ze Spotify, co w praktyce można traktować jako częściowy „shadow backup” katalogu szwedzkiej platformy. Sprawa daleko wykracza poza zwykłe piractwo – to demonstracja, jak łatwo gigantyczne biblioteki cyfrowe mogą trafić w ręce społeczności, jeśli zostaną raz w dużej skali zeskrapowane.

Kluczowe fakty: ile danych wyciekło i w jakiej formie?

Według informacji powiązanych z tym wyciekiem obecnie udostępniono 47 nowych torrentów. W ich zawartości znajduje się około 2,8 miliona plików audio, co przekłada się na około 6 TB danych. Administratorzy Anna’s Archive twierdzą przy tym, że w rzeczywistości zindeksowali już blisko 86 milionów utworów, które razem mają zajmować około 300 TB.

Pliki nie są jednak gotowymi „mp3 do kliknięcia”, tylko specjalnym formatem powiązanym z infrastrukturą Spotify. Każdy utwór identyfikowany jest za pomocą wewnętrznych ID Spotify, a aby zbiór miał sens, potrzebny jest dodatkowy plik metadanych o wielkości ok. 30 GB, który pełni rolę głównego indeksu – dopiero on pozwala kojarzyć pliki z konkretnymi artystami, albumami czy tytułami. Warstwa audio to kontener z danymi Ogg Opus, czyli tym samym kodekiem, który Spotify wykorzystuje do streamingu w swojej usłudze.

Eksperci od sieci P2P sugerują, że publikacja odbywa się falami – w pierwszej kolejności udostępniane są mniej popularne utwory, a dopiero później globalne hity, co ma zmniejszyć rzucanie się w oczy i stopniowo rozbudowywać kolekcję.

Jak wygląda techniczna strona tych torrentów?

Z punktu widzenia przeciętnego użytkownika ten wyciek nie jest „plug and play”. Same pliki zawierające Ogg Opus są zakodowane w sposób typowy dla Spotify i powiązane z abstrakcyjnymi identyfikatorami, które bez dodatkowych danych są praktycznie bezużyteczne. Potrzebny jest więc wspomniany 30‑gigabajtowy plik metadanych, który pełni rolę katalogu głównego – dopiero jego wczytanie pozwala oprogramowaniu z zewnątrz odtworzyć sensowną bibliotekę z nazwami utworów, wykonawcami i okładkami.

Społeczność skupiona m.in. wokół Reddit /r/DataHoarder potwierdza, że pliki da się powiązać z oryginalną zawartością Spotify. W wielu przypadkach zachowane są oryginalne okładki albumów i osadzone metadane, co jest wyraźnym dowodem, że dane pochodzą bezpośrednio z serwerów tego serwisu, a nie z przypadkowych ripów użytkowników. Mimo że proces pobierania, weryfikacji i tagowania jest dość żmudny, entuzjaści archiwizacji danych traktują ten zbiór jako unikalny materiał badawczy i kopię zapasową współczesnej kultury muzycznej w wersji streamowanej.

Starcie z prawem: RIAA kontra Anna’s Archive

W tle całej historii toczy się mocno zaostrzony konflikt prawny. Amerykański sąd wydał wstępny nakaz blokujący dostęp do Anna’s Archive, a RIAA wraz z wytwórniami Universal, Warner i Sony naciskały na usługodawców takich jak Cloudflare, aby odciąć platformę od sieci. Mimo tego serwis wciąż funkcjonuje, wykorzystując repliki i alternatywne domeny, m.in. hostowane na terytoriach takich jak Grenlandia.

Spotify w oficjalnej komunikacji ogranicza się na razie do podkreślania trwających postępowań prawnych i walki ze scrapowaniem na masową skalę. Sprawa unaocznia, jak trudno jest całkowicie kontrolować dane w erze subskrypcji – kiedy cała oferta znajduje się online, wystarczy jeden skuteczny mechanizm ekstrakcji, żeby ogromne archiwa trafiły do świata P2P.

Co to oznacza dla użytkowników i branży?

Dla zwykłego użytkownika Spotify ta sytuacja nie przekłada się bezpośrednio na codzienne korzystanie z aplikacji – konta nie zostały tu masowo przejęte, chodzi o kopię samej biblioteki muzycznej, a nie haseł czy danych kart płatniczych. Mimo to wyciek jest ciosem w wizerunek bezpieczeństwa platformy i może wywołać pytania o to, jak chronione są inne elementy infrastruktury.

Dla branży muzycznej to poważny sygnał alarmowy: jeśli katalog jednego z największych serwisów streamingowych może zostać w dużej części skopiowany i upubliczniony, to model biznesowy oparty wyłącznie na kontroli dostępu do streamu staje się bardziej kruchy. Z drugiej strony, dla środowisk archiwistów cyfrowych to kolejny argument, że kultura zapisów strumieniowych wymaga alternatywnych form przechowywania, które nie zależą tylko od dobrej woli korporacji.

Mój komentarz: cienka granica między archiwizacją a piractwem

Przypadek Anna’s Archive i Spotify pokazuje, jak nieostra bywa linia między ideą „zachowania dziedzictwa cyfrowego” a czystym piractwem. Dla społeczności data hoarderów 6 TB muzyki może wyglądać jak fascynujący projekt archiwizacyjny, ale z perspektywy wytwórni i artystów to gigantyczny wyciek treści chronionych prawem autorskim. Technicznie to imponująca operacja scrapowania, prawnie – oczywiste pole bitwy na wielu frontach.

Bez względu na ocenę etyczną jedno jest pewne: tego typu wycieki będą coraz częstsze, bo im więcej usług działa wyłącznie „w chmurze”, tym większa pokusa, by tworzyć ich nieautoryzowane kopie. Dla użytkowników to także przypomnienie, że muzyka „w streamingu” nie jest tym samym co posiadanie pliku na własnym dysku – a kontrolę nad dostępem można stracić zarówno z powodu decyzji korporacji, jak i wycieków danych.

Total Views: 0

Jesteś naszym klientem?

Awaria sprzętu?

Problem ze sprzętem?

Nasza oferta

Pogoda dla Wrocławia
2°C
Wrocław
zachmurzenie umiarkowane
2° _ 1°
88%
3 km/h
sob.
3 °C
niedz.
-1 °C
pon.
2 °C
wt.
4 °C
śr.
-1 °C