Spotify Music Library With 86M Music Files Scraped by Hacktivist Group
2025/12/23 CyberSecurityNews — Anna’s Archive として知られるシャドウ・ライブラリが公表したのは、Spotify を対象とする大規模スクレイピングの結果である。それによると、約 8,600 万曲のオーディオ・トラックと、2億 5,600 万曲分のメタデータを含むトレント・コレクションが窃取されたことになる。このグループの普段の活動は、学術論文や書籍のアーカイブ化に向いているが、今回のターゲットは音楽データである。この不正取得について、世界初の音楽向けオープン保存アーカイブであると Anna’s Archive は主張している。

コレクションの総容量は約 300 テラバイトに及ぶ。このダンプは公開されている音楽メタデータ・データベースとして最大級の規模であり、Spotify のカタログの約 99.9% をカバーし、プラットフォーム上の全ストリームの 99.6% を占める。
この公開の詳細を記したブログ投稿で、「Spotify を大規模にスクレイピングする方法を発見した」と、このグループは述べている。
彼らの主張は、現在の音楽アーカイブ化の取り組みが、高音質オーディオ・ファイル・フォーマット (ロスレス FLAC など) や人気アーティストに偏っているため、不十分であるというものだ。それにより、無名の音楽のロングテール (無名の楽曲群) が失われる危険性があると警鐘を鳴らしている。
このグループは、「私たちの使命は、人類の知識と文化を保存することにあり、メディアの種類を区別しない。時には、テキスト以外の領域で機会が訪れることがある。まさに、今回の例が、それに該当する」と述べている。
このグループは、Spotify の人気指標に基づいて品質を優先し、膨大なファイル・サイズを管理している。最も人気のある曲は、オリジナルの OGG Vorbis 形式の 160 kbit/s でアーカイブされている。その一方で、人気スコアが “0” の曲は、容量節約のために OGG Opus の低ビットレートで再エンコードされた。
Anna’s Archiveは、「これまでに人類が生み出した、すべての音楽を保存するために必要と判断したトレードオフである」と述べている。
データは BitTorrent を通じて段階的に公開されている。最初はメタデータが公開され、続いて人気順に音楽ファイルが公開された。同団体はコレクションを自然災害/戦争/予算削減などから守るために、これらのトレントをシードするよう一般に呼びかけている。
Anna’s Archive は、これを文化保存プロジェクトと位置付けている。しかし、このスクレイピングは Spotify の利用規約に対する重大な違反であり、著作権で保護された素材の大量配信に関与することになる。
Spotify が提供している膨大な楽曲データやメタデータに対し、Anna’s Archive が独自のスクレイピング手法を発見し、実行してしまいました。彼らは、人類の文化保存を掲げ、本来はストリーミングで利用されるべきデータを、カタログのほぼ全域にわたって組織的に取得し、外部へ持ち出しています。これほどの規模で、規約に反したデータ収集が行われた背景には、プラットフォーム側が想定していた以上に効率よくデータ収集を可能にする手法があります。音楽という著作権で守られた素材が、大量に配信されている現状は、法的な面でも大きな課題となっています。


You must be logged in to post a comment.