2026年6月21日 03:46
AtlanticがAI学習用音楽2100万曲DB公開
The Atlantic created a searchable database of the music used to train AI
3行まとめ
- •1200万+900万曲のAI学習データDBを公開
- •GoogleやStability AIの使用が判明
- •著作権訴訟の具体的根拠となる情報を提供
詳細
背景
Atlanticの記者アレックス・ライスナーは、AIモデルの学習に使用されている音楽データセットを4つ発見し、一般向けに検索可能なデータベースとして公開した。最大の2セットはそれぞれ1200万曲・900万曲という膨大な規模であり、残り2つも各10万曲以上を含む。
内容
これらのデータセットはすでに数千回ダウンロードされており、GoogleとStability AIが使用していることが明らかになっている。データベースを検索することで、音楽アーティストは自分の楽曲がAI学習データとして使用されているかを確認できる。これまで各社の学習データの詳細は非公開であったが、今回の取り組みにより実態が可視化された。
著作権問題
著作権者の許諾を得ずに音楽を学習データとして使用することは法的グレーゾーンとされており、音楽業界からAI企業に対する訴訟が各地で進行中である。今回のデータベース公開により、AI学習データの使用実態を示す具体的な証拠が初めて公に提供された。AI企業の学習データに関する透明性の欠如を問う議論が改めて浮き彫りになっている。
なぜ重要か
AI学習に使われた音楽2100万曲超が初めて可視化され、著作権をめぐるAI企業への訴訟や規制議論が加速する。
元記事を読む — The Verge AI