メタが AI モデルの学習用に 約600万のサイト、うち 上位10万ドメインを対象にスクレイピングを実施したことが、内部リークで明らかとなったようで

スクレイピング対象には、ニュースサイト、教育サイト、個人ブログ、さらには復讐型ポルノや違法性が疑われる性的コンテンツなども含まれており、robots.txt などのアクセス拒否設定も無視していました

情報は、ガザでのイスラエルを支持するメタへの社内批判からリークされたもので、関係者はこの行為を「非倫理的で違法の可能性もある」と警告。一方、メタ側は「このリストはデタラメだ」と否定しています

このリストを確認するといくつかの大手Fediverse鯖が確認できる他、日本の大手3インスタンスのメディアもあります