画像生成AI(人工知能)の精度を上げるための学習に使われる膨大な画像データの中に、国立国会図書館が「違法な児童ポルノの恐れがある」として閲覧を禁じた写真集の一部が含まれていることがわかった。データの中にはほかにも児童の裸の画像が複数あった。ネットから収集する過程で紛れ込んだとみられる。学習する際、違法画像を取り除くフィルター機能があるが、排除しきれていないという。
画像生成AIは、文章を入力すると、イラストや写真のような画像を作り出す。最も人気が高い画像生成AIの一つ「ステーブル・ディフュージョン(SD)」が学習に使うデータセット(データ群)はネット上で公開されていた。

 読売新聞が昨年12月、内容を調べた結果、1993年に出版された裸の少女を写した写真集の画像データが見つかった。
 出版当時は規制する法律がなかったが、18歳未満の性的画像の公開などを禁じた児童買春・児童ポルノ禁止法が施行された99年以降、こうした写真集の公開は違法になった。国会図書館は2006年、この写真集を「児童ポルノに該当する恐れがある」として閲覧を禁止していた。データセットの中にはほかにも児童の裸の画像データが複数あった。

(以下記事全文はソース元にてご確認ください)

読売新聞 2024/03/21 05:00
https://www.yomiuri.co.jp/national/20240321-OYT1T50036/