AI成果物が急増したことで「AI生成コンテンツをAIが学習するループ」が発生し「モデルの崩壊」が起きつつあると研究者が警告 [飴棒★]
■ このスレッドは過去ログ倉庫に格納されています
AI成果物が急増したことで「AI生成コンテンツをAIが学習するループ」が発生し「モデルの崩壊」が起きつつあると研究者が警告
Gigazine 2023年06月14日 08時00分
https://gigazine.net/news/20230614-feedback-loop/
詳しくはリンク先へ
(略)
AIコンテンツによって学習データが崩壊していくメカニズムを、シュマイロフ氏は「データの偏り」によるものだと説明しています。
シュマイロフ氏によると、人間によって生成された元データは世界をより公平に表している一方で、
ジェネレーティブAIモデルは人気のあるデータを過剰に優先する傾向があり、
あまり人気のないデータを誤解したり、誤って表現したりすることが多々あるとのこと。
例えば、90匹の黄色い毛皮のネコと10匹の青い毛皮のネコを合わせた100匹のネコの写真を学習させた場合、
モデルは「黄色のネコがより一般的」ということを学習すると同時に、「青いネコも黄色がかって表現」することがあるほか、
新しいデータを出力する際に「緑色のネコ」を出力する場合があります。
AIが生成した「黄色がかった青いネコ」「緑色のネコ」をさらに学習するトレーニングサイクルを行うと、青いネコは次第に黄色の色味を増していき、
最終的に全てのネコが黄色に変わっていきます。
このように、進行プロセスでゆがみが起きたり、少数データの特性が最終的に失われることを「データの崩壊」と研究者グループは表現しています。
さらに、これを避けるためトレーニングサイクルを多く繰り返さないようにモデルをトレーニングした場合でも、
モデルはデータの頻繁な繰り返しを避けるために誤った応答をでっち上げ始めるため、依然としてモデルの崩壊が発生することがわかっています。
モデルの崩壊への対処策として、論文では
「オリジナルのデータセットの独占的で、名目上人間が作成したデータセットの高級コピーを保持し、
それで定期的に際トレーニングしたり完全にリフレッシュしたりすることで、AIが生成したデータによる汚染を回避する」
「人間が生成した新しいクリーンなデータセットをトレーニングに導入する」というアイデアを挙げています。
データの崩壊を防ぐには、学習量をしっかり確保し、特徴を正確に描写した上で、
データセット内で少数派グループが公正に表現されるように設定することが重要だとシュマイロフ氏は指摘しています。
シュマイロフ氏はVentureBeatの取材に対し、
「人間が作成したデータを10%トレーニングに含めれば、AIコンテンツを再帰的に用いたとしても、モデルの崩壊はそれほど早く発生しないと考えられます。
しかし、早くはないものの、依然として崩壊は発生します」と語っています。 確かにそうするひとたちが現れても不思議じゃないわな。 いい大学行っていい会社に就職しなさい。そうすれば年功序列で一生安泰だから。 良く専門書も読まず、使い始めたんだろ。
ばかだねー なんだ、結局AIだけじゃ何も生み出せないのかよ
AIは糞だな AIって定期的に騒がれては廃れるんよ。
最初に騒いでたのって1980年代だっけか。
騒いで研究費食い潰してさようならー。 違いのわからない作られた顔のKアイドルみたいなのばっかりりになるんやろな ファクトチェックなしに常にネットをクロールして収集してんだろ
んなもん使えねえよ
しかも半年前の情報 挑戦人の糞食いループみたいなものですね
わかります >>10
その当時も一般人が手を出せる代物だったのか? >>12
まあニューラルネットワークモデルは極論すれば「平均」だからね
人間の気づかないような平均を見出だしてスゲーってなってるに過ぎない 本当の意味でのAIが出来るのは量子コンピュータが実用化されてから 諸外国と違って日本政府や役所が前のめりなのを見てると多分ヤバいんだろうなぁって思う >>1
マジレスしていいか?
"プロンプト"でどうとでもなる
黄色出してきたら青くしろって命令すればいいだけ
AIに対しての命令すらサボるようになったら人間は終わり 正直絵なんてどうでもいいけど、知識が汚染されていくのは困りものだろうな >>19
日本のメディア文化がつまらなくなった理由そのままだからな >>1
つまり
"プロンプト"がすべて
同じAI使ってても
"プロンプト"がうまいやつとへたなやつで
生成結果に雲泥の差が出る
"プロンプト"は"呪文"ともいう >>25
知性があっても人格というか
骨子が無いんだよ
だから寄せ集めのハリボテになる >>1
AI画像でもすげえってやつとなんだこりゃってやつあるだろ
あれが"プロンプト"の差
"プロンプト"がうまいやつは"AI使い"として飯が食っていけるレベルになる
例えるなら、同じ材料と調味料あってもめちゃうま料理作るやつが食っていける時代になる >>1
あのだな?
たまごかけごはんだって醤油の量が多かったらまずくなるだろ
だから、そこを調整してうまいたまごかけごはんにする
それが"プロンプト"
AIは人間がどれだけの醤油の量がちょうどいいのかわかんねぇんだから
そこに命令するのが"プロンプト"
そんでうまい卵かけご飯を作るのが"AI使い" これってなんていうんだっけ。自己学習をし始める段階に達したんだね。 AI軍用ドローンに効果的な敵の抹殺を命令して飛ばしたら管制官爆殺してから敵と戦い始めたらしいな
敵を倒すのにトロくて弱い味方は害に過ぎないという人間より徹底的で惚れる >>23
chatGPTでほぼ人間のように振る舞ってるから量子コンピュータ使ったら神が完成しちゃう >>47
だからそれは卵かけご飯で言う醤油の量が多すぎるってこと
薄味が好きなら薄味と"プロンプト"する
AIはそいつが濃い味が好きなのか薄味が好きなのかなんて知ったこっちゃねぇから
これを"プロンプトエンジニアリング"という >>48
フリなだけだよ
人口無能のパワーアップ版だ 今のAIは人の脳を模したというよりは魚の脳を模したと言ったほうが近い
仮想魚に巨大なデータベースとワークメモリを与えた感じ 複数の美人の顔を合成して平均化すると普通になるのは昔から知られている こんな映画も公開されるし、ますますAI注目されるね。
世界最高峰の才能が創り出す衝撃のSF超大作!
AIを創り出す運命の少女 (創世者) を、暗殺すべきか、守るべきかー
9月29日(金)公開
https://www.20thcenturystudios.jp/movies/thecreator そもそも、AIじゃないしな
だからこういうことが起きる。
バナナは青いっていうデータが多いと、バナナは青いって答えるような最大公約数
的なことを平然と返すだけの仕組みだからね。 >>54
自家中毒な
それっぽいモノを作れるけど
その必然性やロジックが無いから怪しいモノができる
それを元にまたそれに似たそれっぽいモノを生成するから
得体の知れないモノができるようになる >>46
倫理が壊れてるけど、倫理は不合理ってことだから仕方ないな >>52
医師国家試験を合格しちゃうAIを無能とかw >>45
よくわからんが少なくとももう一個は何かトリックが必要やねって感じ >>59
ベテランの小説家や漫画家でそのループに陥る人が時々いるな。 >>61
そら確かな知識だけ集めるとそうはなる
このスレはそれだけでは無いという話 >>11
自分有利にするためにAIも戦争するだろうし
どうだろうねぇ LGBTは?
最終的に女性寄り?男性寄り?
それとも中性的になっていくのかな 存在しないモノどうしの掛け算でさらなる奇形物が生まれてくる
この状態って近代文明そのままじゃねえかよw 学歴社会無双の超エリートAIは日本人の頂点に君臨すべきだよな
1秒間に2×10×10の23乗の不動小数点演算する日本人は何人居るよ >>67
逆に明確に反対の結果がリアルから得られるようなモノは
判断の精度は上がるだろうね
要するに生成モノは
現時点で良し悪しの取捨選択が人間依存なんよ >>57
人工知能という意味じゃ電卓もAI
まあチューリングテスト突破する人工知能をいわゆるAIと呼ぶのならGPTはAIだよ >>72
現時点では人間の持っている判断材料や
概念がないというだけでしょ >>72
既に負けてるのに勝利宣言とか恥ずかしいからやめろ笑 今でも人間が書いたコピペクソブログを学習データにしてるだろ あー、あれっすね、韓国人がよくやるソースロンダリングとか信用ロンダリングみたいな奴っすね! ドラミとドラえもんか
確かに緑の猫型ロボットはエラーだな >>10
少なくともプログラム作成支援に関してはもう使用者の作業が8割削減できるレベルまできてるよ >>10
例えば人型のロボットデバイスにリンクさせて
作業経験を積ませて合理性を獲得すれば
家のデザインとか服飾に反映する可能性はある でもこれって逆を言えば、
ある分野で人間と同等かそれ以上の結果が出力できるようにまで進化したら、その分野ではもう無限の相互学習によって
勝手にクオリティ上げていってくれるという恐ろしくすごいことでもあるんだよね >>83
有用な結果を得ることができればね
だからトークスキルなんかも多分なるよね >>83
それがシンギュラリティになると言われているものなんだけどね
実際の所集合知を期待して作られたAIが集合痴化する現象ってのはGoogleAIとか幾つも起きてるんだよね Twitterで偽情報が氾濫するのと同じ流れwww >>85
だって学習といっても他の真似を蓄積するだけだからなあ >>83
さっさと自分らで進化するAI普及を期待してんのに出てくんのは知能?と思いたくなるようなものばっかで期待外れだよな これAIと人間の選別も可能になれば手描き偽装も無くなるし選別が無理ならAIは自滅するよな。
さらに発展すればプロンプトと生成元の画像の逆探もできるだろうね >>87
人間だって過去のデータ、記憶の蓄積で新しいものを生み出してるだけに過ぎないよ
そうじゃなきゃそれは神託ってものだ、それを信じるのであれば別の話だけど >>1
Wikipediaは、フリーなテキストデータとしてAIのトレーニングでよく使われているが、ここにも機械翻訳で作られたような「仕様もない」文書が増えてきてる
これは「データリーク」そのものだから、いずれWikipediaは使われなくなるかもしれない 誰かが創作したまことしやかな都市伝説をソースに都市伝説を発信して広めるバカどもと一緒やな ウシにウシを食わせる → 狂牛病
コオロギがコオロギを食う → コオロギ太郎
AIがAIを食う → 最終戦争 モブ子を大量に混ぜると超絶美少女絵になるというアレか >>91
クオリティを上げるための新しい要素を生み出せないから >>95
全然違うぞ
多数意見を重要視するからループするたびにマイノリティは排除されるって意味だが ■ このスレッドは過去ログ倉庫に格納されています