【IT】AmazonやAppleの音声認識アルゴリズムに「黒人の声を上手く聞き取ることができない」問題があると研究者が指摘
■ このスレッドは過去ログ倉庫に格納されています
音声認識アルゴリズムはスマートスピーカーやスマートフォンなど、さまざまなデバイスやアプリケーションに採用されており、もはや日常の一部となっています。ところが、AppleやAmazon、Google、IBM、Microsoftなどの音声認識アルゴリズムを使った実験で、「音声認識アルゴリズム白人の声と比較して黒人の声を上手く認識できない」問題があることが判明しました。
音声認識アルゴリズムはスマートアシスタントの操作や音声入力、文字起こしサービスなど、さまざまなアプリケーションに採用されています。音声を認識するシステムには機械学習アルゴリズムが用いられており、開発者らが用意した音声データやテキストデータで機械学習アルゴリズムが訓練されています。
そんな音声認識アルゴリズムの精度を調査するため、スタンフォード大学の研究チームはApple、Amazon、Google、IBM、Microsoftの音声認識アルゴリズムに対し、さまざまな人が話した音声を文字に変換させる実験を行いました。実験に用いられた音声は合計で19.8時間分であり、42人の白人と73人の黒人によって話された2141個の音声で構成されていたとのこと。また、話者の44%が男性であり、平均年齢は45歳だったそうです。
実験の結果、各社の音声認識アルゴリズムは平均で白人が話した単語のうち19%を誤認しましたが、黒人が話した単語が誤認される割合は35%に上りました。また、エラー率は黒人男性で全体の41%、黒人女性のエラー率は30%でした。
以下のグラフが、各社の音声認識アルゴリズムによる白人話者のエラー率と黒人話者のエラー率を比較したもの。どの音声認識アルゴリズムにおいても、黒人が話す言葉のエラー率が白人の話す言葉のエラー率を上回っていることがわかります。Appleの音声認識アルゴリズムが最もエラー率が高く、黒人話者のエラー率は45%、白人話者のエラー率は23%。最も成績がよかったMicrosoftの音声認識アルゴリズムでも、黒人話者のエラー率は27%、白人話者のエラー率は15%となりました。
https://i.gzn.jp/img/2020/04/19/voice-assistants-racial-divide/02_m.png
スタンフォード大学の工学准教授であるSharad Goel氏は、「結果は特定の企業に限定されるものではありません。5社全てに類似したパターンが見られました」と述べています。
過去にもアルゴリズムやソフトウェアが人種的な偏りを持つケースは報告されており、Google Photosが黒人を「ゴリラ」と認識してタグ付けしてしまった事例や、人種に関するデータが存在しない医療システムで黒人が不平等に評価されるケースも判明しています。
一連の問題は、機械学習アルゴリズムを訓練する際のデータセットに存在する偏りが原因の可能性が高いと考えられています。訓練に使用されるデータそのものが白人話者の音声を豊富に含み、黒人話者の音声をあまり含んでいない場合、音声認識アルゴリズムが黒人話者のアクセントや話し方を上手く学習できず、エラー率が高くなってしまうとのこと。研究チームのAllison Koenecke氏は、「私たちの論文は、開発者が音声認識アルゴリズムを訓練する上で、より多様なデータを用いる必要があると示唆しています」と指摘しています。
今回の結果を受けて、Googleの広報担当者であるJustin Burr氏は、公平性がGoogle製AIの基本原則の1つであり、長年にわたって音声認識アルゴリズムの精度向上に取り組んでいるとコメント。「私たちは数年間にわたってさまざまな種類の音声を正確に認識するという課題に取り組んでおり、今後も継続していきます」と、Burr氏は述べています。また、IBMの広報担当者も、「IBMは私たちの自然言語と音声処理機能の開発・改善・進歩を続け、IBM Watsonを通じてユーザー機能のレベルを向上させています」とコメントし、Amazonは音声認識アルゴリズムを継続的に改善していることを説明するウェブページを提示しています。
https://i.gzn.jp/img/2020/04/19/voice-assistants-racial-divide/img-snap03659_m.png
https://gigazine.net/news/20200419-voice-assistants-racial-divide/ そもそもラップってアメリカ人は誰でもちゃんと聞き取れてるの? アップルは知らんが
グーグルに比べてアマゾンはホント馬鹿だよな >>2
オートチューン使いまくりで元の声を編集してるので
黒人か白人かアジア人か、声だけじゃ知らなきゃ誰もわからんw
マイケルジャクソンみたいにそっくりの別人が歌ってたスキャンダルとかもあったしw アルゴーの探検隊が持ち帰った知識の中に含まれていたからアルゴーリズム
ビーン 日本語に対してもたいして精度高くないし
所詮は欧米列強どものツールでしかない
中国製は当然として、いい加減国内回帰すべき時期だと思う
まぁ、だらだら開発している国内研究所ってのも問題あるが
そういうのも、改善しつつ国内回帰 これからマジで重要 アップルやアマゾンはレイシストだ。
お前ら日本人みたいに、
金持ち(日本は債券国だろ)先進国に生まれたというだけの、ぐうだらでバカでクズのボンボンのクソガキが、選民思想持っていてナチ思想を持っていて、貴族になりたがっていたら、
白馬の王子様もオマエラ日本人のところには来ないのは当然だろwww
例えば、ハリウッドスターとかリベラルとかで、東南アジアの途上国の孤児や難民を引き受けて育てる奴いるけど。ひねた見方をすればあれもパフォーマンスで受けがよいからやるわけで。
お前らみたいな「選民思想持っていてナチ思想を持っていて貴族になりたがっている、金持ち(日本は債券国何なんだろ?)先進国に生まれたというだけの、ぐうだらでバカでクズのボンボンのクソガキ」
を引き取っても何のプラスにもならないだろwww
それどころかマイナスしかない。お前らみたいな日本人を引き取ったらイメージが悪化するだろwww
オマエラ日本人がもっと貧乏になり選民思想を捨て貴族面するのをやめたら、白馬の王子様も来てくれるってことだろwww
ただ、おもそも白馬の王子様は存在自体が間違いだぞ。オマエラ日本人は頭がおかしいんだ。
オマエラ日本人は、北海道にでも行って、ヒグマに頭でもかじられてろ。
オマエラ日本人「どうして、私の前にひれ伏さないの?!」
オマエラ日本人「ディズニーアニメでは、お姫様の前に、ライオンでもトラでもチーターでも象でもハイエナでも全部ひれ伏しているわ!」
お前ら、お姫様のつもりかよ。あれはアニメだ。北海道に行って、クマに頭かじられて来い。
オマエラ日本人「どうして、このクマは私にひれ伏さないの?!?」
クマ「ガブッ!(間抜けなえさが来た)」 >>8
言語自動判別でフランス語エンジンになりそう 確かに独特のフガフガ感があって聞きづらい
ハチムラ君もそんな感じだから、あれは骨格なのかな お前らジャップは、
AI「ジャップは、チョンマゲフンドシ肥溜めのハラキリセップク野蛮人だ」
と、”AIが言えば”、差別じゃないと言っているわけだろ? スマート・スピーカーなんて誰も話題にしなくなったなw
本質は盗聴器だからね 声が低いから?
それともトレーニングサンプルの問題? 白人の訛りの強い人のはどうだか知らんけど南部の、黒人さんとか本当に何言ってるかわからない事あるな
音質も違うかも T-mobile の音声認識で、"forget pass word "を色んな発音をし10回目位でやっと認識され、日本語英語の限界を感じた。 画像認識でも音声認識でも認識されない黒人
デジタルステルスを標準装備してるんだな 一方グーグルは黒人とゴリラの区別ができなくて諦めた 北部出身と南部出身で分けてもこのくらいの差は出るんじゃないか? スマホの音声認識ってすごいわ俺はいつもモゴモゴ言わんではっきり喋れ言われるし実際ほんとによく聞き返されるんだけどちゃんと一回で認識するからな ドロクバ 「ヒュー! ハッキリ言って日本にチャンスはないな。」 画像認識の方は「さもありなん」って気がするけど音声もか。
「人種(と言うか肌の色)によって同じ言葉を話しても違う」ってのは
むしろ新しい発見じゃないか? アジア系やヒスパニック系の声では検証すらしてないのかよ… 学習データにバイアスがかかってるんだから仕方ないよね >医療システムで黒人が不平等に評価されるケースも
まだるっこしい書き方しやがって何があったかさっぱりだわ くろんぼはアフリカに帰してやれ
可哀想だろ
いつまで奴隷飼ってるんだ
人権侵害だぞ >Google Photosが黒人を「ゴリラ」と認識してタグ付けしてしまった事例や、
機械にすら差別される黒人ってことか? アレクサは日本語のなんちゃって英単語でも上手く認識してくれるから
英語圏の黒人の発声なんて平気そうだけどなぁ しかし、黒人もさ、黒いは黒いけど、
図抜けた黒さの黒人いるよな?
昔、レジで前に並んでた黒人は、黒地の柄模様のシャツ着てて、
その黒も、ちゃんとした相当な黒なんだけど、
着てる黒人の肌の黒が、それ以上に黒い、なんつーか真紅って言葉があるが、
真黒っていう感じに黒かった。
本当、見たことないぐらいの黒。
あそこまで行くと、逆に美を感じるぐらいだね。 確かに黒人の落ち着きない話し方は
声だけで認識するの難しいかもな
umbu, umba, da, unba, understood? 英語は全然喋れないが、
TVとか見てて、黒人の特に男が喋ってる時は、
白人よりこもりがちで低い声質なので、
姿を見なくても、黒人が喋ってるってすぐ分かる。 いわゆる南部訛りの事だろ
おらだつのこどばっさわがりゃねんだと?
ぐらいのイメージ シュール
Google Photosが黒人を「ゴリラ」と認識してタグ付けしてしまった事例 >>14
サラリーマン社長が経営やってる様な日本の会社じゃ無理。
ちゃんと創業家が経営やってるか、プロの経営者が会社の
経営やってる会社以外は淘汰されるべき。
日本にはプロの経営者は居ないから、創業家だな。 そんなもんだろ
alexaに猛虎弁で操作させろって言っても無理だろ >>1
画像認識でも、黒人のアトリビュート判定が難しいんだよな。
年齢性別推定が本当に難しい 白人を元に作ってるから
いくら黒人のサンプル増やしても
同じってことなんかなぁ >>5
やっぱアレクサはダメか
持ってるけどまぁバカすぎて使わないもん >>10
そもそもアジア人って移民一世じゃなきゃ白人発音同じじゃね? 黒人英語は音がいわゆる舞台俳優の言葉とは違うのでなれていないと
日本人にとっても聞き取りにくいよ。中国人の英語も聞き取りにくいよ。
インド人の英語は音は舞台俳優言葉とは違うし、音韻も英語よりも多いようだが、
日本人にとってはアメリカの標準的な白人の英語よりも聞き取りやすい。
なぜなら単語をはっきりわけてしゃべるから。ロシア人の英語もそうだ。
ネイティブではない方が日本人には聞き取りが簡単なんだ。無闇に早く
しゃべらないからでもあるだろうし、語彙を少なくしゃべるからかもしれないな。
アメリカ白人と英国人白人の英語は英国人白人の言葉の方が教科書的で
わかりやすい。
でもいわゆるフォーマルじゃない会話は、単語がくだけてたりスラングが
多用されていたり、単語がほとんどくっついて発音されるので、日本人には
聞き取り難い。 >>74
テドロスどんの英語はてしけに聞き取りやすいわ 黒人の声じゃなくて黒人訛りの英語が分からないんじゃね?
音声認識って基本的に方言が苦手だもん。 youtubeの自動字幕は日本語は滅茶苦茶だな
英語はちゃんと翻訳できてるっぽいが 写真で黒人とゴリラの顔が分からないのもあったな
まだまだAIは技術不足か >>74
俺もアメリカの黒人の英語は聞き取りにくかった、でもインド人はそれ以上の聞き取れなかった >>77
おそらくそれだろうな
隠語や黒人特有のブロークンな言い回しがたくさんある わかった
英語として認識しないで、黒人が話すのは英語によく似た黒人の言葉としてAIに学習させるか
スペイン語とポルトガル語みたいに別言語扱い 声じゃなくてファッキンとかメーン?とか言葉じゃね? 黒人っていうかいわゆるB系な奴らの喋りって訛ってるというか独特の法則があるよね
語尾のer(アー)が伸ばす感じじゃなくa(ア)やah(アァ)みたいになる
スペリングも敢えてそう書いたりするし
自然に細かくリズムに乗るような発音になるんだろうか >>74
自分は中国人の発音はめっちゃ聞き取りやすい
独特の中文直訳な言い回しする部分は知らないと戸惑うけど発音自体は綺麗に思う
30代以下の話す英語しか知らないから中年以上のはどうか知らないけど
イタリア語圏とスペイン語圏の人の英語はカタカナ語に近い感じで聞き取りやすい
waterもワラじゃなくちゃんとウォーターって言うから好き
フランス人だけは英語で話してくれててもフランス語っぽく聞こえて聞き取れない
あいつら英語を話さないんじゃなくて英語で話してても英語だと認識して貰えてないだけなんじゃ >>87
スペインイタリアの発音は日本のローマ字読みでしょ アメリカも、いわゆる南部訛りというのがあって、これが慣れないと何をいっているのか
わかりにくかったりする。でもどうやらそれはもともと移民してきた時代のイギリスの
英語の癖がその地域に移植されて温存されているかららしい。 黒人の音声データの学習が不足してるんだろ
説明しにくいけど、黒人特有の言いまわしとか抑揚とかあるよね
黒人が歌うとその特徴が良くでる >>80
インド人の英語鉛キツいね
俺の英語も酷いがインド人の英語は何言っているか分からず、結局英語で筆談した
別れ際に日本人は英語話せないな!と捨てセリフ
なぜかそれだけ聞き取れた >>95
中国人留学生たらこんな所まで出てきちゃって・・・ 一番低い誤認率でも19%もあるのか
自分が英語話しても認識されないはずだw マイケルジャクソン
曲を聞きながら、歌詞カードを目で追ったけど、全く分からなかった学生時代の記憶
あれで英語は自分は無理と諦めた・・・
初めて出会ったのがビートルズだったら、
俺も今頃あの英語は聞き取れないという間違った先入観を持つことなく、英語ペラペラだった気がする >>88
スペイン語イタリア語はローマ字発音だけど彼らの英語は流石にローマ字発音じゃないよw
英語喋る時はmateをマテと言ったりcomeをコメとは言ったりはしないw
あでも時々英伊の語源一緒の単語がイタリア語発音のままになって4月をエプリーレと言ったり
12月をディチェンブレって言う人はいたけどそれはローマ字発音だとわかるから推測しやすかった
>>95
台湾人は大陸中国人よりは訛ってるけどベースがアメリカ英語だからか日本人には聞き取りやすいと思う
個人的にはシンガポール人の話す英語が語尾にラー!とかついて可愛いから好き >>99
英語は、ロマンス語のフランス語起源の単語大量だけど、スペインイタリアと仏語なら平気なのかな? >>92
serverを「サルバール」とか言ってたな。
#define private public
とか超黒魔術使ってたし・・・なんかこっちと感覚がまるで違うw ボブ・サップとボビーと八村の声が聴き分けられないとか? 黒人に共通した訛りなんかあるかね
YO!とかHEY!とかじゃねえよなw セントルイスのラッパーがヒットした時はthereをターって発音してたな
わかりにくいのがウリだった
ブルーノマースのヒットもローマ字発音では無理 >>86
erをaにするのはそこから来たのか。
アメドラでチソチソを元気にする薬にerectaってラベル貼ってあったな 言語も変化するからな
AIも言語のダイナミズムに対応できないってことだろ
もうちょいAIも進歩しないと 確かにサンコンとかゾマホンとかボビーオロゴンとか何言ってるかわかんない時あるよね。 Chip on my Sholderと言うと、ちんぽ真っ白だって聞き取られちゃうの? 黒人はTHの発音ができないでTと発音する。
マイケルジャクソンのスリラーはツゥリラーといっている。 >>1
くまモンの人形の声もうまく聞き取れてなかった >>66
むりだね。うちも電気機器メーカーだけど、Windows UpdateのP2PキャッシュはWinnyの技術だから禁止。よって第2水曜日はネットワーク激重。
在宅勤務でスカイプは許可されたけど、チャット機能とデスクトップ共有は情報量流出の危険性があるから禁止。
アホかとバカかと小一時間。 >>1
ゴリラと黒人を識別出来ない件はどうなった? ■ このスレッドは過去ログ倉庫に格納されています