偽造音声でのなりすまし、実現は間近(中) - 偽造音声でのなりすまし、実現は間近:CIO Magazine
http://itpro.nikkeibp.co.jp/atcl/idg/17/053100041/053100002/
2017/06/07

 攻撃者にパスワードを盗まれることはあっても、生体を盗まれることはないという前提が、テクノロジーの進展に伴って、確実なこととは言えなくなった。例えば、今や指紋は、ハッキングが絶対不可能な認証方法とは言い切れず、なりすましが可能である。そして声についても、同じことが言える日は近そうだ。

Lyrebird自身、同社のサイトに掲載した簡潔な倫理規定の中で、同社の技術について、「誤った駆け引き、詐欺、他人のIDを盗むことで生じる問題全般など、危険な結果を生む可能性がある」と認めている。

 さらには、「当社のテクノロジーを広くリリースして、誰でも利用できるようにすることで、そのようなリスクが生じないようにしたい」と述べている。

 この技術に対しては、セキュリティコミュニティからさまざまな反応がある。Scientific Americanの記事によると、米IBM ResilientのCTO(最高技術責任者)で、暗号化の第一人者であるBruce Schneier氏は、偽のオーディオクリップに出くわすリスクは「新たな現実」になったと発言した。


 またSchneier氏は、自らのブログ記事で次のように述べている。「攻撃者が標的の人物に電話をかける時に、その人の知り合いになりすませるとしたらどうなるか、ソーシャルエンジニアリングでの影響を想像してみてほしい。我々はこれへの準備はできていないと思う」

 だが、この言葉に対しては、記事のコメント欄で多少の反論もあった。読者の1人は次のようにコメントしている。「種の1つとして、来たるべきものに対して人類が準備できているということは決してない。経験を通じて適応するよう学習していく。それはおそらく、人類にとって最も強力な生存スキルだ」

 別の読者は、この懸念は新しいものではないとコメントし、2003年にオレゴン健康科学大学が発表した別の文章に言及している。この文章では、テロ事件の首謀者とされたOsama bin Laden容疑者の肉声としてたびたび登場した録音テープが本物かどうかという点について、同大学の教授が疑問を提起している。

 この文章で、同大学のOGI School of Science and Engineeringの数理心理学者、Jan van Santen氏は、「音声変換技術が次第に利用可能になりつつあることから、偽造された音声かどうかを見破るのは難しくなってきている」と話していた。


 言うまでもなく、当時のこうした録音テープは、音質の悪さでよく知られていた。一方、AdobeのVoCo、Lyrebird、あるいは米Alphabet(Googleの親会社)の「WaveNet」といった現代の音声模倣技術は、音質が格段に優れているし、今後1〜2年の間にいっそう向上することが予想される。

 だが、認証の専門家は、声は依然として、本人確認のための要素として信頼に足る1つだと話す。ただし、他の要素と組み合わせるのならば、である。

 「身元を確認する要素が声しかないとしたら、困ったことになる」と、米VeridiumのJames Stickland CEOは言う。

 一方で、Stickland氏が「アンサンブル」と呼ぶ要素群の1つとして、所有物認証(例えばトークン)や知識認証(例えばパスワード)と組み合わせるのであれば、声は引き続き認証で不可欠な役割を果たす。

 Schneier氏が言うように、声のなりすまし技術に対して人間の準備が整っていないのだとしたら、その理由は、「所有物認証、知識認証、生体認証を依然として分けている人が多い」からだとStickland氏は言い、「これ以外も含めたすべてを組み合わせるのが認証の未来だ」と話す。

翻訳:内山卓則=ニューズフロント