X



【IT】「自分に似た声」を作るアプリが無料で公開 36〜40万円が相場の音声合成業界に価格破壊の風
■ このスレッドは過去ログ倉庫に格納されています
0001きらら ★
垢版 |
2018/06/08(金) 16:54:20.37ID:CAP_USER9
みなさんは自分の声そっくりにしゃべる合成音声をお持ちだろうか? 
筆者は2年4カ月前から自分の声「松尾P」を使えるようになっていて、たまに記事で使っている。ちょっとした自慢だ。
ところがこの先行者特権が失われようとしている。
4月17日に東芝デジタルソリューションズが公開したモバイルアプリ「コエステーション」が原因だ。
自分の観測範囲でもかなりの人が自分の合成音声「コエ」を持ち始めている。
コエステーションは、自分の声で10個の文を読み上げるだけで自分の声を基にした「コエ」ができて、TTS(Text to Speech)による発声をアプリ内でできる。しかも無料。
これはとんでもない価格破壊だ。

これがどのくらいの価格破壊かというと、既存の音声合成企業が提供しているカスタムボイス作成では40万円(AITalk Custom Voice)、36万円(ボイスター ライト版)と、簡単に手を出せる価格ではない。
筆者の声をモデル化した「松尾P」は、HMM(隠れマルコフモデル)を使った音声合成だ。
オープンソース版のTTSであるOpen JTalkと、それを商用化したCeVIOがこの技術に基づいている。
CeVIOはTTSだけでなく、歌唱合成もできて、故・三波春夫の歌声を合成することもできる。
歌声合成のオープンソース版はSinsyで、筆者の歌声(英語のみ)を合成して歌わせることもできる。

■HMMを使った音声合成Open JTalk

このOpen JTalkを元にしたWindowsアプリにSHABERUというものがある。
無料で様々な音声を使ってしゃべらせることができるアプリだ。
作者のアキヒロさんはOpen JTalkで用いられているhtsvoice形式の音響モデル作成を無料で提供していて、筆者は自分で収録したサンプル文をアキヒロさんに送り、データベース化作業をアキヒロさんがやってくれたのだ。
通常、特定の声の音声合成モデルを作成するためには、音素の組み合わせを網羅したたくさんの文章を読み上げ、そこからモデル化する。
よく使われている例文はATR503音素バランス文というもの。
htsvoice構築にも通常はこの文章を用いる。アキヒロさんは独自のバランス文を用いて、200程度の文章で可能にしているが、それでもなかなかの作業だ。
htsvoiceの作成にはLinuxと様々なツールをインストールし、そのシステム構築は大変だ。
やり方を自分でも模索してみたが、独力でできる気はまったくしない。

■コエステーションはいきなりできたわけではない

そしてコエステーションである。
なぜいきなり東芝子会社がこんな技術をと思うかもしれないが、東芝は音声合成で長い歴史を持つ老舗なのだ。
2001年に終了してしまったLaLaVoiceというTTSのパッケージソフトを持ち、dynabook(当時はDynaBook)にバンドルしていた。
LaLaVoiceには簡易的な歌声合成機能もあり、登場時期はVOCALOIDよりも早かった。

LaLaVoiceが終了した後で登場したToSpeakは現在、東芝デジタルソリューションズのクラウドAIであるRECAIUSで使われている音声合成エンジンと位置付けられている。
人に似せた声でしゃべるカスタムボイス機能は実証済みだ。
2016年に人気パーソナリティーである小林克也さんが録音した数時間分の音声から作り出された合成音声「コバカツ君」がそれだ。
このときはRECAIUS音声合成ソフトサービスとして紹介されている。
さすがスネークマンだけあって日本語だけでなく英語も流暢にしゃべり、歌もうたう。

■小林克也さんの声から作り上げた「コバカツ君」はFM NACK5の放送でも使われた

コエステーションはこうした手間のかかるカスタマイズをiOSアプリでやってしまうというところが画期的だ。
iPhoneかiPadと付属のEarPodsイヤフォンがあれば、自分の声に似た合成音声を作り、実際に使うことができる。
それも最初は10の文を読み上げるだけでよい。

Open JTalkの場合は503、少なくとも200以上の文を安定した状態で読み上げる必要があった。
しかもその処理には複数のアプリを組み合わせたLinuxをぶんまわす必要がある。
コエステーションはiOSアプリの中で読み上げると1文ずつサーバに送られる。
10文を読み上げると第1段階「コエレベル1」クリアだ。

コエレベルは最高で5。コエレベル1は10文、レベル2は50文、レベル3は100文、レベル4は150文。
筆者は200文を読み上げ、最終段階のレベル5に到達している。
ここまでくると、品質はかなり高く、少し荒削りなところもあるOpen JTalkより柔和で本人に近く聞こえるようだ。

動画 https://youtu.be/0g06LxUIZ4E

http://www.itmedia.co.jp/news/articles/1806/08/news104.html
0005名無しさん@1周年
垢版 |
2018/06/08(金) 16:56:42.31ID:KPukoTu+0
バーチャン オレオレ
0006名無しさん@1周年
垢版 |
2018/06/08(金) 16:57:19.95ID:1FOo31Vb0
つまり
このアプリを使えば
好きな女性タレントにおまんこって言わせられるの?
0009名無しさん@1周年
垢版 |
2018/06/08(金) 16:58:16.13ID:+mzWFija0
ということは、俺の声で
あんなエロい言葉や、こんなエロい言葉を
喋らせられるのか!!
しかも無料で!
0010名無しさん@1周年
垢版 |
2018/06/08(金) 16:59:10.54ID:kX7Dzhkg0
これでもうどもらなくてすむな
0011名無しさん@1周年
垢版 |
2018/06/08(金) 16:59:52.28ID:Cvp9qmbJ0
官僚の声で「おっぱい」と言わせればセクハラで仕留められるし、
脅迫やら犯罪に色々使われて

音声録音が証拠として意味を持たなくなっていくんだろうな……
0014名無しさん@1周年
垢版 |
2018/06/08(金) 17:01:34.56ID:DMZ3aqUZO
これで好きな声優の音声で朗読出来る?
小山力也風で老人と海を聴きたい
0015名無しさん@1周年
垢版 |
2018/06/08(金) 17:01:39.98ID:6aFrrbr80
※実はこのムービーのナレーションも音声合成です。

ホラーよりのSFだよ
うん
うそだね!
これは
うそだよ!
0017名無しさん@1周年
垢版 |
2018/06/08(金) 17:02:08.37ID:xUSDNUyR0
PC用なら今でも無料ソフトあるじゃん
0018名無しさん@1周年
垢版 |
2018/06/08(金) 17:02:18.30ID:yNX+EWU90
いや、自分の声が欲しいわけじゃないんだが。
0021名無しさん@1周年
垢版 |
2018/06/08(金) 17:04:30.34ID:8F6gkyY40
普通の人は声の訓練なんてしないからな。
ユーチューバーにすらなれない
0022名無しさん@1周年
垢版 |
2018/06/08(金) 17:05:12.18ID:6aFrrbr80
アニメ声優は無価値かもねw

音響監督と一晩寝るだけの仕事になるw
0023名無しさん@1周年
垢版 |
2018/06/08(金) 17:05:25.31ID:OSrXvX0a0
皆口裕子の声で問い詰められたいわ。
0024名無しさん@1周年
垢版 |
2018/06/08(金) 17:05:49.65ID:Cvp9qmbJ0
リンク先を見たけど
まだまだのレベルだった。
0026名無しさん@1周年
垢版 |
2018/06/08(金) 17:06:04.62ID:645X76Qq0
ゲームの主人公がプレーヤーの声で喋るとか

エロゲにしか需要なさそうだけど
0032名無しさん@1周年
垢版 |
2018/06/08(金) 17:08:19.47ID:6aFrrbr80
女性の声は、あきらかに抜けてる周波数があるけどね

まあ男性の声より女性、子供の声のほうが難しいだろうね
0033名無しさん@1周年
垢版 |
2018/06/08(金) 17:08:43.69ID:9ocveysh0
Android版ないのかiPhoneとか誰も使わないだろ
0036名無しさん@1周年
垢版 |
2018/06/08(金) 17:10:34.09ID:jOwFpZ8W0
ルパン三世の声優さんもいつでも引退できるね。
0037名無しさん@1周年
垢版 |
2018/06/08(金) 17:10:36.66ID:puk0Yyfq0
政界も含め、有名人の爆弾発言ゴッコが溢れそうだwww
0038名無しさん@1周年
垢版 |
2018/06/08(金) 17:14:12.47ID:DpZ7tKum0
>>1
オレオレ詐欺の精度があがるな
0041名無しさん@1周年
垢版 |
2018/06/08(金) 17:25:41.83ID:kebafw8x0
この東芝はどこの子会社なん?
美的集団?ハイセンス?シャープ?日米韓連合?
0042名無しさん@1周年
垢版 |
2018/06/08(金) 17:28:33.59ID:kPcbqWQb0
>>16
有料で利益を上げられないなら、無料にする事で活路を見いだす事も出来る
利用は無料なのに収益を上げている企業はいくつか想像出来るだろ?
ただ、シェアを奪えないと意味が無いけれどね
0044名無しさん@1周年
垢版 |
2018/06/08(金) 17:33:49.51ID:GSeooln80
全然詳しくないけど、adobeがなんかそんな技術発表してなかったっけ?機械学習とやらを駆使して、
音声版のフォトショップみてーねことをするってやつ。ちょっとだけ喋って学習させると、自在にその人の声になるとかなんとか。
もっと技術が進めばかなりのものができちまうんだろうね。
クラスの好きな娘の音を録音して「ゆうちゃんだいすき、ミクのおっぱいたっぷりすって?」とか喋らせたいわ
0048名無しさん@1周年
垢版 |
2018/06/08(金) 17:45:53.13ID:9HnvCGte0
ここはやはり峰不二子の声使ってあんなことやこんなこと
0050名無しさん@1周年
垢版 |
2018/06/08(金) 17:50:57.91ID:xZqvcHN90
取得できうる限りの個人情報をステガノグラフィー的に、音声データに埋め込んでおかないと
犯罪に利用された時に追跡できない
0052名無しさん@1周年
垢版 |
2018/06/08(金) 17:51:06.68ID:EbiRvkl00
人に与える印象は声そのものよりしゃべり方の方がよっぽど重要
0053名無しさん@1周年
垢版 |
2018/06/08(金) 17:53:00.75ID:l1z8BnH00
>>50
そもそも個人認証、認知の方法が
声なんて時代が終わるのかもよ
0054名無しさん@1周年
垢版 |
2018/06/08(金) 17:54:28.74ID:57ryy15w0
声の綺麗さでいえば、セビオが一番
0055名無しさん@1周年
垢版 |
2018/06/08(金) 17:56:40.11ID:X67wXzHu0
>>49
あーなるほど
これで、OK,Googleと言わせたらロック解除できちゃいますわ
0056名無しさん@1周年
垢版 |
2018/06/08(金) 17:59:30.72ID:CNPv59XJ0
犯人「よっしゃこれで暴言してもセーフになるわ。どんどんDIS言うたろ」
0058名無しさん@1周年
垢版 |
2018/06/08(金) 18:00:04.30ID:DRAjs9zV0
振り込め詐欺を助長させてどーすんのさ
0059名無しさん@1周年
垢版 |
2018/06/08(金) 18:00:08.85ID:qPkgOZ9a0
詐欺に利用されませんかね
0060名無しさん@1周年
垢版 |
2018/06/08(金) 18:00:57.33ID:61wFxONd0
朝日新聞だったら、安倍総理の声を作って・・・・
あんな事言わせたり、こんな事を言わせたり
国会を引っ掻き回すのに使い倒すだろうな
0063名無しさん@1周年
垢版 |
2018/06/08(金) 18:07:10.99ID:40ESlBFg0
>>58
だよねぇ
俺も思った
でも音声データを登録出来ないだろうから関係ないか
0066名無しさん@1周年
垢版 |
2018/06/08(金) 18:09:34.05ID:7rFeOklM0
好きな子の声でスネークマンショー
0067名無しさん@1周年
垢版 |
2018/06/08(金) 18:12:23.87ID:XZ+5uTO80
蝶ネクタイが実現
0069名無しさん@1周年
垢版 |
2018/06/08(金) 18:15:32.24ID:LbSOBka60
照れくさくて言えない言葉をアプリに言わせて、かわいい子ゲットだぜ。
0070名無しさん@1周年
垢版 |
2018/06/08(金) 18:22:32.44ID:W9iD08ub0
アニメの音声を吹き込んで喘ぎ声を完成させる事のできる神アプリか
0074名無しさん@1周年
垢版 |
2018/06/08(金) 18:30:06.43ID:ECpslQ3M0
>>6
シリコンドールに装着して
お国訛りで 「おまんご、いぐぅーーーっ!」 って言わせることも可能。
0080名無しさん@1周年
垢版 |
2018/06/08(金) 18:41:15.78ID:Vzl/2YYc0
>>75
つんくのような病気に罹った時のために取っとくのもいいかもしれない

でもどうせデータを手元に保存できるわけじゃないんだろうしな
このアプリが声が出なくなる時まで存続してるのか
してたとして使い続けられるのか甚だ心もとないからやっぱいらないかもなw
0082名無しさん@1周年
垢版 |
2018/06/08(金) 18:41:45.89ID:daraBzzf0
好きな子のボイスをゲットすれば色々と捗るじゃん。
0083名無しさん@1周年
垢版 |
2018/06/08(金) 18:41:52.60ID:1TRXeufs0
アップルだけって
開発ヲタってそんなんだから会社も潰れるんだわ
0084名無しさん@1周年
垢版 |
2018/06/08(金) 18:42:34.97ID:hNMKnLdk0
そもそも電話で相手側に届く声は再現された音声であって
本物の音じゃない
0085名無しさん@1周年
垢版 |
2018/06/08(金) 18:50:18.89ID:RrTKt8ss0
ほう、よし!俺の声で吉野家を作ってみるか。
0087名無しさん@1周年
垢版 |
2018/06/08(金) 18:56:45.98ID:DdWivG0s0
これは・・・素直に射精です
0089名無しさん@1周年
垢版 |
2018/06/08(金) 18:59:22.42ID:zOSHaLDF0
俺がこの世の中で最も嫌いなのが「自分の声」だわwwww

聞くとマジで死にたくなる

てか、周りのみんなゴメンな
0090名無しさん@1周年
垢版 |
2018/06/08(金) 19:05:58.82ID:daraBzzf0
アイドルの音声データとかが販売されるのか?
0094名無しさん@1周年
垢版 |
2018/06/08(金) 19:12:26.94ID:A9mnQraj0
これつんく♀みたいに声帯なくして声でなくなった奴には役にたつんか
0095名無しさん@1周年
垢版 |
2018/06/08(金) 19:17:42.31ID:f5hK1yJn0
今の合成音声は、すごく人間の声に近いからな。

音声データだけでは、証拠にならないよ。
0097名無しさん@1周年
垢版 |
2018/06/08(金) 19:35:23.02ID:HLY3/GHZ0
>>1
ショーン君でいいや
0098名無しさん@1周年
垢版 |
2018/06/08(金) 19:36:51.26ID:2rxZ74mR0
他人を騙すのに活用されるな
便利なツールをむやみやたらに公開すべきじゃないな
0100名無しさん@1周年
垢版 |
2018/06/08(金) 19:39:26.10ID:a7MTk7r+0
OCRとか、音声合成とか、特定の分野では東芝強いんだよな
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況