【IT】スマホの次に覇権を握るのは音声認識デバイスか 米国発売のAI搭載「スマートスピーカー」、日本でも入手可能に [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
ついに、AI搭載のスマートスピーカーが日本国内でも入手できるようになる。
Googleは、カリフォルニアで開催されている年次開発者イベント「Google I/O 2017」において、同社のスマートスピーカー「Google Home」の日本国内発売を発表した。今夏を予定しているという。
Google Homeは昨年、米国で発売されたAIを搭載したスマートスピーカー。
同社の対話型AI「Google Assistant」を搭載しており、家庭内の様々な家電製品と連携してコントロールしたり、音声で尋ねれば本日の予定や天気を答えてくれたりと、まさに執事のような存在として振る舞ってくれるのだ。
動画:https://youtu.be/dpnxTXILS4s
今回、日本語への対応に加えて機能拡張も発表されており、音声で「○○さんに電話」などと呼びかけることで、Google Homeがスピーカーフォンとなって電話ができたり、テレビと接続するAndroidデバイス「Chromecast」との連携により、検索結果をテレビで確認できるようになったりするという。
これまでは日本語未対応ということで、国内では「Google Assistant」を利用する機会が少なかったと思うが、Androidスマートフォンでの音声検索「OK, Google」の機能拡大版と捉えればイメージがしやすいかもしれない(Google Alloは対応済み)。
■ブームのきっかけはAmazonのAlexa
ご存知の方も多いと思うが、今、世界中でAI搭載のスマートスピーカーが人気を博しており、各社こぞって開発を進めている。
きっかけは、2014年末に発売されたAmazonの「Amazon Echo」。
同社のAI「Alexa」を搭載しており、米国ではクリスマス前に品切れになるほどの大ヒット商品となった。
何がそこまで人々を引きつけているのかというと、他の機器との接続性であろう。
これまでの単体で完結していた音声入力可能なデバイスとは異なり、本機がハブとなって様々な機器を音声でコントロールできるようになる。
まるで一昔前のSF映画で見たような、未来的な生活が実現するわけだ。
しかも、ただの音声入力機能を提供するだけでなく、AIによる学習機能が備わっている。
使えば使うほどユーザーの声の特徴などを学習し、反応が正確に速くなっていくという。
単に便利なデバイスが登場したという見方もあるだろうが、実は今後のコンピューティングにおいて、大きな意味を持ちそうだと筆者は捉えている。
■コンピューティング体験を変えるユーザーインターフェース
1970年代ごろから登場したと言われるパソコンだが、入力装置としてはキーボード、あるいはマウスなどが主流であり、30年以上も同じ方法が取られてきた。
それがスマートフォンの登場によって、変化が現れる。
2007年に登場したAppleの「iPhone」は、タッチパネルでの入力を前提としており、タップやスワイプという新しい操作方法が一般的なコンピューティング体験にもたらされた。
今や若年層においてはキーボード入力よりも、フリック入力の方が速く文章作成できるとも言われるほどに定着している。
このように、ユーザーのコンピューティング体験を変化させるのに、ユーザーインターフェースは大きな影響力を持っているのだ。
そして、今回のAmazon EchoやGoogle Homeにおいては、AIアシストによる音声コントロールという操作方法がもたらされる。
これは、家庭におけるコンピューティング体験を大きく変えるきっかけになるのではないだろうか。
特に、超高齢化社会となっていく日本においては重宝されそうである。
キーボード操作よりも音声でコントロールできた方がはるかに自然であり、高齢者にとって利用障壁が格段に下がるのは当然であろう。
そのように考えていった場合、一般的なユーザーのコンピューティングがパソコンからスマートフォンに移り変わりつつあるように、将来的にはスマートフォンから音声コントロールデバイスへと変わっていくのかもしれない。
そうした見通しを持っているからこそ、各社ともスマートスピーカーの開発に乗り出しているのではないだろうか。
日本国内での発売一番乗りはGoogle Homeになりそうだが、Amazon Echoの発売も噂されるほか、チャットツールが国内で格段の普及率を誇っているLINEも自社のAI「Clova」を搭載したスマートスピーカーを今秋に発売するとしている。
今後、次世代デバイスの覇権を巡って、スマートフォンOSの時のような競争が激化しそうだ。そこから生まれてくる未知なる体験を楽しみに待ちたい。
http://news.livedoor.com/article/detail/13087088/ Uberでもそうだったが、騒がれ出してから、日本やアジアでまともに普及するのに最低でも二年はかかる
後追いベンチャーで、日本とアジア押さえりゃ結構行けるぞ 日本は規制でダメだけど、中国や東南アジアはいち早く新しいものを取り入れるよなぁ >>2
マジでデータ会社に送信したりしやがるからな
アメリカはIoTの録音データ漏洩のニュース頻繁にある
利用規約にもちゃんと送信しますって書いてあったりな >>6
ベンチャーが主流だからな
だからベンチャーの出が悪いシンガポールは、東南アジアの他の国より出遅れてるぞ >>5
中国語とその派生語の日本語、韓国語は言葉の並びに英語のようにしっかりとした構造が無いから
音声認識がなかなか難しいんだよねぇ
I had dinner in my room last weekend.
英語だとこのほぼこの言い方ひとつなんだけど、日本語だと
先週末私は自分の部屋で晩ご飯を食べた
自分の部屋で先週末晩ご飯食べた
先週末晩ご飯は自分の部屋で食べた
自分の部屋で晩ご飯食べた先週末は
等々、個人によって文章に揺らぎが生まれるので、日本語の認識は大変なんだよね おもちゃとしては面白いんだろうけど、実用的ではないわな
そもそも、自宅に盗聴器を置きたいとも思わんしw 日本の場合は美少女キャラと組み合わせないと売れないだろ 昔からあるシステムなんだけどなぁ
精度が上がって使いやすくなってるんだろうけど
全然ワクワクしないなぁ ちんちん痒いってつぶやいたら軟膏が送られてくるとか?? 3Dテレビと同じような扱いになりそうな…
音声入力に対応したからって、結局ボタン入力を音声に置き換えただけだもの
機械使えない人間にはどっちも同じだよ >>21
AI「こんどそれいったら通報な、機械と思って舐めんなちんカス!」
こんくらい来るとか? トニー・スタークみたいにぶつぶつ言いながら
うろつきたくないお Siriを使った事あるならわかるはず、
最初だけ面白がって使っても、普段は使わないし、
コレだとゴミになるし、ゴミ箱くらいの性能は欲しいよなぁ 音声認識のインターフェースが擬人化されたら、萌えコンテンツの日本の独壇場。 スマホ操作より声だす方が面倒臭い
まわりに人居たら嫌だし 慣れると元に戻れなくなるとかも、言われてるね。
最早リモコンなしのTVって使いにくいだろう。そんなものらしい。 >>19
ネットのカキコでは威勢がよくても
会話はてんでダメってのが昔より多いだろうしなw スマホへの文章入力も、音声にしたほうが便利になると言われてるしね。
もしかしたら、そっちから先に音声デバイス使用習慣は広がっていくかも。 ローカライズ担当がヘボで、日本語対応するときに無残な認識率になりそうw >>39
ならないと思う、Siriは日頃使わないし ヘイSiriとか言ってるやつを白い目で見てしまう俺には要らない物だな 日本ではあまりしゃべらない
ちょっとした仕草で反応してくれなきゃ
日本では使い物にならない 完全自動運転には必須だろ。極普通に会話するように行き先を伝えられるようにならなきゃダメ。 >>44
NAVIにもうすでにあるけど試しに使ったきり
二度と使わない グーグルのスマートスピーカーの投入先が米国・英国・ドイツ・フランス・日本
単純にGDP上位国に、、と思いきや、やっぱりシナチクは嫌われているw 口腔内デバイス舌をマウスやインプット機器にするほうが汎用性高いだろうな。
フリック入力もできるし、 正直な話、邪道すぎてあれだが
ほぼ全ての新しいサービスが、アメリカで騒がれ出してから、アジアにとどくまで2 年から3 年かかるので
今からスピード重視の後追いベンチャーで、日本と東南アジア、インドをとるだけで、アマゾンやGoogleに勝てちまうぞ >>49
人間同士が会話するように話せるようになんなきゃダメだろうな。
最低限タクシーで行き先告げる程度のノリで。 「思いどうりに使いたい」
「思い」に反応してくれなきゃ無理
アメリカ人は「思い」が勝手に言葉になるんだろう googleの音声検索が私を馬鹿にする
一生懸命話しても認識しねぇ 完全無視のクラスメートより酷い 音声認識キライ
ちゃんと普通の声量で発声して滑舌もそんな悪くないのに
ちっとも聞き取ってくれない
何か特殊な波長の声なのかな 便利な物が増えると物に能力を依存して人はどんどん馬鹿になるからな 僕「あー彼女欲しいなー」ボソッ
ピンポーン「オリエント工業の方から来ました」 音声認識は一発で変換すれば気持ちいいけど、3回に一回は聞き取れないので何度も言い直すのがストレスになる。
そもそも日本の家屋で「〜おっぱい画像くれ」とか言えねーよw >>12
だから中国人はホラをべらべらしゃべり続ける暇があったら帰れって。
何が日本語は中国語の派生語だ、頭がおかしいんだろ?お前。
古代中国も含む中国語の文法は日本語とは全然違う。どちらかというとラテン語や英語寄りだろ。
英語は一通りしかない? 英語にも倒置表現はあるから。
”同化工作”はいいからさっさと中国人は帰れって、うんざりなんだよお前等の下劣なやり方は。 >>2
なぜ会話したり言葉を発しなきゃならんのか。。。 ウザ杉 仮に完璧な対応ができたとしても、電車の中で口頭で指示を出すような人はあまりいないだろ。 お前ら、結婚できないだろ。
家電ぐらいしか会話してくらないだろ。
素直に喜べよ。 日本語は難しい。文章をよく咀嚼して言葉を選んで。
「口にするより前に一旦考えてから発現しなさい。」
だからキーボードで打ち込み画面で確認するぐらいが丁度いいんだよ。 それより先に、勝手に「OK GOOGLE」と言われたと思って「音声を認識出来ませんでした」って言うのやめろよ 結構思ったより大きかった
物に対して全部対応するなら 当たり前か 車運転しながら実況中継して
それがそのままツイッターに流れるとか 確かにグーグルマップの音声認識は便利だ
運転しながらというシチュエーションがあるから音声入力が有効になる
運転しながら「オーケーグーグル、コンビニ」と言えばルート途中のコンビニ検索をしてくれる
スマートスピーカーで何ができるかは分からないが
「ながら命令」なら音声は有効だ
IT家電のコントローラーとして普及しそうだが
その前にIT家電のコントロール規格の統一と普及が必要だ 顔の表情から気持ちをくみ取ってくれるデバイスの方が、はやると思います。 技術的には音声操作くらいは実現できそうだな
といってもインターフェイスが糞でどうしようもないが
現状だとブラウザ画面上での検索くらいか 電話掛けるにしてもLINEとか特定のにかけられるようにして欲しい
電話回線とか今時使わん 正しく言ったのにちゃんと認識されないとイラッとくるよね >>10
日本もそうだけど、その分安全と信頼に重点を置いた財・サービスを提供できる 家に据え置きだろこれ
外で音声操作はハードルが高い >>42
日本企業はこういう発想。
出遅れて後の祭りだし、日本発のイノベーションはほとんど起こらない。 未来が来たな。
2001年宇宙の旅のHALみたいだな。 >>1
喋るっていのは結構重労働なんだよな。手元で指で操作のが絶対にいい スマホの次というか、IoT入門ではない?
これでWebサイト閲覧できるん? 日本では流行らない、というか受け入れる下地がない機能だと思う ガラケーの頃は日本が世界一最先端技術が民間に降りてくる国だったのにな
今や世界一どころか二週遅れで韓国台湾より遅いIT後進国 流行らない流行らないいってないで
素早くアメリカの名もない音声ベンチャーそのまま買い取って
ホンダジェットみたいに、名前だけ国産にして、日本市場専門に開発させて市場を強奪
そのまま儲けてから、技術を国内に移しつつ
東南アジアも強奪
こんな技術でも、どうせ今まで通り
二年は攻めてこれないぞ OK Google便利だけど外だと恥ずかしくて使えん
せめてOK Googleを任意の言葉にできればいいのに ■ このスレッドは過去ログ倉庫に格納されています