AI側が人を見分ける(聞き分ける)ところまで踏み込まないと、こうした齟齬はやがて普及に伴いどんどん出てくる。
誰(オーナー家族かそうでない人の声か再生音声か)なのか、その人にはどのようなpermissionが与えられているのか、どのような意図なのか?
それくらいは弁別すべきなのだ。
例えば日本語で「おい!」「おーい!」と呼んだら、それが誰なのかどのような意図なのか聞き分けられなければいけない。
今のところ慣れた人間(家族など)にはそれができてAIスピーカーにはできないのだ。