スマートスピーカーで話題の「音声技術」　専門家が語る課題と“体験”の重要性（前編）

2018年7月23日 18時配信

2018年上半期のトレンドといえば「Amazon Echo」や「Google Home」といった「スマートスピーカー」は欠かせません。人工知能（ＡＩ）が内蔵されていることから、いよいよ近未来のテクノロジーが本格的に日常に入り込んできたと期待している人も多いでしょう。

私たちの生活を変えるかもしれない「音声インターフェース」。その可能性と課題はどこにあるのでしょうか？
ソニー株式会社でユーザーインターフェースやネットワークに関する研究開発に携わり、音声UXデザインチームを作り統括。2014年に独立し、音声UIやUXデザイン（顧客体験設計）に関するコンサルティングや研究開発に携わる河野道成さんは、『音声に未来はあるか？』（日経ＢＰ社刊）で丁寧に現状を分析しながら、「課題は山積み」だと指摘します。詳しくお話をうかがってきました。

（新刊JP編集部）

――河野さんが上梓された『音声に未来はあるか？』は、音声インターフェースの現状についてまとめられていますが、その中で課題を指摘する記述も多く見受けられました。

河野：スマートスピーカーの発売以来、音声インターフェースは注目を集めているのですが、ある意味スマートスピーカーという商品の比較に終始してしまっていて、音声認識の技術まで踏み込んだ話ってあまり出ないんですよね。だから、技術の話とＵＩやＵＸデザインの話を絡めた本を書ければと思っていました。

――河野さん自身は以前勤められていたソニーで音声UXデザインチームを率いていたそうですね。

河野：そうです。ソニーの中には、音声に関する技術を研究するプロフェッショナルたちがいるのですが、技術先行になりがちなところがあって、技術を前提にサービスを作るという流れになりがちでした。

もちろん研究開発は最も大事です。ただ、ユーザーにサービスとして提供する場合、ユーザーが快適に使ってもらうために適した形にしなくてはいけません。要素技術の研究者はそれぞれ専門性が高く独立しているだけに、他の技術との組み合わせ（統合）や体験設計までしっかり考えるのは難しい状況にあります。

だから、体験設計からサービスやプロダクトのプロデュースをする人が必要だということで、音声UI／UXデザインというのを私が受け持っていました。

――当時、河野さんが認識していた音声インターフェースの「課題」とはどのようなものでしたか？

河野：やはり「音声認識」にフォーカスされがちだったということですね。例えば音声で指示をしてテレビがつけば「すごい！」となる。だけれども、手元のリモコンの電源ボタンを押せばテレビはつくわけですから、結局慣れている方に行きますよね。

ＵＸ（ユーザーエクスペリエンス／顧客体験）とはそういうもので、実際に使ってもらうには、体験的なデザインが必要です。音声の場合、体験よりも技術が先行していたこともあり、体験が追いつかずにいくら良い技術もちゃんと活かすことができていなかった。これがブレイクしない原因でもありました。

だから、ＵＸデザインについてしっかり考えないと、また技術先行のサービスやプロダクトができてしまい、同じ轍を繰り返してしまうのではないか…。そういう思いがありましたね。

――サービス側からのアプローチということで、技術開発者と意見がぶつかることも多いのではないですか？

河野：それはありますね。こういう体験を創り出すことがベストだということを伝えないといけませんから。

例えば、スマートスピーカーやスマホに「アレクサ！」とか「Siri！」と呼びかけるってハードル高くないですか？　恥ずかしいと思う人もいるでしょう。だからそういう呼びかけがなくなるのは私としてはベストだとは思います。ただ、呼びかけをなくしてしまうと、自分が発した声以外に勝手にシステムが反応して、予期せぬ動作が起こるかもしれない。そういうせめぎ合いもあります。

私はソニー時代、技術者の皆さんに「技術を洗練してください」と伝えていました。一方で、私は「ユーザーにとってこれが良い」という優先度付けをして、もし技術ではなくＵＸデザインでごまかせるところがあれば、その方法を取ったりもしていました。

――「ごまかす」というのは？

河野：音声の面白さはやはりコミュニケーションです。だから、エンジニアリングで不足している部分をコミュニケーションで逃げることができるんですね。

例えば、ユーザーの好みの季節を知りたいときに、「好きな季節はなんですか？」と聞くと確実に失敗します。季節って春夏秋冬以外にもたくさんありますよね。「初夏」「秋と冬の間」とか。ほかに「春と夏」と２つ答える人もいます。

――答えは確かに４つではないですね。

河野：そうです。だからその返答に対する応答のシナリオをたくさん作らないといけません。そうすると、システムがすごく複雑化するんですね。ならば、シンプルに「春夏秋冬どれが一番好きですか？」と聞く。こうすればシナリオは４つの選択肢プラス１つで終わります。「プラス１」というのはたとえば「４つのうちで答えて下さい」という例外処理対応です。

聞き方は変わるけれど、ユーザーは嫌な気持ちにならないでしょう。つまり、システムの都合がいいように答えを誘導することも、UXデザインのキモなのです。