ロボットと話すのは恥ずかしい?--Nextremer×ユカイ工学が語る「機械との対話」

 2月27〜28日の2日間に渡って開催されたイベント「CNET Japan Live 2018 -AI時代の新ビジネスコミュニケーション-」。2日目には、AIやロボット関連ベンチャー2社のCEOによる対談が行われた。テーマは「ロボット&モビリティとのコミュニケーション」。人間が音声やジェスチャーで機械的システムとコミュニケーションする際の課題について、ざっくばらんに語り合った。


対話AIの「Nextremer」、おもしろロボットの「ユカイ工学」

 登壇したのは、Nextremer代表取締役CEOの向井永浩氏、ユカイ工学CEOの青木俊介氏。モデレーターはCNET Japan副編集長の藤井涼が務めた。

 向井氏がCEOを務めるNextremerは2012年10月創業。以来、AI活用型の対話システム開発を一貫して行っている。現在は、さまざまな分野での応用を想定したマルチモーダル対話システム「minarai(ミナライ)」を展開。チャットボットや対話型デジタルサイネージのバックエンドとして広く利用されているという。


Nextremerの事業概要

 そのminaraiのもう1つの注力分野がモビリティ(車)だ。2017年11月から2018年2月末まで本田技研工業(ホンダ)と共同で、レンタカー向け観光ガイドシステム「ラジオDJ」の実証実験を沖縄で実施した。音声入力による周辺情報の検索はもちろん、複数のAIキャラクター同士のかけあい対話に人間が“割り込める”機能を備える。


 ユカイ工学は2007年12月に設立され、コンシューマー向けのロボット製品を数多く世に送り出している。2012年4月発売の「Necomimi」は、その名の通り猫の耳のような形状だが、脳波センサを内蔵。集中度・リラックス度に応じて耳が立ったり、逆に垂れ下がるといった仕掛けが盛り込まれている。

 そして2018年秋には「Qoobo(クーボ)」を発売予定。丸々としたクッションに“尻尾”がついていて、なで方に応じて尻尾の動きが変化するというセラピーロボットだ。「コミュニケーションのおける『言語』の割合は4割程度と言われる。実際にはイントネーション、ジェスチャーなどが関わっているが、現在は言語を音声処理してテキストに変換するのが主体で、捨てられてしまっている情報も多い。そういった部分をロボットのジェスチャーで再現できるのではないか、という発想からQooboのプロジェクトが立ち上がった」(青木氏)。

ちょっとの工夫でAIとコミュニケーションしやすく

 AIやロボットの進化が進む一方、人とデバイスを結ぶインターフェースについてはまだまだ課題も多い。たとえばデジタルサイネージは、単純に画像を表示するタイプもあれば、タッチパネルで操作ができるタイプもある。しかし、ユーザーは一見しただけではどちらのタイプか分かりづらい。結果、せっかくの機能が持ち腐れになるケースもある。今後は音声対話が可能なデジタルサイネージも増えると見込まれるが、そこでどのようなインターフェースを構築するかは、デバイスの利用率をも左右しかねない。

 向井氏がその解決案として挙げたのが、音声対話型サイネージの前にメガホンを置くことだった。非常にアナログな手法ながらメガホンを見れば人は「なにか声を出せばよい」という発想が自然に生まれる。この手法はテレビ朝日でのイベントで実際に試されたが、向井氏は「1つのイノベーションだった」と回想し、その効果の高さをうかがわせた。

 また、自然言語での音声対話システムは、その利用場所がプライベート空間かパブリック空間かによっても前提条件が変わる。たとえばGoogle Homeのようなシステムは、操作に必要な音声コマンドを利用者側がある程度記憶しておかねばならない。これは自宅などのプライベート空間であればそれほど問題にならないが、パブリック空間となると、コマンド一覧表を貼り出すといった工夫が必要になる。


音声対話システムを考える上では「移動と固定」「パブリックとプライベート」を意識すると、求められる役割がよく理解できる。例えば空港カウンターでの案内システムは「固定・パブリック」。モビリティ向けなら「移動・プライベート」だが、乗る車がタクシーやバスなら「移動・パブリック」になる

 よって、音声対話システムを構築する上では、「パブリックとプライベート」という軸に「移動と固定」を加えることで、考慮すべきポイントが浮かび上がってくる。「たとえば、自分で運転中の車内は、そもそもジェスチャーなどができないため、音声入力との相性が良いと考えられている。また、車内で歌ったりする人がもともと多いので、(前述の)沖縄の実証実験でも利用者の方はかなりよく喋ってくれた」(向井氏)。

 モデレーターの藤井は、沖縄での実証実験を現地で取材した。その際、画面内に3人のキャラクターが表示されていたことが印象的だったという。「3人のキャラクター同士が会話していて、沖縄に関する小ネタをラジオのように聞き流せるし、一方で『美味しいレストランはどこ?』といった質問にも答えてくれる。Google Homeのような(人間とAIの)1対1ではなく、1対多。3人の会話に混ぜてもらうような感覚が味わえた」(藤井)。


「ラジオDJ」では3人のキャラクター同士が会話する

 向井氏によれば、見た目上のキャラクターを3人用意することで「会話している感」が醸成されるのだという。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]