朝日インタラクティブは6月19日、「CNET Japan Live 2014 Summer あらゆるモノがつながる世界~IoTが起こす新ビジネスイノベーション」において、モノのインターネット(Internet of Things:IoT)への世界的な注目に対するビジネスチャンスやイノベーションのあり方についての講演やパネルディスカッションを行った。
「入力・操作の未来--IoT時代の電子機器とのコミュニケーション」と題したセッションでは、ニュアンスコミュニケーションズジャパン モバイル&コンシューマー事業部 事業部長の岡田学氏、トビー・テクノロジー代表取締役社長の蜂巣健一氏、モデレーターにメディア戦略コンサルタントの松永エリック・匡史氏が登壇し、音声認識やアイトラッキングにおける未来の入力装置のあり方についてパネルディスカッションが行われた。
1993年にゼロックスの事業部として設立したニュアンスコミュニケーションズは、ビジネスやコンシューマー向けの音声・言語ソリューションを提供する企業だ。ヘルスケア事業では臨床ドキュメント作成のオートメーションサービス、携帯電話、自動車や電化製品などのディクテーション、検索、自動言語処理、音声制御ソリューション、企業向けにはカスタマーケアサービスなどを提供している。
「文字入力は80言語以上、音声合成は50言語以上、声紋認証は40言語以上に対応している。現在のトレンドは、モバイルをどのように活用するか。例えばカーナビに音声認識をビルドインさせ、ネット接続によってあらゆる情報を活用するソリューションなどを提供している」(岡田氏)
アイトラッキング分野で世界トップシェアを占めているトビー。アイトラッキングの利点は「誰でもとれる、精度が高い、自然に動ける」といった3つの要素があると蜂巣氏は語る。トビーは、学術研究やマーケティングリサーチなどのリサーチ事業、視線だけで操作する福祉機器の開発や、手や視線で操作する次世代型ユーザーインターフェースの開発といった、インターフェース事業を展開している。
「マーケティングリサーチでは、デジタルサイネージなどの広告における効果的なUX開発を支援している。インターフェース開発では、障害を抱えている人でも操作できるようなPCやタブレット、最近では視線だけでカーナビを動かせるインターフェースなどを開発している」(蜂巣氏)
音声認識もアイトラッキングも、それ単体だけですべてをカバーする技術なのだろうか。また、1つではなく複数の機能との組み合わせによってさまざまな可能性が考えられる。岡田氏は「使うシチュエーションによって、音声が有効活用できる時とできない時がある」と語り、音声が必ずしも万能ではないと指摘。それらを踏まえた上で「手足が不自由な人にとって、声は大きな武器。企業側で決めつけるのではなく、あらゆる人に対して可能性を提示し、最終的にユーザーがどのような状況でも選択できるようなサービスにしていきたい」と語る。
蜂巣氏は、アイトラッキングはクリックのような何かを選んだり実行したりするのには不得手だと指摘。まばたきや5秒間目を開け続けることで実行コマンドとする操作機能も、かなり難しい操作だ。
「目だけで何かをする、という状況は難しい。目の操作を1つの方法論として捉え、さまざまな技術と組み合わせながら、あらゆるユーザーに対して最適なインターフェースを作っていきたい」(蜂巣氏)
音声認識やアイトラッキングも入力装置の1つでしかなく、入力した先にある個人情報や企業秘密などが漏洩しないようなセキュリティを意識しなければならない。岡田氏は、音声も文字と同様に完璧に守ることはできないとするも、企業向けのソリューションでは単純な音声認識ではない複雑な技術を通じた二重三重のセキュリティを行なっているという。近年では、民生レベルにおける声紋認証サービスも登場し始めている。その背景には、セキュリティと個人の身の安全の観点から有用だという。
「海外では、指紋認証よりも声紋認証が好まれる。声は生きていないと発することができず、泥棒に侵入されても指紋認証などのために身の危険にさらされることもない。また、音声認識は毎回変わるランダムな文字の読み上げのため、録音対応もできている。仮にモノマネをしても、解析エンジンが分析するため、人間の耳では聞こえないレベルのもので判断しており、セキュリティレベルは高い」(岡田氏)
虹彩などの目による個人認証は、個人特定の精度は高いが一般に普及するためには開発コストが課題だと蜂巣氏は語る。そこで、目以外の方法との組み合わせによって、よりセキュリティを強化することも可能だと付け加えた。
「仮に、目だけで何かを保護しようとするのであれば、画面を見ていない時に自動的に画面が消える、といったものはすぐにできるかもしれない。単純な個人レベルでの情報保護から、企業における重要なセキュリティなど、あらゆるレイヤーに合わせた技術の活用を考えるべき」(蜂巣氏)
モーションセンサーの次に、声や感情を読み取る技術が発達するのでは、と言われている。はたして、声や視線から感情を読み取ることができるのだろうか。岡田氏は、言葉のテキストだけではなくその言葉の中身を理解する、いわゆる自然言語理解の発達が現在進んでいるという。言語ロジックをもとに、問いかけられた言葉からその人の目的を理解し、その目的に応じた動作や操作が可能になるという方向性は、今後の音声認識における言語処理の可能性として大きいと語る。
視点は、その人がどこを見ているかだけではなく、行動パターンや瞳孔の開き方などから、何を考えているかを探ることは今後可能になってくるだろうと蜂巣氏は語る。視線のよる分析や、音声、心拍などのさまざまな人の行動から、その人の感情をより正確に分析する時代が来るかもしれないという。
こうした音声認識や視線の分析は、ゲームやマーケティング以外に、社会課題解決への期待も大きい。両者がそれぞれフォーカスしていきたい今後の方向性について伺うと、岡田氏は「しゃべったり聞いたり、言葉を返したりするのは人間のコミュニケーションの根幹であり、重要なもの。今後は、言葉だけではなく触れたり、匂ったりという五感を通じたコミュニケーションのあり方を開発し、生活に根付いたテクノロジを提供していきたい」と話す。
蜂巣氏は、リサーチで人の行動の相関関係を分析しているという。どこを見て、どこを記憶し、どんな印象を抱いたか、という行動分析と相関関係を導き出していきたいという。
「リサーチによる相関関係を導き出した研究成果をもとに、インターフェース開発に活かす。リサーチとインターフェースは、まさに両輪な関係」(蜂巣氏)
最後に、スマートフォンやタブレットの進化の先に、音声認識やアイトラッキングがどのように関わってくると予想しているのだろうか。岡田氏は、最新のインテルのウルトラブックには音声操作が搭載されるなど、音声認識の領域は確実に広がっていると語る。
「音声は、今後の新しい入力装置になってくる。しかし、音声も万能ではなく合うところと合わないところがある。パソコンなどのデバイスのみならず、生活のさまざまな場面における、音声認識の可能性をもっと模索していきたい。ぜひ、みなさんにも考えてもらいたい」(岡田氏)
蜂巣氏は、技術先行ではなく、あくまで人の行動をサポートするための技術だという考えを踏まえつつ、さまざまなシチュエーションにおいて、アイトラッキングや音声などの技術が活きるシーンが、身の回りに数多くあるだろうと指摘。「自動車や医療の現場において、両手がふさがっているシーンをどうにかしたい、というニーズは大きい。技術を正しく使い、生活を豊かにしていく努力を今後もしていきたい」と蜂巣氏は語った。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
「程よく明るい」照明がオフィスにもたらす
業務生産性の向上への意外な効果
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス