Bukshteyn氏が詳しく説明してくれたシステムでは、例えば2人でディナーに行く計画を立てる場合に、それをクエリに分解し、カレンダーやレストランの評価、位置情報などのさまざまな場所のデータを使用できるようになるという。
「そのデータはすべて、実際はさまざまな場所にあるものだ。そのため、そういった場所すべてを確認できるエンジンやサービスを用意している。ユーザーのカレンダーや履歴、2人とも行ったことがありそうな場所を確認したうえで、いくつか選択肢を示して場所を選ぶ手助けをし、予約を完了する。それは非常に価値のあるものになると考えている」(Bukshteyn氏)
ここで鍵となるのは、もちろん、自分の電話に向かって、その夜にディナーに行きたいと言うだけで、そのプロセスが始まることだ。「これは実質的に、Microsoftの音声認識ツールが向かっているところだ」(Serafin氏)
Microsoftのオンラインオーディエンスビジネス担当シニアバイスプレジデントであるYusuf Mehdi氏は11月、Bingで複数のタスクを1つのアクションに統合するというMicrosoftの目標についてコメントしたが、Serafin氏はこれを繰り返しながら、携帯電話にインストールしているアプリケーションの数や、そのすべてを使う必要性について、あまり気にかけなくてもよくなるようなシステムの概要を説明した。
「この分野では、場合によっては複数のキーストローク、あるいは複数のアプリケーションが必要だったタスクを完了できる。音声の理解という面で、ユーザーのしたいことを手助けできるような環境になりつつある」(Serafin氏)
これが実現する時期については、Serafin氏は語ろうとしなかった。「われわれは、こういった基盤を足がかりとした導入を進めている。それについてはいずれもっとお見せできるようになるだろう。われわれが重視しているのは、音声技術の背後にある戦略、そして、われわれがこれまでに築いてきたものを、それが実際にどのように活用するかだ」(Serafin氏)
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス