> >

MSの音声認識技術--言葉の「意味」の理解に向けた新たな取り組み - (page 3)

文：Josh Lowensohn（CNET News）翻訳校正：川村インターナショナル2010年12月20日 07時30分

　Bukshteyn氏が詳しく説明してくれたシステムでは、例えば2人でディナーに行く計画を立てる場合に、それをクエリに分解し、カレンダーやレストランの評価、位置情報などのさまざまな場所のデータを使用できるようになるという。

　「そのデータはすべて、実際はさまざまな場所にあるものだ。そのため、そういった場所すべてを確認できるエンジンやサービスを用意している。ユーザーのカレンダーや履歴、2人とも行ったことがありそうな場所を確認したうえで、いくつか選択肢を示して場所を選ぶ手助けをし、予約を完了する。それは非常に価値のあるものになると考えている」（Bukshteyn氏）

　ここで鍵となるのは、もちろん、自分の電話に向かって、その夜にディナーに行きたいと言うだけで、そのプロセスが始まることだ。「これは実質的に、Microsoftの音声認識ツールが向かっているところだ」（Serafin氏）

　Microsoftのオンラインオーディエンスビジネス担当シニアバイスプレジデントであるYusuf Mehdi氏は11月、Bingで複数のタスクを1つのアクションに統合するというMicrosoftの目標についてコメントしたが、Serafin氏はこれを繰り返しながら、携帯電話にインストールしているアプリケーションの数や、そのすべてを使う必要性について、あまり気にかけなくてもよくなるようなシステムの概要を説明した。

　「この分野では、場合によっては複数のキーストローク、あるいは複数のアプリケーションが必要だったタスクを完了できる。音声の理解という面で、ユーザーのしたいことを手助けできるような環境になりつつある」（Serafin氏）

　これが実現する時期については、Serafin氏は語ろうとしなかった。「われわれは、こういった基盤を足がかりとした導入を進めている。それについてはいずれもっとお見せできるようになるだろう。われわれが重視しているのは、音声技術の背後にある戦略、そして、われわれがこれまでに築いてきたものを、それが実際にどのように活用するかだ」（Serafin氏）

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。