MS、モバイル向け音声認識を強化--テキストメッセージ作成や「Bing」検索など精度向上

Jay Greene (CNET News) 翻訳校正: 編集部2013年06月18日 14時56分
  • このエントリーをはてなブックマークに追加

 ライバルのGoogleとAppleが圧倒的にリードしている携帯電話市場において、Microsoftが自社の巨大な研究部門を活用し、音声によるテキストメッセージやウェブ検索を利用するユーザー向けに音声認識性能の向上に取り組むことで、そのシェアを少しずつ拡大しようとしている。

 Microsoftの研究者らによると、脳の働きに似た計算モデルを作り出すことで、音声認識の精度を高め、変換処理を高速化する斬新なアプローチを考え出したという。同研究者らは、いわゆるDeep Neural Networks(DNNs:深層ニューラルネットワーク)を音声認識に適用することにより、米国のユーザーがテキストメッセージを作成したり、「Bing」で検索を実行したりすると、同社の従来技術の2倍の速さで結果が表示されると主張している。また、同研究者らは、精度は15%向上したと述べている。

 Microsoftで音声技術グループのシニアプログラムマネージャーを務めるMichael Tjalve氏は、「普通の文章なら、訂正する語がこれまでより1語分少なくなる」と述べた。

 Microsoftの社内テストでは、ワード誤り率が16%から13.5%に減少したことが分かった。誤り率は、背後の雑音から携帯電話のマイクの品質にいたるあらゆる状況に応じて変動する。

 さらに、音声からテキストへの変換はほぼ瞬時に行われる。これまでだと変換に1秒少々かかる可能性のある文章が、ユーザーが話しを止めるのとほぼ同時に携帯電話の画面に表示される。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

  • このエントリーをはてなブックマークに追加