logo

ヤフー、各種サービスの「音声認識」精度を改善--ディープラーニングを活用

井指啓吾 (編集部)2015年05月19日 16時21分
  • このエントリーをはてなブックマークに追加

 ヤフーは5月19日、同社の音声認識エンジン「YJVOICE(ワイジェイボイス)」にディープラーニング(深層学習。人工知能技術の1つ)を取り入れ、認識精度を大幅に改善したと発表した。特に向上したのは、騒音下における認識精度。これまで、駅のホームや街頭などの騒音がある場所で誤認識されていた「声」が、正しく認識されやすくなったという。

 同日、「音声検索」や「Yahoo!音声アシスト」、「Yahoo!乗換案内」、「Yahoo!カーナビ」など、YJVOICEを搭載する18のアプリやウィジェット(後述)が、精度が向上した音声認識機能に対応した。


YJVOICEのシステム構成とDNN実装範囲

音声区間検出を用いた音声認識処理の流れ

 ディープラーニングとは、脳神経細胞の働きを工学的にモデル化した手法で、人工知能の分野において大きな注目を集めている。米国では、GoogleやTwitter、Facobookなどの大手企業がディープラーニング技術を開発する新興企業を買収したり、社内に専門チームを結成したりして技術開発に注力している。国内では、ドワンゴが社内に「人工知能研究所」を設置し、ディープラーニング技術の研究開発に取り組むなどの動きがある。

 ヤフーでは「Yahoo!検索」などのサービスで蓄積したビッグデータを生かし、2013年に研究を開始。現在は、東京工業大学の篠田研究室(篠田浩一教授)との共同研究なども進めている。同研究室は「パターン認識手法とその実世界応用に関する研究」で、ディープラーニング手法の研究をはじめ、音声認識や映像検索などで成果を挙げているという。

 ディープラーニングは、さまざまな事例を学習させるために膨大なデータが必要になる。YJVOICEの開発を担当する三宅純平氏は「Yahoo! JAPANは最も日本語のデータが集まる場所であり、日本語に特化した音声認識を追求できる」と強みを語る。また、今後の見通しとして「次世代デバイスは、従来の『文字入力』から『音声入力』になるはず。今後も精度の改善を続けていく」と話した。

 音声認識精度が向上したアプリやウィジェットは、iOS/AndroidアプリのYahoo! JAPAN、Yahoo!音声アシスト、Yahoo!カーナビ、Yahoo!地図、Yahoo!乗換案内。iOSアプリの音声検索、GYAO! KIDS、Yahoo!ショッピング。AndroidアプリのYahoo!ブラウザー、Yahoo!ファイナンス、Yahoo!あんしんねっと。AndroidウィジェットのYahoo! JAPANウィジェット、Yahoo!検索ウィジェット。

-PR-企画特集