logo

グーグルが音声検索を改善--高速化と騒音環境での認識向上 - (page 2)

Liam Tung (Special to ZDNet.com) 翻訳校正: 緒方亮 高橋朋子 (ガリレオ)2015年09月29日 10時19分
  • このエントリーをはてなブックマークに追加

 「これにより、われわれは計算を劇的に削減し、認識システムを大幅に高速化した。また、訓練データに人工のノイズと反響を加え、認識システムを周囲の騒音により強くした。モデルが文章を学習する過程をこちらの動画で見ることができる」と音声チームは述べている。

 これらの改善によって、Googleは実際の音声トラフィックに使える、より高速で正確な音響モデルを手にした。

 「しかし、もう1つクリアすべき問題があった。このモデルでは音素の予測に約300ミリ秒の遅延があったのだ。モデルはこのとき、音声信号のより先を見越すことで予測の質を向上させられることを学習したばかりだった」

 「賢くはあるが、ユーザーにとっては待ち時間が増えることを意味し、容認できるものではなかった。この問題は、音素予測の出力を実際の発話のタイミングに大幅に近づけるようモデルを訓練することで解決した」と音声チームは説明している。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]