KDDIおよび沖縄セルラーは1月12日、au携帯電話に分散型音声認識機能「声de入力」機能を搭載し、ナビタイムジャパンとの協業により2月上旬からサービスを提供開始すると発表した。
分散型音声認識機能とは、音声認識機能を携帯電話側とサーバ側に分散配置し、ユーザーの発声から特徴的な情報を抽出してサーバ側で音声認識処理を行うシステムのこと。高性能サーバを利用できるため、従来と比べて大規模かつ高精度な音声認識が可能になる。さらに、今回au携帯電話に搭載される声de入力機能では、音声認識時に周辺雑音を測定し高い認識性能を維持、誤認識の可能性がある場合に原因を推定してユーザーに利用方法をアドバイスするといった工夫をしている。
サービスの内容としては、歩行者向けナビゲーションサービスであるEZナビウォークにおいて「声で乗換検索」「声で目的地検索」を提供する予定。ユーザーは画面を見ずに歩きながら乗換検索や目的地検索ができるようになるという。EZナビウォーク対応au携帯電話であれば利用できる。EZナビウォークの利用料金がかかるが、追加の費用は発生しない。
なお、声de入力機能にはKDDI研究所が研究開発した音声特徴情報抽出ソフトウェア・音声認識エンジンを利用した。KDDIが耐雑音性や処理能力、信頼性などを向上させて商用化した。
「声de入力」利用イメージ |
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」