アドバンスト・メディアは9月29日、iPhone向けの「AmiVoice音声認識エンジン」を開発したと発表した。サーバと携帯電話で分散型音声認識を行うDSR版と、携帯電話上での音声認識を実行するスタンドアロン版の2タイプを提供する。
DSR版は、一般の携帯電話では仕様上の制限により使用が困難であった通信プロトコルTCP/IPを使用。iPhoneとサーバ間で分散型音声認識を行うことで、レスポンスの向上を図った。
また、スタンドアロン版では、iPhoneの許容アプリサイズの大きさや使用可能メモリサイズ、高性能CPUが動作する開発環境などにより、レスポンス、対応語彙数、認識精度などを向上させた。
アドバンスト・メディアでは今後、音声によるメール入力サービスや声を利用したゲーム、英会話学習アプリケーションなどへの同音声認識エンジンの導入を進める。また、アプリケーション製作会社に対して、音声認識ライブラリの販売も予定している。
なお、DSR(Distributed Speech Recognition)とは、端末機器に音声認識の前処理機能を搭載し、サーバと分担して行う分散型音声認識のこと。端末機器内で、音声を音声認識処理に必要なデータ「特徴量データ」へ変換したのちサーバに送り、音声認識の処理を行う仕組みだ。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス