IBMによると、技術革新とコスト削減を実現する音声アプリケーションのおかげで、音声認識技術の時代がやっと到来したという。
Prudential SecuritiesやホンダなどのIBMの大手顧客は、音声コマンドでナビゲーションできるヘルプデスクや個人口座用ウェブページなどのサービスを顧客に提供する、ソフトウェアモジュールの導入を開始しているという。こうした技術導入によるメリットが明確になってきたことから、今後この動きに追随する企業は増えるだろうと、IBMパーベイシブ・コンピューティンググループのゼネラル・マネージャ、Gary Cohenは26日(米国時間)に語った。
Cohenは先週、サンフランシスコで開催された「SpeechTek 2004」の講演で、「音声認識技術は現在、一気に普及し始める段階にある」と述べ、さらに「我々は、音声認識に対する見方を変えつつあり、これまでの単体としての技術から、(エンタプライズ・アプリケーションに)組み込まれたものと見るようになっている」と付け加えた。
企業にとって、音声アプリケーションを利用するメリットは、主にコスト削減や顧客満足度の向上に関するものが中心となっている。Cohenはその一例として、自動顧客対応システムを音声ナビゲーションで提供した場合、電話のボタンから操作させるものよりも概して高速に対応可能で、フリーダイアル通話にかかる時間を短縮できることを挙げた。通話数が数百万件もある場合には、こうした細かな時間短縮が、大きな費用の削減につながる。
顧客側も音声ナビゲーションシステムに満足しているようだ。Cohenによると、携帯電話大手のNextel Communicationsは、音声ナビゲーションのヘルプデスクに移行して以来、顧客の不満が13%減少したという。また、投資管理会社のT. Rowe Price Groupは、プッシュボタン操作から音声ナビゲーションに切り替えて以降、自動ヘルプデスクだけで問題を解決できる割合が10%増加したという。
このように、音声アプリケーションがますます広く受け入れられている背景には、数年前に始まったソフトウェア業界の大規模な変化がある。長い間、IBMやその他のベンダーは、キーボードベースのツールに代わる選択肢として、音声認識と音声アクティベーションソフトウェアを売り込んできた。しかし、こうした企業では、手紙やメモをコンピュータに書き取らせたいと望んでいる人は少ないという事実を発見した。
また、人間の話し言葉の意味を正確に把握できるテキスト変換ソフトの開発も難しいことが判明した。その結果、開発作業の重点がシフトし、キーボード操作が便利ではないアプリケーションや、音声によるコマンドが短い言葉に制限されるアプリケーションに、音声認識技術を組み込むことになった。なお、こうした取り組みは、MicrosoftやNuance Communicationsでも進められている。
この記事は海外CNET Networks発のニュースをCNET Japanが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」