人間と同じように聞いたり話したりできるコンピュータが、現実のものとなりつつある、と多くの研究者や企業幹部が考えている。
音声認識や、それを応用したコンピュータの操作は、画期的なコンピューティング技術の1つであるにも関わらず、これまでは技術的欠陥、高コスト、アプリケーションのトラブルが普及の妨げとなってきた。しかし今、これらの問題が解消しつつあるという。その結果、企業はボイスコマンドを使ってデータベースにアクセスしたり、あるいは電子メールを一方向あるいは双方向の会話に変えるための、様々な製品を相次いで発売している。
米Microsoftは9日(米国時間)、音声コマンドを使ったより簡単なサーバ操作を可能にするソフト「Speech Server」の最初のパブリックベータ版と、Speech Application Software Developer Kit(SDK)のベータ3を発表する。また、パートナープログラムにより、サードパーティの開発者によるSpeech Server推進の動きも高まり始めている。なお、Speech Serverは2004年上半期に発売が予定されている。
Speech Server(旧称:.Net Speech Platform)は、自動電話応答システムの開発コスト削減を目的としており、Microsoftが進める電話とコンピュータをつなぐ取り組みの一環として開発が進められている。多くの航空会社が利用しているような自動応答システムは、価格が100万ドルにもなるが、これでは大半の企業にとってあまりに高すぎる、とMicrosoftの音声技術グループのバイスプレジデント、Kai-Fu Leeは語る。
「これまでごく一部のコールセンターへの売り込みしか成功していない」(Lee)
いっぽう米IBMは、同社の研究所やサービス部門で大企業向けのショーケース・アプリケーションを開発している。金融サービス会社のT. Rowe Priceは、一般によく使われる音声命令を発することで顧客が金融商品の取引を行えるという、IBM製の口座管理システムを導入した。
「『取引したい』とシステムに話しかけると、「取引の種類は」と答える」とIBMのパーベイシブコンピューティング部門のモバイルソリューション担当ディレクター、Eugene Coxは語る。
IBMによると、同社の研究所は年末までに、異なる言語を話す人同士でも容易に会話ができるようにするためのコンピュータ、たとえば英語を話す旅行者と中国語しか話せないガイドにアドバイスを行う公衆電話も発表する予定だという。
この記事は海外CNET Networks発のニュースをCNET Japanが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス