> >

W3C、「VoiceXML 3.0」で話者認識方法を標準化へ

Dawn Kawamoto（CNET News.com）2005年12月07日 18時45分

　インターネット技術の標準化団体World Wide Web Consortium（W3C）は米国時間6日、VoiceXMLの最新仕様において、話者認識の方法を標準化する計画であることを明らかにした。

　同仕様のドラフト作成を進めるW3Cによると、VoiceXML 3.0では、電話やコンピュータ上の音声サービスを使って商取引を行うユーザーが、音声による本人確認を行えるようになるという。

　VoiceXMLは、キーボードではなく、音声を使ってウェブ上のサービスにコマンド入力する際に利用される。多くの企業がVoiceXMLを利用して、プロセスの自動化や従業員削減を実現している。

　だがこのところ、こうした音声サービスのセキュリティが侵害された例が急増しているため、一般ユーザーや企業はこのような取引の安全性を懸念し始めている。

　先ごろ、VoiceXML Forumの会長に選出されたばかりのKen Rehorは声明で「話者の識別や認証に使われる技術は、電話による取引やコミュニケーションを安全に遂行するためのバイオメトリクス技術として役立つだけではない。これらの技術は、VoiceXMLを実装したシステムの音声認識技術や音声合成技術などとシームレスに連携する」と述べた。

　W3C Voice Browser Working Groupの共同会長James Larsonによると、W3CはすでにVoiceXML 3.0仕様の要件をまとめており、2006年第1四半期中に同仕様のワーキングドラフトをリリースする見込みという。

　またW3Cは同日、SSML（Speech Synthesis Markup Language）の対応言語を標準中国語、日本語、韓国語などにも拡大すると発表した。

　SSMLを利用することで、開発者は、速度や音量など、さまざまな要素を制御しながら、音声を作成することができる。

この記事は海外CNET Networks発のニュースを編集部が日本向けに編集したものです。海外CNET Networksの記事へ

CNET Japanの記事を毎朝メールでまとめ読み（無料）