ウェブ技術の標準化団体であるWorld Wide Web Consortium(W3C)は2月3日、ウェブ上の音声入出力インターフェースとなる「VoiceXML2.0」の勧告案を公開した。また、テストスイートも公開した。
VoiceXML2.0を使うと、音声合成やデジタルオーディオ、音声認識、プッシュホンからのダイヤルトーン(DTMF)入力、音声の録音、通話、話者が任意に移り変わる会話の各機能を実現する音声対話ダイアログの作成が可能となる。
アプリケーションとユーザーとの対話制御方法を記した「W3C音声入出力インタフェースフレームワーク」では、音声合成記述言語「Speech Synthesis Markup Language(SSML)」、音声認識文法仕様「Speech Recognition Grammar Specification(SRGS)」、呼出制御記述言語「Voice Browser Call Control(CCXML)」、音声認識における意味解釈「Semantic Interpretation for Speech Recognition」などが定められている。
Voice BrowserアクティビティリードであるDave Raggett氏は、「VoiceXML2.0には、電話による情報サービスや顧客サービスの実現方法を大きく変える力がある。加えてVoiceXML2.0は、目の不自由な方や車の運転中など、手や目が離せない状況下でウェブアクセスを必要としている方にその機会を提供する」とコメントしている。
Voice Browserワーキンググループには、キヤノン、日立製作所、三菱電機などの日本企業や、HP、IBM、Intel、Microsoft、Motorola、Nokia、Sunなどが参加している。
http://www.w3.org/2004/02/voicexml2-pressreleaseCNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」