Operaは、同社の開発するブラウザに音声制御機能を追加する。これにより、ユーザーは自分のPCに話しかけることで、ウェブのブラウズや、音声対応のウェブフォームへの入力を実行でき、またウェブサイトのコンテンツを読み上げさせることも可能になる。
Operaの最高経営責任者(CEO)Jan Tetzchnerによると、同社は次のバージョンのブラウザを「2ヶ月以内」に発表するという。これは、MicrosoftによるSpeech Server Softwareの発表とほぼ時期が重なりそうだ。MicrosoftのSpeech Server Softwareは、サーバ側での音声コマンドの処理方法を改善するよう設計されている。
Operaのブラウザには、IBMのEmbedded ViaVoiceという音声認識技術が組み込まれる予定で、広告付き無料ダウンロード版と、広告の付かない有料版の、2種類のバージョンが用意されるとTetzchnerは述べている。
Tetzchnerによると、音声制御機能の追加で、アクセシビリティの向上という明らかなメリットが得られるほか、車載コンピュータ向けの用途もいくつか考えられるという。「車内では、画面表示と音声の組合せがほしいが、運転中は画面を見ていたくない。そこで、音声制御でタスクを処理し、さらに音声によるフィードバックを受けとれればとても便利になる」(Tetzchner)
Operaはまた、音声制御の応用例のひとつとして、スライドショー機能を追加した。Opera Showというこの機能と音声を組み合わせることで、ユーザーはプレゼンテーションの最中に、次のスライドを映すよう音声で指示できるため、コンピュータの所に行って「次ページへ」のキーを押す必要がなくなる。
IBMのembedded speech担当ディレクターで、VoiceXML Forumの会長でもあるIgor Jablokovは、「この新技術は、音声をほかの出入力フォームと組み合わせて、我々がウェブコンテンツとより自然な方法で交われるようにする。まずはPCでの採用からだが、近い将来には携帯電話やPDAのようなデバイスにも拡大されるだろう」と述べた。VoiceXML Forum は、Voice Extensible Markup Language(VoiceXML)の策定と推進のために作られた業界団体だ。
また、開発者はオープンスタンダードに基づくX+Vマークアップ言語を用いて、マルチモードのコンテンツの作成をはじめられると、Jablokovは言う。「大半のプログラマが今日既に備えている開発スキルを使えばいい」(Jablokov)
「ブラウザを音声で制御できるのもひとつだが、これはXHTML+Voice (X+V)コードが含まれたページを利用することにもつながる」とTetzcherは語った。X+V仕様は、Opera、IBM、Motorolaがウェブ標準化団体World Wide Web Consortium(W3C)に2001年に提出した音声標準仕様だ。
X+Vマークアップ言語は、ともにXMLをベースにした2つのマークアップ言語を組み合わせたもの。XHTMLは、XMLの形で表されたHypertext Markup Language(HTML)で、またVoiceXMLは開発者が音声アプリケーションをつくるためのXMLフレームワークだ。
X+Vは、これもXMLをベースに開発された、Speech Application Language Tagsというマイクロソフトの支援する技術と競合している。
IBMのX+V技術の追加に取り組むブラウザメーカーはOperaが初めてではない。携帯機器用にNetFrontというブラウザを開発する日本のアクセスは、昨年9月に音声機能を追加する同様の取り組みを発表している。
OperaはまずWindows用ブラウザの英語版で音声技術を組み込んだものをリリースする予定で、このブラウザは当初企業顧客や開発者向けに販売されることになる。
この記事は海外CNET Networks発のニュースをCNET Japanが日本向け に編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」