logo

Intelが読唇術ソフトウェアをリリース

  • このエントリーをはてなブックマークに追加

 Intelは、コンピュータに人の唇の動きを読ませるソフトウェアを発表した。Audio Visual Speech Recognition(AVSR)と呼ばれるこのソフトウェアは、発声者の顔と口の動きを認識することができる。音声認識ソフトウェアと組み合わせることで、たとえ雑音の多い環境においても、コンピュータ上で音声認識コマンドを実行するのに十分なデータを与えることが可能になるという。

 多くの会社は、何年間にもわたって音声認識ソフトウェア実用化の研究を続けてきたが、CPUパワーの不足とソフトウェアのパフォーマンス制限によって苦労してきた経緯がある。だが最近になり、この状況にも急速に変化が起きつつある。プロセッサの動作速度は1.5G〜3GHzにまで上昇し、より確実に音声認識を行うためのソフトウェア技法も開発されている。

 またMicrosoft Researchは、音声コマンドやジェスチャーでウィンドウやスクロールの操作が可能な、GWindowsと呼ばれるプロトタイプシステムの開発を行っている。

-PR-企画特集