Intelは、コンピュータに人の唇の動きを読ませるソフトウェアを発表した。Audio Visual Speech Recognition(AVSR)と呼ばれるこのソフトウェアは、発声者の顔と口の動きを認識することができる。音声認識ソフトウェアと組み合わせることで、たとえ雑音の多い環境においても、コンピュータ上で音声認識コマンドを実行するのに十分なデータを与えることが可能になるという。
多くの会社は、何年間にもわたって音声認識ソフトウェア実用化の研究を続けてきたが、CPUパワーの不足とソフトウェアのパフォーマンス制限によって苦労してきた経緯がある。だが最近になり、この状況にも急速に変化が起きつつある。プロセッサの動作速度は1.5G〜3GHzにまで上昇し、より確実に音声認識を行うためのソフトウェア技法も開発されている。
またMicrosoft Researchは、音声コマンドやジェスチャーでウィンドウやスクロールの操作が可能な、GWindowsと呼ばれるプロトタイプシステムの開発を行っている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
「もったいない」という気持ちを原動力に
地場企業とともに拓く食の未来
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力