Intelは、コンピュータに人の唇の動きを読ませるソフトウェアを発表した。Audio Visual Speech Recognition(AVSR)と呼ばれるこのソフトウェアは、発声者の顔と口の動きを認識することができる。音声認識ソフトウェアと組み合わせることで、たとえ雑音の多い環境においても、コンピュータ上で音声認識コマンドを実行するのに十分なデータを与えることが可能になるという。
多くの会社は、何年間にもわたって音声認識ソフトウェア実用化の研究を続けてきたが、CPUパワーの不足とソフトウェアのパフォーマンス制限によって苦労してきた経緯がある。だが最近になり、この状況にも急速に変化が起きつつある。プロセッサの動作速度は1.5G〜3GHzにまで上昇し、より確実に音声認識を行うためのソフトウェア技法も開発されている。
またMicrosoft Researchは、音声コマンドやジェスチャーでウィンドウやスクロールの操作が可能な、GWindowsと呼ばれるプロトタイプシステムの開発を行っている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
パナソニック エコシステムズの目指す社会を
実現させるための事業戦略とは
セキュリティ×コミュニケーションで
社会課題の解決へ
Google Cloud が提案する、業務最適化と
イノベーションの実現ヒントが盛り沢山!
MSとパートナー企業主催のハッカソンが
企業文化変革のきっかけに