Intelは、コンピュータに人の唇の動きを読ませるソフトウェアを発表した。Audio Visual Speech Recognition(AVSR)と呼ばれるこのソフトウェアは、発声者の顔と口の動きを認識することができる。音声認識ソフトウェアと組み合わせることで、たとえ雑音の多い環境においても、コンピュータ上で音声認識コマンドを実行するのに十分なデータを与えることが可能になるという。
多くの会社は、何年間にもわたって音声認識ソフトウェア実用化の研究を続けてきたが、CPUパワーの不足とソフトウェアのパフォーマンス制限によって苦労してきた経緯がある。だが最近になり、この状況にも急速に変化が起きつつある。プロセッサの動作速度は1.5G〜3GHzにまで上昇し、より確実に音声認識を行うためのソフトウェア技法も開発されている。
またMicrosoft Researchは、音声コマンドやジェスチャーでウィンドウやスクロールの操作が可能な、GWindowsと呼ばれるプロトタイプシステムの開発を行っている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
パナソニックのV2H蓄電システムで創る
エコなのに快適な未来の住宅環境
OMO戦略や小売DXの実現へ
顧客満足度を高めるデータ活用5つの打ち手
企業や自治体、教育機関で再び注目を集める
身近なメタバース活用を実現する