セガは、会話時の表情をコンピュータグラフィックス(CG)やアニメーションで再現する際に利用可能な音声解析技術Magical VEngine(仮称)を開発した。同社が3月8日に明らかにしたもの。
発話する際の表情をCGなどで再現するには、口やその周辺の動きをうまく構成する必要があり、「CGの質や製作効率の向上には音声解析技術が必須」(同社)という。「新開発の解析方法を用い、顔アニメーションの制作時に飛躍的な質、作業効率の向上を実現する音声解析技術を開発した」(同社)
同社によると、従来の音声解析技術は母音のみを抽出していたのに対し、Magical VEngineは子音も抽出するので「より実際の発話に近い表情を再現できる」(同社)。また、音声に含まれる怒り、悲しみ、喜び、驚きの感情を解析してアニメーション化する機能も備えている。不特定話者の音声に対応するほか、解析処理をリアルタイムに実行可能という。
同社では、Magical VEngineを自社の開発環境に導入するとともに、将来は同技術を使ったインタラクティブエンターテインメントの開発を行うとしている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス