東芝デジタルソリューションズは8月17日、ゲームやコンテンツを制作するクリエーター向けに、AIが声の表現を自動で分析し、音声合成に抑揚とテンポの演出を与える機能を搭載した音声合成ツール「Voice Track Maker」を発表。同日から発売する。
これはWindows PC向けのソフトウェアで、テキストから音声合成を作成できるツール。複数の声の辞書を組み込んで自由で滑らかな発話を作成することができるほか、人の音声の抑揚とテンポの情報をその場で分析し、音声合成に真似させて発声させることができる「韻律射影機能」を搭載している。
これにより、従来の音声合成において、喜びや怒り、哀しみなどといった感情表現機能では難しかった、さまざまな演技表現を再現することが容易になったという。この機能により、ユーザーが模範となる演技表現をソフトウェアに教えることが可能となり、ゲームやコンテンツの制作など、人の声の収録を必須としないクリエーション分野への活用の幅が広がることを想定しているという。
製品は、基本機能と声辞書3本をセットにしたPro Light、基本機能と声辞書8本をセットにしたPro、体験版(一部機能制限あり)のElementsが用意。声辞書は、人の収録音声(生声)を基にしており、Pro Light/Proではオプションでの追加も可能。また、Pro Light/Proでは、商用ライセンス登録を行えば商用で利用することも可能となっている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」