東芝デジタルソリューションズは1月25日、ゲームやコンテンツを制作するクリエーター向け音声合成ツール「Voice Track Maker(ボイストラックメーカー)」について、機能強化版となる「Performance」の提供を同日から開始した。声のテンポだけを簡単に教示できる新機能「テンポ射影機能」を搭載する。
Voice Track Makerは、テキストから合成音声を作成できるWindows PC向けのソフトウェア。幅広い年代・性別の声辞書を組み込んでAIで自由で滑らかな合成音声を作成できるほか、クリエーターがマイクで音声入力し、模範となる演技表現を教えることで、抑揚とテンポ(緩急)をAIが分析し、合成音声に真似させることができる。従来の音声合成での感情(喜び、怒り、哀しみ等)表現機能だけでは難しかった、さまざまな演技表現を再現することを得意としているという。
新たに提供するPerformanceは、テキスト入力で自動生成した合成音声の抑揚はそのままに、クリエーターが教示した声のテンポだけを射影することができるテンポ射影機能を新たに搭載。これにより合成音声に自然な揺らぎを簡単に与えられるようになる。
さらに、落ち着いたナレーション用途の音声や、若々しいキャラクター向け音声まで7人分の声辞書を標準搭載。3人分の声辞書が使えるエントリー版として提供していた「ProLight」と同等価格のまま、声辞書数を増やして提供。また、Performanceに追加して利用できるオプションの声辞書「RIKU」と「CHISA」も同時に提供を開始する。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」