音声合成ソリューション「FutureVoice」がさらに自然な音声を実現

～「デザイン思考」でUIを刷新し、さらに使いやすく～

NTTテクノクロス株式会社 2021年08月04日 12時00分 [ NTTテクノクロス株式会社のプレスリリース一覧 ]

NTTテクノクロス株式会社（本社：東京都港区、代表取締役社長：桑名栄二　以下、NTTテクノクロス）は、音声合成ソリューション「FutureVoice（フューチャーボイス）」をバージョンアップし、最新のAI技術を活用してさらに自然な音声を実現するとともに、直感的かつ効率的にご利用できるようにユーザインタフェース（以下、UI）を刷新し、2021年8月4日より提供を開始します。

■背景
　人の声を人工的に作成する音声合成は、急速なAI技術の発展により、対話サービスをはじめ、ロボットやゲームアプリなどに活用されています。また今後、音声合成の利用拡大が見込まれるエンターテインメント業界や広告業界においては、自然な音声を簡易に作成して、さまざまな場面で利用したいというニーズが高まっています。

■特長
（１）最新AI技術を活用し、さらに自然な音声を実現
　NTT人間情報研究所が開発した最先端AI技術のニューラル波形生成型音声合成技術*1（以下、本技術）を活用することで、デジタル処理による機械的な音を極限まで削減し、さらに自然な音声を実現。声優や有名人の音声合成においては、声の再現性が一層高まり、活用の場面が一段と広がります。また、国内初*2となる独自の高速音声波形生成アルゴリズムにより、一般的なCPUにおける実用的な処理性能と業界トップレベルの自然な音声合成を両立しました。

（２）デザイン思考を基にUIを刷新（特許出願中）
　お客様の潜在的な課題を抽出するNTTテクノクロスのデザイン思考を活用し、UIを刷新。直感的な操作を誘導するカラーデザインや表示形式（パターン表示やタグ付など）の採用に加え、動画のナレーション向けの音声制作において長文の音声を作成する際に、セリフ単位で管理することが可能となり、効率的な作業が行えます。さらに、ご要望が多かった声の高さの部分的な上げ下げや長さの調整を行う機能を付加し、イメージ通りの音声制作が可能です。

■価格
　実際の利用環境などにより構成や価格が変わるため、詳細はお問い合わせください。

■「FutureVoice」とは
　2006年に提供を開始した音声合成ソリューションで、さまざまな分野の「声」に活用できます。NTT人間情報研究所が開発した深層学習（DNN*3）を活用した最新の音声合成技術をもとに、少量の音声データから人の声と遜色ない肉声感・明瞭感のある自然な合成音声を実現します。

このプレスリリースの付帯情報

バージョンアップした「FutureVoice」のイメージ

（画像をクリックすると拡大画像をご覧いただけます。）

用語解説

*1：ニューラル波形生成型音声合成
　韻律情報（声色・発声リズム・イントネーション等の声の特徴）に対して、音声波形生成処理にニューラルネットワークを適用し、従来の信号処理では実現が困難だった肉声感の向上、微小なノイズを軽減する技術。
*2：NTTテクノクロス調べ
*3：DNN
Deep Neural Network（深層ニューラルネットワーク）の略。機械学習の一種であるニューラルネットワークの階層を深くしたアルゴリズムで、画像認識や音声認識などの分野で活用されている。
*「FutureVoice」はNTTテクノクロス株式会社の登録商標です。
*「FutureVoice」はNTTグループのAI「corevo®」の音声合成技術を活用したサービスの1つです。
*「corevo®」は日本電信電話株式会社の登録商標です。（リンク）
* 記載されている商品名・会社名などの固有名詞は一般に該当する会社もしくは組織の商標または登録商標です。

音声合成ソリューション「FutureVoice」がさらに自然な音声を実現

デジタル製品主要記事

ZDNET Japan 注目ヘッドライン

編集部おすすめの記事

人気の記事