日本電信電話(NTT)は2月6日、楽譜と歌詞から歌声音声を合成する技術「ワンダーホルン」を発表した。NTTアドバンステクノロジ(NTT-AT)が運営するウェブサイト「うたぱら.com」で公開される。
ワンダーホルンは、あらかじめ個人の実声収録によって作成した個人歌声データベースと、その場で入力された楽譜と歌詞から歌声を合成する技術。「ビブラート」や「こぶし回し」などの「歌唱スタイル」というエフェクト調整機能を搭載し、コンピュータ合成が困難だった演歌やポップスなどの歌声を再現できる。また、少人数の歌声の歌唱表現を変えて足し合わせることで合唱を合成することも可能だ。
アルゴリズムの軽量化と個人歌声データベースを圧縮したことで、家庭用ゲーム機やDSP(Digital Signal Processor)搭載カラオケ機などでも動作する。楽譜や歌詞の入力インターフェースにはMIDI規格を採用。市販のMIDI編集ツールで作曲したメロディに歌詞をつけることも可能だ。
NTT-ATは、ウェブサイト「うたぱら.com」を通じて、サンプル歌声データベースを使った合成機能を提供するほか、アプリケーションごとの個別カスタマイズや装置への組み込み、各種SIなどの技術提供、個人歌声データベースの制作などの各種関連サービスを提供する。
NTTのニュースリリースCNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」