NECは4月6日、文章のテキストデータから筆者の気持ちを推定し、その時の気持ちに合わせて音声合成による読み上げをしたり、多様な文字飾りつけたりする、コンテンツ自動生成技術を開発したと発表した。
開発されたのは、テキストデータを解析し、各文章に込められた筆者の気持ちがポジティブかネガティブかを推定する「マインド判定技術」と、解析した気持ちに合わせて、合成音声の特性(トーン)を多様に変更できる「可変トーン音声合成技術」だ。
マインド判定技術は、「高い」「小さい」のような文章中の評価表現の評価対象を特定できる評判抽出技術を応用したもの。評価表現を含む文に込められた筆者の気持ちがポジティブかネガティブかを判定するという。「楽しい」「悔しい」など直接感情を表す語句からだけでなく、評価表現と評価対象をもとに筆者の気持ちを推定するとのことだ。
可変トーン音声合成技術は、読み上げの速さや声の高さ、太さ、明るさなど、話者の特性(トーン)を表すパラメータを大きく変更しても、滑らかな音声を合成できる技術。マインド判定技術によって筆者の気持ちが判定された各文章を、パラメータを組み合わせた特徴的な音声に切り替えて読み上げるという。
同社ではこの技術を利用して、携帯電話から音声メッセージと写真をメールで送信するだけで、特徴的な音声合成による読み上げや、豊かな文字飾りなど多彩な表現力を持つ「聞いて見て楽しいブログ」システムを開発したとのこと。
聞いて見て楽しいブログでは、携帯電話から投稿されたブログ用音声メッセージを音声認識技術によりテキストデータへ変換。テキストデータ中のブログ筆者の気持ちをマインド判定技術により推定し、それをもとに読み上げ音声の特性や、テキストの文字色、サイズ、挿入する絵文字を自動設定するという。このため、携帯電話から手軽に多彩な表現のブログを作成できるとのことだ。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力