「めざましマネージャー アスナ」開発者に聞く“俺の嫁”が日常に溶け込む未来 - (page 3)

合成音声と生声のハイブリッドという工夫と、声優あってこその合成音声

 合成音声は東芝セミコンダクター&ストレージの音声合成ミドルウェア「ToSpeak」を活用している。こと、めざましマネージャーは合成音声のチューニングに相当な労力を費やしたという。一度試験的に収録しプロトタイプを作成したがしゃべり方の抑揚に違和感を感じたりと、提供できる状況になかったという。倉田氏は「プロトタイプでもTTS(Text-To-Speech)業界の人が聞いたら十分良くできていると評価されるレベルにはあった。でもファンのみなさんに見たら、イメージが崩れることはとても残念。それはお互いに思っていた」と振り返り、半年以上の時間をかけて調整したという。

 また当初は音声を全て合成音声にしようとしたが、このことから生声のハイブリッドに変更。ただし、その場合は両方の声が並んで出ると差を感じやすいというリスクも生まれる。チューニングの成果もあるが、セリフも工夫することでうまく聞こえるようになったという。例えとして、天気予報で「今日の天気は晴れ」としゃべる場合、「今日の天気は」までが収録音声、「晴れ」などの天気は合成音声の仕組みになっているが、収録音声の部分に抑揚が付いていれば、晴れの部分に抑揚がなくても全体的に抑揚のあるセリフと受け取ってもらえる。それが全般的にうまくいったと両氏は語った。

 加えて、アスナの合成音声は戸松さんの力量にも助けられたと口をそろえた。倉田氏は声優を使う場合、叙情表現が豊かで演技幅が広く表現にドラマチックさがある分、合成音声が作りにくいと思っていたが、戸松さんは常に一定のアスナの声を出し続けていたと絶賛した。

 「製品向けの音声収録時間はおおよそ約5時間。合成音声の収録では日本語の文章として成り立っていないフレーズもあるが、休憩や録り直しをしても、常に純粋なアスナの声が出ていた。高さやトーン、演技幅がずっとアスナだった。まずはキャラクターに命を吹き込む演技があってこそ価値が生まれ、それがあってこその合成音声だと感じた」(松平氏)、「録り直しを行っても、波形は区別が付かないほど一緒。波形は音圧の差でそれが出てしまうが、完璧にコントロールできてて、合成音声がとても作りやすかった。TTSは言葉を読み上げて情報を伝えるところまではきたと思うが、演技はアートの世界。合成音声が声優に取って代わるという意見も聞かれるが、そのようなことは当面起きようがない」(倉田氏)

 正式版ではToSpeakの最新バージョン「G3」を活用。「これまでは何だったんだというくらい劇的に向上した」(松平氏)というほど、合成音声の会話の増量や、情報の読み上げがしやすくなり、サービスレベルが広がったとも語った。 

音声対話インターフェースが“役に立つ存在”であることと「誰がしゃべるか」という方向の進化

 松平氏はコンセプトを固めたり開発を進める中で気を使ったポイントとして「あくまでツールであること」と「対話を強いることはしない」ことの2点を挙げた。またキャラクターと自由におしゃべりできるという方向には向かわず、「目的に対して、その意図を理解して反応できるか」というコンセプトを大事にしたいとも付け加えた。

 「いざ何でもいいからしゃべろうとしても、なかなかしゃべることはできないもの。またどんな返答が返ってくるかが読めずブラックボックスなところもあり、心理的な抵抗感もある。そのため、ユーザーにしゃべってもらうということを前提にはせず、設定したら一方的にしゃべり出す。問いかけにも『はい』か『いいえ』ぐらいにして、インターフェースも極力シンプルにして『そこにアスナがいる』という以外の要素は省いた。対話しなくても使えるツールであることを通じて、アスナと一緒に暮らすという感覚をいかに出すかを目指した。そうして身近に感じてもらった上で、対話もできるというのがポイント。人間と機械のやりとりの間にキャラクターがいる。こういうことが世の中をリッチにするということを感じてもらう発端がこのアプリ」(松平氏)

 そして大ざっぱな例えとなるが、お風呂を沸かしたり乗り物の予約ができるといった実体的なことをしてくれる、いかに役に立つ存在となれるかがこのアプリ、しいてはソリューションの目指す方向性だという。

一緒に暮らせる情報ツールとしての進化が、めざましマネージャーの狙いでもある
一緒に暮らせる情報ツールとしての進化が、めざましマネージャーの狙いでもある

 現状でも音声認識を使った操作や検索機能などはさまざまな機器で搭載されているが、まだ一般的ではない。とはいえ、松平氏は音声は入力インターフェースとして早く、かつ突き詰めると便利なものであるとし、この先、あらゆる機械や物がしゃべり出す未来はくるとの考えを持っている。そうして対話が標準的なインターフェースとして浸透したときに、個人の好みにあわせた個性を持つキャラクターが差別化のポイントになるという。今後の展開や進化していくなかでは「誰がしゃべるか」ということも大事にしていきたいという。

 「世の中の目指すべきテクノロジと進化の過程のなかで、僕の中で今回のめざましマネージャーは全体の行程の2割ぐらいのポジションにいるイメージ。この先お客さんに喜ばれる製品とするために必要な技術を高めたり、お客さんと一緒に育てていく。このアプリは、そのために非常に必要かつ不可欠なパートナーだととらえている。ここで育て上げた結果、もっとすばらしい体験を届けられる」(倉田氏)

 「めざましマネージャーとしては、夜の小話の読み上げが上手になったり、その上での機能追加や展開の企画も考えている。その先はスマートフォンにとどまらず、あらゆる物を対象とした展開も考えていきたい。ただお堅くとらえられるよりは、みなさんの妄想を技術の無駄使いをして実現することが目標」(松平氏)

「ソードアート・オンライン」
(c)2014 川原 礫/KADOKAWA アスキー・メディアワークス刊/SAOII Project

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]