アニプレックスは、テレビアニメ「ソードアート・オンライン」(SAO)に登場するヒロイン「アスナ」をバーチャルアバター化し、最新の音声合成技術を活用して発話する「宣伝隊長アスナ」として展開中。その経緯や狙いを聞いた。
SAOは川原礫氏による小説を原作とした作品。多方面で展開されているなか、10月からはテレビアニメシリーズ最新作となる「ソードアート・オンライン アリシゼーション」を全4クールで放送している。
宣伝隊長アスナは、SAOアリシゼーションを盛り上げる施策として開発されたもの。ソニーが開発したバーチャルアナウンサー「沢村碧」のシステムとしても活用されている「アバターエージェントサービス」をベースに、最新の音声合成技術で再現されたアスナの音声と、Live2Dによるモーショングラフィックでアスナを表現。昨今盛り上がりを見せているバーチャルYouTuberとは異なり、裏側で声や動きを演じている人は存在せず、全てコンピュータプログラムによって自動的に生成されたものとなっている。
宣伝隊長アスナの企画経緯について、SAOアリシゼーションの宣伝プロデューサーを務めるアニプレックスの相川和也氏は「アスナがSAOシリーズにおけるヒロインで人気キャラクターではあるが、SAOアリシゼーションにおいては、比較的出番が少ない事情もあり、宣伝隊長という立ち位置でユーザーとの接点を増やせば、作品とは違った形でファンに喜んでもらえると思った」と語る。
アスナの露出を増やす企画についてはさまざまな案が検討されたとしているが、すでに音声合成と生声を組み合わせてアスナがしゃべる、ソニー・ミュージックコミュニケーションズの「めざましマネージャー アスナ」があり、これをうまく活用したいと考えたという。
前述のようにアスナが活躍できる場を増やすとともに、音声合成システムであれば、声優や収録スタジオにかかるコストを必要としないという現実的なメリットもさることながら、SAOアリシゼーションにおいてはAI(人工知能)もテーマにしていることから、その世界観にもマッチするものになるという考えもあったと語る。
「宣伝隊長アスナ自体はAIは活用していないものの、近未来にAIの機能が発達したとき、AI自身が考えた物事をアウトプットするのに使われるのは、こういったものではないかというイメージがあり、それにマッチすると考えた」(相川氏)。
アバターエージェントサービスを手掛け、宣伝隊長アスナの技術面をサポートしているソニーの倉田宜典氏によれば、ツール上に限ってみれば、宣伝隊長アスナ用に特別なことはしておらず、必要なアスナの音声データやLive2Dデータ、背景データを入れ込み、キャラクターや背景を切り替える形で利用することが可能。これによって“伝える”という用途のなかでも、ニュースを読むだけではなく、イベントの告知やSNS上での案内など、一歩外に広がる展開もできるようになったとしている。
技術面での大きな特徴は、アスナの音声合成。エンジンは東芝デジタルソリューションズのミドルウェア「ToSpeak」を活用。めざましマネージャー アスナや現在の沢村碧の音声合成については「G3」というバージョンを使用していたが、宣伝隊長アスナについては、「GX」と呼ばれる最新バージョンを活用。倉田氏によれば、GXはサンプリングレートが上がっており、収録時の声のいい部分が音声合成でも残りやすく、再現もしやすくなったという。
「戸松さん(※アスナ役の声優を務める戸松遥さん)の声には高い部分が含まれていて、そこにアスナらしさがある。G3ではその高い部分の表現が弱かったが、GXで表現できるようになったのが大きい。告知要素の多い同じトーンで喋る内容の場合、環境が悪かったり、“ながら聞き”のように気を抜いて聴いていたりすると、生声と音声合成の区別がつきにくいレベルになっている」(倉田氏)
倉田氏も技術面を手掛けためざましマネージャー アスナにおいては、全編にわたっての音声合成の使用は許諾が下りず、生声を組み合わせる形を取った。とはいえ「生声と音声合成の組み合わせは、その差異について違和感を覚えるところも否定できない」と語る。今回はアスナが話すすべてにおいて、音声合成を使用することで、製作委員会からの許諾が下りているという。
倉田氏は少し余談としながらも「これまではアスナを使わせていただくという立場で音声合成が活用された。今回は製作委員会を通じて公式として音声合成を活用してもらっている。これは、今後キャラクターの音声合成を展開するうえで大きいこと」と語る。許諾について相川氏は、感覚の部分があるため説明が難しいとしながらも「私や製作委員会のメンバーが、以前はそう思えなかったが、今回はぱっと聴いて『これはアスナだ』と思えたことが大きかった。生身の人間のように話すことが目指すべき場所だとすると、まだまだ改善の余地はあるが、その前提のうえで、チャレンジングな企画は前向きに取り組んでいこうという気質があるので、進めていこうという話になった」と説明した。
また、今回の音声では戸松さんによる新規収録は行っているが、以前に比べて収録時間などは格段に減少したと倉田氏は説明。音声合成に使われる“ツボ”と言えるようなフレーズを効率的に組むかが重要とし、それまでは試行錯誤も含めてかなりの時間がかかっていたが、そのときのノウハウと、集める音声を減らしても心地よくするための工夫を凝らした結果だとしている。
宣伝隊長アスナでは動きを増やしたり、BGMのコントロール、天気予報の雲の動きにイメージされるようなスライドショーへの対応など、細かいところで改善が行われている。これによって、用途にあったさまざまな動画が作成できる環境が整ったと倉田氏は語る。逆に「ただ単に、静止画1枚とキャラだけ表示させて、一本調子の音声合成が淡々と喋るだけだと、音声合成の悪い部分だけが印象に残ってしまう」(倉田氏)とし、動画の“作り”として、工夫する必要性に気づいたところもあったと振り返る。
できることの幅が増えた一方で、ツールとしての煩雑さや習熟に時間がかかるところもあるようで、SAOアリシゼーションの宣伝担当であり、宣伝隊長アスナの運用を手掛けるアニプレックスの高階誠氏も「ようやく慣れてきたところもあるが、今でも試行錯誤中」という本音も明かした。動画として、テンポのいい内容にするための構成をきちんと考える必要もあり、ツールの習熟もあわせて時間がかかるという。もっとも運用面での課題は、随時倉田氏へフィードバックをして改善を進め、毎週の作業に関してはかなり軌道に乗ってきているとしている。
高階氏と倉田氏は、実際に運用するなかで字幕表示の重要性にも気づいたという。宣伝隊長アスナは主にTwitterでの動画投稿を主としているが、字幕表示はわかりやすさもさることながら、最初に目にした段階では音声をオフにしていることが多く、内容を認識してから音声をオンにする傾向があるという。ツール上でももともと字幕表示の機能は搭載されているが、より作りやすい方向で改善をしているという。
Twitter上では「#宣伝隊長アスナへリクエスト」のハッシュタグを通じてリクエストを募る企画も展開しているが、高階氏によれば、リクエストとして多いのは「衣装」と「作中にあるセリフを喋ってほしい」という。このうちセリフについては、倉田氏から、音圧も含めたコントロールはまだ音声合成に取り入れられず、演技要素の強いセリフの再現は難しいとの説明があった。高階氏は、宣伝隊長アスナに対するファンの反応として「アスナが音声合成で喋ることに、最初は賛否両論あったというのが正直なところ。ただ、楽しみにしてくださる方がいるのは事実で、一方的なものではなく双方向のコミュニケーションの楽しみと、一緒にアスナを育てていくというストーリーを提供していきたい」とした。
倉田氏は、アニメとのコラボレーション企画について、多くは3カ月(1クール)の期間で、企画も単発で終わることが多いが、SAOアリシゼーションは合計4クールと長期間になることが発表されていることから、フィードバックを得て改善するというサイクルがあり、開発にとってありがたかったという。相川氏は「長期間の放送であるため、あえてたどたどしさを感じられる企画があってもいいと思って始めたところもある。ファンの皆さんにも一緒に宣伝隊長アスナの成長を感じてもらいつつ、テレビアニメも中盤、後半に向けて盛り上げていくので、両方で楽しんでほしい」と語った。
(C)2017 川原 礫/KADOKAWA アスキー・メディアワークス/SAO-A Project
(C)川原 礫/アスキー・メディアワークス/SAO Project
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
住環境に求められる「安心、安全、快適」
を可視化するための“ものさし”とは?
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス