「声の装い」は社会課題の解決--AI活用で自分の声を変換するDeNA「七声ニーナ」誕生秘話 - (page 3)

佐藤和也 (編集部)2021年06月25日 10時00分
  • 一覧
  • このエントリーをはてなブックマークに追加

七声ニーナは赤ちゃんの状態--ユーザーの体験ががらりと変わる瞬間作る

――リリースしてからの反応はいかがでしょうか。

岩朝氏: 取り組み当初では明確な事業目標やKPIを設定せず、なんとなくの変換数の想定や、こういう反応があったらいいという漠然としたものはありました。で、ふたを開けたら、1年間での変換数の目標を、リリース24時間で達成しました。見積もりが甘かったのか想定よりも話題になったのかわかりませんけど、サーバーコストやサーバーが落ちる心配を竹村はしていましたが、安定稼働はしていたようですし、反応があること自体は非常によかったと思います。

竹村氏: DeNAのAIブランドとして、一人ひとりの声からオリジナルグラフィックが作れる 「fontgraphy」というサービスがあったんです(※現在は終了)。これをもとに変換数の想定を行ったのですが、それをはるかに上回るものでした。クラウドのコストに関しては、これを想定していた設計になっていたので、実際に多くの変換数があっても、少ないコストで運用できましたし、予算的にも心配せずに済んだところです。また、初日からさらに変換数のペースが加速度的に上昇したならば厳しかったんですけど、さすがに今は落ち着いてきているので、その心配はない感じです。

岩朝氏: 今回のようなユーザー体験について、TTSを活用した配信したものに親しんでいる方からすると、ちょっと新しいという感じだと思うんです。品質的にも既存技術を知っている方からすると、評価されているところはあります。ただ、それは少数の反応で、大多数の方は、初めて自分の声が変換できるという体験を目の当たりにしたと。ボイスチェンジャーではなく、キャラの声に乗り替わる体験はなかったと思うので、それで驚いた方も少なくないと感じています。そして、いろんな使い方ができることに気づく方もいらっしゃる感じですね。

遠藤氏: SNSでも使い方について話題にしている方は結構いましたね。

――使われ方について、想定していたものや想定外のものなどはあったりしましたか。

岩朝氏: AIチームとも、ユースケースや使われ方の想定はいろいろしていました。ゆくゆくは動画配信やゲーム実況にも使われるだろうと思っていましたが、もうリリース初日の夜にはやってる方がいました。あとは小説や有名な言葉の読みあげ、高田さんが演じたキャラクターの特徴的なセリフを言わせることに挑戦する方もいらっしゃいました。

 想定外の観点でいけば、日本語をベースに作っていたので、変換した音声も日本語だけしか喋らないと思っていたのですが、韓国語のニュアンスでも上手く変換できるとして、韓国語で喋べらせる方も多かったです。中国からのアクセスも多かったですし、ロシア語での変換を試みた方もいらっしゃいました。多言語で試したときのさまざまな制約を突破しようとした方がいらっしゃったのは想定外でしたね。

遠藤氏: 既存の音声認識を活用すると言語依存性が高くなるので、全くできないと思います。反響の高さから考えると、今回の技術では他言語でも一定うまくいくときもあるという感じですね。

岩朝氏: 言語によっては、発する音声の性質が異なるものもあるのですけど、聞いた感じでは、韓国語についてはわりとうまくいってる気がします。

――この先の展望や未来像などがあれば、教えてください。

竹村氏: 今回はさまざまな制約があってリアルタイムではない音声変換ですけど、先のゴールでは、ライブ配信のアプリに組み込んだり、ゲーム実況のツールに組み込むといったことを想定しているので、それで動くレベルでの音声変換を実現したいです。そのときに、クラウドで動作することだけではなく、スマートデバイス端末上で動作することも想定しています。そのほうが、コストが安くなりますしレイテンシも低減できますので。音声変換の速度と品質のチューニングしつつ、いろんな端末で体験できるような技術としていきたいです。

遠藤氏: 七声ニーナという形で音声変換技術と、その体験を提供したのですけど、やはりこれをゲームや配信サービスに活用するところまでに持っていきたいというのが、先の目標にあります。品質的には、まだまだ足りていないところがあるのも事実です。技術系のチームとしては、技術視点で難しさを考えてしまうのですけど、サービス視点での品質や求められていることを少しずつ感じられるようになってきているので、そのギャップを埋めていくことで、みなさんによりいいもの、そしていい体験を提供していきたいです。そして、単発で終わらせず矢継ぎ早に提供して、DeNAは音声に関わる技術を持っていると認知していただけるようになれればと思います。

岩朝氏: サービスの観点で言うと、七声ニーナはまだよちよち歩きの赤ちゃんの状態です。品質的な課題もあれば、パフォーマンスの向上も図っていかないといけないですし、設計上の制約もあります。もちろん、リアルタイムでの変換も提供できていません。そのハードルを超えるためのアプローチや努力はずっと続けていきますし、そこが本業のチームでもある遠藤や竹村などのメンバーがしっかりとやってくれると思っています。

 自分としては冒頭でもお話したように、AIがインターネットと同じぐらいに爆発力のあるゲームチェンジャーの技術であることを示すこと、それをDeNAとしてひとつでも形にすることに力を注ぐのが仕事です。この技術がサービスとなって、ユーザーの体験ががらりと変わる瞬間を、DeNAの力+αでどう作るか、プロデューサーとしてやることはたくさんあると思っています。

 ゲームでボイスチャットがキャラの声になったら、もっと活用する人は多くなるはず。面接でも、自分の声で喋っていても、理想の声で喋ることができれば自己表現がうまくなる方もいると思います。そういったUXを描いて実現することを、DeNA+αでやっていくことがミッションですし、短期的ではなく中長期的な視点で取り組んで、あのときにAIやボイスアバターの取り組みを行って良かったとさまざまな方に思っていただけるストーリーを紡いでいくことが責務だと思っています。

 IP展開の観点では、基本的に何でもウェルカムです。ハッカドールのときはIPの展開を想定したものではなく、キャラクターも設定もほぼ思い付きだったのにもかかわらずいろんなお話もいただいてコラボ展開もしましたし、ひょんなことからテレビアニメになったりしたので。

 ハッカドールのアニメ化のときに、アニメスタジオのみなさんと設定まわりについてかなり話しをして感化されたところはあったので、今回はキャラクター設計や設定はかなり考えて作ったつもりです。とはいえ、ハッカードールのときもそうですけど、七声ニーナでも来るもの拒まずのスタンスですので、いろんなお話をいただければと思いますし、みなさんと何か面白いことができればと思っています。

――最後に少し余談として岩朝さんに伺いますが、ハッカドールのときはプレサイトや、サービス終了を告知したブログで、ソースを表示すると謎の文章があったのですけど、七声ニーナのサイトにはないのでしょうか。

岩朝氏: あります。今回は、単にソースを表示させるだけでは出てこないようになっています。仕掛けもあって、見つけただけでは“解”ではないです。AIのことも少しわかるような内容にしていて、七声ニーナにどういうことを学習させたのかのヒントもあります。もしよければ探してみてください。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]