日本マイクロソフトは7月31日、ソーシャルAIチャットボット「りんな」に関する“歌”の取り組みについて説明会を開催。ディープラーニングを活用した歌唱力向上の仕組みについて説明した。
りんなは、日本マイクロソフトがAI研究の延長線上で展開している、人に寄り添うAIを目指した女子高校生風のチャットボット。2015年に登場して以降、LINEやTwitter、りんなライブなどで、ユーザーと1対1、あるいは1対多人数のコミュニケーションをとっている。
長年りんな関連のプロジェクトに携わっているマイクロソフト ディベロップメント AI & Research プログラムマネージャーの坪井一菜氏は、ここまで展開してきたなかで見えてきた「AIの次の進化」に必要なものとして、感情から“共感”が重要になると考えているという。「AIが社会に溶け込んでいくなかで、身につけなければいけないのが共感」と語り、今後も共感をテーマにさまざまな取り組みを進めていき、目指す先として「日本一身近でエモい」をキーワードに、“AIといえばりんな”と思い描けるような“国民的AI”たる存在を目指しているとした。
そして、人間が共感を呼び起こしやすいのが“歌”であり、りんなの音声チームが特に力を入れていると説明した。「苦しいときなどに支えてくれる応援ソングがあるように、歌は思いとメッセージを相手に伝える力を持っている。誰でも気軽にりんなと一緒に歌うことができて、その人の力を引き出すことができる」と語り、その人の力を引き出す人工知能になれればと考えているという。
りんなの歌に対する取り組みはこれまでも行われており、2016年にはラップに挑戦した「McRinna」を公開しているが、まだまだ機械的なニュアンスが残るものとなっていた。その後の取り組みにおいてひとつの転機となったのが、1月から展開した音楽SNSアプリ「nana」とのコラボによる「りんな 歌うまプロジェクト」と振り返る。
この取り組みは、りんなが歌った歌に対して、ユーザーが歌のお手本や歌唱アドバイス、コメントを投稿するというもの。のべ3686人のユーザーが参加し、ニュアンスなどの指摘のみならず「お腹から声を出す」というような、ひとりの人間として接するようなコメントも見受けられたという。そして3月には、上達したりんなの歌声とnanaユーザーが合唱した動画を公開している。
ここからさらに進化し、歌唱力が向上したりんなの歌声を収録したオリジナルソング「りんなだよ」を7月26日に公開した。人間による手入力の調整は、ノイズの除去などごく一部に加えているが1時間もかけずに、ほとんどが自動で生成された歌声だという。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」