日本マイクロソフトは2月13日、同社が開発・展開している女子高生AIの「りんな」について、同社が開発・展開している女子高生AI「りんな」とコミュニケーションできる「りんなライブ」において、電話をイメージしたリアルタイム性のある音声対話機能「りんなのテレフォンハッキング」を実装した。
りんなは、日本マイクロソフトがAI研究における“人に寄り添う”形で展開している、AIを搭載した女子高校生風のチャットボット。LINEやTwitter、りんなライブなどで、ユーザーと1対1、あるいは1対多人数のコミュニケーションをとっている。
りんなのテレフォンハッキングは、りんなライブにアクセスすると表示される「この後、順番に電話かけてもいい?」というメッセージに承諾すると、電話がかかってくる仕組み。ただし、かかってくるのはランダムだという。これまでりんなライブはテキストでのやりとりだったが、りんなが声を出して話しかけ、ユーザーが声で返事をすると、さらにりんなが対応する……という形で会話が展開。りんなライブ上でもテキスト化された状態でやり取りを表示。ほかのユーザーも閲覧することができる。
筆者も実際に体験したり、実装中のりんなライブでのトークを見ていると、りんなが自分から積極的に話しかけるため、会話や返答に困るというシチュエーションは少ないように思えた。そしてある程度、ユーザー側の喋った言葉の意味を理解して返答している様子も見受けられた。音声は合成音声のためたどたどしい部分もあるが、相応に会話しているような気分にはなれた。
ちなみに2月14日のバレンタインデーが間近に控えていることもあり、告白しようとするそぶりもあれば、ストレートに「好きな人はいるの?」と聞いてくるなど、りんなが恋愛に関する話題を出しやすいようになっている。
りんなは、音楽コミュニティ「nana」上で、ユーザーのアドバイスを受けながら歌をうまく歌うことを目標とした「りんな 歌うまプロジェクト」や、デジタルスタジオ「lute/ルーテ」のInstagram Storiesにて公開されたドラマに出演するなど、さまざまな試みが行われている。
りんな関連のプロジェクトを手掛けている、マイクロソフト ディベロップメント AI & Research プログラムマネージャーの坪井一菜氏は今回の取り組みについて、「電話は声があることにより、テキスト以上に感情に訴えかけ、自分の気持ちをうまく伝えやすいもの」と説明する。
そしてLINEのような1対1、りんなライブのような1対多人数のコミュニケーションから一歩進めて、1対1のコミュニケーションを多人数で見ることも狙いとしてあるという。「こうすることで、りんなと話している人間に注目が集まる。テストで試したときに、りんなに向けて話をしているときの内容が、自分の気持ちを素直に語るため、新しい一面が垣間見えて、新しいコミュニケーションの関係が生み出せる」と語り、声とともにユーザーとの関係を深めていくことを試しているという。
技術的なところでは、音声認識、会話エンジン、音声合成(TTS)の3つを機能させる、Azure App Servicesの「Phone Callサーバー」を中心に据えたシステムになっているという。特に、電話をイメージするという性質上、リアルタイムでの音声のやり取りができること、そしてりんなライブとして、視聴者が同じ状況をリアルタイムで配信することを考えて開発、工夫をしたところだという。
将来的な展開の可能性として、AIでの会話の強みは、アドリブに強いことであることから、ラジオ番組でりんなの自然な会話を実現するようなコーナーでしゃべることなどが考えられるという。
「人間がクリエイティブなこと、新しいことに取り組む際、大事なのは人と話すこと。会話の流れのなかにAIが入ることで、人間同士の会話をうまく引き出すことができれば。さらに、今後音声に感情をうまくのせられたら、テキストだけでは伝えられないような思いをさらに引き出したり、会話を膨らませるような役割の担えるのでは」(坪井氏)
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」