「めざましマネージャー アスナ」開発者に聞く“俺の嫁”が日常に溶け込む未来 - (page 2)

「フィギュアがしゃべり出すと面白い」から始まった「おはよう俺の嫁」プロジェクト

 企画の発端は、ソニー・ミュージックコミュニケーションズが手がけている「3Dプリント・フィギュア」というサービス。3Dスキャナーと3Dプリンターの最新技術を活用し、有名人や自分自身をそのままフィギュアにできてしまうサービスだ。松平氏はこのころ、Android OSを搭載したボックスで何ができるかということもあわせて考えていた時期だったころから「フィギュアの台座にマイクとスピーカー、そしてAndroidボックスを仕込み、話しかけたらしゃべり返してくれるようになったら面白いと思った。そんな音声対話を実現できたら、フィギュアだけではなくあらゆる方面で活用できるだろうと思ったのが、そもそものきっかけ」(松平氏)。

 ソニーグループ内で音声対話の技術について探していたところ、ヒントとなるものがあった。スマートフォンで音声を認識し、ソニー製のBlu-rayディスクやDVDレコーダーの番組録画や再生をするAndroidアプリ「Koe-Kara」だ。これには「○○さん(愛称や略称)が出る月曜の夜のドラマ」や「今日のバラエティ番組を探して」と音声入力すれば、各項目の候補が表示される機能も搭載されている。松平氏は「これだ」と思い、グループ内のつてをたどって倉田氏に相談。制作の実現に向けて動き出した。

 めざましマネージャーは「朝専用音声対話型エージェントアプリ」ともうたっており、朝のシチェーションに絞った機能となっている。これは倉田氏の提案によるもの。実は倉田氏は過去、エンターテインメントロボットとして発売された「AIBO」や対話可能な二足歩行ロボットの試作機「QRIO」のアプリケーションディレクターとして関わっていた経験を持つ。人間の行動は千差万別かつ膨大なパターンがあり、全てをフォローするシチュエーションの表現は難しかったと振り返る。

 そのことを踏まえつつ、サービスを提供する際になんらか用途を特定し、ユーザーの“何をしたいか”にあわせられると重宝されると考えたという。そのなかで、どのようなシチェーションを想定した機能を盛り込むかを検討。朝は人の行動パターンのばらつきが少なく似たような行動をするため、ユーザーが求めている機能や仕様を絞り込みやすいと考えた。

 このことから「キャラクター」「音声対話」「朝」をキーワードとして進めていくことになった。「プロジェクト名は『おはよう俺の嫁』(笑)。原案部分はすごく早く決まった」(松平氏)。「最初のミーティングだけで、こういうことをやるというコンセプトの部分は2人の間でほぼ決まった」(倉田氏)という。

 キャラクターがアスナになったのは、前述のように松平氏が好きだからという要素が多分にあるのだが、検討を進めていくなかでも、今回のめざましマネージャーに適していると判断。SAOは最新の技術によって限りなく現実に近い仮想空間を舞台とした“VRMMORPG”と呼ばれる世界を描いた作品。音声対話をはじめとした最新の技術を活用したサービスという意味では、SFのテイストを持つSAOにあっている。細かいところでは、電波の状況が悪いことをセリフとしていう場合、他の作品では世界観からはずれたセリフになってしまうが、SAOではそういったセリフも違和感を感じないということも大きかったという。

 「SAOではほかにも魅力的な女性キャラはたくさん登場するが、アスナの存在感は圧倒的。だから『アスナは俺の嫁』というフレーズが出回っていると。そして『“おはよう俺の嫁”だから、やっぱりアスナだよね』と、打ち合わせはそれで盛り上がった。アニメ特有のかわいらしさが過剰に出ておらず、誰からも好かれやすいキャラであるのもポイント。アスナ以外の選択肢は考えられなかった」(松平氏)。

「技術の無駄遣い」というほどの最新技術を投入した対話エンジン

  • 「BSP60」

 倉田氏は、松平氏との出会いのタイミングもよかったと話す。朝のシチュエーションに特化した意図は前述した通りだが、すでにそれをコンセプトとした製品の研究開発を進めていたという。それが形となったものに“ハロっぽいスピーカー”と呼ばれる、日本でもこの7月に発売されたボイスコントロール対応スピーカー「BSP60」がある。この技術の活用も提案したという。めざましマネージャーの技術的な部分はBSP60とほぼ同じで、ウェアラブルデバイス「SmartBand Talk SWR30」にもこの技術は活用されている。

 「こういったアニメ関連のアプリは大きな予算をかけられない事例も多く、音声対話機能をイチからは制作するには難しい。ただ開発をしている技術を活用する形であれば、“中身”があるのでコストは抑えられると。また“外側”の部分をビジネスとしてのデザインができればいいものになると思ったし、発展の先を探していた。そのときにちょうど松平が訪れた」(倉田氏)

 倉田氏によれば、音声対話の仕組みとして大まかに「音声認識」「意図理解」「対話生成」「発話」の4つの流れがあるなかで、意図理解と対話生成の部分が人間で言うところの「脳」にあたる部分であり、ソニーがオリジナルで開発をしている部分だという。

音声対話の仕組み
音声対話の仕組み

 「お客さんに向けて何を届けるかは事業や商品の性質によって異なるが、ここさえしっかりとしておけば、ソニーが目指すユーザー体験をさまざまな形で送り出すことができると。またこの部分はクラウド側で持つことによって立ち振る舞いのコントロールもこちらでできる。『技術の無駄遣い』というほどにあらゆるテクノロジをふんだんに使っているが、技術がすごいというのはあまり関係がなく、まずはお客さんがいいよねと思ってもらうことを訴求することが大事。その観点でいくと、めざましマネージャーは誰にアプローチしていくかが明確。アニメファンの方に目覚ましを通して関わり合いを持つことができたらいいと。何より我々もアニメファンなので、自分たちが欲しいと思うものを作ったつもり」(倉田氏)

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]