スマートスピーカは“一線を越える”と使われる--「Google Home」のキーマン・徳生氏に聞く

藤井涼（編集部）2017年10月11日 14時30分

　グーグルは10月6日、音声AIを搭載したスマートスピーカ「Google Home」を日本で発売した。価格は税別1万4000円で、Google Storeや大手家電量販店などで購入できる。また、携帯キャリアではKDDIが独占して販売する。小型版の「Google Home Mini」も10月23日に税別6000円で発売する予定だ。

　Google Homeに「OK, Google」と話しかけることで、「Google Play Music」の楽曲再生や、「Google カレンダー」と連携したスケジュール、天気予報などを読み上げてくれるほか、NHKや日本経済新聞のニュースを聞くこともできる。また、スマートフォンで音声検索をするように、食材のカロリーや職場までの交通状況を質問したり、連携したスマート家電を音声で操作したりできる。

グーグル製品開発本部長の徳生裕人氏

　日本では、8月末にLINEがスマートスピーカ「WAVE」を投入したほか、年内にはアマゾンの「Amazon Echo」が上陸する予定となっており、2017年は“スマートスピーカ元年”と言える。競争が激化する同市場におけるGoogle Homeならではの強みとは何か。日本語対応における開発のこだわりや、発売後の反響なども含めて、グーグル製品開発本部長の徳生裕人氏に聞いた。

音声合成には「手間をかけた」

－－なぜ、Google Homeの日本展開を10月にしたのでしょう。偶然にも、発表日（10月5日）がLINEのスマートスピーカ「WAVE」正式版の発表と同日になりました。

　日本展開については、できるだけ早い方がいいと考えていましたが、新しいハードウェアなので日本語対応やパートナーの話も含めていろいろと準備が必要でした。5月にはスマートフォン向けに（音声AIの）「Google アシスタント」を日本でも提供しましたが、そこまで時間をかけずにGoogle Homeも発売できたと思っています。

　（LINEと同日発表になったことについて）これは会社ではなく個人の意見ですが、スマートスピーカは新しいものですので、各社からいろいろなものが出てくるのは非常にプラスだと思っています。何が正しいかということは、まだどの会社さんもわからないと思います。私どもが持っていてLINEさんが持っていないものがあればその逆も当然あると思いますので、そこはお互いにとって刺激になると思います。

－－発売から数日経ちましたが反響はいかがですか。ユーザーの声で、印象に残るものがあれば教えてください。

　まだ正確な販売数は把握していませんが、それでもウェブでの評判を見たり、セールスに関わっているメンバーから話を聞いたりすると、思った以上に受け入れられているなと感じます。（現状のGoogle Homeで）出来ることと出来ないことは自分たちでも理解しており、もう少しお叱りを受けるかなと思っていたのですが、まずは狙っていた以上のものを出せたのかなと思います。

　ユーザーの声としては、音声認識や音声合成はわれわれの強みだと思っていましたので、そこを評価していただいている意見が多かったのは嬉しかったですね。音声合成は、Google DeepMindの最先端技術を活用しているのですが、「音声合成にしては自然すぎる」と言っていただけたのは嬉しかったです。

スマートスピーカ「Google Home」

－－Google Homeの強みとしては「検索」や「Google サービスとの連携」なども挙げられると思います。

　そうですね。スマートスピーカでは、ユーザーが話していることを理解して、正しい機能を引っ張ってくることが1番大切で、そこにはわれわれがずっとやってきた検索の経験を生かすことができました。ただ同時に、音声認識の精度も高くないとストレスが溜まるので、少し離れていたり、騒音があったり、囁くような話し声であっても認識できることが大事だと思っています。

　Googleサービスとの連携についても、当然頑張らなきゃいけないところで、正直まだきちんとできていないところもあると思います。今後も米国で提供している機能はできるだけ日本でも展開する予定です。ただ、Googleのプロダクト前提だとどうしてもつまらなくなってしまいますし、できないことも多々ありますので、いろいろなパートナーと連携していくことが非常に重要だと思っています。

－－日本で展開する上で、最も苦労したのはどの機能でしょうか。

　どれも苦労はしていますが（笑）、会社全体で頑張ったところは、やはり音声認識や音声合成のところですね。手間をかけた分、利用につながっているのかなと思います。昔のGoogleの音声を覚えていますか？少し不自然なロボットのような音声でしたが、この1年でかなり進化したと思います。

　あとこれは永遠の課題なのですが、日本語の自然言語処理は難しいところがあって、「今日疲れた」でも明るい言い方と暗い言い方だと全然意味が違いますし、主語がなかったりすることもあります。そのあたりはできるだけ大事な時に動くようにしたつもりです。

「一線を超える」と使ってもらえる

－－スマートスピーカにすぐに飽きて、使わなくなる人もいます。継続して使ってもらうために求められるのは、「コミュニケーション力」だと思いますか、それとも「機能」でしょうか。また、LINEのWAVEは正式版で連続会話に対応しましたが、対応予定はありますか。

　Google Homeでは今は機能が中心ですが、やはり機能の中には明らかに「OK, Google」と言わなくてもいいシチュエーションがありますし、間違えて言い直したい時もあります。そういう時に、毎回「OK, Google」と言ってから正しいコマンドを言わないといけないのは、やはり人間的ではないですよね。

　グローバルではこれまでずっと「OK, Google」で通してきましたが、日本語では初めて「ねぇ、Google」にも対応しました。それで多少呼びやすくなったのですが、それでもやはり（起動ワードが）長いという方もいます。ただ、あまり短くしてしまうと誤作動を起こしたり、勝手に喋り出してしまう可能性があるので、プライバシーも含めてまだまだ改善が必要です。

　連続会話についても、気がついたらGoogle Homeに話を聞かれていたみたいなことを避けるために、いまは起動ワードを喋らないと動かないようにしています。ただ、1日に何十回も「OK, Google」と言うのは大変だと思いますので、これも改善の余地があると思っています。

　そういった、ちょっとした認識精度とか、ちょっとした声のかけやすさとか、そういうものが積み重なって一線を超えるとようやく使ってもらえる製品になると思いますので、今後も地道な改善を続けていくと思います。

　まだユーザーの話しかけ方によってはうまく反応しないこともありますので、「わかりません」と答えることのないようにしなければいけません。返答のレスポンスについても、聞いた瞬間にすぐに答えられるようにしたいですね。

－－搭載されているAIの「性格」についても教えてください。たとえば、LINEのWAVEでは、政治や性などデリケートな話題には触れないようチューニングをしているそうですが、Google Homeではいかがでしょう。