お使いのブラウザは最新版ではありません。最新のブラウザでご覧ください。

CNET Japan ブログ

スマートスピーカーは我々の生活をどう変えるのか!?

2017/07/24 10:00
  • このエントリーをはてなブックマークに追加

プロフィール

土屋夏彦

radikoが有料で全国が聴けるようになり、いよいよ聴き逃しサービス「タイムフリー」も始まるかと思いきや、2016年になってしまいましたが、AMが在京3局も含め順次ワイドFM化を始め、TOKYOFMグループのi-dioもいよいよこの3月から始まるようで、今年の地殻変動はかなり大きいかも!
ブログ管理

最近のエントリー


ニッポン放送、Cerevo、グッドスマイルカンパニーの3社は7月20日、クラウドファンディングを通じて開発したワイドFM対応ラジオ「Hint BLE Radio」を9月初旬に発売すると発表しました。以前からもこのblogでも何度か紹介してきた「ラジオ局が手掛ける"かっこいいラジオ"」がいよいよユーザーのお手元に届けられることになりました。

元々は昨年7月にクラウドファンディングサイト「CampFire」で募集を開始し、9月には予定の1300万円を大幅に越える3045万円が集まり製品化が決定。今年の3月末の製品化の予定がトラブルもあって延期され、今回満を持しての発売決定となりました。

「Hint BLE Radio」は360度無指向性スピーカーをそのまま円筒形にした形状で、ワイドFMの受信のほか、Bluetoothに対応しているので、スマートフォンとのさまざまなやりとりが出来る仕様になっています。そこがこれまでのラジオチューナーとは一線を画しているところなのですが、この話はまた別の機会に譲るとして、今回は、同じような円筒形で全米の生活環境を変えようとしている「スマートスピーカー」について書いてみたいと思います。

全米では昨年くらいから大ブームを巻き起こしていますが、日本ではまだ販売は開始されていません。全米での一番人気はAmazonが販売する「アマゾン・エコー」だそうですが、その発売を前に、日本では先日7月14日、LINEから「WAVE」の予約販売を開始。これが日本でのスマートスピーカー第1号になるようです。

しかしながら我々はこの「スマートスピーカー」についてあまり良く知りません。なぜそんな円筒形のスピーカーに人気が集まっているのか? そもそもスピーカーが「スマート」だと言う意味もよくわかりません。

例によって、先日私のレギュラーで登場しているラジオ番組で特集をしたので、それを元に「スマートスピーカー」の現状についてまとめて置きたいと思います。

■改めてスマートスピーカーとは・・・

「スマートスピーカー」と言われていますが、これはいわゆる「音声認識アシスタント機器」の一つです。音声認識アシスタントとは、コンピュータがユーザーの発話を解釈し、音声で指示されたさまざまな操作を実行できる機能のこと。

2011年10月に、AppleがiOS 5向けの音声アシスタント「Siri」を発表したことで、音声アシスタントは広く知られるようになり、日本では、2012年2月にNTTドコモが日本語に対応した音声アシスタント機能「しゃべってコンシェル」の提供を開始したのが最初とされています。

いわゆる声やしゃべりでさまざまな機器の操作を可能にするシステムのことで、ここ1年で急に「音声アシスタント」が注目されるようになったのは、Amazonが「アマゾン・エコー」という音声アシスタントを搭載した「スマートスピーカー」を発売し、全米で飛ぶように売れたのがきっかけになっています。

「アマゾンエコー」は2014年11月に全米で実験的に発売されて以来、Uber(タクシー)を呼んだり、ピザを注文したりといった機能がどんどん追加され、現在では、「電気をつけて」「コーヒーメーカーのスイッチを入れて」「音楽を流して」などのほか、「今日の天気は?」とたずねると「今日の降水確率は90%、傘を忘れないでください。」などと答えてくれるなど、生活の一部にまでなりつつあります。

ちなみにこういった音声対応機能は、アマゾンでは「スキルSkill」と呼んでいて、月1000スキル程度の追加が現在も行われていて、6月末時点で(米国版だけでも)1万5000スキルを超えているんだそうです。

「アマゾン・エコー」の値段は179.99ドル、販売台数は800万台を突破したとの噂で、いまだ大人気継続中。昨年2016年にはイギリスとドイツでも販売開始。今年の秋以降には日本でも発売が予定されています。

「アマゾンエコー」の成功で、他社も音声アシスタントに本腰を入れるようになり、現在では、Googleの「Google Home」、アップルの「HomePod」、日本ではLINEが今年の3月に「WAVE」を発表。7月14日には予約販売を開始しています。

■音声認識(アシスタント)の歴史

「音声認識アシスタント」ということでは「Siri」や「アマゾンエコー」などの形にまとまり始めていますが、そもそも「音声認識」の歴史を紐解くとイバラの道を歩んできたようです。

コンピュータが普及しだした1970年代から21世紀初頭の現在まで「音声認識」技術の開発には、長年にわたって莫大な資金と優秀な人材が投入されてきたようですが、成功して普及したものはほとんどありませんでした。

言葉の認識という意味では、同音異義語が少ない欧米系の言語では90%の認識率と言われるなか、日本語は複雑なため、理想的な環境下でも60%程度が限界とされてきたため、特に日本での普及はアメリカに比べてかなり遅れていました。

そんな中でも、音声認識をコンピュータやゲームに応用したもので人気を博したものもあります。

架空の魚と会話をして賢く育てるという「シーマン」というゲームがあったのをご存知でしょうか? ほかにも「ゼルダの伝説」では、ファミコンのコントローラーのマイクに向かって何か叫ぶと、敵が一撃で倒せたみたいなのがありました。あれは音声認識ではなくて単なる音量認識だったんですが、恥ずかしげもなくコントローラーに大声出してました。

また音声入力という意味では、文章をキーボードで入力する手間を省きたいために、音声で入力する研究が多数行われてきました。

2013年(4年前)windows7あたりからはヘッドセットマイクを使って、パソコンを音声操作したり、メールを音声入力したり、できるようになりましたが、まだまだ認識率はあがらず、実用には程遠い状態だったんです。つい3年前くらいの話ですが、みなさんで使ったことある方少ないんじゃないですか? ほかにも音声認識ソフトで「ドラゴンスピーチ」というのも売り出されました。

そんな中、まさに昨年の2016年に入って、人工知能の技術が「機械学習」や「深層学習」などで一気に向上したことで、Google音声入力が進化を遂げます。リアルタイムで喋った日本語をほとんど間違わずに文字に置き換えていってくれるようになったんです。

これは、録音された音声データを読み込ませて、自動聞き起しなどにも応用できるようになりました。(ただし誤字脱字や、一時的に考え中になったりなどが起きるため、完全実用的とまではいっていません。)

そんな中で、スマートフォンに搭載された音声認識アシスタントに人工知能の技術が応用されるようになりました。iPhone(Apple)の「Siri」や、Android(Google)「Google Now」はもちろん、MicrosoftがWindowsPhone用に開発した「Cortana」、これらに加えてAmazonは音声認識を主とした人工知能「Alexa」を開発、Lineも「Clova」を発表。

こうした流れから、人工知能による音声認識機能を搭載した、スピーカー型の音声認識アシスタント機器として「スマートスピーカー」が誕生したんです。

■スマートスピーカーで何をするのか?

改めて現在アメリカで販売中の主なスマートスピーカーをご紹介します。

◎「Siri」が搭載されたアップルのスマートスピーカー:「HomePod」

◎「Google Now」が搭載されたグーグルのスマートスピーカー:「Google Home」

◎「Alexa」が搭載されたアマゾンのスマートスピーカー:「Amazon Echo」

◎「Cortana」が搭載されたMicrosoftのスマートスピーカー:「INVOKE」

これに加えて、国産第1号としてアジアから発売開始予定のものが

◎「Clova」が搭載されたLineのスマートスピーカー:「WAVE」

ということになります。

ちなみにスマートスピーカーはAIと音声認識を活用した生活支援機能付きスピーカーとなっていて、AI音声アシスタントとも呼ばれています。

ではスマートスピーカーがあるとどんなことができるのか? スマートフォンに搭載された音声認識とは何が違うのかを見ていきたいと思います。

まず、スピーカーとしては、スマートフォンやPCとBruetoothなどでリンクさせることで、保存された音楽データを再生することができます。また室内のワイファイにつないでおくことで、スピーカーだけでも、直接、定額制音楽配信サービスから音楽を再生させることが出来ます。(ただし、Amazon Echoなら「Amazon Prime Music」からしか聞けないなどあるようです。)

つまりスイッチを入れればお気に入りの音楽がいつでも流すことができる「家庭用ジュークボックス」「音楽専用ラジオ」みたいな存在になります。「アレクサ! クイーンの「ボヘミアン・ラプソディ」を演奏して。ボリューム8で!」こんなことは朝飯前。

これだけなら最近だったらスマートフォンとリンクできるスピーカーが多数販売されているので、それとあまりかわらないんですが、ここからがスマートスピーカーの本領発揮です。

まず、リビングでスマートスピーカーで音楽を聞きながら本でも読んでいるとしましょう。そこにスマートフォンにメールが届きます。音楽が少し小さくなって、スマートスピーカーから「メールが届きました、誰々さんからです、お読みしますか?」と言ってきます。もしすぐに読みたいときは「アレクサ、読んでくれ」と呼びかけるだけです。(アメリカ仕様のものしか見たことないので、日本仕様になったらどういう言葉になるのかわかりませんが笑)

また、本などを読んでいて、ちょっと疑問に思ったこと、例えば、乃木坂46の衛藤美彩は大分出身だったっけ、長崎出身だったけ・・なんていうのも、Siriだったらいちいちアプリを立ち上げて声をかけなければなりませんが、スマートスピーカーなら、いきなり「アレクサ、衛藤美彩の出身地は?」と言うだけですぐに「大分です」と答えてくれるでしょう。「いっしょに誕生日も登録しておきますか?」(1月4日)とか聞かれて「お願い」といえば、カレンダーにしっかり衛藤さんの誕生日が登録されます。

ほかにも、スマートスピーカーとリンクできるいわゆるIoT機器(インターネットオブシングズ)、エアコンとか照明とか、テレビとか鍵とかも、言葉(音声)でコントロールできるようになります。

■企業との連動続々・・・

Domino’s Pizzaは、日曜のフットボールの試合を見ながらソファから立ち上がることなく、一言でピザが注文できるようにしたそうです。さらに注文したピザは、いまどこまで来ているかも随時教えてくれるそうです。

タクシーサービスのUberは「タクシーを10時にお願い」など簡単なコマンドだけで配車サービスに電話をするツールを提供。

自動車メーカーのフォードは、車内で音声認識(Alexa)の機能を提供する正式なパートナーシップを発表したそうです。もし全米の2億5千万台の車両にAlexaが2020年までに完全に搭載されるということになれば、自動運転とあいまって、まさに夢のカーライフが実現するでしょう。

Capital Oneというオンラインバンキングとの連携では、「Alexa、私は先週いくら使った?」という簡単なコマンドで週ごとの支出をいつでも確認できます。

こうしたスマートスピーカーに命令できる言葉をアマゾンでは「スキル」と呼び、例えば「アマゾンエコー」だったら1万5000スキルも用意されているというんですから、ちょっとおもしろそうですよね。ちなみに米Googleの「Google Assistant」で使えるスキル(Googleは「Voice App」と呼ぶ)は378件、米Microsoftの「Cortana」のスキルは65件と大分数が違うようです。

ICTアドバイザリ企業のGartnerのレポート(2016/10)によれば、AI音声アシスタントの世界市場は、2020年に21億ドル(約2,275億円)を越えるとも言われているそうです。2000億円と言えば、mixiやGree、モバゲーがソーシャルゲームで、2007年にわずか4億円だった市場が5年間で2000億円と50倍になったことを思い出します。そういう意味では2000億円はそれほど大きな金額でもないのかもしれませんが、全世界の約3%の家庭にスマートスピーカーが普及すると言われると、見逃せない状況です。

■これからどうなる・・・

GoogleのJaja Liao(ジャジャ・リアオ)氏が最近書いた記事によれば「1930年にはアメリカの家庭の40%しかラジオを持っていなかった。しかし10年後にはラジオがアメリカのリビングルームの80%以上に普及したんだ。これによって安心で快適な場所からアメリカ人のホームエンターテインメントの概念を変えたんだ。」つまり、いつの時代もリビングルームを掌握することが市民の生活を掌握することにつながっているということだといいます。

これから一気に日本上陸が決まっているスマートスピーカータイプの音声認識アシスタント機器ですが、先日、スマートスピーカーの専門家の方にお話を聞くチャンスがあって、おもしろい話が出てきたんです。

それは、日本は海外に比べて携帯電話の普及が早かった、ツイッターやフェイスブックなどの普及も海外を超える勢いがあることに注目すべきじゃないかということなんです。それは「寂しいの(つながりがないこと)は嫌だけど、煩わしいのも嫌である。人とのつながりがほどほどにできるのが良い」と言うわけです。

日本は海外に比べて、同じ人種、同じレベルの生活、相手の考えがわかりやすい・・・そういった関係があります。つまりお互いにわかりやすいからこそ、あまり面と向かったコミュニケーションを取りたくない。でも何もない寂しいのはいやだ。そういうことからメールだったりSNSが普及しやすいんだそうです。

そういう生活に、ただ単に音楽が流れるスマートスピーカーでは、少し役不足なのではないかと言うわけです。つまり、流れる音楽に対してリクエストが出来たり、かかった曲へのリスナーのコメントが聞けたり、まさにいまの生放送のラジオのようなことがスマートスピーカーでできたら、日本らしいゆるいつながりがスマートスピーカーで実現出来るのではないかと思います。

ちなみに、音声アシスタントとしてはアップルのSiriが先行していたにも関わらず、アマゾンのAlexaにあっさり抜き去られてしまいました。その理由は、なんでもSiriに聞いてみようと大きく出た割には認識率が悪評だった脇を、アマゾンが応答時間を当初の3秒から1秒に短縮させるなどの使い勝手を徹底的にこだわったことで、難なく抜き去ってしまったという事実があるそうです。

果たして、アメリカ同様にアマゾンが顧客のこころをつかむのか、はたまた国産のLINEのWAVEが日本人を意識したサービスを搭載して一気に普及させるのか、日本のスマートスピーカーのこれからに注目が向けられます。



※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。
運営事務局に問題を報告

最新ブログエントリー