スマートフォンにそれほど依存しなくてもさまざまなことが可能になるという未来を、「rabbit r1」でちらりとうかがわせる。そう約束していたテクノロジー系スタートアップのrabbit inc.だったが、このハンドヘルド型のAI搭載デバイスが4月に発売されたとき、その約束はまったく果たされていなかった。
それから6カ月が経過した今でも、筆者はrabbit r1ではなくスマートフォンに手を伸ばしている。とはいえ、この手のひらサイズの小型ガジェットが、6カ月前に最初にテストしたときから大幅に改善されたことも事実である。バッテリー持続時間が長くなり、応答もより速くなった。さらに操作ジェスチャーも簡単になったことで、発売時よりもはるかに使いやすくなった。
しかし、こうした修正は、「rabbit r1は本当に必要なデバイスなのか」という筆者最大の懸念事項を解決してはくれない。こうした改善が施された後でも、スマートフォンの方が使いやすく、直感的だ。rabbit r1はここ何カ月でずっと賢くなり、複雑で何度かやりとりが必要な質問にも対応できるようになった。私たちがこの10年間使用してきたバーチャルアシスタントよりもはるかに進化しているように見える。
ただし、問題は、スマートフォンのバーチャルアシスタントがそれと同等、もしくはそれ以上の速さで進化していることだ。rabbit inc.創設者のJesse Lyu氏は、AIファーストのインターフェースの方がより効率的で自然だという考えを売り込もうとしている。しかし、そう考えるのはスマートフォンメーカーも同じだ。そして、スマートフォンの方がrabbit r1よりも機能的かつ便利で、すでに私たちの生活で一定の地位を得ている。
モバイルソフトウェアの今後の方向性に関して言えば、Lyu氏のビジョンが向いている方向は間違っていない。モバイルインターフェースをよりインテリジェントにして、アプリの切り替えに時間をかけなくても済むようにするという目標には、どうやらGoogleやQualcomm、Appleなどのテクノロジー大手各社もそれぞれ独自の方法で取り組んでいるらしい。
ただし、こうしたインターフェースを使用するためのデバイスとして、rabbit r1が選ばれることはないと思う。
まず、気に入った点をお伝えしよう。この6カ月で提供された一連のアップデートにより、rabbit r1の性能は間違いなく向上した。スクロールホイールを使用して設定メニューにアクセスしやすくなったことなど、使い勝手を良くする改善が施されたほか、rabbit r1で最も重要な、質問に答えるという機能も強化されている。
午後6時ごろにニューヨークにあるクイーンズ区のアストリアからブルックリン区のグリーンポイントまで行くのにかかる時間と、自動車と地下鉄のどちらが早いのかrabbit r1に聞いてみたところ、正確で役に立つ答えが返ってきた。自動車だと約20分、地下鉄だと約30分かかるとのことで、「Googleマップ」の提案に沿ったおおまかな道順も箇条書きで表示されていた。また、自動車の方が10分ほど早いものの、その場合は、渋滞や駐車にかかる時間も考慮した方がいいとのアドバイスで締めくくられていた。
また、rabbit r1は時間管理やスケジュール決めにも役立つことが分かった。午前7時40分までにシャワーを浴びなければならないが、その前に軽く運動をしたい場合、何時に起きればいいか、と聞いてみた。ちなみに、いつも最初に15分かけてストレッチとウォームアップをしていることも伝えた。rabbit r1の回答は、15分ストレッチをしてから30分のエクササイズができるように、午前6時55分に起きるといい、というものだった。これは、筆者のいつものスケジュールと一致している。
しかし、rabbit r1の回答にはそこまで感動しなかった。GoogleのAIアシスタント「Gemini」からも同じ答えが返ってきたからだ。しかもGeminiは「Android」のスマートフォンや「iPhone」で無料で利用できる。こうしたことも、より賢くて会話力の高いアシスタントを利用するのに、スマートフォン以外は必要ないのではないかという点を浮き彫りにしている。それでも、4月に試してみたときの信頼性の低さや不具合の多さ、機能性の低さを考えると、rabbit r1にとっては大きな前進である。
ただし、rabbit r1の回答は完ぺきではない。多くのAIチャットボットや音声アシスタントと同様、rabbit r1も間違った答えを返したり、筆者のプロンプトと合っていない答えを返したりすることがある。例えば、自分はSFもののテレビドラマが好きだが、長すぎるものは見たくないと伝えてから、動画配信サービスの「Max」や「Netflix」で配信されているお薦めのテレビドラマを教えてほしいと頼んでみたところ、おすすめされた作品の中には、どちらのストリーミングサービスでも配信されていないテレビドラマ(「Apple TV+」で配信されている「サイロ」)や、SF要素の入っていないテレビドラマ(映画やドラマの情報サイトではコメディードラマに分類されている「エブリシング・ナウ!」)もあった。
一方、Geminiはといえば、「ストレンジャー・シングス 未知の世界」や「アンブレラ・アカデミー」「ブラック・ミラー」「ウエストワールド」といった筆者の希望に合う作品を薦めてくれた。ただし、こちらの回答も欠点がないわけではなかった。提案された作品の中には「きみがぼくを見つけた日」もあったが、これはテレビドラマではなく映画だ。さらに、筆者は短めの作品を希望したにもかかわらず、かなり長いシリーズものもいくつかあった(「ウエストワールド」や「ストレンジャー・シングス」など)。このことは、AIが生成した回答は確実なものではなく、スマートフォンで検索する場合も、rabbit r1のようなデバイスで検索する場合も、回答が正しいかどうかチェックする必要があることを示すさらなる証左である。
ただし、rabbit r1が返した答えの中で、本当に驚かされたものが1つある。カメラを起動して冷蔵庫の中に向け、そこにある食材で何が作れるのか聞いてみた。Geminiもいくつかのレシピを提案してくれたが、rabbit r1の案はもう少し具体的だった。
例えば、rabbit r1の場合、冷蔵庫にブドウとピクルス、卵、サラダ菜、アーモンドミルクがあることを認識し、卵サラダ、ブドウとアーモンドミルクのスムージー、ピクルスと卵のサンドイッチなどの料理を提案してくれた。Geminiの方は、提案してくれた料理の数はrabbit r1よりも多く、かかる手間別に分類してくれたりもしたが、認識した食材はブドウとサラダ菜と卵だけだった。
質問に回答する以外にも、rabbit r1には数多くの改良が加えられており、以前の回答に基づいて質問に回答できるようになったり、回答を画面に表示するときのユーザーインターフェースも改善したりしている。また、スマートタイマーやアラームが追加されたほか、「Apple Music」や楽曲生成サービスの「Suno」といった追加サービスにも対応するようになった。パワーナップ(昼寝)のタイマーを設定するよう指示したり(25分のタイマーが設定された)、前の週に尋ねたSpotifyのお薦めを教えてほしいと伝えたりすることもできた。回答は、満足できるものだった。Olivia Rodrigoのような明るいインディー系ポップロックを教えてほしいと伝えたところ、提案された楽曲の中には、米国の音楽サイト「Stereogum」がOliviaのファン向けにまとめたロック系プレイリストが含まれていた。
筆者がrabbit r1について最も憂慮しているのは、とにかく使おうという気にならないことだ。何週間もずっと、ハンドバッグやバックパックにrabbit r1を入れていて、友だちのアパートに行くときでもオフィスに行くときでも持ち歩いてはいる。それでも、rabbit r1に手を伸ばすことはめったにないのだ。もちろん、ある程度は習慣の問題だろう。スマートフォンはもう身体の一部と化していて、毎日の行動で使うのが習慣になってしまっている。
だが、それより大きな問題は、rabbit r1でできること(とそれ以上のこと)はすべてスマートフォンでできそうだということだろう。今はできなくても、遠からずできるようになりそうだ。モバイルチップメーカーのQualcommは、10月に開催された「Snapdragon Summit」イベントで、生成AIによってアプリやバーチャルアシスタントがユーザーに代わってタスクを実行できるようになるというビジョンを紹介した。rabbit inc.が約束していることとそっくりだ。Googleも個人のコンピューターでタスクを実行できるデジタルアシスタントを準備中だとThe Informationは報じており、これもrabbit inc.の「LAM Playground」エージェント(後述する)とよく似た発想と思われる。そしてAppleは、「iPhone 16」シリーズに搭載する「ビジュアルインテリジェンス」という機能のベータ版をリリースしたばかりだ。「カメラコントロール」ボタンで起動し、写真を撮ってプロンプトに追加したりできる新しいモードである。
それ以外の点でrabbit r1は大きく進歩しているが、筆者が望むレベルまでユーザーフレンドリーにはなっていない。rabbit r1の登場以降おそらく最大のアップデートであるLAM Playgroundは、rabbit inc.の技術を利用してユーザーの代わりにインターネットを閲覧し、一連のタスクを実行することができる。rabbit inc.はこのLAM(大規模行動モデル)を、さらに高度なAIエージェントの構築に向けた一歩と捉えている。将来性はあるが、現状ではまだ動作がぎこちない。
LAM Playgroundには2通りの使い方がある。rabbit inc.のオンラインポータルでウェブブラウザーを使う方法と、rabbit r1本体を使う方法だ。ウェブブラウザーで使う場合は、コマンドを入力すると、そのタスクがウェブページ上のウィンドウで実行される。rabbit r1本体を使う場合は、他のプロンプトと同じようにコマンドを発声する。
筆者も試しに、「Reddit」にアクセスして人気の女性用ランニングシューズを探すという一連の操作を実行させてみた。この指示は正しく処理されたが、うまくいかなかった指示もある。例えば、「Googleマップ」を開いて、ニューヨーク市で誕生日パーティーに向いているバーを、予約可能時間も含めて検索するよう音声で尋ねてみたところ、処理が混乱していたように感じられ、時間もかかっていた。予約可能時間をチェックしていると繰り返すばかりで、調べているのがどの店かは教えてくれなかった。
一方、ウェブ検索の機能に感心したこともある。米CNETのサイトにアクセスして一番お薦めのテレビを検索し、電気製品小売の大手Best Buyでその価格を確認するよう指示してみた。すると、期待どおり一番のお薦めであるTCLの「QM8」を紹介し、Best Buyで999.99ドル(約15万4000円)だと教えてくれた。
しかし、LAM Playgroundを使うときは、通常の音声プロンプトほどシームレスにはいかない。応答が遅く、手順がいちいち復唱されるのだ。分かりやすくはあるが、変な感じもする。ウェブサイトの閲覧中に問題が発生することもあるため、体験が安定していない。例えば、口コミサイトの「Yelp」では、サイトを閲覧しているのが人間ではないと正しく判定されて検索がブロックされてしまった。rabbit inc.は、自社のウェブサイトでLAM Playgroundを「実験」と称していることにも注意しておきたい。現時点ではまったくその言葉のとおりである
もうひとつ筆者が不満なのは、rabbit r1が何かを提案しても、その結果を実際に活用する理想的なインターフェースになっていないことだ。前のプロンプトで教えられたリンク先、レシピ、Spotifyのお薦めなどをもう一度開きたいと思ったら、スマートフォンかノートPCでrabbit inc.のウェブポータルを開かなければならない。これでは、アプリの要らない未来といううたい文句は台無しだ。
rabbit r1がスマートフォンに取って代わるものになるとrabbit inc.がうたったことは一度もないが、特定のタスクをスマートフォンよりもうまく実行することを目指すと主張していた。そして、当初はその約束を実現できなかった。多くの改良が施されてもなお、その改善のすべては、スマートフォンで何かを実行するときに、アプリを開く代わりにコマンドを発して実行させることを目指す未来を示唆している。そうした点を総合して考えると、rabbit r1はある意味で時代の先を行く製品である一方で、その進歩は遅いという印象だと言わざるを得ない。
rabbit r1
アップルの生成AIが使える「iPhone 16」(価格をAmazonでチェック)
この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」