> >

AI検索でグーグルとOpenAIに挑むPerplexity AI--根底に「ソース重視」の考え方

Lisa Lacy （CNET News）翻訳校正：川村インターナショナル2024年08月22日 07時30分

　中学生のとき、学校の宿題で国務長官が誰かを調べなければならないときがあった。今なら「ググる」だけですぐに解決するが、その当時はもう少し努力する必要があった。

提供：igoriss/iStock via Getty Images

　筆者の継父は、ことあるごとに何かを教えたがる人だった。このときも、図書館に電話して司書に質問してみれば、国務長官が誰か答えてくれるだろうと教えてくれた。そう言いながら、継父は声に出さずに答えを口にしていたので、その唇を読み取って「Warren Christopher」だと分かった。だが、そのうえでなお図書館に電話をかけさせられ、筆者は人生に必要な貴重なスキルを身につけているのだと思った。

　遠からず、図書館司書の役割は生成人工知能（AI）が、具体的にいうと生成AIを利用した検索が担うようになるかもしれない。大手IT企業から全面的な注目を集めているAIの分野である。

　検索エンジン大手のGoogleも、「ChatGPT」の開発元であるOpenAIも、検索の未来について独自のビジョンを抱いている。両社がそれぞれ展開しているサービスが、「AIによる概要」と「SearchGPT」だ。AIによって生成される要約を介して、より直接的な回答を引き出そうとするもので、いちいちスクロールするよりも早く答えが得られることを理想としている。6月の時点では、Googleの全検索結果のうちおよそ8％で、「AIによる概要」が自動的に上部に表示されていた。一方、SearchGPTは1万人ほどのユーザーによってテスト中だと報じられている。

　両社とは別にPerplexity AIという企業もある。AIと検索を新しく組み合わせたことによって、テクノロジー業界でにわかに話題を呼んだスタートアップだ。Perplexity AIは、オープンウェブを利用しつつ、「Reddit」や「X」といったソーシャルメディアのプラットフォームからもデータを取得できるため、無料版ChatGPTやGoogleの「Gemini」にとって強力な代替サービスになる、と米CNETの同僚であるImad Khan記者がレビュー記事の中で書いている。だが、同記者によると、AIスタートアップAnthropicの「Claude」モデルの方が、情報の合成が優れており、微妙な表現の回答を生成できるようにうまく調整されているように感じられるという。

　結局のところ、こうした企業が目指していることはすべて同じだ。2032年には4300億ドル（約63兆円）に達すると予測されている検索エンジン市場での取り分である。

「要約機能としての大規模言語モデル」

　サンフランシスコを本拠とするPerplexity AIは、自らを「AI回答エンジン」と称している。従来の検索のようにユーザー自身にクリックを続けさせるのではなく、信頼できると同社が考えるソースを見つけ、そこから関連性の高い事実を識別する。それを組み合わせたうえで、出典サイトの引用（そのためファクトチェックがしやすい）とともに回答を示すのである。

　OpenAIのSearchGPTとよく似ているが、Perplexity AIの最高業務責任者（CBO）を務めるDmitry Shevelenko氏は、逆にSearchGPTの方がPerplexity AIに触発されたと考えたいようだ。Perplexity AIは2022年12月に公開されている（OpenAIは、Googleが「AIによる概要」を導入して誤回答で問題になった数カ月後の2024年7月にSearchGPTを発表したばかり）。

　Shevelenko氏によると、Perplexity AIは問いに答えることに重点を置いているが、SearchGPTはチャットを重視しており、そこに両者の違いがあるという。だが、その点はどちらも似たようなものかもしれない。

　Perplexity AIの共同創業者は4人いて、そのうち3人が博士号を持っている。学界には「引用こそが価値あるもの」という価値観があり、Shevelenko氏によると、そういう世界での経験がPerplexity AIの今の形につながったのだという。

　「大規模言語モデルを、情報源としてではなく、情報の合成・要約機能として使い、それからリアルタイムのインターネット上で、品質と信頼性の高いソースを知識のベースとして利用する。このアイデアが、ある意味で新しい発見だった」、とShevelenko氏は語る。

　（大規模言語モデルとは、機械学習を用いて文章を理解するAIモデルの一種である。前に並んだ単語に基づいて、それに続く単語を予測するように訓練されている［機械学習は、AIの一分野であり、データとアルゴリズムを使って人間の学習の仕方を模倣する］）

　これを実現するために、Perplexity AIは独自のウェブインデックスおよびランキングシステムを開発した。50のデータシグナルを使ってドメインの信頼性と評価を決定する、とShevelenko氏と説明している（参考までに、Googleが使っているランキングシグナルは少なくとも200ほどあるとみられている）。

　「常に評価が高いのは、報道機関だ。記事の中に埋め込まれている事実は常に優先度が高くなり、それが、当社が参照する多くのデータシグナルに反映されている」（同氏）

　スタートアップであるPerplexity AIとそうした報道機関とは複雑な関係にあった。WiredとForbesは6月、Perplexity AIが両社のコンテンツを無断で使っていると報じた。Perplexity AIの最高経営責任者（CEO）Aravind Srinivas氏は、その指摘を否定。同社は翌7月に「Perplexity Publishers' Program」の立ち上げを発表した。これには、TIME、DER SPIEGEL、Fortuneといったメディアパートナーとのレベニューシェアが盛り込まれている。

　Perplexity AIは、顧客向けに2つのプランを用意している。無料版では、「クイック」検索が無制限で、「Pro」検索は1日あたり5回まで。月額20ドル（約3000円）のProプランでは、1日あたり300回以上のPro検索を使える。

　同社のブログ記事によると、7月に登場したPro検索は、より複雑な質問に答えることができる。高度な数学やプログラミングタスクも実行でき、従来より綿密にリサーチを経た回答を生成する。

　Perplexity AIは企業向けのサブスクリプションとAPIも提供している（開発者は、そのAPIを使用してPerplexity AIの技術に基づいた新しいアプリケーションを開発できる）。また、第3四半期には広告の立ち上げも計画している。現在開発中なのが、「Sponsored Question」という広告ユニットで、これを利用するとブランドが検索結果でフォローアップ質問のスポンサーになることができる。

　「今からおそらく18カ月後には、それが当社最大の収益源になると予測している」と、Shevelenko氏は広告機能について述べている。

　ユーザー数は公表していないものの、同社によると、7月には2億5000万件の質問に回答したという。それても、皆さんご存じの某社の総件数に比べると、ほんのわずかだ。

　Googleは検索ボリュームに関するデータを公表していないが、検索数は1日あたり85億件と推定されている。1カ月に換算すると2550億件ということになる。

「Holy cow（たまげた）」というフレーズの由来は？

　この記事の執筆中に、筆者はランキングシグナルについてSEO関係の友人と話をしていた。その友人によると、Googleのランキングシグナルの数は200以上とされているが、2024年に入ってからリークされた内部文書によると、8000にも及ぶ可能性があるといわれている。

　「Holy cow（たまげた）」、筆者はそう口にし、それからふと、そのフレーズの由来は何なのかと気になった。そこで、Perplexity AIに尋ねてみた。

　Perplexity AIは、引っ越し会社のSquare Cow Movers、質問回答サイトのHowStuffWorks、ニュースサイトThe Indian Expressの引用を示しながら、このフレーズは遅くとも1913年までさかのぼると答えた。野球のアナウンサーが、罵倒語の代わりに使ったのだという。Perplexity AIは、ただし、「Holy Christ」のバリエーションという可能性もあり、アイルランド移民が言う「Holy cathu」の影響かもしれない、と続けた。cathuはゲール語で「悲しみ」を表す単語で、それが英語のcowのように聞こえるらしい。

　一方、Googleの「AIによる概要」はWikipediaと、やはりIndian Expressの記事を引用し、English with Jackieというクリエイターが作ったYouTube動画も紹介した。cathuについての説明は最初に取り上げられていた。

　通常のGoogle検索だと、検索結果のトップはWikipediaの記事だが、それにSquare Cow Moversが続き、ソーシャルフォーラムサイトのReddit、質問回答サイト「Quora」、HowStuffWorks、Indian Expressと続いた。

　率直にいうと、出典がここまで重なったことには驚いた。

　「今夜のアトランタ・ブレーブスの試合は何時から？」と尋ねると、Perplexity AIもGoogleも、ロサンゼルス・エンゼルス戦が東部時間9時38分からと答えてきた。Perplexity AIが出典として報道ウェブサイトCBS Sports.comを挙げたのに対し、Googleではトップが野球サイトMLB.com、それにThe New York TimesとCBSSports.comが続いた。

　トマトを使ったレシピの検索で、おそらくPerplexity AIの限界が表れていたと思う。Googleでは各種の回答があったのに対して、Perplexity AIが答えたのはパンツァネッラのレシピだけだったのだ。

　今後、Perplexity AIは検索結果に視覚的要素を増やしたいと考えている、とShevelenko氏は話している。

　同社はこれまでに1億6500万ドル（約242億円）を調達してきた。これには、2024年に入ってからの投資第4ラウンドの6300万ドル（約92億円）も含まれる。

　Shevelenko氏が確定的に答えたのは、同社が「1億ドル以上を調達した」ということと、その先については「具体的な計画はない」ということだった。

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。

CNET Japanの記事を毎朝メールでまとめ読み（無料）