お使いのブラウザは最新版ではありません。最新のブラウザでご覧ください。

CNET Japan ブログ

[解説] グーグルのリアルタイム検索への取組みと今後の課題

2010/02/15 17:22
  • このエントリーをはてなブックマークに追加

プロフィール

渡辺隆広

日本でSEOを始めた第一人者として知られるアイレップサーチエンジンマーケティング総合研究所 所長の渡辺隆広氏が、競争の激化する検索市場をビジネス、マーケティング、テクノロジーの各方面から掘り下げます。
ブログ管理

最近のエントリー

グーグル・リアルタイム検索が日本語に対応

2月15日16時時点でグーグル社から正式なアナウンスがありませんが、先週12日時点で日本語(google.co.jp)でのリアルタイム検索が始まっています。TwitterやFacebookに数分以内に投稿された書き込みが、ウェブ検索結果に表示されるようになりました。

以前、QDF (query deserves freshness)の仕組みに触れつつ、グーグルが検索結果の「鮮度」を大切にしている点について解説しました。リアルタイム検索が表れる条件も同様に、「その話題が、いま旬なものか」が判定されています。

ただし、私が観察している限り、ニュース検索ほど頻繁に表示されるわけではありません。Yahoo!トピックスに掲載されているなど、旬な話題に対してセンシティブかというとそういうわけでもなく、単純にTwitterで頻繁に利用される語句だからリアルタイム結果枠が出現することもあります。出現する条件や割合は、ニュース検索のそれとは大きく異なるようです※。

※ 「検索ツール」→「最新」を選択した時の結果画面ではなく、通常検索結果にリアルタイム検索枠が混在表示される場合を想定しています。以下、特に断りがなければ同様です。

たとえば、13日正午時点であるニュースが報道された時、ニュース検索結果は以後、新しい情報がアップデートされる限り、1〜3日は表示され続けることが多いです。しかし、リアルタイム検索枠は、Twitter上での投稿数を考慮しているのか、発生から数時間して、RTなどが一巡すると同枠は表示されなくなっています。

一方で、バンクーバー五輪に出場した、スキーモーグルの選手・上村愛子さんのように、14日に続き公式ブログへの投稿が話題となった本日と、つづけてTwitter上で話題にされ続けているケースでは、継続してリアルタイム検索枠は表示されています。

課題が多い、リアルタイム検索

リアルタイム検索はTwitterの利用者数の増加に伴い昨年から注目を集めている分野で、すでにGoogle、MicrosoftはTwitterと提携し、Firehoseを通じてリアルタイム性の高いデータソースを使ったリアルタイム検索に着手しています。Yahoo!もTwitterの公開APIを使った検索サービスの開発を試行錯誤していますし、他にOneRiotなど多くの新興企業がこの分野に参入しています。しかし、リアルタイム検索の将来については賛否両論があるのも事実ですし、また、技術的課題も山積しています。

以下、論点について述べていきます。

1. リアルタイム検索で、本当に便利になるのか?

Twitterとは基本的に、他人にとってのノイズが流れていても良い場所です。たとえば私は先日、病院での治療中で暇だったので「レーザー治療なう」とつぶやきましたが、これは他のユーザにとって意味が全くありません。

また、所詮最大140文字でつぶやかれる程度の内容ですから、ある課題や問題を片付けるために検索しているであろうユーザが、これらの単純なつぶやきが結果に表れることで助けになるかというと、疑問が残ります。

Yahoo!が、単純につぶやきを検索結果に表示するのではなく、そのストリーム情報を分析・加工した上で検索結果に何らかの形で組み込むというアプローチを取ろうとしているのには頷けます。

ユーザがリアルタイム検索で恩恵を受けるのは、「キーワードの意図に合致する、最も新鮮な情報が表示される時」であって、誰かのつぶやきが表示される時ではありません。単純に文字列一致でTwitter等のつぶやきを表示しても、単に検索結果画面上のノイズを増やすだけで検索の満足度向上にはつながらないこともあります。

この課題を解決するためには、リアルタイム検索を表示すべき時の判定と、ノイズが混ざったストリームの中から「価値あるつぶやき」を拾い出すことが必要です。しかし、後述するように技術的に難しいのが現実です。

2. 検索ビジネスとしての収益性

リアルタイム検索は特定の検索目的においては有効です。たとえば、昨日のスキー・モーグルの結果やサッカー・日本代表の試合結果の直後に、サッカーの試合結果について知りたくて検索したであろうユーザが、リアルタイム検索枠を通じて「いま、ネットユーザが思ったこと」を即座に知ることができることは素晴らしいかも知れません。また、あるイベントや出来事が起きたときに、その場にいるユーザ同士で意見交換や共有ができる、それを即座に検索で探しだせる、というのも有効かも知れません。

確かにリアルタイム検索が有効なシーンは多いのですが、それは大抵の場合、コマーシャルクエリが少ないシーンが該当します。つまり、検索連動型広告による収益頼りとなっている検索ビジネスにとって、コマーシャルクエリが少ないというのは、うまみがないということです。過去にも動画検索やブログ検索で多くの新興企業が市場参入したものの撤退したり苦労したのは、マネタイズが困難だったことも一因です。

グーグルのようにすでに最大シェアを誇るウェブ検索に組み込む形で検索全体の利便性を高めてユーザのリテンションを強めるという戦略がとれるならまだしも、他の多くの企業にとっては先行きが不透明な市場でもあります。

3. 価値あるつぶやき、発言者を区別することの難しさ

これが最大の障害になりうるのですが、ストリームウェブにおいて、価値ある発言及び発言者を区別するのが非常に困難であり、適切なランキングが決定できないという課題があります。

たとえばモバイル(ケータイ)検索は3年余りが経過した今日でも検索品質の抜本的改善には至っていません(いや、ずいぶんマシになってはいますけど。これは、ケータイページの重要度の判定をするための適切なサイン(指標)が存在しないためです。

ウェブの世界はもともと互いがリンクで張り合うという文化があり、そのリンク構造に目をつけて考案されたPageRankに代表されるリンク分析技術によって、PC検索品質は大きく改善されました。対してモバイルの世界はもともとリンクで張り合う文化がありませんでしたし、文化がないのにリンクという指標を持ち込んだので、スパムなリンクが大半を占めているのにそのリンクでページの重要度を推し量ろうという、おかしな状況になっています。

これと同じ状況がリアルタイム検索でもすでに起きています。GoogleやOneRiotはそれぞれのTwitterやFacebook投稿の重み付けを判断する指標として、フォロー数、フォロワー数、及び投稿頻度、つぶやきに含まれる要素(RT、リンクなど)を分析しているといわれますが、正直、精度がいいとはいえません。これらのサインは、発言者や発言の重要度(authority)を判定するに十分ではないからです。

現時点で単純に、ターゲットとなる単語と、リンクあるいはRTが含まれていると、リアルタイム検索枠に出現しやすい状況になっています。すでに一部のユーザがワードサラダ的な、時事性の高い単語がごちゃまぜの投稿を書き込んでいるケースや、全く無関係なリンク先ページ(カジノや怪しいサイドビジネス、ねずみ講まがいのページへの誘導リンク)を含めた投稿が、リアルタイム検索に表示されてしまっています。

Twitterは1人で無数にアカウント作成できますし、フォロー数もフォロワー数も簡単に操作可能ですし、投稿もbotでやれば簡単です。Googleがウェブ検索に複合表示するようになれば、トラフィック獲得を狙ったスパム行為がますます増加するでしょう。こうした中で、価値ある投稿を拾い出すことは容易なことではありません。

#

一応、他の指標と組み合わせてノイズを減らすこては可能です。たとえばソーシャル検索で用いているソーシャルグラフと連携させて、検索対象を自分の知人、知人の知人までといった具合に限定すると、無関係なノイズは大幅に減らすことができるかも知れません。しかし、このアプローチは検索カバレッジとのトレードオフになります。

まだ取組みが始まったばかりの分野ですし、あと1〜2年したら、ストリームウェブの中からきれいに有益な情報を取り出すための検索技術が生み出されるかも知れませんので、問題は解決していくかも知れません。とはいえ、そんな話は、私はブログ検索でも、動画検索でも、モバイル検索でも耳にしました。現実を見るとなかなか難しい気がします。

 [追記] グーグルのリアルタイム検索は、別にTwitterやFacebookなどに限った話ではなく、検索ツール→最新で絞込み検索をした場合は、最新のブログやニュースも含まれています。 とはいえ、検索結果の鮮度に関しては今回のリアルタイム検索の前から同社はかなりの精度で取り組んできていますので、あえて取り上げていません。その観点でいえば、私の手元にあるデータ(暫定的なものですが)では、ある大きなニュースが出てきたときに、それが検索結果に反映されるまでの時間は Google 5分 /avgに対して Yahoo!JAPANは130分 /avgです。検索結果の鮮度が検索の満足度やレリバンシーに対してどれくらい影響しているのかわからないのですが、Yahoo!JAPANはこの問題にどう取り組んでいくのか楽しみです。

※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。
運営事務局に問題を報告

最新ブログエントリー