規模の大きさが重要ではないと言ったのは誰だ?
米Googleと米Overture Servicesが繰り広げる検索エンジン競争において、規模の大きさはそのまま自慢のタネとなる。
検索エンジン大手のOvertureは先週、子会社のAlltheWebの新しいインデックスを、誰もが認めるインターネット界のリーダーGoogleのインデックスよりも大きいと喧伝した。同社の21日(米国時間)の発言によると、AlltheWebはユーザーのクエリーに答えるために、32億近い数のページを検索する。これは21日時点でGoogleがインデックスしていたページ数を、6800万ページ以上、上回るという。
しかしその後、Googleは28日までに同社のデータベースにあるウェブドキュメント数を33億以上に拡大し、トップの座をあっさりと奪い返した。これはGoogleのサイトに書かれていたことで、同社関係者もこの点を認めている。
「Googleは、ユーザーに提供するWebページの数を正確に反映するために、インデックスするホームページの数を拡大した」と、この関係者は電子メールのなかで答えている。Googleが持つ世界中のインデックスには、33億のWebドキュメントと、8億のUsenetページ、そして4億の画像データがあるという。
これらは、GoogleとOvertureとの間で繰り広げられている競争で最近あった一幕に過ぎない。そしてそれは、この業界の競争の厳しさを反映している。業界各社は、インデックスのサイズと機能については、長い間互いの模倣を繰り返してきた。しかし、ウェブ検索のビジネスがウェブポータルと検索スペシャリストの両者にとってドル箱へと成長したことから、その重要度が増している。ある調査によると、今年の検索エンジンの広告収入は、全体20億ドルに達する見込みだ。
サイズはどれほど重要か?
検索対象となるインデックスの規模は、検索エンジンの素晴らしさを測る手段のひとつにすぎないと言うアナリストもいる。データベース上のドキュメント数は、検索の3本柱のうちのひとつで、あとの2つはクエリーに対する検索結果の関連性と、新鮮さだ。たとえば、米Bancorp Piper JaffrayのアナリストSafa Rashtchyは、検索エンジンのインデックスサイズを重要視しない。
「単独では、インデックスサイズはさほど重要ではない」と、Rashtchyは言う。また、負荷を考慮すると、検索エンジンが持つべきドキュメント数は20億と30億の間だろうと付け加える。「大きな差を生むのは、関連性のアルゴリズムだ。検索結果は新鮮で、関連性のあるものでなければならない」(Rashtchy)
Googleは、検索結果の関連性の高さで、数百万人ものネットサーファーたちに愛されてきた。全ての検索会社のなかでも、依然としてGoogleはこの分野のリーダーだとRashtchyはいう。そして、YahooのInktomiとAlltheWebがその次に着けている。結果として、特にFastのAlltheWeb(Overture)は、関連性に重点を置いている。
Overtureによると、AlltheWebはインデックスに10億のドキュメントを追加しただけではなく、独自で行うウェブページの順位付けに使用する関連性のアルゴリズムの改善も実施したという。
この記事は海外CNET Networks発のニュースをCNET Japanが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」