グーグル、検索アルゴリズムを少しずつ明らかに

文:Stephen Shankland(CNET News.com) 翻訳校正:編集部 2008年05月22日 13時31分
  • このエントリーをはてなブックマークに追加

 Googleは、同社の検索エンジンの内部動作について、少し秘密にしすぎていたという結論に達した。

 同社はこれまで、何を検索結果一覧の先頭に表示するかを決定するアルゴリズムについて、あえて公表を避けてきた。同社の検索品質に関するエンジニアリング担当バイスプレジデントを務めるUdi Manber氏は米国時間5月21日付けのブログ投稿で、その理由の1つは、競合他社による模倣を防止するためであり、また別の理由としてはそれを悪用するウェブサイトの出現を防ぐためであったと述べた。しかし今後は、もう少し公開していく予定である。

 「完全な秘密主義を貫くのは理想的ではない。このブログ投稿は、今後はこれまでよりももう少し公開していこうという新たな決意を示すものである」とManber氏は述べている。「これからは定期的に新しい部分について語り、古い部分を説明し、アドバイスをし、情報を公開し、対話していくよう努力する」(Manber氏)

 今回のブログ投稿では、ほとんど検索品質に関する活動の概要が述べられているだけで、実際の内容については今後のブログ投稿を待たなければならないようだ。しかしManber氏は、Googleが重み付けに使用している要因のいくつか(社内では「input」と呼んている)を少しだけ紹介している。

 「われわれのランキングアルゴリズムの中で最も有名な部分は、Google創設者のLarry Page氏とSergey Brin氏が開発したアルゴリズムPageRankである。PageRankは今日でも使用されているが、現在ではより大規模なシステムの一部にすぎない。他の部分としては、言語モデル(慣用句、同意語、発音記号、スペルミスなどを処理するための機能)、クエリモデル(言語だけではなく、今日の用法を含む)、時間モデル(30分前に作成されたページが回答として最も適したクエリもあれば、過去に作成された実証済みのページが回答として最適なクエリもある)、パーソナライズモデル(好みは人によって様々であるため)などがある」(Manber氏)

この記事は海外CNET Networks発のニュースをシーネットネットワークスジャパン編集部が日本向けに編集したものです。海外CNET Networksの記事へ

  • このエントリーをはてなブックマークに追加