お使いのブラウザは最新版ではありません。最新のブラウザでご覧ください。

CNET Japan ブログ

Vivisimoのクラスタリングエンジン

2005/12/01 13:43
  • このエントリーをはてなブックマークに追加

プロフィール

渡辺隆広

日本でSEOを始めた第一人者として知られるアイレップサーチエンジンマーケティング総合研究所 所長の渡辺隆広氏が、競争の激化する検索市場をビジネス、マーケティング、テクノロジーの各方面から掘り下げます。
ブログ管理

最近のエントリー

数年前にどこかの新聞の特集で「メタ検索エンジンに注目が集まる」という趣旨の記事を見た時、日本でもメタ検索エンジンが流行る日がまもなく来るかと思ったものの、結局、それ以後何の注目も集めることなく現在に至る日本。こんな状況の中、米国のVivisimoという会社が日本語対応のメタ検索エンジン Clusty.jp を立ち上げた。

Clusty.jp
http://clusty.jp/

メタ検索エンジンは、一度の検索で複数の検索エンジンの検索結果をまとめて取得できるサービスだ。例えばGoogle、Yahoo!、MSNサーチそれぞれで検索したい時は3回の検索を実行しなければならない。メタ検索エンジンはクエリを投げると複数の検索エンジンから取得した結果を一覧表示してくれる。ただ、単純にひとまとめにされても重複したウェブページをそのまま表示されても困るし、単体(例えばGoogle)の検索エンジンよりもレリバンシー(関連性)が劣ってしまうのでは無意味なので、メタ検索を開発する会社はあれこれと知恵を絞って検索の利便性を高めようとする。

この問題に対するVivisimoの出した答えが「クラスタリング」と呼ばれるものだ。Vivisimoのクラスタリングエンジンは、取得したウェブページ一覧を意味のあるまとまりで分類表示をしてくれる。例えばClusty.jpで「パソコン」と検索してみよう。すると、検索結果の画面左側にフォルダで「ノート」「機器」「パソコン教室」「通販」「デジタル」「試験、協会」のようにクラスタリングエンジンが分析・分類したフォルダが表示される。例えば「ノート」をクリックすると検索結果が切り替わり、ノートパソコンに関連するウェブページ一覧に切り替わる。

Clusty.jpで「パソコン」と検索したところ。トピックごとにページを分類している。

この分類はあらかじめ人が作成した分類方法に当てはめているのではなく、技術的に実現している。リアルタイムで処理しているので、例えば「建築確認」と検索すると、いま世間を賑わせている話題に関連する分類フォルダをきちんと表示してくれる。「振り込め詐欺」と検索すると「防犯」「被害額」「商法、悪徳」といった具合だ。

このような分類手法はwakanoという同じく日本語対応したメタ検索エンジンや、TeomaやFAST等でも実現しており、技術的に目新しいというわけではない。採用する技術は異なるが豪mooterもある。ただ、例えば両者を使い比較してもらうとわかるがVivisimoの方がきちんと検索ユーザーにとって意味のある分類をしてくれており精度は良さそうだ。これはVivisimoの検索対象がMSNサーチのほかに asahi.comやnikkei.netなどニュースメディアを含んでいることが関係しているかもしれない。

GoogleやYahoo!の提供するウェブ検索を使いこなすためには、ユーザー側に相応のリテラシが求められる。「検索エンジンを使いこなすための検索活用テクニック」のようなセミナーや書籍があるように、首尾よく欲しい情報にたどり着くためには、何の検索キーワードを使うべきかをよく考えなければいけないのが実情だ。GoogleやYahoo!は確かに精度の高い検索サービスを実現するようになったが、その性能をどれだけ引き出せるかはユーザー側の検索能力に依存する。例えばオンライントレードを自分で勉強するのに役立つためのサイトを探したい時、多くのユーザーは「オンライントレード」と検索してしまうだろう。しかし、オンライントレードを含む全てのサイトが表示されてしまうので、その一覧の中から欲しいページの選別作業をユーザー側が負担しなければならない。だからといって関係ないサイトを除外して「オンライントレードを学べるサイト」だけを見つけるためのキーワードを考えるのは検索に慣れていないユーザーにとってはハードルの高い作業だ。

Vivisimoの提供するアプローチが決してベストというわけではないが、GoogleやYahoo!とは異なる検索方法であり、欧米と比較して新検索技術がなかなか登場しない日本市場にこうした技術を使った検索サービスが投入したことには意味があることだと思う。

※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。
運営事務局に問題を報告

最新ブログエントリー