情報洪水に立ち向かう--次世代検索ツール開発へのさまざまな取り組み - (page 3)

Michael Kanellos (CNET News.com)2004年08月11日 10時07分

 数々の新手のツール

 膨大なデータをうまく管理するためのアプローチの1つは、特定のトピックやデータセットに特化した検索エンジンを開発することだ。UCバークレーのFlamencoプロジェクトでは、このアプローチを採用している。

 FlamencoはYahooに似たインターフェイスを持ち、世界中の美術館が所蔵するコレクションから集めたアート作品が、内容(たとえば、動物、天国と地上、形状や色など)や、製作年代、作者、メディア(絵画、家具、彫刻など)その他の属性に従って、このインターフェイス上に分類表示される。ユーザーは、枝分かれした分類を上下しながら、このデータベースに収められたあらゆる動物の絵を閲覧したり、あるいはたとえば1700年から1709年の間に焦点を合わせ、この時代の作品を眺めたりできる。その結果(あくまでこのデータベースに収められた作品に限っての話だが)、この期間には蹄をもつ動物の絵が4枚しか描かれていないことを発見するのだ。

 この検索エンジンは、絵画に含まれる視覚情報を探す代わりに、その作品をデータベース登録用にデジタル化した美術館側の提供するテキスト情報を調べる仕組みになっている。

 このほか、InxightやGeoFusionのような検索ツールは、検索を通じて得られたデータを図式化して表示する。GeoFusionでは、地理データを取り扱うソフトウェアを開発しているが、同社の検索ツールは、タグを取りつけたマグロの動きを示す地図を描き出すことが可能だ。

 これに対し、Inxightのソフトウェアは、名前やトピックス同士の関係を示す見取り図を作り出す。このツールをつかって、たとえばホワイトハウスと実業界の情報を調べると、ホワイトハウスに最も多くリンクしている企業がHaliburtonであることがわかる。また、IBMでも自社のWebFountainプロジェクトで同様の試みを行っているが、こちらはあるニュースに対してブログ執筆者のつくる各コミュニティが、どれほど素早く一斉に反応したかを調べる実験に使われている。

この記事は海外CNET Networks発のニュースをCNET Japanが日本向けに編集したものです。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]