数々の新手のツール
膨大なデータをうまく管理するためのアプローチの1つは、特定のトピックやデータセットに特化した検索エンジンを開発することだ。UCバークレーのFlamencoプロジェクトでは、このアプローチを採用している。
FlamencoはYahooに似たインターフェイスを持ち、世界中の美術館が所蔵するコレクションから集めたアート作品が、内容(たとえば、動物、天国と地上、形状や色など)や、製作年代、作者、メディア(絵画、家具、彫刻など)その他の属性に従って、このインターフェイス上に分類表示される。ユーザーは、枝分かれした分類を上下しながら、このデータベースに収められたあらゆる動物の絵を閲覧したり、あるいはたとえば1700年から1709年の間に焦点を合わせ、この時代の作品を眺めたりできる。その結果(あくまでこのデータベースに収められた作品に限っての話だが)、この期間には蹄をもつ動物の絵が4枚しか描かれていないことを発見するのだ。
この検索エンジンは、絵画に含まれる視覚情報を探す代わりに、その作品をデータベース登録用にデジタル化した美術館側の提供するテキスト情報を調べる仕組みになっている。
このほか、InxightやGeoFusionのような検索ツールは、検索を通じて得られたデータを図式化して表示する。GeoFusionでは、地理データを取り扱うソフトウェアを開発しているが、同社の検索ツールは、タグを取りつけたマグロの動きを示す地図を描き出すことが可能だ。
これに対し、Inxightのソフトウェアは、名前やトピックス同士の関係を示す見取り図を作り出す。このツールをつかって、たとえばホワイトハウスと実業界の情報を調べると、ホワイトハウスに最も多くリンクしている企業がHaliburtonであることがわかる。また、IBMでも自社のWebFountainプロジェクトで同様の試みを行っているが、こちらはあるニュースに対してブログ執筆者のつくる各コミュニティが、どれほど素早く一斉に反応したかを調べる実験に使われている。
この記事は海外CNET Networks発のニュースをCNET Japanが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
住環境に求められる「安心、安全、快適」
を可視化するための“ものさし”とは?
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス