情報洪水に立ち向かう--次世代検索ツール開発へのさまざまな取り組み - (page 2)

Michael Kanellos (CNET News.com)2004年08月11日 10時07分

膨れあがる情報量

 過去にインターネット上で公開された全ての情報を保存しようとしている「Internet Archive」の設立者、Brewster Kahleによると、このプロジェクトから現れた衝撃の事実の1つは、本や映画など、数多くの公の作品が同団体のデータベースに保存される可能性があることだという。

 Kahleは、カーネギーメロン大学のRaj Reddy教授による推計を引用し、これまでに出版された本の総タイトル数はおよそ1億1000万に上ると述べた。そのうちで、米国議会図書館(LOC)に収蔵されているのは、およそ2800万タイトルだ。そして、本1冊分の情報は、Microsoft のWord形式のファイルで保存した場合、平均で1メガバイトまで圧縮可能だ。つまり、LOCの蔵書は容量が28テラバイトのストレージシステムに全て収まることになる。

 Reddyは「家1軒分の費用で、LOCを持つことが出来る」と述べ、さらに現在インドや中国では大量の書籍をスキャナーで読み取るプロジェクトが進行中だ、と付け加えている。

 一般消費向けに発売された録音(その大半は音楽)の数はおよそ200〜300万にすぎない。Internet Archiveは各種コンサートのデジタル録音の保存を開始しており、これまでに同団体のデータベースに保存されたショーの数はおよそ1万5000に上る。また、現在10万〜20万本の劇場用映画(そのうちの半数はインド製)が存在し、1ヶ月におよそ20テラバイト分のテレビ番組が放送されている。さらに、ウェブ上で公開されている圧縮データも毎月およそ20テラバイト分ずつ増えている(1テラバイトは1兆バイトに相当)。そして、1984年以降に発表されたCD-ROMを含むソフトウェアの数は、およそ50000タイトルに上る。

 これら全ての情報の保存/視聴に関しては依然として法的問題が多いが、それらを保存することは現在でも可能だ。

 Kahleは、「人類が保有する全ての知識に自在にアクセスできる時代が間近に迫っている」と述べ、さらに「これは空前の大偉業の1つとなる可能性がある」と語った。

 しかし依然として入手すべき情報は多い。同様に、各ユーザーの個人的なデータカタログも今後、爆発的に急増することになる。Microsoftの基礎研究所、Microsoft Researchで現在行なわれている「MyLifeBits」プロジェクトでは、Gordon Bellという著名な科学者が生涯で出会った全ての書籍、映画、テレビ番組、音楽、その他のメディアをデジタル化する試みを進めている。Bellはこれまでに44ギガバイト分のデータのデジタル化に成功した。

 電子メール、電話のメッセージ、自分で撮影した写真やビデオもまた、個人のデータライブラリーに追加されることになる。英国のケンブリッジでは、医師らが重度の記憶喪失を患う患者らにMicrosoft SenseCamというウェアラブルなカメラを着用してもらい、移動時に捉えた視覚情報を残すという実験を行っている。同プロジェクトに参加するKen Woodによると、記憶障害をかかえる自分の妻に、このカメラを使って記録したその日の出来事を見せている男性もいるという。

 Microsoftはまた、スコットランドで行われるEdinburgh International Festivalと、3年間にわたってあるさまざまな実験を行うことになった。そのうちのある実験では、参加者がSenseCamを首にぶら下げてアート作品の展示された会場をまわり、気に入ったものがあればそれをスナップ写真に撮る、というものになりそうだ。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]