logo

米議会図書館、ツイートアーカイブの状況について発表--約1700億件を収集

Daniel Terdiman (CNET News) 翻訳校正: 編集部2013年01月07日 11時34分
  • このエントリーをはてなブックマークに追加

 米議会図書館は米国時間1月4日、継続的なツイートストリームをすべて収集していくプロセスを完成させたこと、そして、1700億件以上のツイートを整理する作業を開始していることを明らかにした。

 米議会図書館とTwitterの間で2010年に成立した合意の下、Twitterはすべての公開ツイートを含むストリーム全体を米議会図書館に提供している。2006年~2010年4月の間に生成された210億件のツイートが最初に提供され、現在、それ以降に投稿された約1500億件のツイートが追加されている。

 同プロジェクトの現状に関する2013年1月4日の発表の中で、米議会図書館は次のように書いた。

 米議会図書館にとって、Twitterは新しい種類の収集物だが、本館の使命にとって重要な収集物である。社会がコミュニケーションと創造的表現の主要な手段としてソーシャルメディアを採用するにつれて、研究図書館が日常的に収集している手紙や日誌、定期刊行物などの資料をソーシャルメディアが補足するようになった。一部の事例では、ソーシャルメディアがそれらを置き換えている。

 本館はこのアーカイブの構築と安定化に取り組んでおり、研究者へのアクセスはまだ提供していないが、世界中の研究者たちから約400件の問い合わせを受けている。研究者が関心を示しているテーマは広範で、市民ジャーナリズムの台頭の傾向や選出議員の通信内容から、予防接種率の追跡や株式市況の予測まで、さまざまなものが含まれる。

 米議会図書館は継続的なこのアーカイブがどのように利用されるのかについて、明確には述べていないが、本プロジェクトの概要を説明した白書(PDF)を発行している。

 Twitterは先頃、すべてのユーザーが自分の完全なツイート履歴をダウンロードできるようにする取り組みを発表したが、米議会図書館のプロジェクトはもちろんそれとは異なるものだ。Twitterの取り組みは現在進行中だが、現時点で、その機能にアクセスできるのは一部のユーザーに限られている。

 興味深いことに、米議会図書館は白書の中で、1700億件のツイートを含むアーカイブ全体の2つの完全なコピーが約133テラバイトのデータを構成していることを報告した。米議会図書館によると、それぞれのツイートには約50個のメタデータフィールドが追加されているという。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

-PR-企画特集