米議会図書館は米国時間1月4日、継続的なツイートストリームをすべて収集していくプロセスを完成させたこと、そして、1700億件以上のツイートを整理する作業を開始していることを明らかにした。
米議会図書館とTwitterの間で2010年に成立した合意の下、Twitterはすべての公開ツイートを含むストリーム全体を米議会図書館に提供している。2006年~2010年4月の間に生成された210億件のツイートが最初に提供され、現在、それ以降に投稿された約1500億件のツイートが追加されている。
同プロジェクトの現状に関する2013年1月4日の発表の中で、米議会図書館は次のように書いた。
米議会図書館にとって、Twitterは新しい種類の収集物だが、本館の使命にとって重要な収集物である。社会がコミュニケーションと創造的表現の主要な手段としてソーシャルメディアを採用するにつれて、研究図書館が日常的に収集している手紙や日誌、定期刊行物などの資料をソーシャルメディアが補足するようになった。一部の事例では、ソーシャルメディアがそれらを置き換えている。
本館はこのアーカイブの構築と安定化に取り組んでおり、研究者へのアクセスはまだ提供していないが、世界中の研究者たちから約400件の問い合わせを受けている。研究者が関心を示しているテーマは広範で、市民ジャーナリズムの台頭の傾向や選出議員の通信内容から、予防接種率の追跡や株式市況の予測まで、さまざまなものが含まれる。
米議会図書館は継続的なこのアーカイブがどのように利用されるのかについて、明確には述べていないが、本プロジェクトの概要を説明した白書(PDF)を発行している。
Twitterは先頃、すべてのユーザーが自分の完全なツイート履歴をダウンロードできるようにする取り組みを発表したが、米議会図書館のプロジェクトはもちろんそれとは異なるものだ。Twitterの取り組みは現在進行中だが、現時点で、その機能にアクセスできるのは一部のユーザーに限られている。
興味深いことに、米議会図書館は白書の中で、1700億件のツイートを含むアーカイブ全体の2つの完全なコピーが約133テラバイトのデータを構成していることを報告した。米議会図書館によると、それぞれのツイートには約50個のメタデータフィールドが追加されているという。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」