だが、世界中の何百万冊もの書籍をオンライン利用できるようにするのは、きわめて困難な作業だ。出版社が所有する著作権やデータの保管/バックアップ方法、人件費など、解決すべき問題は多い。Internet Archiveによれば、100万冊の書籍をデジタル化して保管するだけでも、6ペタバイトもの容量が必要だという。一方、Googleはおよそ1000万件のウェブドキュメントを蓄積しており、その容量は1.7〜5ペタバイト程度であると言われている。
同社のプロジェクトに関しては、あるやっかいな問題がすでに法廷闘争へと発展している。一部の出版社や著者が、Googleが彼らの著作権を侵し、公正使用法の適用範囲を逸脱していると主張しているのだ。Googleでは、書籍スキャンプログラムに出版社の「不参加制」を導入している。つまり、出版社が自社発行物のスキャンを希望せず、Googleのウェブインデックスに掲載されるのを避けたいと考えている場合は、その旨をGoogleにみずから通達しなければならない仕組みなのだ。
Internet Archiveはこれとは対照的に、公共化されていたり、著作権保有者がスキャンを許可したりした書籍だけを扱うとしている。
Internet Archiveがこうした取り組みを始めてからすでに数年経過しているが、これに弾みがついたのは、「Open Content Alliance」を立ち上げたここ最近のことだ。同アライアンスのメンバーには、Adobe Systemsやコロンビア大学、European Archive、Biodiversity Heritage Library、Smithsonian Institution Librariesなどが含まれている。
ウェブ検索に投資を行い、自社の独自サービスへのアクセスを増やそうともくろむYahooやMSN Searchも、アライアンスの主要なメンバーである。25日に両社は同プロジェクトの公共性をアピールしたが、オープンソースプロジェクトに対する彼らの支持は、Googleのプロジェクトに張り合うための戦略とも見られる。両社は、最終的にMSN SearchおよびYahooの検索を利用して、同オープンソースライブラリを検索できるようにするという。
こうした企業は、同プロジェクトの金銭面をサポートしている。例えば、MSN Searchは約500万ドルを投じて、15万冊の書籍のスキャンに尽力すると発表している。これらのデータは、2006年中にライブラリに追加される。
Internet Archiveは、「Open Library」と称するウェブサイトを先週開設し、今後はここに世界中の書籍データを収容していくことを明らかにした。現在は、15件のデジタル化作品を公開して、プロジェクトのデモンストレーションを行っている。なお、同ウェブサイトのインターフェースは、英国のBritish Libraryのものを参考にしているという。
Internet Archiveはまた、カリフォルニア大学のアーカイブプロジェクトが選んだ、著作権の切れた小説1万8000冊をデジタル化すると述べている。
この記事は海外CNET Networks発のニュースを編集部が日本向けに編集したものです。海外CNET Networksの記事へ
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス