> >

Web 2.0：次世代ソフトウェアのデザインパターンとビジネスモデル（後編）

Tim O'Reilly2005年11月09日 08時00分

特集

※この記事はWeb 2.0：次世代ソフトウェアのデザインパターンとビジネスモデル（前編）の続きです。

3. データは次世代の「インテル・インサイド」

　重要なインターネットアプリケーションには必ず、それを支える専門のデータベースがある。Googleのウェブクロール、Yahoo!のディレクトリ（とウェブクロール）、Amazonの製品データベース、eBayの製品／出品者データベース、MapQuestの地図データベース、Napsterの分散型楽曲データベースなどだ。昨年、Hal Varianは個人的な会話の中で、「SQLこそ、次のHTMLだ」と語った。データベース管理は、Web 2.0企業のコアコンピタンス（中核能力）でもある。このため、これらのアプリケーションは単にソフトウェアではなく、「インフォウェア（infoware）」と呼ばれることもある。

　この事実は、ある重要な問いを投げかける。それは「そのデータを所有しているのは誰か」というものだ。

　インターネット時代には、データベースをコントロールすることによって市場を支配し、莫大な収益をあげた企業が少なくない。当初は政府の委託を受けて、Network Solutions（後にVerisignが買収）が独占したドメイン名登録事業は、インターネットにおける最初のドル箱事業となった。インターネット時代には、ソフトウェアAPIを支配することで、ビジネス上の優位を確保することははるかに難しくなると書いたが、重要なデータソースを支配した場合、優位を確保することはそう難しくない。そのデータソースが作成に莫大な資金を必要とするものだったり、ネットワーク効果によって、収益を拡大する見込みのあるものだったりする場合はなおさらだ。

　たとえば、MapQuest、maps.yahoo.com、maps.msn.com、maps.google.comなどが生成する地図には必ず「地図の著作権はNavTeq、TeleAtlasに帰属します」という文章が添えられている。最近登場した衛星画像サービスの場合は、「画像の著作権はDigital Globeに帰属します」と書かれている。これらの企業は莫大な資金を投じて、独自のデータベースを構築した（NavTeqは7億5000万ドルをかけて住所／経路情報データベースを構築したと伝えられている。Digital Globeは公的機関から供給される画像を補完するために、5億ドルをかけて自前の衛星を打ち上げた）。NavTeqに至っては、お馴染みの「インテル・インサイド」ロゴを模倣し、カーナビシステムを搭載した車に「NavTeq Onboard（NavTeq搭載車）」のマークを付けている。実際、これらのアプリケーションにとって、データは「インテル・インサイド」と呼ぶにふさわしい重要性を持っている。ソフトウェアインフラのほぼすべてをオープンソースソフトウェアやコモディティ化したソフトウェアでまかなっているシステムにとって、データは唯一のソースコンポーネントだからだ。

　現在、激しい競争が繰り広げられているウェブマッピング市場は、アプリケーションの核となるデータを所有することが、競争力を維持する上でいかに重要かを示している。ウェブマッピングというカテゴリは、1995年にMapQuestが作り出したものだ。MapQuestは先駆者だったが、Yahoo!、Microsoft、そして最近ではGoogleといった新規参入者の台頭を許した。これらの企業はMapQuestと同じデータの使用許諾を受けることで、同社と競合するアプリケーションをやすやすと構築することができた。

　それと対照的なのがAmazonである。Barnesandnoble.comなどの競合企業と同じように、Amazonのデータベースも当初はR.R. Bowkerが提供する「ISBN（国際標準図書番号）」をもとにしたものだった。しかし、MapQuestと異なり、AmazonはBowkerのデータに出版社から提供される表紙画像や目次、索引、サンプルなどのデータを追加することで、データベースを徹底的に拡張していった。さらに重要なのは、これらのデータにユーザーがコメントを加えることを可能にしたことである。10年たった今では、BowkerではなくAmazonが書誌情報の主要な情報源となっており、消費者だけでなく、学者や司書もAmazonのデータを参照している。また、Amazonは「ASIN」と呼ばれる独自の識別番号も導入した。ASINは書籍のISBNに相当するもので、Amazonが扱う書籍以外の商品を識別するために利用されている。事実上、Amazonはユーザーの供給するデータを「積極的に取り込み、独自に拡張（embrace and extend）」したのである。

　これと同じことを、MapQuestがしていたらどうなっていただろうか。ユーザーが同社の地図と経路情報にコメントを加え、幾重にも付加価値を加えることができるようにしていたら、同じ基礎データを手に入れるだけで、他社がこの市場に参入することはできなかっただろう。

　最近登場したGoogle Mapsは、アプリケーションベンダーとデータ供給者の競争をリアルタイムで観察できる場となっている。Googleの軽量なプログラミングモデルを利用して、サードパーティがさまざまな付加価値サービスを生み出しているが、これらのサービスはGoogle Mapsとインターネット上のさまざまなデータソースとを組み合わせたマッシュアップの形を取っている。Paul Rademacherの housingmaps.comは、Google MapsとCraigslistの賃貸アパート／売家情報を組み合わせたインタラクティブな住宅検索ツールだ。これはGoogle Mapsを利用したマッシュアップの傑出した例ということができる。

　今のところ、これらのマッシュアップの大半は、ハッカーによる斬新な試みの域を出ていないが、そのすぐ後ろでは企業家たちが列を成して、好機をうかがっている。少なくとも一部の開発者の間では、Googleはすでにデータソースの座をNavteqから奪い、最も人気のある仲介サービスとなっている。今後数年にわたって、データ供給者とアプリケーションベンダーの間では競争が繰り広げられることになるだろう。Web 2.0アプリケーションを開発するためには、特定のデータがきわめて重要な役割を果たすことを、双方が理解するようになるからである。

　コアデータをめぐる争いはすでに始まっている。こうしたデータの例としては、位置情報、アイデンティティ（個人識別）情報、公共行事の日程、製品の識別番号、名前空間などがある。作成に多額の資金が必要となるデータを所有している企業は、そのデータの唯一の供給元として、インテル・インサイド型のビジネスを行うことができるだろう。そうでない場合は、最初にクリティカルマスのユーザーを確保し、そのデータをシステムサービスに転換することのできた企業が市場を制する。

　アイデンティティ情報の分野では、PayPal、Amazonの「1-click」、大勢のユーザーを持つコミュニケーションシステムなどが、ネットワーク規模のIDデータベースを構築する際のライバルとなるだろう（Googleは携帯電話番号をGmailのアカウント認証に用いる試みを始めた。これは電話システムを積極的に採用し、独自に拡張する一歩となるかもしれない）。一方、Sxipのような新興企業は「連携アイデンティティ（federated identity）」の可能性を模索している。Sxipが目指しているのは、「分散型1-click」のような仕組みを作り、Web 2.0型のシームレスなアイデンティティ・サブシステムを構築することだ。カレンダーの分野では、 EVDBがwiki型の参加のアーキテクチャを使って、世界最大の情報共有カレンダーを構築しようとしている。決定的な成功を収めた新興企業やアプローチはまだないが、こうした分野の標準とソリューションは、特定のデータを「インターネットOS」の信頼できるサブシステムに変えることによって、次世代アプリケーションの登場を可能にするものとなるだろう。

　データに関しては、プライバシーと著作権の問題にも言及しておかなければならない。初期のウェブアプリケーションは、著作権をあまり厳密には行使してこなかった。たとえば、Amazonはサイトに投稿されるレビューの権利が同社に帰属すると主張しているが、その権利を実際に行使しなければ、ユーザーは同じレビューを別のサイトに投稿するかもしれない。しかし、企業はデータ管理が競争優位の源泉となることを認識しつつあるので、今後はデータ管理がこれまでよりも厳しく行われることになるかもしれない。

　プロプライエタリなソフトウェアの興隆が、フリーソフトウェア・ムーブメントをもたらしたように、プロプライエタリなデータベースの興隆によって、今後10年以内にフリーデータ運動が起きることになるだろう。反動の兆しはすでに現れている。WikipediaやCreative Commonsなどのオープンデータプロジェクト、サイトの表示をユーザーがカスタマイズできるGreasemonkeyなどのソフトウェアプロジェクトはその一例だ。