お使いのブラウザは最新版ではありません。最新のブラウザでご覧ください。

CNET Japan ブログ

WebFountainでGoogleの先を目指すIBM

2004/03/04 09:48
  • このエントリーをはてなブックマークに追加

プロフィール

umeda

シリコンバレーで経営コンサルティングを行なう傍ら、ベンチャーキャピタリストとしても活躍する梅田望夫さんが、IT業界の先を読むのに役立つ英文コンテンツを毎日紹介していきます。これを読めば、英語と業界動向を読む力が同時に身に付くはず(このブログの更新は2004年12月30日で終了しました)。
ブログ管理

最近のエントリー

CNET本体、News.comの記事「IBM sets out to make sense of the Web」が、IBMのWebFountainプロジェクトを取り上げた。必然的に、日本語訳もCNET Japanに掲載されている。「WebFountainで次世代の検索に挑むIBM」がそれだ。

「Traditional search engines such as Google are already hard-pressed to match search terms to specific Web pages. Now WebFountain and other projects will take on a task that's exponentially more complex.」(Googleをはじめとする従来型の検索エンジンは、検索語を特定のページと結びつける方法に関して、すでに行き詰まり状態だ。WebFountainやその他のプロジェクトが目指しているのは、これとは桁違いに複雑な作業である。)

「"Search is trying to find the best page on a topic. WebFountain wants to find the trend," said Dan Gruhl, chief architect of the project at IBM's Almaden Research Center in South San Jose, Calif.」(あるトピックに最もマッチするページを見つけるのが検索だとすれば、トレンドを見つけるのがWebFountainだ)

というわけで、明らかにGoogleの先を目指す大プロジェクトだと言っていい。

CNET Japanには今年から全記事にトラックバックが打てるという画期的機能がついたが、今日現在、このWebFountainの記事にはトラックバックが打たれていない。別にトラックバックが打たれていないからといって、あんまり読まれていない、というわけではないだろうが、本来ならばもっと注目を集めるはずの話だと思うので、ここで改めて、ご紹介しておきたい。

大企業にしかできないネットの研究開発

このIBMのWebFountainというプロジェクトは、大企業がネット関係の研究開発をやる場合、どういうスケールで研究をやらなければならないか、という本質的な問いかけに対する、IBMなりの答えだと、僕は考えている。

ネットの世界は、アマゾン、eBay、ヤフー、グーグルといった新興企業が、最先端の技術開発を行なっている。IBMといえども、自らネット事業を持っていないから、技術開発のための事業場が存在しない。よって日々オンライン・ユーザとのインタラクションの中で技術を磨く競争相手をキャッチアップしていくのは難しい。しかし、IBMにはカネがあって、才能もある。何かしておかなければならないというのも事実。そんなとき、数人のグループで何か新しいアルゴリズムなんか考えていたって、結局、仕方ない、やるからには大企業にしかできないスケールの大きな研究開発プロジェクトを起こすべきだ、そうIBMは考えて、100億円以上のカネを既に投入して、このプロジェクトが進んでいるのだと思う。やっぱりIBMは凄い。底力があると思う。

WebFountainについてのこのCNET記事は、英和対訳が既にあるので、そのくらいの解説で、ぜひ、日本語、英語を対照しながら、お読みください。

ところで、WebFountainについて初めてきちんと取り上げたメディアは英エコノミスト誌で、昨年秋のことではなかったかと記憶している。

調べたところ、同誌9月4日号「Fountain of truth?」が今も無償で読めるようなので、興味が湧いた方は、CNET記事を補足する形で、ぜひどうぞ。

さらに、学会誌のIEEE Spectrum誌は、2003年のコンピューティング分野におけるベスト研究開発プロジェクトに、このWebFountainプロジェクトを選び、詳しい解説を書いている。「A Fountain of Knowledge」がそれである。そして、この記事に対しては、1月14日の渡辺千賀Blog「Web Fountain」に解説がある。

「Web Fountainはインターネット上のぐちゃぐちゃなデータの形式を整えて、さらに適当な単語の属性(XMLタグ)を付加して、より意味のあるサーチや分析ができるようにする、というもの。例えば、"Mount Fuji"という単語が出てきたら、「地理的言及」、「緯度XX」「経度XX」といったタグを足したりする。

ものすごく壮大なプロジェクトである。IBMのサーバ上のデータ量は160テラバイトととてつもなく超巨大。

なお、spectrumの紙媒体のほうの記事によれば、この過程を通じてIBMが発見したことは・・

■ウェブの30%はポルノ

■ウェブの30%は他の繰り返し

■一日に新たに変更されるのは5千万ページ

■ウェブの65%は英語

なんだそうだ。なるほど・・・。」

この日本語解説を軽く読んでから、このIEEEの記事の原文にあたるといいと思う。また、「Roland Piquepaille's Technology Trends」というBlogには、解説とともに、これら以外のWebFountainに関する参考文献が提示されている。

Google成功の秘密

さて、検索といえばGoogle。Googleについては明日また触れるが、今日は、Goodpic「GoogleのAdSense広告戦略は、新市場型破壊による”イノベーションの解”か?」を読んでみてください。

「Googleはなぜ革新的なのか?IPOを控えてGoogle談義が花盛りのなか、幾つかの記事を読んでいると、クリステンセン氏の新著「イノベーションの解」で提起されている、”新市場型破壊”のパターンに、Googleが見事に一致するような気がしてきました。Yahoo!などの大手ポータルサイトが、なぜ当初はGoogleをパートナーとしていたのに、ここに来て急にGoogleと決別して、検索エンジンを自社開発したり、Overtureの買収をおこなったりしているのか。逆に言うと、なぜ初期の段階ではYahoo!は検索エンジンに、Googleを採用するという判断を下したのか。GoogleのAdWords、AdSense広告がなぜこれほどまでに急速に普及し始めたのか。この辺りの疑問を読み解くために、「イノベーションの解」の”無消費を市場にする”、”新市場型破壊のパターン”といったロジックが、非常に有効なアプローチとなるような気がします。」

という書き出しで始まる、GoogleのAdsenseとクリステンセンのイノベーション論を結び付けての詳細な解説Blogで、内容が非常に濃い。

Googleの先は何?

そして「Googleの先は何?」と考える人には、Esther Dysonが、「Life after Google」を書いているので、こちらもどうぞ。IBMのWebFountainが示す「次の方向」とは違う方向を指し示している。

「One sign of a truly successful venture is that everyone starts looking for its successor: What's the next big thing? The question on everyone's minds right now is, What comes after Google?」

「As Internet search evolves, it has to get more knowledgeable as well as more intelligent, incorporating concrete information about users and the real world they live in, instead of just more sophisticated yet abstract algorithms.」

と書き、新しい3つの方向性を、PERSONALIZATIONと、GEOGRAPHY-SPECIFIC RESULTSと、BETTER-DISPLAYED RESULTS、として提示している。

さて、このEstherの論についてもまた、SW's Memoが2回にわたって、「サーチの近未来(1)」「サーチの近未来(2)」と題してBlogで詳細に解説している。

今日はIBMのWebFountainを皮切りにサーチの未来についての最近の論考をざっと見てきたが、そのほぼすべてに日本語訳や日本語による紹介や解説があるという状況になっていることに気づく。素晴らしい。1年半前とは大違いである。今日はたまたま引用しなかったが、サーチエンジン専門の日本語Blog「エッセンシャル・サーチエンジン」でも、ほぼ毎日、サーチについての最新動向の分析が行なわれている。

僕がBlogなどという言葉を知り、個人サイトで何か始めてみようと思ったのが2002年10月のこと。CNET Japanがリニューアルして新体制がスタートしたのが2003年1月。この連載を始めたのが2003年3月。今回ご紹介したBlogでは、渡辺千賀Blogのスタートが2002年11月。GoodpicSW's Memoと「エッセンシャル・サーチエンジン」のスタートも2003年のどこかだったと記憶している。いずれにせよ、1年半前と今とでは、少なくとも僕の関心領域に近いところでの日本語Blogの充実度合いが全く様変わりしてしまった (先週の「観察・啓蒙系」の議論以来、いくつかの質の高い日本語Blogを例としてご紹介したが、その大半が2002年後半から2003年生まれ) 。Blogの拡がりと共に、英語で書かれたIT関連記事・Blogについての日本語によるカバレージは確実に増えてきている。そのことが、今日のエントリーからもよくおわかりいただけるのではないかと思う。

※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。
運営事務局に問題を報告

最新ブログエントリー