増殖するインターネット
1993年にインターネットブラウザの祖『MOSAIC』がリリースされてから、インターネットは世界規模で本格的に普及しました。”インターネットの大きさ”というものをウェブページの数で考えてみると、1995年には約3億ページという統計データがあり、それから10年経った2004年の時点では150億ページにまで膨れあがってます。

それが、2006年時点で総ページ数が約330億ページとなり、かつて10年かけて100億ページ増えたものが、単純にいえば、1年に100億ページずつ増えている計算になります。
純粋にインターネット上で公開される知識が猛烈な勢いで増えているかというと決してそういう理由ではありません。
この増殖を加速させている要因はふたつ。
ツールとしての『ブログ』と、モチベーションとしての『アフィリエイト』。
誰もがインターネットに自分の投稿を手軽に公開できるというブログは、ツールとしてはとても便利なものであり、企業もプロモーションにこぞって活用するなどマーケティングツールとしてのポジションも獲得している技術です。また、RSSフィードをうまく利用することで”フィード広告”なる新たな広告手法も出現してきました。
その一方で、どこかに書いてある情報をそのまま自分のブログに転載することも簡単にできますし、それを増長させているのが小遣い稼ぎのための『アフィリエイト』です。
つまり、自ら発信する情報を持っていないユーザーが、ブログで日々膨大なページを複製しているのです。一見検索サイトのように見えていながら、Overtureのリスティング広告だけで成り立っているトリッキーなサイトも多数あります。また、アフィリエイトで広告収入が得られることを謳い文句に、ブログで特定の商品についてのレビューを書かせるプロモーション手法も増えてきています。
国内海外問わず、検索サイトでキーワードを検索して表示される結果に似たような情報が何十何百とリストされるのはこのブログが原因なのです。
二分化するブログの使われ方
ブログが日記型ウェブのことだと誤解され、本来もっている特長が活かされていないといってもいいでしょう。
現在、ブログは、簡単にウェブページを公開できるCMS(Contents Management System)としての使われ方と、誰もが手軽に情報発信できる公開日記としての使われ方が主流になっています。しかし、ブログ固有の機能である『トラックバック』を正しく活用しているサイトは残念なことに非常に少ないのです。
元々『トラックバック』は、インターネット上での”引用”や”参考文献”を指し示す役割をするものであり、欧米の批評文化を機能に落とし込んだものと言えます。他人の意見を忠実に示しつつ自分の意見を主張をするという Critique というものが根底にあり、BBS上の匿名の荒らしや、メーリングリストでのflameというネットのネガティブな要素を払拭するものでもありました。
さらに『トラックバック』が画期的なのは、BというページからAというページに対して『トラックバック』すると、自動的にAからBへの『バックリンク』も張られるという機能を持っていることです。それまでのリンクは一方的なもので、Aに対してBがリンクを張るのは任意の行為であり、Aがそれを拒否するということも技術的には出来ないという特徴を持っていました。
つまり、一般的に言われるリンク(狭義のHyperText)には”ベクトル(指向性)”があったのです。
Googleの特許、PageRankについておさらい
Googleの非常に優れている点は、使い勝手の良いシンプルな画面構成、キャッシュを利用したアーカイブ、検索結果のサマリの的確さ、高速インデックシングを実現するクラスタリング技術などとあわせて、PageRankというウェブページ重要度自動判定技術にあると言えます。
あくまで目的は、ユーザーがもっとも必要としているものを的確にしかも自動的に判断し、結果として表示することにあり、PageRankが卓越した数学的アルゴリズムである以上に、社会工学的な観点から練り上げられた技術なのです。
社会における人間関係の相関を考えてみた場合、かならず「ハブ」となる人が思い当たります。
マルコム・グラッドウェル著「ティッピング・ポイント」では「コネクター(媒介者)」ともいわれる人は、とにかく顔が広く、しかも、幅広い分野の重要人物を知っている。1つひとつの絆はそれほど強くなくても、絆の多さには右に出るものがいない。いわば「弱い絆の達人」ともいえる。新しい知識を得たい、新しい関係を築きたいという場合、この「コネクター」を通じてそれらに接触することが多いとしています。
「コネクター」はある程度の数の絆を持つと、それを基に爆発的に人との関係が増えていき、同時にそれらの人間関係のリンクから常になんらかの情報が(有益、無益に関係なく)もたらされるようになるという意味で「ハブ」の役割を果たすことになります。しかも、あらゆる情報を平等に伝えるのではなく、inbound情報に独自のフィルタリングを行った上でoutbound情報をつくりあげ、さらにそれを適切な人に伝えることが多く、結果として「コネクター」から受け取った情報は自分にとって非常に有益であり、「コネクター」が紹介してくれた人物とは新たな絆(リンク)が持てる相手となると説明しています。
PageRankはまさにこの社会工学的なリンク構造をネットワーク上のページの相関関係に持ち込んだものなのです。つまり、「多くの有用なページからリンクされているページは、やはり有用なページである」ということを、100億ページのリンク構造によって判定しているのです。判定の具体的なポイントは以下の3つ。
1. たくさんのページからリンクされているか(被リンク数)
2. 人気度の高いページからのリンクか(PageRankの高いページからか)
3. 選び抜かれた上でのリンクか(リンク元ページのフィルタリング)
被リンク数の多さというのは、やはりひとつしかリンクされていないページよりもたくさんのページからリンクされている方が情報として有用であると判断することを示しています。このとき、コンテンツとしての情報が正しいかどうかは無関係で、これもリンクを張る人がそれぞれ判断した結果であるから近似的に「正しい情報」と見なしているのです。学術論文など、引用回数が多い論文がリファレンスとなっていくことと同じです。このアルゴリズムによって、カルト的なサイトや特殊な情報を提供するページなど被リンク数の少ないページはランキングが低くなります。
次に、人気度の高いページからリンクされているかどうかも指標となっている。Yahooなどのポータルサイトからのリンクや、企業のオフィシャルサイトからのリンクなどがあると「類は友を呼ぶ」的な良質のページであると判断されます。質の高いサイトの運営者がなんらかの判断を下して然るべきページにリンクしたと捉え、そのページの持つ情報そのものの質が高いと見なすわけです。このアルゴリズムによって、風説や虚偽の情報など信頼性にかける情報を掲載しているページはランキングが低くなります。
さらに重要なアルゴリズムとして、リンク元のページが持つリンク数が少ないかどうかを判定の基準としてます。これは、リンク集としてやたらに多くのサイトにリンクをもっているページからリンクされていてもランキングは高くならないことを示しています。アダルトサイトのように多数の相互リンクをもっているようなページはこのアルゴリズムによってランキングが低くなります。
これらのアルゴリズムは現実のインターネット空間の性質を数学的に捉えてプログラム化したものであり、スケール・フリー・ネットワークのトポロジーを反映させた理論である。最新のネットワーク・トポロジー研究によってもたらされた学術的な裏付けのある仕組みのため、このアルゴリズムを越えた検索エンジンを開発するのは容易ではないことが、Googleの優位性が保たれている大きな理由です。
トラックバックがPageRankを崩壊させる
正確には、トラックバックによる『バックリンク』が問題となります。
PageRankはなるほど素晴らしい理論であり、それを数億個の変数と数十億の用語の等式を駆使したアルゴリズムによって実現しているのは驚嘆に値します。しかし、それは大前提として『リンクにはベクトルがある』から成り立っているのです。
AからBにトラックバックしたことで、BからAにもバックリンクが張られ、リンク構造としては「A<->B」として相互リンクと同等になってしまうことは、PageRankの原理に含まれていないのです。
実際、ここ数年Googleで検索したときのリストから、本来必要としている事実やリファレンスとなるデータを見つけるのが難しくなり、何ページもリストを丹念に見ないと目的のページにたどり着けないと感じた経験は誰もがしているのではないでしょうか。通常のウェブページとブログページを見分けるのは容易であり、トラックバックのベクトルを見分けることも技術的に困難なことではありません。しかし、ブログページあるいはバックリンクのあるページが価値が低いとは一概に言えないのです。
Googleはこの問題に対して技術的な解決を当然試みていますし、それは「TrustRank」という名称を商標登録していることからも窺えます。
情報の信頼度をどのように判定するか、かつてのPageRankとは異なるアルゴリズムが必要とされていますし、今がGoogleの優位性を覆す絶好の機会なのかもしれません。
信頼に値する情報の源流を押さえるGoogle
今後ブログがどちらの方向に向かっていくかでGoogleの優位性が揺らぐと推測しています。
アフィリエイト目的のブログがさらに増え、しかもPageRankをあげるために無差別にトラックバックするスパムも増え、その中にあっても正しく使われるブログの割合も多い場合には、リンクのベクトルを分析するPageRankで情報の信頼度を判定することは困難になります。
アフィリエイトリンクの張られたページのランクを下げたり、スパムリンクを排除したり、ブログだけ別扱いでカウントしたりと弛まぬ努力は続いていますが、「TrustRank」としてリリースできるアルゴリズムには到達していません。
最近では、スパムリンクを避けるためにトラックバック機能をオフにして、CMSとしてブログを使うサイトも多くなってきました。CMSがメインとなり、トラックバックが廃れていくのであれば、Googleは安泰でしょう。
そうでない場合のリスクを考慮した戦略とは?
ブログのように無目的に誰もが簡単に使えるものではなく、ある程度のスキルと特定の目的が必要で、さらにはデモグラフィックとサイコグラフィックでセグメント化された『信頼できる情報』を生み出す源流を獲得する戦略を取ったのが最近のGoogleのJotSpotやUpstartle、YouTubeなどの企業買収の真相ではないでしょうか。
※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。
賃貸 on 2007/07/25
目次 [非表示]
1 日本の留学 史
1.1 古代
1.2 中世から近世
1.3 近代
1.4 第二次世界大戦後
1.5 現代
2 留学の種類
2.1 海外留学
2.2 交換留学
2.3 私費留学
2.4 官費留学
3 関連項目
4 外部リンク
留学 on 2007/07/25
桜谷さんども。
PageRankだけが有名になってますけどGoogleの順位表示はもっと多用な要素を組み合わせて使っています。少なくとも2000年ごろにAll Aboutで試して検証した感触ではちょっとしたことで差が出ていました。サイトごとにPageRankの重みをチューニングしてロジックに手を入れているのだろうとみています。
で、結論は前と同じでGoogleを上回る検索結果を出せるサイトができた日が新時代の始まりかと思います。
多聞 on 2006/12/02
コメントありがとうございます>多聞さん
おっしゃる通り、すべてが万能のPageRankというわけではなく、インターネットの変容に応じて実ロジックでチューンしていかなければすぐに使い物にならなくなるのが現状だと思います。
ただ、実ロジックの比重が大きくなると、ライバルの検索サイトも同じような対応が出来るために、優位性の維持が難しくなると言えるでしょう。
nofollowで随意にアンカー属性をコントロールすることもできますが、それではページの信頼性の評価につながらないですね。
記事の書き方がちょっとagitativeだったので、批判的なトラックバックもたくさんありますが、投稿の真意は多聞さんの書かれているように、社会工学とスケールフリーネットワーク理論から生まれたPageRankが現在のインターネットの状態を正しく反映できなくなっていて、そろそろ斬新な理論の検索エンジンができる予感がするということなのです。
桜谷 on 2006/12/02
桜谷さん、こんちは多聞です。
力作お疲れ様です。PageRankは論文や理論としてのPageRankとGoogleが日々チューニングしながら最適な結果が出るように腐心しているGoogleの実ロジックを分けて考えるべきだと思います。つまり、さまざまなパラメータを使って補正して今ベストと考えられる結果を出すべく、ロジックが改良を続けられているからです。
2001年ごろGoogleにヒットするのは2ちゃんねるばかりの時がありました、また一時期は、はてな ばかりの時もありました。その後違和感を感じなくなっているのは何かの係数とかで調整されて言ったからだと思います。
結局、「正しい」検索結果など無いので、Googleを上回ると実感される検索エンジンが生まれた日がその限界が確認される日かもしれません。
多聞 on 2006/12/01
ブログにコメントするにはCNET_IDにログインしてください。
メンバー限定サービスをご利用いただく場合、このページの上部からログイン、またはCNET_ID登録(無料)をしてください。
賃貸 マンションはあなたの夢を叶えます。1人暮らしを夢見ている人は、ぜひこの文章を読んでみてください!そして、賃貸 マンションの魅力を知ってください!独り立ちの夢を、家族との団欒の夢を、賃貸 マンションはきっと叶えてくれるはずです。この文章を読み終えたときにきっとあなたは賃貸 マンションのことをさらに好きになっているでしょう。そして、賃貸 マンションについてもっと知りたくなっていることでしょう。あなたも、賃貸 マンションの魅力に触れてみませんか?