--ただ、そうやって情報を増やしていくと、情報の洪水に溺れそうですね。
そこで登場するのが情報の重要度を割り出して絞り込むことですが、これは純粋な計算だけである程度割り出すことができます。
ただ、実はユーザーは関連性のあるトピックについては、情報が多ければ多いほど喜ぶのです。もちろん、ここで重複している情報などは邪魔になるので、そういう邪魔な要素を取り除いて同じトピックについて、より効率的に多角的な情報を提供できるようにするというのがGoogle Newsの目標の1つです。
--Google Newsが、2001年に実現したということには、何か技術的な背景があるのでしょうか。つまり、Google Newsの実現に必要な技術などはあったのでしょうか。
Google Newsが始まったときには、コンテンツをリアルタイムで索引するインフラストラクチャーができあがっていました。
それ以前の検索エンジンは、クローラーと呼ばれるロボットが、ときどきインターネットのいろいろなウェブページを巡回して、新しい情報を索引化(インデックス化)するといった仕組みで動いていました。リアルタイムのインデックス化は、我々に新鮮なコンテンツの活用を可能にし、ニュースを提供する上で必要不可欠なものでした。
--すると、Google Newsはそのインデックス化技術とKrakatoa Chronicleの経験の融合と考えていいのでしょうか。
詳細に言えば、まずGoogleが持っていたコンテンツを引っ張ってくる技術と、リアルタイムにインデックス化する技術があります。そこに私のInformation Retrieval(情報の取り出し)技術が加わります。1つのウェブページには、ニュース記事の本文だけではなく、他にもいろいろな要素があるので、そこから記事本文だけを取り出す必要があるのです。
その上に、新開発した情報のクラスタリング技術や、個々のトピックの価値を「情報の新鮮さ」といった軸で評価する技術を加えたもの、そう言った方が正確かもしれません。
--現在、Google Newsは日本語を含む、いろいろな国の言葉で提供されていますが、これらはすべて同じアルゴリズムで実現しているのでしょうか。
そうです。キャラクターコードなどの違いはありますが、ウェブページから記事を取り出し、インデックス化したらその後の評価などはまったく同じ手法でできます。
--Google Newsは、いわゆるニュースサイト専用に構築されていますが、将来的には例えばブログなどを読むことにも応用できるのでしょうか。
それは興味深い質問ですね。正直、答えはわかりません。でも、ニュースとブログには新鮮さが大事という点などいくつかの共通点があります。
その一方で、相違点も多いです。ブログで書かれている内容そのものは必ずしも新鮮とは限らないし、そもそもちゃんとしたニュースではないことも往々にしてあります。
--最近、注目されているトレンドというのはありますか。
技術的なトレンドではありませんが、人々の情報の求め方が変わってきていると思います。最近、人々は興味のある話題については、より多角的な情報を求めたり、より深く掘り下げて知ろうとしています。
そうした時代の潮流を察知してか、英国BBCのニュースサイトでは、必要があれば他社のニュースにも積極的にリンクをするようになってきています。これまでは他のニュースサイトに顧客を誘導するなんてことは考えられませんでしたが、非常に健全なトレンドだと思います。
ブログがここまで広がってきたのも、こうした背景があったからでしょう。ブログ記事の多くは、いろいろなニュース記事への誘導元となっています。
今、ウェブのニュースで最も重要と考えているのは「新鮮さ」、「多様性」、「相互リンク」、「市民ジャーナリズム」の4つです。
今後ブログを書く人たちが、その経験を通して事実に基づいた公正かつ平等な評価をする術を身につけていけば、従来のニュースサイトとブログを基盤とした市民ジャーナリズムがうまく共存することになるのではないでしょうか。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
「もったいない」という気持ちを原動力に
地場企業とともに拓く食の未来
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」