logo

MSNサーチが検索市場にもたらすもの

  • このエントリーをはてなブックマークに追加

MSNサーチ Technology Preview

 MicrosoftはMSNサーチ Technology Preview2.0を今週公開する。

 新たな機能追加ポイントは以下の通りである。

 1. 日本語への対応
Preview1.0では含まれなかった日本語に対応した
 2. ドメインのまとめ表示機能
同一ドメインの検索結果サイトをまとめインデント表示する
 3. キャッシュページ
検索結果に表示されたページのキャッシュを表示する
 4. キーワード提案機能
よくあるスペルミスや誤変換に対して代替のキーワードを提案する

 Technology Previewは開発中の検索技術を早期公開することで、広くユーザの意見を次期バージョンに反映させるためのものである。前回の米国のPreviewでは多数の意見が取り入れられ、今回のバージョンに採用されている。

 日本のMSNサーチについてもユーザの要望を積極的に取り入れたいという。表示順位のアルゴリズムや、表示方法、インタフェースなどについて、意見のあるユーザにとって今がチャンスになるだろう。

 こうしたPreviewの先に、Microsoftは何を用意しているのだろうか。

 Preview公開にあたり来日した米MicrosoftでMSN Searchのプロダクトプランニングチーム ディレクターを務めるRichard Chin氏にインタビューした。その内容を元に前半ではMSNの新サービスの可能性を探る。後半では、長期的な検索エンジンの未来を考えた上で、この技術の位置づけを考察する。

 MSNの新サービスは検索サービスに新たなトレンドを予感させる野心的な内容となっている。新サービスは、Webの検索に加えてユーザのPCのハードディスク上のファイル検索を行う「インターナルサーチ」の機能が目玉となる。

長期ビジョン:検索技術は原始時代、本当の革新はこれから

Microsoft
Richard Chin氏

 検索サービスの現状認識についてChin氏は言う。

 「自動車産業の黎明期、ヘンリーフォードは自動車の技術はまだプリミティブな段階にあると言ったそうだ。検索サービスも競争が始まって5年程度の現在は、同じようにプリミティブな段階にあると認識している」

 どうプリミティブなのかをChin氏は検索に要する時間を挙げてこう語った。

 「現在、ユーザは検索で探したい情報を発見するまでに約11分かかっているという調査データがある。11分もかかる理由は、知りたい答えを見つけるまでに、何度も異なる問い合わせを検索エンジンにしなければならないからだ」

 インターネットユーザにとって、Googleの登場は大きかった。Google検索では、Webのリンクの関係を分析することでPageRankという人気度を計算し、関連度の高い検索結果が提示される。ユーザはそれまでの単語の発生頻度を重視したクラシカルな検索との違いに驚嘆した。

 だが、そんなものはまだ原始時代の最初の道具の発明程度に過ぎないと同氏は考えている。検索の黄金時代はこれからやってくるのだと自信に満ちた態度で取材に応じてくれた。その自信の核心は、近い将来、MSNが提供する予定のインターナルサーチ機能にあった。

新たな市場:インターナルサーチ

 次世代のMSNサーチでは、従来のWeb検索に加えて、ローカルのWord、Excel、PDFなどのオフィス文書形式、そして、Outlookのメールとスケジュールまでもが検索対象となるという。この機能は外部のWeb検索に対比して、インターナルサーチと呼ばれる。

 ユーザにとって必要性が高い情報はWebではなく、むしろ、ユーザ端末の内部にあることが多いという経験則は、ユーザが実感していたことだろう。日常使う情報は、個人メールボックスやスケジューラー、文書フォルダの中にあるのであって、外部のWebにあることは少ない。それにも関わらず、ユーザ端末のハードディスクを検索するツールはほとんど普及していない。

 WindowsにはOSの基本機能としてファイル検索機能は用意されていた。だが、ファイルをひとつずつ走査して検索キーワードにマッチするものを見つける”Grep型”アルゴリズムであるため、非常に速度が遅かった。検索結果が表示されるまでに数分を要することも珍しくなく、メールやスケジューラーは対象とされていない。

 インターナルサーチは予め検索の索引を作成し、検索時は高速に結果を表示する。MSNのWeb検索と同様の”Index型”の検索である。索引の作成と更新時間を必要とするものの、Grep型とは比較にならないほど高速軽快に動作する。

 気になるインタフェースだが「検索入力フォームのことをエントリポイントと呼んでいるが、これは複数用意していく予定だ。メールの検索であればメールソフトの中に検索フォームが置かれるようになる。あらゆるアプリケーションのどこからでもサーチが行えるようになる」とのこと。

 日本語の扱いについてだが、Microsoftにとって日本はトップ3の市場であるので、日本語対応も最初から実現したいという。

買収したLookout Softの技術をベースに開発

 インターナルサーチはMicrosoftが2004年7月に買収したベンチャー企業Lookout Softwareの検索技術をベースとしたものだ。Lookout Softwareは Microsoft Outlookのプラグインとして機能するソフトウェアで、Outlookのメールやスケジュール、ローカル文書を横断検索できるソフトである。

 独自検索アルゴリズムについて質問したところ、「日本人はGoogleのPageRankがお好きなようだ。残念ながら我々の検索にはPageRankのように特徴を表すアルゴリズム名を用意していないが、クラシカルな検索技術や、PageRank的なアルゴリズムなども総合したものだと考えてほしい」とChin氏は語る。

 Googleが採用しているPageRankはよくリンクされているページは人気があるという基本発想が分かりやすい。だが、GoogleもPageRankの要素だけで検索順位を決めているわけではない。単語の発生頻度や、見出しや強調語の重視など幾つもの要素の複合結果が利用されている。Microsoftとしては、アルゴリズムの名前よりも、インターナルサーチの便利さをまずユーザに知ってもらいたいと言う。

 他にない特徴としては、質問型検索がある。「世界で一番高い山は?」のような自然文の質問を入力すると、Microsoftの百科事典エンカルタと連動して、答えそのものが表示される。上述のユーザの検索に要する11分をいっきに短縮する機能である。こうしたデータベースと連動したサーチはこれからも充実させていくという。

MSNは日本でも40%のシェアを狙う、武器はインターナル、パーソナライズドサーチ

 Microsoftはこの数年、検索技術に対して巨額の投資を行ってきた。Lookout Softの買収はその一例に過ぎず、今後も検索分野の強化を打ち出していくとChin氏は予告した。

 「例えば?」という質問に対してChin氏は、MSN Newsbotの技術を挙げた。MSN NewsbotはWebのニュースサイトを巡回して記事を集め、カテゴリ分類と重要度を人工知能が計算し、横断型のニュースポータルサイトを構築する実験的サービスである。基本コンセプトはGoogle Newsと同じだが、MSN Newsbotではユーザが閲覧した記事から関心を割り出し、近いテーマのニュースを推薦するPersonalized Newsの機能がある。

 このNewsbotのように、ユーザの関心に応じて検索結果をカスタマイズするパーソナライズドサーチがMSNの追求テーマのひとつとなるという。ユーザは誰で、どこにいて、何をしているか、といった文脈をコンピュータが察知し、最適な情報を提示するようになるという。

 日本においても米国と同じ40%程度のシェアを狙いたいとChin氏は語った。日本におけるWeb検索市場ではツートップGoogle、Yahooに比べるとMSNは出遅れた感じが否めない。だが、インターナルサーチ、パーソナライズドサーチという機能は、先行2社にはまだ欠けている要素だ。

-PR-企画特集