橋本: 私は、検索エンジンとしてはGoogleを利用することが多いんです。Yahoo! JAPANの検索は、自分の知らない分野の有名サイトを知りたい時にディレクトリを使うといった感じで。Yahooは、私にとってインターネットという総合誌の表紙的な役割。どういうものが世の中にあるのかを知ったら、Googleの全文検索を使うというように切り分けているんですよね。
志立: Googleのシンプルさ、レレバンシー(適合性・妥当性)が高い検索結果を順に並べる性能は非常に重要なことです。YahooがウェブサーチにGoogleを使わせてもらっているのもGoogleの価値を十分に認めているからだし、常に世の中にある一番いいサーチエンジンを使いたいと思っているんです。
ですから、Yahoo! JAPANは最初gooと組み、その後Googleを採用しました。そして、近日中に米Yahooが開発したYahoo Search Technology(YST)へとスイッチします。
これは、GoogleとYSTの検索結果の精度やパフォーマンスを比較して、YSTの方がいいという判断をした結果です。
橋本: では、YSTの検索精度がGoogleの同等またはそれ以上になったということですか? 同じキーワードでGoogleとYSTの結果を比べてみると、YSTの方がいいと感じられるレベルなんでしょうか。インデックスのサイズはGoogleと比べてどのくらいですか。
橋本: 海外と比べて日本でYahooが強いのは、日本では検索以外のアプリケーションやサービスの人気があるからだと言う説があります。逆に言えば日本語の場合検索エンジンの精度が低かったから、ユーザーがあまり検索に期待してこなかった可能性もあるんじゃないでしょうか。Google以前の日本語のページ検索は「なんだこりゃ」とでもいいたくなるような検索結果ばかりでしたから。
志立: それは、日本語の処理の問題に尽きますね。ページを集めてくるクロウラーや、インデックスを作るエンジンと、キーワード、つまり投げたクエリーに対する結果が戻る仕組みはまったく同じですから。英語は文節で分かれますが、日本語は形態素解析をしなければならない上に同音が多く、ふりがなも……。そういう意味で今後、日本語の処理の仕方が精度を上げるために重要なポイントになるのではないでしょうか。
橋本: Yahoo! JAPANで使用している検索エンジンすべてがYSTに変わるのですか?
志立: そうです。だから、現在Googleが8割を占めると言われているサーチエンジンのマーケットシェア的には面白いことになると思います。YSTはInktomiが基になっていますが、MSNもInktomiを使用しているのでこれも合わせれば、YSTのシェアはかなり大きくなります。少なくとも国内では、半分以上がYSTになるでしょう。
いまやりたいと思っているのは、Yahoo! JAPANのディレクトリに登録されているサイトの情報をキーワード検索の結果表示のパラメータとして使うこと。先ほど橋本さんがおっしゃていた、インターネットのメジャーサイト一覧のようなものがあるとする。クエリーがメジャーサイトとマイナーサイトどちらにも同じくらいヒットしているとしたら、メジャーサイトから情報を引き出した方がなんとなく気持ちよかったいいんじゃないか、そういうパラメーターとしてディレクトリのデータは使えるのかもしれないと。つまりページの優先順位にディレクトリの情報を反映させるという可能性は考えられるでしょうね。
また、先ほど言ったように「検索の中に取り込めない情報」──動的に生成されるページ、いわゆるデータベース型のサービスについても具体的に提供していきます。その手始めとして、YST導入と同時に「日本タレント名鑑」のデータを検索結果に連動させます。Yahoo! ニュースで芸能人の話が出てくると、名前の読み方がわからなかったり、何をしている人か知りたいこともあるでしょう。その場合、タレントの名前を検索すると顔写真とプロフィールがドンと出る。既存のサービスと検索を連動させ、ニーズの高いものを提供するというコンセプトの第一弾です。
アプローチできるのは、Yahooが持っている電話帳、地図、路線などのほか、研究所や大学、公共団体の情報──私たちはCAP(Contents Acquisiton Program)と呼んでいます──のような、通常検索しただけではクローリング(ロボット型検索エンジンがホームページを自動巡回すること)しない情報もたくさん入ってくるのではないかと思うんです。
橋本: そういったインビジブルウェブという意味では、個人的には書籍が気になります。Amazonでもウェブ検索ツールの「A9」を稼働させ始めましたが、書籍は知識のデータベースとして、質的な価値はインターネットに匹敵、またはそれ以上にあると考えているので、それをどう検索してヒットできるようにするかが考えられるとうれしいですね。
志立: アプローチは2つあると思います。ひとつは無料でのプレビュー、もうひとつは有料での閲覧。特に2つめは、書籍や著作権物を生業にしている方々と正しい形でウィンウィンになるやり方をインターネット上で組まないとダメでしょう。PDFで配るのはいいが、本が売れなくなったら誰も幸せになれない。
そういう意味では、自然な形で知的情報にユーザーがお金を払ってうまく回るような仕組みを作る、その中心になるのが検索だと思うんです。例えば辞書。いまはなかなかネット上で辞書は売れませんが、辞書の情報はメインの検索と一緒になることで価値が増すのでは。月額いくらか払えばメイン検索時に専門の辞書が出てくるといった活用の仕方が考えられるのではないでしょうか。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」