対談:日本における検索の未来 - データセクション 橋本大也 vs ヤフー 志立正嗣 - (page 3)

構成/文:野田幾子、写真:吉成行夫
編集:山岸広太郎(CNET Japan編集部)
2004年05月31日 10時00分

「その答えは午後まで待ってください」という検索

橋本: 私は、検索にはもっといろんな形があっていいと思うんですよね。例えば、「ゆっくりした検索」。現在はコンマ何秒で検索した、と速度を競っていますが、ユーザーは30秒かかってももっと精度の高い検索結果を得られれば満足する人も多いのかなと。1時間、1カ月という形もありなのでは?

志立: 人力検索が近いですね。うちでもユーザー同士で質問し合う「Yahoo! 知恵袋」を4月に始めました。自然文検索で質問できて、2週間くらいかけて答えを得る。でも、最近は最初の返答がその日のうちになりつつあります。

橋本: 私の会社でも「といえばサーバ」という検索エンジンのようなものを作っていて、ある文書とある文書がどれくらいパターン的に似ているかというのを類似検索するタイプなんです。多くの一致する箇所を計算すれば計算するほど精度が高まりますが、ユーザーが検索してから1秒以内に返さなくてはならないので、パターンマッチングの量が限られてしまう。つまり、速度と精度がバーターになってしまっているんですね。急がないのであれば、何時間でも探して精度の高いものが返せると思うんです。だから、検索エンジンもそういうインターフェースがあれば面白いんじゃないかと。「その答えは午後までちょっとまってください」「ベストを考えた結果、提案が3つあります」とか。

志立: コンサルテーションを含めたものもありですよね。最近社内で話題になっているのは、パーソナライゼーションに関することなんです。クッキー制御でクエリーを管理し、傾向を分析してランキングを変えるということ自体はいろいろなところで考えられていると思うのですが、1台のパソコンを父親、母親、子供が共有しているとどうなるか。例えば夜中に父親がマニアックなガンサイトを見ていたとしたら、昼間母親が検索サイトを使ったときにマニアックなページが上位に来てしまう。子供に見せたくないサイトが表示される可能性も大でしょう。

 それは他人とのかかわりだけでなく、自分自身でも昼間の12時に考えてること、夜中に考えてること、それぞれほしいものが違ったりしますよね。同じキーワードでも、欲しい情報が違うことはよくあること。昨日と今日、先月と今月、季節が異なるなど、その都度変わるものです。

 だから、その人のクエリーを見ながらチューニングしていくのが便利なのか不便なのかが、未だにわからない。そういう意味では、最近話題になっている限られたジャンルの中でのチューニングという話にも興味があるし、面白いことになるのかもしれないなと思っています。

内部データの統合の方がセマンティックより優先度が高い

橋本: 以前から不思議だったのですが、Yahoo! JAPANのディレクトリは、ホームページを分類するための独自の方法なのですか? 図書館との分類法とも違いますよね。

志立: 図書館などはある程度分類法がフィクスしているので、どこに行ってもほぼ同じであることに気づくかもしれませんが、Yahooのディレクトリは、階層と横幅が、理論上は無限に拡げられる作りなんです。インターネットが成長することを考慮した上のことで。

橋本: 先ほど話題になった、ディレクトリと検索を統合させてページランクが決まっていくことに反映されるのであれば、ディレクトリの決め方はかなり重要になっていきますよね。オントロジー(知識の内容を明示的に体系化したもの)、概念、データベース……それらが検索エンジンにおける、今後の鍵なのかなと思うのです。キーワードの頻度によりランキングが決まるのではなく、意味的、概念的に関係があるから上位に来るというような。ですから、検索サービスサイトの裏側はそういった思想、オントロジーの考え方が入ってくるかと思うのですが、それにYahooのディレクトリが含まれてくるということでしょうか。

志立: その1つとして使える、という感じです。ディレクトリだけがすべてを解決するものではありませんし、ある2つの言葉の意味を考えることがディレクトリですべて結びつくわけではないので、ほかの手法も使っていかなくてはと思いますが。

橋本: セマンティックウェブ(ウェブ上の文書に意味を持たせる)についてはどう思いますか。最近はRSSをはじめとするメタデータが流行しています。いまはBlogやニュースの見出しに使われることが多いのですが、今後はさらに公開されるメタデータが増えていくと思うんです。それをYahooはどう利用していくのか、非常に興味があります。

志立: 米国では、My Yahoo! にRSSを対応させています。ですから、日本でもそういう試みをしていくことは考えられるでしょう。セマンティックウェブというキーワードに関しては、今後の方向としてありかな、といった感じです。

 Yahooはある意味、メタデータを使うと言うよりはYahooの中にあるデータを利用することの方がたぶん得意だし、何よりYahooの強みが活かせるのでは。その方が、より正確な情報を提供できる──つまり、メタデータの先の信頼性はどうなのか、という問題は必ずつきまとう話なので、まずは内部データとの統合/複合の方が、メタデータよりは優先度が高いです。ただ、すべてのユーザーがYahooの中にある情報だけで満足するとはまったく考えていませんので、今後は組み合わせて使っていかなければとは思います。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]