最終更新時刻:2008年10月10日(金) 23時50分

Yahooが検索エンジンを自社開発した理由

インタビュー:梅田望夫、撮影:Rick English
編集:瀧口範子、山岸広太郎(CNET Japan編集部)

2004/05/24 10:00  

Yahooの検索を支える技術インフラ

梅田: 分かりました。ところでここで興味をひかれるのがインフラの話です。Googleは10万台のコンピューターを組み合わせて検索用のスーパーコンピューターを作ったと言われています。彼らの強みはバックエンドのオペレーション能力ではないかと。Yahooの検索におけるバックエンドのオペレーション戦略について教えてください。

Vish: Yahooは自社で開発したスケーラブルで拡張性が高く低コストなプラットフォームの上でサーチを運用しています。このバックエンドに携わる人員の規模というのは、私の推測ですが、おそらくどこにも負けないと思います。

 重要なのはシステムを低コストで運用できる能力があるかどうかです。サーチというのは受け取ったクエリーを返せばいいという話ではありません。検索を実現するための技術はずいぶん前から存在しているのに、検索サービスを効率的に運用できる企業はほんのわずかです。大規模なシステムを低コストで運用できる能力というのはそれだけで競争力になります。そして、それを実現できているのは2社だけ。その1社がYahooです。

梅田: もう1社はGoogleですか。

Vish: そうですね。

梅田: Yahooもシステムの運用能力をもっとアピールした方が良いと思いますよ。それで、YahooのバックエンドのアーキテクチャーはGoogleと似ているのでしょうか。

Vish: Yahooはとても高度に並列化されたIntelベースの環境を持っています。クラスター技術によって少ない待ち時間と高いパフォーマンス(この2つは同じことですが)を高度な信頼性をもって実現しています。この環境ではサーバーをいつでもプラグ&プレイできます。このためウェブの成長に合わせてインフラ側も常に成長できるのです。

 検索のアーキテクチャーを簡単に説明すると、まずクエリーがサーチエンジンに投げられます。クエリーは1つのコンピューターに対して投げられますが、そのコンピューターが他のコンピューターの1団に向かってさらにクエリーを投げます。これらのコンピューターは自分たちの中にある「小インターネット」を検索し、最初のコンピューターに向かって結果を返します。これらの検索結果の数はものすごい量になります。最初のコンピューターは戻ってきた結果に順位を付けてユーザーに返します。

 これら全ての処理が1秒以内に行われます。そしてYahooでは1秒間に数千回もこのような処理を行っているのです。このレベルのサーチを信頼性と素早い反応速度を維持しながら世界的な規模で提供するために、Yahooはいくつものデータセンターと、超並列なコンピューター環境、そして高速なネットワークを運用しています。

買収した技術の統合

梅田: このインフラはInktomiやOvertureの技術を流用して開発されたものですか。

Vish: はい。買収の成果によるものだと言えます。我々はAltaVistaやFASTの技術も使っています。FASTチームは言語学の分野で信じられない能力を持っています。AltaVistaにはサーチエンジンビジネスの黎明期から続く知的財産がありますし、優秀な博士が何人かいます。そしてInktomiチームがこの低コストでスケーラブルな環境を開発しました。

梅田: 買収した企業はどれもサーチエンジンという点では同じでも別のものですよね。

Vish: 驚くかもしれませんが、例えばドキュメントを解析し順位付けするために、我々は100以上の異なるエレメントを使っています。

梅田: つまり、買収した企業のそれぞれの技術を1つのスイートに統合したということですか。

Vish: それがYSTです。異なるテクノロジーからいくつかの基本となる要素を集めて作っています。Inktomiの技術を統合するのに1年、FASTとAltaVistaは8カ月くらいかかりました。つまり我々がやったことはまずたくさんの技術をかき集め、「さあ、どれが一番いい技術なんだ」と言いながら、よい部分だけを抽出してYSTというプラットフォームを作ったということです。

梅田: 先にあなたが説明した検索の「ソリューション」と、検索の技術とはどういう関係になりますか。

Vish: 検索のアルゴリズムとソリューションとに分けて考えましょう。アルゴリズムはドキュメントの内容を解析し、ページの関係を分析し、結果の順位付けのために使われます。

 アルゴリズムはソリューションを提供するためにも使われますが、ソリューションで一番大事なのはユーザーのニーズに合わせて情報を提供できるように設計するということです。正しい検索結果が出るということと、得られた情報に満足するというのは別の話ですよね。

 ユーザーが満足する情報を提供するのはそんなに簡単ではありません。我々はアルゴリズムの精度を強化し続けながら、その上でソリューションの顧客満足度上げていきます。

特集

「ソーシャルメディアキャンペーン」の半数は失敗--アナリストが指摘する理由
多くの企業がソーシャルメディアキャンペーンを計画している。しかし、ガートナーによると、キャンペーンを始める理由が明確になっていなければ、失敗に終わることになるという。
人工知能による会話マーケティングの可能性
日産NOTEのウェブサイトがおもしろい。人工知能を用いて、ユーザーの質問にCMでおなじみのキャラが反応してくれる。裏側で実現しているのは、PtoPAが開発したソフトウェア「CAIWA」だ。同社はこれをウェブマーケティング分野でも活用しようとしている。

オピニオン

■インタビュー

Windows VistaにとってXPはライバルか?--マイクロソフト グローバルマーケティング担当Brad Brooks氏Windows VistaにとってXPはライバルか?--マイクロソフト グローバルマーケティング担当Brad Brooks氏
コンシューマー市場向けの取り組みを強化すると発表したマイクロソフト。日本におけるWindows VistaやWindows Media Centerの現状をどう見ているのか、コーポレートバイスプレジデントのブラッドブルックス氏に話を聞いた。
「iPodを日本で一番売りたい」--ビックカメラ有楽町店に聞く新iPodの魅力「iPodを日本で一番売りたい」--ビックカメラ有楽町店に聞く新iPodの魅力
発表後初の週末となった9月13日に、新iPodファミリーの店頭イベントを開催したビックカメラ有楽町店本館で、店長の石川勝芳氏に、iPodの販売状況と店内での取り組みについて伺った。

■コラム

進化するユーザビリティテスト〜「ユーザー行動観察調査」の効果・効能進化するユーザビリティテスト〜「ユーザー行動観察調査」の効果・効能
近年のウェブサイトリニューアルプロジェクトでは「ユーザビリティテスト」を実施することが当たり前になってきたようです。今回は、単なる「使いやすさ調査」を超えた「ユーザー行動観察調査」の効果・効能を紹介します。
“オトコの遊びゴコロ”をくすぐるロマンたっぷり「自動車ケータイ」“オトコの遊びゴコロ”をくすぐるロマンたっぷり「自動車ケータイ」
香港や中国のケータイショップでは、「おぉっ!こりゃかなりいける!」とワクワクしてしまう怪しいトンデモケータイに出会うことがある。そんな魅力あふれる製品の1つが、今回ご紹介するケータイである。
ソフトバンク株価の下落加速--iPhone一巡し資金繰りを懸念ソフトバンク株価の下落加速--iPhone一巡し資金繰りを懸念
日経平均が約4年10カ月ぶりに1万円の大台を割り込む中、ソフトバンクの株価が、全般相場の低迷にも増して下落が加速している。

企画特集

ネットと家電をつなぐチャレンジ「Life-X」
第一題:ライフログ・シェアリングサービス「Life-X」の第一印象は?
エンタメCGM「gooメーカー☆メーカー」エンタメCGM「gooメーカー☆メーカー」
【第2回】メーカー/占いのコンテンツを作ってみた!

ブログネットワーク

アルファブロガー

外資系エグゼクティブの日々I am Jamming!
外資系エグゼクティブの日々
クロサカタツヤの情報通信インサイトグッバイ、レバレッジ!(1)
クロサカタツヤの情報通信インサイト
末吉隆彦 ロケーションウェアの「空」と「実」9月イベントお知らせ
末吉隆彦 ロケーションウェアの「空」と「実」
ケータイ時代のスタンダードiPhonista Nightの事後報告
ケータイ時代のスタンダード
江島健太郎 / Kenn's Clairvoyance新サービスをローンチしました
江島健太郎 / Kenn's Clairvoyance
鈴木健の天命反転生活日記パラレルワールドとしての電脳コイル
鈴木健の天命反転生活日記

読者ブロガー

フリーエンジニアでのあれこれsolrのDistributed Search
フリーエンジニアでのあれこれ
将来のPC業界パワーバランスXeon 7400シリーズのSPECの再考察
将来のPC業界パワーバランス
今どきのメッセージ論日経平均株価の落ち着く先は…
今どきのメッセージ論
電気仕掛けの網は俺達に自由の夢をみせるのか?人々は自らの行為に恐怖した
電気仕掛けの網は俺達に自由の夢をみせるのか?
IT業界(笑)最底辺層生活オトナになるということ
IT業界(笑)最底辺層生活

リサーチ

■リサーチコラム

薬事法規制の厳しい健康食品に代わり、増え続ける化粧品メーカー
薬事法規制が厳しくなる今、特に規制が厳しい健康食品にかわって化粧品を販売しようとする企業が増えている。そこで、覚えておきたい化粧品と薬事法の関係について簡単にまとめた。
携帯電話の待ち受けに関する調査--最も利用される画面は「自分で撮影した写真」
携帯電話の待ち受け画面に関する調査を実施したところ、10・20代は飽きやすく待ち受け画面を頻繁に変更する傾向にあり、30・40代は季節感や臨場感を重視することが明らかとなった。
電子マネーによるライフスタイルの変化に関する調査--電子マネーコアユーザーは、高所得者層
電子マネーによるライフスタイルの変化に関する調査したところ、電子マネーを活用するのは高所得者層に多く見られた。また、1度に1万円以上チャージするユーザーは10%強であることも明らかになった。

■調査レポートダウンロード

金融不安の市場に、IR活動は何を頼るか!?
CMS未導入企業300社へのアンケート 担当者のホンネを徹底追求

■調査発表

【ゲームクリエイターの方へ】攻めの開発体制を敷くAQインタラクティブ社の中途採用・求人情報をレポート
Alibaba JAPAN、カー用品店に関する調査 カー用品専門店の認知、利用ともトップは「オートバックス」
調査結果「携帯OS『Android』認知度調査、6割が『知らない』 〜ユーザー期待のメーカーは?」

CNET Japan セレクション

ココが変わった、新型「ニンテンドーDSi」--「ニンテンドーDS Lite」と比較
任天堂が11月1日に発売する新型ゲーム機「ニンテンドーDSi」はどんな点が新しいのか。既存のニンテンドーDS Liteと比較するとともに、新機能を紹介する。
フォトレポート:本体が分離するNTTドコモの「セパレートケータイ」の謎に迫る
NTTドコモは家電展示会「CEATEC JAPAN 2008」において、端末が2つに分離できる携帯電話「セパレートケータイ」を展示している。どのような仕組みなのか、何ができるのかを、写真で紹介する。
話題のスマートフォン、写真で見るBlackBerry Bold
RIM製スマートフォン「BlackBerry」の新モデル「BlackBerry Bold」を2008年度第4四半期にも発売すると発表したNTTドコモ。話題のBlackBerry Boldを写真で紹介する。
こんなものもありました--CEATECで見つけたオモシロ新技術たち
幕張メッセで開催されている展示会「CEATEC JAPAN 2008」では、幅広い分野の最新技術が一堂に会している。ここではその中でもユニークな新技術や展示を紹介する。
「iPhone 2.2」アップデートの概要が明らかに--App Storeのインターフェースなど変更
アップルは、新たな「iPhone 2.2」アップデートのリリースに向けて準備を進めている。Safariに加え、App Storeのインターフェース変更などが予定されている。
ケータイはまだまだ進化する--CEATECで見た未来の技術
幕張メッセで開催されているデジタル家電の展示会「CEATEC JAPAN 2008」では、携帯電話関連の新技術が数多く展示されている。その様子を写真で紹介する。

今日の見どころ

自動車の未来を垣間見る--2008年パリモーターショーのコンセプトカー

2008年度グッドデザイン賞が発表--環境を意識した新基準も

GMのハイブリッドカー「Chevrolet Volt」、パリモーターショーに登場

レビュー

今週の新製品総チェック:新PS3が登場!ニコンが発表した映像製品「UP」とは?
「東京ゲームショウ2008」が10月9日から開催され、新PS3やXboxの新作ゲームなど、ゲーム機の大型発表が相次
[レビュー]2011年画質を備えた高画質、多機能Blu-ray--ソニー「BDZ-X95」
ソニーのBlu-ray Discレコーダー新製品が登場した。2007年から引き継がれる「やりたいことから選ぶ」シリー
今週の新製品総チェック:よりモバイルPCとして進化した「Let's note」が登場
松下電器産業の「Let's note」、デルのデスクトップPCとPC新製品が数多く登場した。Let's noteは9時間駆動
今週の新製品総チェック:フルサイズCMOS搭載のキヤノン「EOS 5D Mark II」が登場
キヤノンからもフルサイズCMOSセンサを搭載した「EOS 5D Mark II」が登場した。合わせてコンパクトデジカメ
今週の新製品総チェック:第4世代iPod nano登場、ソニー「α」、松下「LUMIX」に新機種も

CNET_ID

メンバー限定サービスをご利用いただく場合、このページの上部からログイン、またはCNET_ID登録(無料)をしてください。