GoogleやYahoo!で「Baiduspider」と検索してみよう。検索結果にざっと目を通すと「出入り禁止」「〜がやってきた」「行儀が悪い」などと否定的な言葉が並ぶ。。Baiduspiderとは中国の検索エンジン「百度(baidu)」のWebページ収集ロボット(クローラ)の名称だが、総じてウェブマスターからの評判は悪い。実際、私自身も運営するサイトでは Baiduspider を弾いている。要は、クロール頻度が高くサーバに多大な負荷をかけてしまうことが問題なのだ。
そんな百度は日本市場への進出を既に表明しているわけだが、この度、日本のサイト運営者に対してのメッセージを発表した。百度の日本語公式サイトから引用してみよう。
さて、弊社はまもなく日本語版検索サービスを開始致しますが、それにあたり現在日本語サイトの情報収集Spiderのリサーチを実施しております。
それにより御社のサイトに過剰なアクセスが発生したため、管理者の方には多大なるご心配をおかけ致しました。
私たちは百度作業管理担当者としてこの度百度Spiderが御社のサイトにご迷惑をおかけしましたことに関して誠に申し訳なく思っております。
ようやくこの問題に目を向けて、クロールのコントロールを強化するようだ。全体的なクローラ負荷を下げる、具体的には「最大クローラ頻度を9回/秒から1回/秒にする」「中小サイトに対してクローラ頻度を20秒/回以内にコントロール」「毎日のクローラ総量をコントロールする」などとしている。
Baiduspiderのアクセスをブロックするサイト運営者が増えれば増えるほど、日本語ページの収集に支障が生じ、結果として検索サービスそのものの提供が困難になる。検索サービスを成立させるためには検索利用者だけでなく、情報収集対象となるサイト運営者に対してもメリットを与える存在である必要があり、百度が熱心に日本市場の開拓に取り組んでいきますという姿勢の表れだろう。
※このエントリは CNET Japan ブロガーにより投稿されたものです。シーネットネットワークスジャパン および CNET Japan 編集部の見解・意向を示すものではありません。
メンバー限定サービスをご利用いただく場合、このページの上部からログイン、またはCNET_ID登録(無料)をしてください。
新着コメント
なんだかね、この業界のこと知らないんじゃないのか? 筆者は船井さんと関係......
時代に合わせて見直せるか!IT業界が迫られる分岐点とは
投稿者 : 草木生(そうもくしょう)
☆霧笛さん、補足をありがとうございます、たしか「FON ラ・フォネラ2.0」は5......
W編集長も参加のCNETブログ3周年オフ会、お疲れ様でした!
投稿者 : わをん
アロンさん、お久しぶりです。 仰るとおりです。 私も20日位マシン室に泊......
韓国へのサイバー攻撃のニュースを見ながら…
投稿者 : sugibeya
おいおい日本の新聞だって恣意的な記事は沢山あるぞ。あと警察の発表をあえて......
ニュースをコンテンツとして売る!
投稿者 : アロン
システム開発でもデスマーチに耐え切れずに自殺なんてことはよくある話で、別......
韓国へのサイバー攻撃のニュースを見ながら…
投稿者 : アロン