お使いのブラウザは最新版ではありません。最新のブラウザでご覧ください。

企画特集

企画特集一覧

注目コンテンツ

読まれている記事

    CNET Japan ブログ

    ヤフーが新たにサポートした「Robots-Nocontent」って何だ?

    2007-05-06 19:04:47

    プロフィール

    渡辺隆広

    日本でSEOを始めた第一人者として知られるアイレップサーチエンジンマーケティング総合研究所 所長の渡辺隆広氏が、競争の激化する検索市場をビジネス、マーケティング、テクノロジーの各方面から掘り下げます。
    ブログ管理

    最近のエントリー

    私たちは情報を識別する時に視覚的要素や過去の経験や知識を用いて自動的に情報の意味を判断することがあります。例えば新聞の1面を開いた時、どの範囲がひとかたまりの記事であるとか、どれが広告でどれが新聞名であるとか、文字を読まなくても判断できます。それが日本語で書かれていなくても、例えば英語やベトナム語であっても、「文字読めないけどこれがヘッドライン」などと推定を立てることができるわけです。

    しかしながら視覚情報や知識や経験といったものに頼れない検索エンジンはそうはいかないのです。あるページを開いたとき、人間であれば明らかに「これは主トピックではない」といった情報も検索エンジンにはあたかもそれが重要な言葉のように捉えてしまい、検索クエリに対してまとはずれな答え(ページ)を表示してしまうことは多々あります。

    Googleニュース検索で「アイレップ」と検索した結果。3番目に株式会社ファンコミュニケーションズのホワイトペーパーへのリンクが掲載される

    例えばGoogleニュース検索で「アイレップ」と検索すると3番目(2007年5月6日18時45分時点)に「日本最大級のアフィリエイトネットワーク!A8.net」というタイトルのページがヒットします。でもクリックするとファンコミュニケーションズさんのホワイトペーパーライブラリーのページ。全然「アイレップ」とは関係ないのですが、何故検索にヒットするかというと主コンテンツとは関係ないエリアにアイレップという文字列があり、Googleがそれをこのページと関連づけてしまっているからです。

    これはCNET Japanのソースコードの書き方が悪いとも言えるし、Googleのアルゴリズムの処理の仕方にも問題があるとも言えるのですが、どっちが悪いにせよユーザの検索要求に適切に答えているとはいえないことは確かです。

    結局のところ、検索エンジンはページ上の情報において、どれが重要でどれが重要でないのか、完璧に把握する技術を持っていないからこうした問題が起こります。この課題に対して検索エンジンもチャレンジをしています。例えばマイクロソフトは「VIPS: a Vision-based Page Segmentation Algorithm」(論文)という論文を発表しているのですが、これはページの情報をセグメントに区切り、ページ上の主トピックを特定しようという技術的アプローチです(少なくとも日本語環境において上手くいっているとは思えないけれども)。フッターやヘッダーくらいならパターンマッチングである程度スコアリングのさじ加減はできるでしょうが、それ以上の情報を取り扱おうとすると難しいわけです。

    前置きが相当に長くなりましたが、米Yahoo!が5月2日に発表したRobots-Nocontent属性(タグ)はこうした問題を解決するためのサイト運営者側で対応する方法の1つです(Yahoo!ガイドライン:How do I mark web page content that is extraneous to the main unique content on the page?。要は、検索エンジンにインデックスさせなくていい(無視していい)情報エリアを"Robots-Nocontent"でマークアップしてあげると、Yahoo!はそれを検索対象から除外してくれます。

    通常Webページは主コンテンツ以外にもヘッダーやフッター、ナビゲーションリンク、広告エリア、サブコンテンツ、キャンペーン告知などなどページの主トピック以外の情報を数多く持っているものです。先日の記事「ヤフーにとってマイクロソフトは魅力的か?」のページを見ても、右側には他のCNETブログ皆様の最新エントリー一覧や、ニュースリリースのリンク、レビューなど、ヤフーとマイクロソフトの交渉とは全く関係ない情報はたくさんあります。こうした情報をRobots-Nocontentで囲ってあげることで、これらは重要でない情報であることをYahoo!に伝えられると同時に、どれが主コンテンツ(検索対象にしてほしいコンテンツ)であるかも明示できるようになるのです。

    Yahoo!も色々とフィードバックを得ながら検討した結果リリースしたようですが、これは確かに面白そうです。しかしながら、果たしてサイト運営者は今後Webページを作っていく上でこれを導入していくか?となると未知数です。

    きっと今これにすぐ取り組むことでメリットを享受できるサイト運営者は、ものすごく膨大なコンテンツを持っているけれどもHTMLソースコードがものすごく汚くてSEO対策も不十分なためにページと全く関係ないキーワードでよく検索にヒットさせてしまっているようなケースなのでしょうが、そういう人ってなかなかいないと思います。Google、Yahoo!、Microsoftが共同歩調をとったけれども微妙な存在の rel=nofollow(リンクを無視させるための属性)とは違って別の問題を引き起こすような性質はないものの、導入しなければいけない必然性が欠けています。

    GoogleやMicrosoftもサポートを開始すると話は変わってくるのでしょうが、現状はYahoo!オリジナルのものですから様子見といったところでしょうか。最もこうしたことは試してみないとわからないことが多々ありますから、サーチマーケティングに関心ある方は試しに取り組んでみたらいかがでしょう。CMSでテンプレートを操作できるなら導入は簡単だと思います。

    ※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。
    運営事務局に問題を報告

    最新ブログエントリー

    雛人形が大集合

    雛人形が大集合
    豪華七段飾りから人気のキャラ雛も続々登場

    LEDシーリングライト

    LEDシーリングライト
    明るく省エネ。便利な調光、調色機能も

    ルームランナー

    ルームランナー
    運動不足を解消!自宅で簡単トレーニング

    U.F.O.そばめし

    U.F.O.そばめし
    日清焼そばU.F.O.がそばめしになった

    スマートフォン特集

    スマートフォン特集
    人気モデルが続々登場!アクセサリーも充実

    注目のデジタル一眼レフ

    注目のデジタル一眼レフ
    最新モデルから型落ちモデルまで続々ご紹介

    特集 by 楽天市場

      インタレストマッチ - 広告の掲載について
      個人情報保護方針
      利用規約
      訂正
      広告について
      朝日インタラクティブについて