グーグルのフィルタリング技術に「勇み足」の苦情

Declan McCullagh (CNET News.com)2004年04月26日 11時54分
  • このエントリーをはてなブックマークに追加

 PartsExpress.comは、ネット最大のオーディオビジュアル関連製品の品揃えを誇らしげに謳っている。だが、検索エンジンのGoogleが用意するオプション機能で、アダルトサイトをはじく設定にしている買い物客が、同サイトの存在を知ることはないだろう。

 スペルの偶然の一致から、オハイオ州にあるこの電子関連製品販売業者のドメイン名には、運悪く「sex」という文字が含まれてしまっている。Googleで検索結果にフィルタをかけていると、これだけで同ウェブサイトは弾かれてしまう。

 運が悪いのはPartsExpress.comだけではない。GoogleのSafeSearchというフィルタリング技術は、ドメイン名に「sex」(セックス)、「girls」(女の子)あるいは「porn」(ポルノ)といった文字列が含まれているだけで、多くの無害なウェブサイトを誤ってブロックしてしまうことが、CNET News.comの実施した調査から明らかになった。

 GoogleのSafeSearchが抱える欠陥は、単なる技術的な問題ではない。ブロックされた罪のないウェブサイトに、深刻な結果をもたらす可能性もある。Googleはいま最もよく使われている検索エンジンであることから、その検索にひっかからなければ、特にマーケティング予算の限られた小規模企業などでは、売上に直接影響がでることも考えられる。

 調査会社のWebSideStoryは先月、Googleが米国全体の41%というこれまでで最高の検索参照率を記録し、同社の市場シェアが着実に増加したとの報告を発表している。

 「Googleから流れてくるトラフィックは商売の命運を左右するものだ」というのは、ALittleGirlsBoutique.comというサイトを運営するMaria Medina。この家族経営の衣料品店のサイトも、SafeSearchの検閲に引っかかってしまう。「私には4人の子供がおり、もっとたくさんの時間を子供たちと一緒に過ごしたいと思った。そこで、自宅でできるビジネスとして、小さな女の子用のドレスやアクセサリを売るウェブサイトを開いた。なのに、それが家族向きではないとして排除されてしまう。バカげた話だ」(Medina)

 Googleのエンジニアで、4年前にSafeSearchを設計したMatt Cuttsは、自分のアルゴリズムがウェブアドレスのフィルタリングに使っているキーワードの数は「比較的少数」だとしているが、ただしこのキーワードにひっかかってしまうとSafeSearchの排除リストにアドレスが登録され、そのサイトのコンテンツまで評価されることはないという。

 「われわれは精度、想起、安全性の3つの点から、ベストなバランスを見つけるようにしている。SafeSearchを利用している人の大半は、われわれがかなり慎重でも問題ないといっている」(Cutts)

 CuttsはSafeSearchを利用した検索について、Google全体のほんの数パーセントにすぎないと述べただけで、具体的な件数は明らかにしていない。

 しかし、自社の検索エンジンの優秀さを誇りとし、またコンピュータ科学の博士号取得者が世界でもっとも多く集まっていると自慢するGoogleにとって、このいい加減なフィルタリング技術は、めずらしく評判を傷つけるものとして、よけいに目立ってしまう。同社ではSafeSearchが「高度な独自技術を使ってキーワードやキーフレーズをチェックし、ポルノや明らかに性的な内容を含む」ウェブページだけをはじくとしている。

この記事は海外CNET Networks発のニュースをCNET Japanが日本向けに編集したものです。

  • このエントリーをはてなブックマークに追加