「CAPTCHA」技術を応用して書籍のデジタル化を進める新ツール「reCAPTCHA」 - (page 2)

文:Stephen Shankland(CNET News.com) 翻訳校正:大熊あつ子、吉武稔夫、長谷睦2007年05月25日 21時10分

デジタルライブラリ構築を助けるreCAPTCHA

 reCAPTCHAプロジェクトは、書籍をデジタル化して「Internet Archive」に登録する作業を行っている。Internet Archiveは、文化的資料のデジタルライブラリを構築するプロジェクトで、その時々のウェブサイトのスナップショットを保存する「Wayback Machine」の運営元でもある。

 von Ahn氏によると、同プロジェクトでデジタル化が進行中の書籍としては、哲学者John Deweyの著作『Psychology』などがあるという。reCAPTCHAでは、他の書籍についてもデジタル化を検討中だと同氏は付け加えた。

 また、APIを使ってreCAPTCHAを自分のサイトに統合することも可能だ。このAPIを利用するためのソフトウェアプラグインは、「Google Code」でオープンソースのソフトウェアパッケージとして提供されている。

 reCAPTCHAはまた、メールアドレスを勝手に収集してスパムの送付先に登録しようとするコンピュータから、メールアドレスを守るためにも使える。

 von Ahn氏の専門は、同氏が「ヒューマンコンピューティング」と呼ぶ分野で、同氏の定義によるとこれは「人間の計算能力(「サイクル」とも呼ばれる)を利用した新しい技術」だという。

 一方、Microsoft Researchも、CAPTCHA技術を応用した独自の無償プロジェクトを展開している。「Asirra」と名づけられたこのプロジェクトでは、文字列の代わりに猫と犬の写真が提示され、そこから猫の写真を選ぶ。動物の種類の識別は、コンピュータには困難な作業だが、人間ならば可能だという点を利用したものだ。しかしこの手法の場合、常に新しいペットの画像を表示しなければならない。そこでMicrosoftは、動物の里親を捜すサイト「Petfinder.com」と提携して同サイトから写真を引用し、「adopt me(飼い主になってください)」というリンクも付加するようにした。

 von Ahn氏のプロジェクトで有名なものには、ほかにもオンラインゲームの「ESP Game」と「Peekaboom」の2つがあり、どちらも人間の画像分類能力を利用している。画像分類は、不明瞭な文字の解読同様、コンピュータが苦手とする分野だ。

 Googleは、ESP Gameに使われている技術のライセンスを取得して「Google Image Labeler」として提供し、自社の画像検索の精度向上に利用している。

 von Ahn氏によると、カーネギーメロン大学では、reCAPTCHAサービスをIntelから寄贈された3万ドル相当のサーバ上でホスティングしているという。同プロジェクトには、Intelのほかにも「SUSE Linux Enterprise Server」のサポート契約を提供するNovell、さらにはカーネギーメロン大学自体も支援を行っている。

この記事は海外CNET Networks発のニュースを編集部が日本向けに編集したものです。海外CNET Networksの記事へ

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]