グーグル、reCAPTCHAを買収--書籍スキャンにも活用へ

文:Tom Krazit(CNET News) 翻訳校正:編集部2009年09月17日 11時41分

 GoogleがreCAPTCHAを買収した。reCAPTCHAは、ウェブサイトのサインインページの下部によく表示される、ゆがんだ文字のテキストボックスを手がける企業の1つだ。

 買収条件は明らかにされなかったが、Googleがブログ記事で述べたところによると、同社はreCAPTCHA の技術を一部のGoogleサイト内におけるセキュリティ対策として利用するほか、大規模な書籍スキャンプロジェクトでも役立てる計画という。reCAPTCHAは、カーネギーメロン大学コンピュータサイエンス学部のプロジェクトから生まれた企業で、従来のCAPTCHA(スパムボットやそのほかの人間でない厄介者を惑わすことを目的とする、曲がりくねった書体で書かれた文字列)技術に新しい工夫を凝らしている。

 CAPTCHA技術が開発された目的は、コンピュータには読めない文字を提示することである。しかし、コンピュータは、昔の書籍などからスキャンされた単語の読解にも弱い。そこでreCAPTCHAは2つの単語を提示する。1つはreCAPTCHAが既に正解を知っている単語で、もう1つはreCAPTCHA自身もどう読むのか知らない単語。

reCAPTCHA画像
提供:Google

 reCAPTCHAは、最初の単語を読めたユーザーは人間である可能性が高いわけだから、2つ目の単語も正確に読み取れるだろうという思想に基づき、2つめの単語に対するすべての回答をプールする。そして、認識の正確さに確信を得たところで2つめの単語の正解を登録してゆくことができる。こうすることで、書籍からスキャンした文字を単語としてアップデートすることができるのだ。現在、手に入る書籍をすべてスキャンしようとしているGoogleが、この技術に関心を持つのは当然と言えよう。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。 原文へ

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]