Googleは、画像や映像に含まれるテキストの認識および利用に関する技術の特許を申請した。
特許申請自体は2007年6月に行われたが、申請の内容は米国時間1月3日に発表された。Googleによると、この特許は「抽出した画像内のテキストを利用するための方法、システム、装置に関するもので、それらの中にはコンピュータプログラム製品も含まれる」という。
申請書の要約では、「ある実行例の中には、コンピュータを使って実行する方法が挙げられる。この方法は、1つ以上の画像検索語の入力を受け、入力された1つ以上の検索語からキーワードを発見することを含む。また、この方法には、キーワード群、例えば画像内のテキストから抽出されたキーワードを検索し、1つ以上の画像検索語に対応する抽出された画像テキストに関連する画像を選び出し、その画像を表示することも含まれる」と述べられている。
Googleは、ネット上で最も広く利用されている画像検索機能だけでなく、主要なビデオ共有サイト「YouTube」をもすでに所有している。そのため、画像や映像に含まれるテキストを正確に読み取ることが可能になれば、同社にとっては大きなメリットだ。この機能の可能性としては、より正確なキーワードの作成やファイルの自動タギングなどが考えられる。また、背景に写っている文字から、その写真がどこで撮影されたかを特定することも可能だ。
Googleの広報担当者は7日、特許申請に関する質問に答えたが、回答はごく標準的な内容だった。広報担当者は、「われわれは、従業員が思い付いた多様なアイデアに関する特許申請を行う」とした上で、「これらのアイデアの中には、後に実際に製品やサービスになるものもあれば、そうでないものもある。特許を申請したからといって、必ずしも将来製品として発表されるわけではない」と語った。
Googleが光学式文字認識(OCR)の分野に踏み込んだのは、今回の特許申請が初めてではない。現在、OCR技術は主に文書をワープロで読み込み可能なフォーマットに取り込むために用いられている。
Googleは2006年9月に、(もともとHewlett-Packardが開発した)「Tesseract」と呼ばれる旧式OCRエンジンのデバッグを支援し、それをオープンソースとしてリリースした。当時、Googleは「一流のOCR専門エンジニア」を採用したいという希望も述べていた。
この記事は海外CNET Networks発のニュースを編集部が日本向けに編集したものです。海外CNET Networksの記事へ
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力