Googleが、現在進めている画像検索用の実用的なツールの作成に関して、より具体的な内容を明らかにし始めた。
Googleは米国時間5月1日、「Google Research Blog」の記事で、画像に関連付けられたテキストよりも視覚的な手がかりを利用して画像を分類する「VisualRank」システムについて手短に紹介した。また、その詳細を「PageRank for Product Image Search」と題する長めの資料(PDFファイル)に掲載した。これは、2008年4月下旬に北京で開かれたWeb技術に関する会議でGoogleの2人の研究者が披露した資料だ。
VisualRankシステムはまだ稼動しておらず、Googleは、この画像検索技術が近いうちに一般に公開されることはないとほのめかしている。ブログの記事によれば、同社は「テキストと視覚的な手がかりの両方を簡潔に統合する方法」についての詳細を「数カ月後に」発表する予定だという。
VisualRankの取り組みの初期段階では、Googleの研究は、製品クエリに重点を置いていた。その理由の1つは、製品検索クエリが、この研究の中心である「画像の特徴」のタイプと大いに一致していたからだ。また、こうしたクエリのタイプは、「実際の利用において一般的」であり、ユーザーは得られる結果に対して明確な期待を抱くため、研究者が重要な具体例を得て役立てることができた、と同社は述べた。
Googleはまた、取り組みを拡大し、旅行関連のクエリなど、他のタイプのクエリも検討し始めた。
Googleは、開発を進める過程で、主に3つの課題に取り組んでいると述べた。
「第1に、ウェブ上にあるすべての画像の類似性測度を判定することは、計算のための費用が高くつく。概算の利用や代替の計算手法が求められている。第2に、代替のクラスタリング手法が最近たくさん提案されているが、これらとわれわれのアプローチを比較評価したいと考えている。第3に、PageRankの多くのバリエーションは、非常に興味深い方法で画像検索に応用できる。たとえば、これまでに発表されたこうした手法の一部を利用して、VisualRankのアルゴリズムが削除したテキスト情報を意味に応じて再び挿入することができる」
画像検索は、Googleをはじめ、新興企業のPolar RoseやRiyaといった企業にとって長年の重要課題で、進歩の大半は、顔認識の諸要素のうちごく一部に限られていた。たとえば、Googleは2007年に、「Google Image Search」は顔が写っている画像と顔が写っていない画像を区別できると述べたが、人物ごとの顔の違いは区別できなかった。
この記事は海外CNET Networks発のニュースをシーネットネットワークスジャパン編集部が日本向けに編集したものです。海外CNET Networksの記事へ
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」