Googleがオンライン動画に関する興味深い特許を取得した。
「自動的な大規模動画内物体認識」と題されたこの特許は、動画内に出てくる物体をユーザーからの情報入力に頼ることなく識別する、Googleの技術に用いられる手法を詳述したものだ。ゆえに、ユーザーが撮影した動画にエッフェル塔のような世界的に有名な建造物や「Porsche 911」のような製品が映っていれば、Googleの技術によってそれらを識別できるようになるかもしれない。
有名なもの、さらにはありふれた椅子のようなものも含めて、それぞれの物体が何であるかを判断するため、Googleでは「物体名リポジトリ」を構築するという。このリポジトリには「少なくとも5万種類の物体の名前」が記録されるとGoogleは述べている。
「従来のシステムは、例えば犬が含まれていることがわかっている一連の画像について、対象の物体を表現するものとして明示的に識別された物体の代表名を提供するにあたり、事前の人間による精査に基づいた、人間が直接入力する情報に依拠していた。しかしながら、このような人間による情報の入力は費用と時間がかかり、数十万の物体や数百万の画像で構成される巨大なデータセットを処理可能な規模には拡大できない」とGoogleは2009年2月に提出した特許出願書類に記している。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」