Googleがオンライン動画に関する興味深い特許を取得した。
「自動的な大規模動画内物体認識」と題されたこの特許は、動画内に出てくる物体をユーザーからの情報入力に頼ることなく識別する、Googleの技術に用いられる手法を詳述したものだ。ゆえに、ユーザーが撮影した動画にエッフェル塔のような世界的に有名な建造物や「Porsche 911」のような製品が映っていれば、Googleの技術によってそれらを識別できるようになるかもしれない。
有名なもの、さらにはありふれた椅子のようなものも含めて、それぞれの物体が何であるかを判断するため、Googleでは「物体名リポジトリ」を構築するという。このリポジトリには「少なくとも5万種類の物体の名前」が記録されるとGoogleは述べている。
「従来のシステムは、例えば犬が含まれていることがわかっている一連の画像について、対象の物体を表現するものとして明示的に識別された物体の代表名を提供するにあたり、事前の人間による精査に基づいた、人間が直接入力する情報に依拠していた。しかしながら、このような人間による情報の入力は費用と時間がかかり、数十万の物体や数百万の画像で構成される巨大なデータセットを処理可能な規模には拡大できない」とGoogleは2009年2月に提出した特許出願書類に記している。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
すべての業務を革新する
NPUを搭載したレノボAIパソコンの実力
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
先端分野に挑み続けるセックが語る
チャレンジする企業風土と人材のつくり方