logo

AIで動画の中身も検索可能に--グーグル、「Cloud Video Intelligence」公開

  • このエントリーをはてなブックマークに追加

 Googleは、動画に記録されている対象物や、対象物の動きをキーワードとして検索できるAPI「Cloud Video Intelligence」(プライベートベータ版)を公開した。同APIを使うと、ある動画に「トラ」が映っているかどうか、映っているとしたらビデオのどの部分に映っているのか、何が「走っている」のか「泳いでいる」のかなどが調べられる。


動画に映っているものの検索が可能に(出典:Google)

 Cloud Video Intelligenceは、動画内の情報を言語化できる技術。「犬」「花」「人間」といった名詞や、「走る」「泳ぐ」「飛ぶ」といった動詞を使って、ビデオ内を検索できる。

 人工知能(AI)技術の一種である深層学習(ディープラーニング)を応用し、Googleの機械学習フレームワーク「TensorFlow」をベースに開発した。すでに「YouTube」などで使われているそうだ。

 Googleは、メディア企業が膨大な非構造化データである動画ライブラリを同APIで解析し、カタログ化することで価値を高められる、としている。また、ビデオ管理ソフトなどでの活用も考えられるという。


ビデオ全体を通し、映っている対象物をリスト表示(出典:Google)

 同APIの紹介ページでは、映像に映っている対象物の候補を提示するデモが体験できる。以下の画像は、その動作の一部をとらえたものだ。


これだけで「キリン」と推定(出典:Google)

笑顔の人間も判別(出典:Google)

「ネコ」に見えないこともない(出典:Google)

自信なさそうに「魚」(出典:Google)

人間が世話をしているからか「ペット」だと思ったらしい(出典:Google)

実写とアニメの区別も可能(出典:Google)

もちろんスマートフォンも認識(出典:Google)

-PR-企画特集