Googleは、動画に記録されている対象物や、対象物の動きをキーワードとして検索できるAPI「Cloud Video Intelligence」(プライベートベータ版)を公開した。同APIを使うと、ある動画に「トラ」が映っているかどうか、映っているとしたらビデオのどの部分に映っているのか、何が「走っている」のか「泳いでいる」のかなどが調べられる。
Cloud Video Intelligenceは、動画内の情報を言語化できる技術。「犬」「花」「人間」といった名詞や、「走る」「泳ぐ」「飛ぶ」といった動詞を使って、ビデオ内を検索できる。
人工知能(AI)技術の一種である深層学習(ディープラーニング)を応用し、Googleの機械学習フレームワーク「TensorFlow」をベースに開発した。すでに「YouTube」などで使われているそうだ。
Googleは、メディア企業が膨大な非構造化データである動画ライブラリを同APIで解析し、カタログ化することで価値を高められる、としている。また、ビデオ管理ソフトなどでの活用も考えられるという。
同APIの紹介ページでは、映像に映っている対象物の候補を提示するデモが体験できる。以下の画像は、その動作の一部をとらえたものだ。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス