Facebook、マシンビジョンの最新コードをオープンソース化へ

Larry Dignan (ZDNet.com) 翻訳校正: 編集部2016年08月26日 10時55分
  • このエントリーをはてなブックマークに追加

 Facebookの人工知能(AI)研究チームがマシンビジョンと顔認識に関して、より多くのコードとフレームワーク、研究成果をオープンソース化する。

 「Facebook AI Research」(FAIR)はブログ記事で、マシンビジョンに関する最新のコードをオープンソース化することを明らかにした。それには以下の3つのツールが含まれる。

  • セグメンテーションフレームワークの「DeepMask」。
  • DeepMaskと連携して、Facebookのマシンビジョンシステムが画像内のあらゆるオブジェクトを検出できるようにする「SharpMask」。
  • 画像内のそれぞれのオブジェクトにラベルを付けて分類する「MultiPathNet」。

 Facebookにとって、このテクノロジは極めて重要だ。なぜなら、同社のユーザーがビジュアルコンテンツを共有したり、利用したりすることが増えているからだ。Facebookが目指しているのは、タグやキャプションを使わずに画像を検索できるようにすることだ。マシンビジョンはまだ人間に追いつけていないが、その差は縮まりつつある。例えば、The New Yorkerは先頃、粒子の粗い写真から犯人を特定できる人間を集めたロンドンの「super recognizer」(超認識者)チームについて、記事を掲載した。通常、Facebookの画像はそれより高画質なので、機械でも識別できる可能性が高い。

 オープンソース化されるツールの中で注目に値するのは、FacebookのDeepMaskとSharpMaskのアルゴリズムだ。Facebookはそのテクノロジのコードと研究論文、デモを公開する。

 DeepMaskは写真をピクセルに分解した後、特徴に基づいてオブジェクトを学習する。その後、膨大な数の例からパターンを学習できるようにFacebookのニューラルネットワークを訓練する。DeepMaskは基本的に画像を二項分類する。その後、SharpMaskがDeepMaskからの出力を洗練させる。

 Facebookはこのように説明している。

 DeepMaskはネットワーク全体を対象にフィードフォワードパスで粒子の粗いマスクを予想するが、SharpMaskはディープネットワークで情報の流れを反転させる。そして、ネットワークの低レベルの層の特徴を利用して、DeepMaskの予想を洗練させる。次のように考えると分かりやすい。オブジェクトの全体的な形状をとらえるには、自分の見ている対象を高レベルで理解する必要があるが(DeepMask)、正確に識別するためには、ピクセルまで遡って、より低レベルの特徴を調べる必要がある(SharpMask)。基本的に、われわれが目指しているのは、追加の負荷を最小限に抑えながら、ネットワークのすべての層からの情報を利用することだ。

 FacebookはAIを利用して、動画も分析したいと考えている。動画は動きがあるので、画像より難易度が高い。

 

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

  • このエントリーをはてなブックマークに追加