Facebookの研究チームは、インターネット上にあるラベル付けされていないランダムな画像グループから学習できる、新たな人工知能(AI)モデルを発表した。この画期的な成果は、まだ初期の段階とはいえ、コンピュータービジョンに「革命」をもたらすことになるとチームは期待している。
「SEER(SElf-supERvised:自己教師あり)」と名付けられたこのモデルには、一般に公開されているInstagramの画像10億枚が与えられた。これらの画像は、それまで人手でキュレーション(整理)されたことがないものだ。しかし、一般にアルゴリズムの学習に使われるラベルや注釈がなくても、SEERは自律的にデータセットの内容を調べ、その過程で学習し、最終的にオブジェクト検出などのタスクでトップレベルの正確性を実現した。
自己教師あり学習という相応しい名前が付けられたこの手法は、AIの分野ではすでに確立されており、その実体は与えられた情報から直接学習できるシステムの開発だ。その際、写真の中の物体を認識したり、ひとまとまりの文章を翻訳したりするなどのタスクを実行する方法を学習させるために、丁寧にラベル付けされたデータセットを利用する必要はない。
自己教師あり学習は近年、科学的に大きな注目を集めている。人手でラベル付けするのに必要なデータを大幅に減らせるからだ。これは非常に時間のかかる作業で、ほとんどの研究者はやりたがらない。一方、キュレーションされたデータセットが不要であれば、自己教師ありモデルはより大規模かつ多様なデータセットを処理できる。
一部の分野、特に自然言語処理の分野では、この手法がすでに飛躍的な進歩につながっている。かつてないほど多くのラベル付けされていないテキストで学習させたアルゴリズムは、質問応答、機械学習、自然言語推論といった用途での発展を可能にした。
対照的に、コンピュータービジョンでは自己教師あり学習をまだ十分に活用できていない。SEERはその先駆けになるものだと、Facebook AI ResearchのソフトウェアエンジニアであるPriya Goyal氏は米ZDNetに語った。「SEERはインターネット上のランダムな画像でトレーニングされた初の完全な自己教師あり学習のコンピュータービジョンモデルだ。これに対し、コンピュータービジョンにおける既存の自己教師あり学習モデルは、高度にキュレーションされたデータセット『ImageNet』でトレーニングされている」(同氏)
ImageNetは、膨大な数の画像からなる大規模なデータベースで、研究者らがラベル付けしており、広範なコンピュータービジョンのコミュニティーに開放されて、AIの発展に役立っている。
Facebookの研究チームは、SEERのパフォーマンスを評価するベンチマークとしてこのプロジェクトのデータベースを利用した。研究チームの調査によると、この自己教師あり学習モデルは、ローショット(サンプル数の少ない)学習、オブジェクト検出、セグメンテーション、画像分類などのタスクで、最新の教師ありAIシステムのパフォーマンスを上回ったという。
Goyal氏は、「SEERは、無作為の画像で学習させるだけで、既存の自己教師ありモデルのパフォーマンスを上回る」として、次のように述べた。「この結果は基本的に、コンピュータービジョンにImageNetなどの高度にキュレーションされたデータセットは不要であり、無作為の画像による自己教師あり学習から非常に高品質のモデルが生まれることを示している」
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力