Facebookは、同サイトにアップロードされた公開動画から、人工知能(AI)に音声、テキストおよび視覚による表現を自動的に学習させるプロジェクト「Learning from Videos」を開始すると発表した。Facebookによると、このプロジェクトは将来、コンテンツの推薦やポリシーの適用などに利用する同社の中核的なAIシステムを改良する助けになるほか、新たな用途も可能にするという。
「ほぼすべての国と数百言語にわたり世界中で続々と公開されている動画から学習することで、当社のAIシステムは精度を向上させるだけでなく、変化の激しい世界に適応し、文化や地域によって異なるニュアンスやビジュアルキュー(視覚的な手がかり)を認識するようになる。また、AI研究者がラベル付けされたデータへの依存から脱却できるよう支援することにより、われわれはAIを活用する製品を改良して、まったく新しい体験を生み出せるようになる」(Facebook)
Facebookによると、自己教師あり学習は、たとえば「Show me every time we sang happy birthday to Grandma」(私たちがおばあちゃんにハッピーバースデーを歌ったすべての回を見せて)などの検索フレーズに合致する動画を見つけるよう、AIシステムが自動的に学習するのに役立つ可能性があるという。こうした検索を実現するには、「ハッピーバースデー」のフレーズと、ろうそく、ケーキ、バースデーソングを歌う人々などの要素を一致させるようシステムを訓練することが必要になる。
Facebookは、「自動化されたソリューション」を利用してプライバシーの確保を強化することに重点を置くと述べている。すでに、Facebook上で公開された動画を利用した半教師あり学習と自己教師あり学習によって、コンピュータービジョンおよび音声認識システムを改善させてきたという。
Facebookは、「動画を理解する最先端の自己教師あり学習フレームワーク」の開発開始から半年も経たないうちに、Instagramの短尺動画機能「Reels」(リール)のリコメンデーションシステムにAIモデルを導入したという。さらに、初期の実験では動画に自己教師あり学習を適用することで音声認識のエラーが20%減少したとして、自動の字幕生成やヘイトスピーチの検出に役立つ作業などの用途を改善できる可能性があるとしている。
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス