Facebookはこうした状況を変えたいと考えている。LeCun氏によると、物体を認識させるために、言語を通じてインテリジェントなシステムと対話することは可能だが、「言語は伝えられる情報量が非常に少ない手段」だという。また、人間には豊富な背景的知識があり、その助けを借りて言語を解釈することができるが、現在のマシンには、そうした背景的知識をリアルタイムで利用し、常識を模した方法で文脈的なつながりを見つける能力は備わっていないという。
視覚学習や、ストリーミングされる画像もしくは映像などの媒体を利用することが、この問題を解決する1つの方法になるかもしれない。
LeCun氏はMIT Technology Reviewに対して、次のように述べている。「『これはスマートフォンだ』『これはスチームローラーだ』『物体の中には、押して動かせるものもあれば、そうでないものもある』とマシンに教えれば、おそらくそのマシンは世界の仕組みについて基本的な知識を習得するはずだ。赤ん坊が学習するのと同じように」
「われわれが本当にやりたいと思っていることの1つは、マシンが映像やそのほかの手段を通じて現実世界を『観察』するだけで、現実世界のさまざまな制約になっている膨大な数の事実を把握できるようにすることだ。それに成功すれば、マシンは最終的に常識を備えることができるだろう」(同氏)
インテリジェントなマシンに世界を観察する能力を与えることで、背景的知識に関する能力差は埋められると考えられる。それにより、AIは、プログラムされたアルゴリズムとあらかじめ決められた答えという現在のレベルから大幅な進歩を遂げるかもしれない。例えば、Facebookが探求したいと考えている1つの分野は、映像のコマをいくつか見せることで、その後に起こる出来事を予想してくれるAIシステムというアイデアだ。
「システムを訓練して、そうした能力を持たせることができれば、われわれは教師なし学習システムの根幹をなす技術の開発に成功したことになる。私の考えでは、そこまで到達したら、興味深いことがたくさん起きる可能性が高い。この技術の用途は必ずしも視覚的なものだけに限られない。これは、AIを進化させるというわれわれの取り組みの大きな部分を占めている」(LeCun氏)
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
企業や自治体、教育機関で再び注目を集める
身近なメタバース活用を実現する
パナソニックのV2H蓄電システムで創る
エコなのに快適な未来の住宅環境
OMO戦略や小売DXの実現へ
顧客満足度を高めるデータ活用5つの打ち手
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス