Googleの人工知能(AI)担当責任者で、ディープラーニング(深層学習)やAIを主要な研究テーマとするプロジェクト「Google Brain」を共同で立ち上げたJeff Dean氏によると、現在のAIモデルは1つの芸当しかできない段階にあり、「通常は1つのことしかできないように訓練されている」という。しかし、「Pathways」という新たなアプローチにより、多数の芸をこなすよう訓練できるようになる可能性があるという。
Dean氏はPathwaysを「次世代のAIアーキテクチャー」と表現し、「1つのモデルで数千、または数百万ものことをするよう訓練できる」としている。
Pathwaysは、1つの感覚から得た情報にしか反応できないというAIモデルの能力の限界を取り除き、テキストや画像、音声など複数の感覚に反応できるようになる。
「Pathwaysは、視覚、聴覚、言語理解力を同時に駆使するマルチモーダルモデルを実現できる可能性がある」(Dean氏)
このマルチモーダルモデルは、例えば「ヒョウ」という言葉、誰かが「ヒョウ」と言っている音声、あるいはヒョウが走っている動画を処理できる。
マルチモーダルモデルのAIは、これら3種類のどの情報からでもヒョウという概念を認識する。Dean氏は、こうしたモデルなら「より洞察力に富み、ミスやバイアスに囚われにくい」としている。
Googleにとって、バイアスは厄介な問題だ。同社でAI倫理チームの責任者を務めていたTimnit Gebru氏は2020年12月に辞職し、共同執筆した論文にDean氏が異議を唱えていたことが報じられた。この論文は、新しいAIモデルの開発に関連するエネルギーコストや、人種差別的コンテンツや性差別的コンテンツ、攻撃的コンテンツを含むあらゆるものをAIモデルがウェブから取り込むため、それがAIモデルの働きに影響するおそれがあるという事実について書かれたもので、発表はされていないが、MIT Technology Reviewの査読を受けている。
Dean氏は、「何種類もの作業をシングルタスクで実行するだけでなく、すでに持っているスキルから必要な部分を抽出して組み合わせ、新たな作業をより迅速かつ効率的に学ぶこともできる1つのモデルをトレーニングしたい」と述べる。
同氏が説明しているのは、「ネットワークのどの部分がどの作業に適しているかを動的に学習し、モデルの最も適切な部分に作業を回す方法を学ぶ」AIモデルだ。
したがって、Pathwaysを使えば、機械学習の判断能力が高まり、ひょっとすると問題や状況について実際に論理的な判断を下せるAIに一歩近づけるかもしれない。
Dean氏はPathwaysについて、何種類もの作業を学習する能力が高いだけでなく、ネットワーク内の与えられた作業に関連する部分だけを動かすため、エネルギー効率も高いと説明している。
「Pathwaysは1つのAIシステムを使って、何千種類あるいは何百万種類もの作業をこなせるように汎用化したり、さまざまなタイプのデータを理解させたりできる。それも、驚くほど効率的に。それによって、われわれはパターン認識しかできない単目的モデルの時代から、より汎用的なインテリジェントシステムが人間の世界についてさらに深く理解し、新たなニーズに適応できる時代に進める」(Dean氏)
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」