ニューラルネットワークを訓練する新たな方法を見つけるのは、特に自動運転車の開発競争が過熱するのに伴い、ますます重要になってきた。そこで開発者はニューラルネットワークをさらに進化させるため、かなり独創的な方法を考え出している。
いずれもAlphabet傘下で自動運転技術を開発するWaymoと人工知能(AI)を開発するDeepMindが協力し、ニューラルネットワークをより効率的に訓練するための新たな方法を考案した。ダーウィンの進化論に着想を得たものだという。
MIT Technology Reviewの記事によると、この方法はもともと、DeepMindがリアルタイム戦略ゲーム「StarCraft II」をプレイするAIボットを訓練するのに利用したもの。
StarCraft IIでは、それぞれが固有のスキルを持った数十種類のユニットを制御しなければならない。その一方でリソースを管理して、自分を消し去ろうとしている敵と戦う必要がある。これは複雑なタスクで、人間なら得意だが、機械だと手こずることがある。
WaymoとDeepMindは、Population-Based Training(PBT:集団に基づく訓練)と呼ばれる訓練手法を使って自然淘汰を模倣することを可能にした。この手法では、複数のニューラルネットワークを競わせ、より効率的にタスクをこなすものを残していく。
Waymoの機械学習インフラ担当ディレクター、Matthieu Devin氏はMIT Technology Reviewの取材に対して次のように述べた。「産業システムの機械学習に取り組んでいる誰にとっても主要な課題の1つは、新しいコードを活用できるようシステムを再構築できるようにすることだ。われわれは絶えず(ニューラル)ネットを再訓練し、コードを書き直す必要がある。そして再訓練する場合には、パラメータの微調整が必要となることもある」
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
住環境に求められる「安心、安全、快適」
を可視化するための“ものさし”とは?
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」