> >

WaymoとDeepMind、戦略ゲーム用ボットを訓練した手法を自動運転AIに応用

Kyle Hyatt （CNET News）翻訳校正：湯本牧子吉武稔夫（ガリレオ）編集部2019年07月29日 14時03分

　ニューラルネットワークを訓練する新たな方法を見つけるのは、特に自動運転車の開発競争が過熱するのに伴い、ますます重要になってきた。そこで開発者はニューラルネットワークをさらに進化させるため、かなり独創的な方法を考え出している。

提供：Waymo

　いずれもAlphabet傘下で自動運転技術を開発するWaymoと人工知能（AI）を開発するDeepMindが協力し、ニューラルネットワークをより効率的に訓練するための新たな方法を考案した。ダーウィンの進化論に着想を得たものだという。

　MIT Technology Reviewの記事によると、この方法はもともと、DeepMindがリアルタイム戦略ゲーム「StarCraft II」をプレイするAIボットを訓練するのに利用したもの。

　StarCraft IIでは、それぞれが固有のスキルを持った数十種類のユニットを制御しなければならない。その一方でリソースを管理して、自分を消し去ろうとしている敵と戦う必要がある。これは複雑なタスクで、人間なら得意だが、機械だと手こずることがある。

　WaymoとDeepMindは、Population-Based Training（PBT：集団に基づく訓練）と呼ばれる訓練手法を使って自然淘汰を模倣することを可能にした。この手法では、複数のニューラルネットワークを競わせ、より効率的にタスクをこなすものを残していく。

　Waymoの機械学習インフラ担当ディレクター、Matthieu Devin氏はMIT Technology Reviewの取材に対して次のように述べた。「産業システムの機械学習に取り組んでいる誰にとっても主要な課題の1つは、新しいコードを活用できるようシステムを再構築できるようにすることだ。われわれは絶えず（ニューラル）ネットを再訓練し、コードを書き直す必要がある。そして再訓練する場合には、パラメータの微調整が必要となることもある」