「Ms. Pac-Man」(ミズパックマン)のプレイスキルで人間が2位に転落した。Ms. Pac-Manは人工知能(AI)にとってクリアが最も困難なゲームの1つと評価されていたが、それでもAIを阻止することはできなかった。
Microsoftの「Maluuba」チーム(Microsoftが2017年に入ってから買収したカナダの深層学習スタートアップ)がMs. Pac-Manでフルスコアの99万9990点を記録した。これは、人間のプレーヤーが保持する最高スコアの4倍の数字だ。
この偉業は、「Hybrid Reward Architecture」(ハイブリッド報酬アーキテクチャ)と呼ばれる強化学習手法を使って達成された。チームは150のAIエージェントに対し、並列的に連携してMs. Pac-Manのプレイスキルを高めるよう訓練した。あるエージェントにはペレットを食べると報酬を与え、別にエージェントにはお化けをよけたら報酬を与えた。その後、トップエージェントはほかのエージェントからフィードバックを得て、加重平均を使って判断を行った。
予測不可能なゲームでMicrosoftのAIが成功を収めたことで、研究者は、AIが同様に予測不可能な現実世界の状況に対処するのも支援できるようになるかもしれない。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」