ソニーは、レーシングビデオゲーム「グランツーリスモ7」の全プレーヤーを対象に、同ゲームの世界トップクラスのプレーヤーに勝利した人工知能(AI)エージェント「GTソフィー」を期間限定で体験できるようにした。
「レース・トゥギャザー」とソニーが呼ぶ期間限定イベントが、米国太平洋時間2月20日午後10時(東部時間21日午前1時)に開始された。期間中は、由緒あるこの「PlayStation」ゲームの最新バージョン「グランツーリスモ7」(GT7)に無償でアップデートできる。3月下旬まで、GT7の4つのコースで、GTソフィー4台とレース対決が可能だ。
ソニーは、対戦相手となるコンピューターをレベルアップしている。これにより、人間のプレーヤーに格段に優れた挑戦しがいのあるゲームを提供できるだろうと、ソニーAIアメリカのディレクターで、GT Sophyプロジェクトを率いるPeter Wurman氏は述べた。4つのコースは、3つの難易度レベルに分かれており、さらなる上級者は、GTソフィーと同一パフォーマンスの車両で1対1で対戦できる。
「これによって、すべてのスキルレベルで、より人間らしく感じる対戦相手がいる、はるかに現実的なレーシング体験を提供できると期待している」とWurman氏は述べた。また、GT7の標準的なコンピューター対戦相手は、スキルが最も高いものでも中級レベル止まりだが、GTソフィーはそれよりもスキルが高いため、プレーヤーは強力な人間の対戦相手を求めて、オンライン上を開拓する必要はなくなると語った。
体験できるのはわずか1カ月だが、ゲーム業界においては大盤振る舞いだ。もしくは、それ以上と言えるかもしれない。ソニーはゆくゆくは、AI対戦相手をグランツーリスモだけでなく他のビデオゲームにも追加したい考えだ。また、このAIスキルが、カーレーシングのビデオゲームで適切に機能するということは、その技術が実生活にも適用されるようになる可能性があることを示している。
「これは、こうした技術の一部が、人間に力を与えるためにどのように役立つかを示す1つの例だ」と、コンサルティング企業McKinseyのシニアパートナーLareina Yee氏は述べた。つまり、フォークリフトの操縦者や農業従事者が、ボットから学ぶようになる可能性がある。「これらの技術は、とりわけ特殊なスキルや専門技術が求められる場合に、トレーニングの促進に役立つ可能性がある」(Yee氏)
OpenAIの「ChatGPT」が、新たなレベルの理解と創造性を示し、Microsoftが、このチャットボット技術を検索エンジン「Bing」に組み込み、Googleがそれに競合する「Bard」を開発していることで、AIは今、高い注目を浴びている。それらには、大規模言語モデルという技術が採用されており、それによって、見苦しい失態もあれば、目を見張る利便性も示されているが、ソニーのAIには、強化学習という異なるアプローチが採用されている。
強化学習は、現在のほとんどのAI手法と同様に、人間の脳にヒントを得た「ニューラルネットワーク」と呼ばれる基盤を用いる。学習段階でニューラルネットワークにパターン認識を「学習」させ、次に推論段階でそのネットワークに、車がコーナーを曲がる速度などを判断させる。
ソニーは「GTソフィー」を訓練するにあたり、20台の「PlayStation」を24時間ぶっ続けで稼働させ、AI同士を対戦させたと、Wurman氏は述べた。GTソフィーは、人間のプレーヤーと同じように加速やブレーキ、ステアリングをコントロールした。人間のレーサーが用いるゲーム機のコントローラーやハンドル型コントローラーの代わりに、GTソフィーは、GT7にコントロールデータを毎秒10回送るコンピューターインターフェースを使用した。
強化学習では、ラップを完走する、相手を追い越すなどの正しい行動をとった場合に報酬を与えたと、Wurman氏は述べている。一方、壁に衝突したり、他の車とぶつかったりした場合は、罰を与えてその行動を抑制する。
この強化学習の手法を用いて、Google傘下のDeepMindは、Atariの古典的なビデオゲーム全57本で勝利し、さらには、より難しいリアルタイムストラテジーゲーム「StarCraft II」でも人間を打ち負かした。
DeepMindの研究チームはそのほか、囲碁で人間に勝つAIを構築したり、分子の配列がどのように折りたたまれてタンパク質になるかを予測する、有名な計算の難問に取り組むなど、優れた学術的成果を上げている。しかし、GTソフィーの技術は、2022年に科学誌「Nature」の表紙を飾るという栄誉を得ただけでなく、一般家庭の居間にあるゲーム機にその姿を現す。
ソニーAIの最高執行責任者(COO)でいくつかの学術論文の著者でもあるMichael Spranger氏は、ソニーにとって強化学習とは、他の車を追いかけているときと先頭を走っているときで空気力学がどのように変化するかといった、ゲームの微細な物理現象をGTソフィーが学習できることを意味すると述べている。
「これがAIのブレイクスルーとして興味深い理由は、そこに複雑な要素が加わっていることだ。他のドライバーと競わなければならない、すなわち追い越すことを学ばなければならない」と、Spranger氏は言う。「他の車の後ろにつけると、トップスピードはさらに速くなるが、ブレーキに時間がかかる」
複雑さはそのレベルにとどまらない。レースには暗黙のルールがあるのだ。「非常に緩やかな決まりごとではあるが、エチケットに反するようなことをすれば罰せられる」と、Spanger氏は指摘する。人間のプレーヤーは、現実世界で発達してきた規範をGTソフィーが守らなければいら立ちを覚え、GTソフィーとの対戦を避けるようになってしまうという。
GTソフィーは、わずか2日ほどのトレーニングで、人間のプレーヤーの95%より速く走れるようになった。さらに10~12日間のトレーニングを積んだところ、GTソフィーはGT7でトップクラスの人間のプレーヤーに勝てるようになったという。
今回、GTソフィーが参戦する期間は数週間のみだが、このAIプレーヤーはいつの日か戻ってくることが期待される。
「今回(のイベント)は、数十万人のプレーヤーに(GTソフィーとの対戦を)体験してもらい、フィードバックを得て、次回に向けた改善方法を見つける機会をもたらしてくれる」と、Wurman氏は言う。「われわれはもちろん、この機能を恒久的にゲームへ実装することに関心を持っている」
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」