> >

AIが6人プレーのポーカーで人間に圧勝--FacebookとCMUの「Pluribus」

Queenie Wong （CNET News）翻訳校正：矢倉美登里吉武稔夫湯本牧子（ガリレオ）2019年07月12日 12時11分

　先ごろ、15人のプロのポーカープレーヤーが、ちょっと変わったテキサスホールデム（ポーカーの一種）をプレーした。これらのベテラン勢が対戦したのは、彼らに比べれば初心者の、Facebookとカーネギーメロン大学（CMU）が開発した人工知能（AI）ボットだ。

提供：Getty Images

　AIはこれまでに、チェスと囲碁のプロのプレーヤーに圧勝してきた。チェスと囲碁は、どちらもルールが明確なボードゲームだ。ポーカーもルールは明確だ。だが、相手の手がわからず、ブラフのような戦術を通じて感情を操る必要があるため、もっとやりにくいと考えられている。この対戦では、各ゲームに6人のプレーヤーを参加させ、AIが管理しなければならないシナリオを増やして、複雑さを増した。

　それでも、ポーカー専用ボット「Pluribus」を止められなかった。Pluribusは、人間の挑戦者をものともしなかった。その中には、ポーカーの世界的トーナメントであるWorld Series of Poker（WSOP）やWorld Poker Tour（WPT）のチャンピオンもいた。研究者らは、ボットの成績について「超人的」だと評した。

　Facebookはブログで次のように述べた。「AIボットが、主要なベンチマークとなる、3人以上のプレーヤー（または3つ以上のチーム）が参加するゲームで、トップクラスのプロに勝てることを証明したのは、これが初めてだ」

　Facebook AI ResearchのリサーチサイエンティストであるNoam Brown氏は、CMUでコンピューター科学の教授を務めるTuomas Sandholm氏とともに、Pluribus（ラテン語で「もっと」を意味する）を開発した。Sandholm氏が率いるチームは、16年以上にわたってコンピューターポーカーを研究している。両氏の研究結果は米国時間7月11日、学術誌Scienceに掲載された。

　2人は、2つの実験を計画した。1人の人間が5体のPluribusを相手にする実験と、5人の人間が1体のPluribusと対戦する実験だ。どちらの場合も、Pluribusが明らかな勝ちを収めた。

　最初の実験では、いずれも米国のポーカーのプロであるDarren Elias氏とChris "Jesus" Ferguson氏が5体のAIボットを相手に、1人5000回プレイした。Elias氏はWPTの最多優勝者という記録を持ち、Ferguson氏はWSOPで6回優勝したことがある。両氏は自宅のコンピューターからプレイした。

　2人には、テキサスホールデムのゲームへの参加報酬として2000ドル（約22万円）が贈られた。両氏にいかんなく実力を発揮してもらうため、AIに対してすぐれた成績を収めた方には、さらに2000ドルが贈られることになっていた。

　総合成績として、Pluribusはゲーム1回あたり平均32mbb（milli big blind）で両氏を打ち負かした。big blindはテキサスホールデムにおける強制ベットで、milli big blindは成績の比較に使う単位だ。

　もう一方の実験では、全員がプロとしてそれぞれ100万ドル（約1億850万円）超を獲得したことのある13人のプレーヤーが、このAIボットに挑戦した。Pluribusは一度に5人のプレーヤーと対戦し、12日間にわたって1万回プレイした。

　Pluribusはゲーム1回あたり平均48mbbで勝利した。Facebookはブログ記事の中で、チップ1枚を1ドル（約109円）とすれば、ボットは5人との対戦で1時間あたり1000ドル（約10万9000円）を獲得したことになると述べた。研究論文では、この勝率はPluribusが「人間の対戦相手より強い」ことを示すものだとしている。

　「時に、下手なプレーヤーでも、いいカードが来たというだけで世界最高のプレーヤーを打ち負かすことがある。われわれは、そうした運の要因を測りたいわけではない。本当に測りたいのは、技能の要因だ」（Sandholm氏）

　Pluribusは、自らのコピーと対戦することで、テキサスホールデム向けの戦略をゼロから考案した。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

CNET Japanの記事を毎朝メールでまとめ読み（無料）