logo

AIが6人プレーのポーカーで人間に圧勝--FacebookとCMUの「Pluribus」

Queenie Wong (CNET News) 翻訳校正: 矢倉美登里 吉武稔夫 湯本牧子 (ガリレオ)2019年07月12日 12時11分
  • このエントリーをはてなブックマークに追加

 先ごろ、15人のプロのポーカープレーヤーが、ちょっと変わったテキサスホールデム(ポーカーの一種)をプレーした。これらのベテラン勢が対戦したのは、彼らに比べれば初心者の、Facebookとカーネギーメロン大学(CMU)が開発した人工知能(AI)ボットだ。

提供:Getty Images
提供:Getty Images

 AIはこれまでに、チェスと囲碁のプロのプレーヤーに圧勝してきた。チェスと囲碁は、どちらもルールが明確なボードゲームだ。ポーカーもルールは明確だ。だが、相手の手がわからず、ブラフのような戦術を通じて感情を操る必要があるため、もっとやりにくいと考えられている。この対戦では、各ゲームに6人のプレーヤーを参加させ、AIが管理しなければならないシナリオを増やして、複雑さを増した。

 それでも、ポーカー専用ボット「Pluribus」を止められなかった。Pluribusは、人間の挑戦者をものともしなかった。その中には、ポーカーの世界的トーナメントであるWorld Series of Poker(WSOP)やWorld Poker Tour(WPT)のチャンピオンもいた。研究者らは、ボットの成績について「超人的」だと評した。

 Facebookはブログで次のように述べた。「AIボットが、主要なベンチマークとなる、3人以上のプレーヤー(または3つ以上のチーム)が参加するゲームで、トップクラスのプロに勝てることを証明したのは、これが初めてだ」

 Facebook AI ResearchのリサーチサイエンティストであるNoam Brown氏は、CMUでコンピューター科学の教授を務めるTuomas Sandholm氏とともに、Pluribus(ラテン語で「もっと」を意味する)を開発した。Sandholm氏が率いるチームは、16年以上にわたってコンピューターポーカーを研究している。両氏の研究結果は米国時間7月11日、学術誌Scienceに掲載された。

 2人は、2つの実験を計画した。1人の人間が5体のPluribusを相手にする実験と、5人の人間が1体のPluribusと対戦する実験だ。どちらの場合も、Pluribusが明らかな勝ちを収めた。

 最初の実験では、いずれも米国のポーカーのプロであるDarren Elias氏とChris "Jesus" Ferguson氏が5体のAIボットを相手に、1人5000回プレイした。Elias氏はWPTの最多優勝者という記録を持ち、Ferguson氏はWSOPで6回優勝したことがある。両氏は自宅のコンピューターからプレイした。

 2人には、テキサスホールデムのゲームへの参加報酬として2000ドル(約22万円)が贈られた。両氏にいかんなく実力を発揮してもらうため、AIに対してすぐれた成績を収めた方には、さらに2000ドルが贈られることになっていた。

 総合成績として、Pluribusはゲーム1回あたり平均32mbb(milli big blind)で両氏を打ち負かした。big blindはテキサスホールデムにおける強制ベットで、milli big blindは成績の比較に使う単位だ。

 もう一方の実験では、全員がプロとしてそれぞれ100万ドル(約1億850万円)超を獲得したことのある13人のプレーヤーが、このAIボットに挑戦した。Pluribusは一度に5人のプレーヤーと対戦し、12日間にわたって1万回プレイした。

 Pluribusはゲーム1回あたり平均48mbbで勝利した。Facebookはブログ記事の中で、チップ1枚を1ドル(約109円)とすれば、ボットは5人との対戦で1時間あたり1000ドル(約10万9000円)を獲得したことになると述べた。研究論文では、この勝率はPluribusが「人間の対戦相手より強い」ことを示すものだとしている。

 「時に、下手なプレーヤーでも、いいカードが来たというだけで世界最高のプレーヤーを打ち負かすことがある。われわれは、そうした運の要因を測りたいわけではない。本当に測りたいのは、技能の要因だ」(Sandholm氏)

 Pluribusは、自らのコピーと対戦することで、テキサスホールデム向けの戦略をゼロから考案した。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]