先ごろ、15人のプロのポーカープレーヤーが、ちょっと変わったテキサスホールデム(ポーカーの一種)をプレーした。これらのベテラン勢が対戦したのは、彼らに比べれば初心者の、Facebookとカーネギーメロン大学(CMU)が開発した人工知能(AI)ボットだ。
AIはこれまでに、チェスと囲碁のプロのプレーヤーに圧勝してきた。チェスと囲碁は、どちらもルールが明確なボードゲームだ。ポーカーもルールは明確だ。だが、相手の手がわからず、ブラフのような戦術を通じて感情を操る必要があるため、もっとやりにくいと考えられている。この対戦では、各ゲームに6人のプレーヤーを参加させ、AIが管理しなければならないシナリオを増やして、複雑さを増した。
それでも、ポーカー専用ボット「Pluribus」を止められなかった。Pluribusは、人間の挑戦者をものともしなかった。その中には、ポーカーの世界的トーナメントであるWorld Series of Poker(WSOP)やWorld Poker Tour(WPT)のチャンピオンもいた。研究者らは、ボットの成績について「超人的」だと評した。
Facebookはブログで次のように述べた。「AIボットが、主要なベンチマークとなる、3人以上のプレーヤー(または3つ以上のチーム)が参加するゲームで、トップクラスのプロに勝てることを証明したのは、これが初めてだ」
Facebook AI ResearchのリサーチサイエンティストであるNoam Brown氏は、CMUでコンピューター科学の教授を務めるTuomas Sandholm氏とともに、Pluribus(ラテン語で「もっと」を意味する)を開発した。Sandholm氏が率いるチームは、16年以上にわたってコンピューターポーカーを研究している。両氏の研究結果は米国時間7月11日、学術誌Scienceに掲載された。
2人は、2つの実験を計画した。1人の人間が5体のPluribusを相手にする実験と、5人の人間が1体のPluribusと対戦する実験だ。どちらの場合も、Pluribusが明らかな勝ちを収めた。
最初の実験では、いずれも米国のポーカーのプロであるDarren Elias氏とChris "Jesus" Ferguson氏が5体のAIボットを相手に、1人5000回プレイした。Elias氏はWPTの最多優勝者という記録を持ち、Ferguson氏はWSOPで6回優勝したことがある。両氏は自宅のコンピューターからプレイした。
2人には、テキサスホールデムのゲームへの参加報酬として2000ドル(約22万円)が贈られた。両氏にいかんなく実力を発揮してもらうため、AIに対してすぐれた成績を収めた方には、さらに2000ドルが贈られることになっていた。
総合成績として、Pluribusはゲーム1回あたり平均32mbb(milli big blind)で両氏を打ち負かした。big blindはテキサスホールデムにおける強制ベットで、milli big blindは成績の比較に使う単位だ。
もう一方の実験では、全員がプロとしてそれぞれ100万ドル(約1億850万円)超を獲得したことのある13人のプレーヤーが、このAIボットに挑戦した。Pluribusは一度に5人のプレーヤーと対戦し、12日間にわたって1万回プレイした。
Pluribusはゲーム1回あたり平均48mbbで勝利した。Facebookはブログ記事の中で、チップ1枚を1ドル(約109円)とすれば、ボットは5人との対戦で1時間あたり1000ドル(約10万9000円)を獲得したことになると述べた。研究論文では、この勝率はPluribusが「人間の対戦相手より強い」ことを示すものだとしている。
「時に、下手なプレーヤーでも、いいカードが来たというだけで世界最高のプレーヤーを打ち負かすことがある。われわれは、そうした運の要因を測りたいわけではない。本当に測りたいのは、技能の要因だ」(Sandholm氏)
Pluribusは、自らのコピーと対戦することで、テキサスホールデム向けの戦略をゼロから考案した。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
住環境に求められる「安心、安全、快適」
を可視化するための“ものさし”とは?
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス