ピッツバーグで20日間にわたって開催されたポーカーのヘッズアップトーナメントで、カーネギーメロン大学(CMU)の開発した人工知能(AI)システムがプロのポーカープレーヤー4人を破った。
2人のプレーヤーで行われる無制限のテキサスホールデムでは、10の160乗の情報セットが考えられる。CMUのAIシステム「Libratus」は、その情報セットを処理する戦略的推論能力と計算能力を備える。
Libratusを開発したのは、コンピュータサイエンス教授のTuomas Sandholm氏とコンピュータサイエンス博士課程学生のNoam Brown氏だ。Libratusは、ピッツバーグスーパーコンピューティングセンターの「Bridges」コンピュータにホストされている。
両氏によると、Libratusの勝利は運によるものではないという。
「不完全な情報について戦略的推論を行う最も優秀なAIの能力は、最も優秀な人間の同じ能力を超えた」(Sandholm氏)
4人のプロを倒すために、Libratusはすべてのカードを把握できるわけではない状態で決定を下し、同時に相手のブラフを見破ろうと試みる必要があった。
CMUによると、Libratusはトーナメントを通して、Bridgesの846台のコンピュートノードのうち、約600台の生の処理能力を利用したという。Bridgesの合計処理速度は1.35ペタフロップ(ハイエンドなノートPCのおよそ7250倍)で、メモリ容量は274テラバイトだ。
「毎日、対戦が終わった後、メタアルゴリズムによって、プロが発見して利用したLibratusの戦略の欠点を分析した」(Sandholm氏)
「その後、Libratusはそれらの欠点に優先順位をつける。そして、毎晩、Bridgesを使って上位3つの欠点を修正する。これは、過去にポーカーで学習が使用されてきた方法と大きく異なる」(同氏)
「通常、研究者が開発するのは、相手の弱点を利用しようとするアルゴリズムだ。それとは対照的にLibratusでは、日々の改善の狙いは自らの戦略の欠点をアルゴリズムで修正することだ」(同氏)
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス