人工知能がポーカーでも人間のプロに勝利--カーネギーメロン大学の「Libratus」

Asha McLean (Special to ZDNET.com) 翻訳校正: 編集部2017年02月02日 11時09分

 ピッツバーグで20日間にわたって開催されたポーカーのヘッズアップトーナメントで、カーネギーメロン大学(CMU)の開発した人工知能(AI)システムがプロのポーカープレーヤー4人を破った。

 2人のプレーヤーで行われる無制限のテキサスホールデムでは、10の160乗の情報セットが考えられる。CMUのAIシステム「Libratus」は、その情報セットを処理する戦略的推論能力と計算能力を備える。

 Libratusを開発したのは、コンピュータサイエンス教授のTuomas Sandholm氏とコンピュータサイエンス博士課程学生のNoam Brown氏だ。Libratusは、ピッツバーグスーパーコンピューティングセンターの「Bridges」コンピュータにホストされている。

 両氏によると、Libratusの勝利は運によるものではないという。

 「不完全な情報について戦略的推論を行う最も優秀なAIの能力は、最も優秀な人間の同じ能力を超えた」(Sandholm氏)

 4人のプロを倒すために、Libratusはすべてのカードを把握できるわけではない状態で決定を下し、同時に相手のブラフを見破ろうと試みる必要があった。

 CMUによると、Libratusはトーナメントを通して、Bridgesの846台のコンピュートノードのうち、約600台の生の処理能力を利用したという。Bridgesの合計処理速度は1.35ペタフロップ(ハイエンドなノートPCのおよそ7250倍)で、メモリ容量は274テラバイトだ。

 「毎日、対戦が終わった後、メタアルゴリズムによって、プロが発見して利用したLibratusの戦略の欠点を分析した」(Sandholm氏)

 「その後、Libratusはそれらの欠点に優先順位をつける。そして、毎晩、Bridgesを使って上位3つの欠点を修正する。これは、過去にポーカーで学習が使用されてきた方法と大きく異なる」(同氏)

 「通常、研究者が開発するのは、相手の弱点を利用しようとするアルゴリズムだ。それとは対照的にLibratusでは、日々の改善の狙いは自らの戦略の欠点をアルゴリズムで修正することだ」(同氏)

 

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]