AI開発におけるポーカーの重要性

音楽プロデューサーで起業家のケニー・ロジャースは、「優れたギャンブラーは、カードを保持するタイミング、それにゲームから降りるタイミングを熟知していなくてはならない」と話しています。しかし今では、人間のプレイヤーよりもコンピュータープログラムの方が賢いことがわかっています。ポーカー専用に開発された「Libratus」というプログラム。アメリカで行われたテキサスホールデムポーカー大会「Brains Vs. Artificial Intelligence」で、このコンピュータプログラムが4人のプロポーカープレーヤーに170万ドル(約2億円)という大差で圧勝したのです! 

AIを開発したチームにとって、プロに勝ったことは大きな成果でした。ポーカーは複雑なゲームであり、論理的思考や知能も必要とするため、機械が模倣するのは難しいのです。ポーカーは他のカジノのゲームとは違い、またチェスやチェッカー、囲碁とも違います。カードは相手からは見えません。そうした不完全な情報に基づいたゲームを解読するのは非常に大変です。また、相手はあらゆる手段を使ってくる可能性があるので、たくさんの戦略も学ばなくてはなりません。

バイドゥの主任科学者アンドリュー・ングは「ポーカーはAIが解読するのが最も難しいもののひとつ」と述べています。また、「唯一の最善の手はありません。いつ『ブラフ』しているかわからなくするため、AIプレイヤーは無作為に手をつくる必要があります」とも語っています。

Libratusを開発したのは、カーネギーメロン大学でコンピューター科学を研究するトゥオマス・サンドホルム教授と大学院生のノーム・ブラウン。教授は、人間がこれほど長きにわたってコンピューターに勝利しているのは素晴らしい、と述べています。様々な不確実性に基づいた最高の戦略を探るため、研究チームは「ゲーム理論」を採用しました。これは、「平衡」と呼ばれる戦略的な意思決定に関する数学理論です。可能性を測定することは困難なため、通常はある種の近似が用いられます。

デューク大学でAIやゲーム理論を教えているビンセント・コニツァ-教授は、以下のように述べています。「判断の良し悪しは、観測できない要素に依存します。そこから、予測不可能性が必要となります。一度もブラフしなければ、優れたプレイヤーとは言えません。ブラフばかりしていても駄目です。ゲーム理論は、ある意味で最善となるようにプレイを無作為化する方法を教えてくれます。」

昨年、サンドホルム教授は「Claudico」というプログラムを開発しましたが、複数のチームと対戦して大敗しました。Libratusは最新の成果を多く採用した結果、現在のような高い能力を手に入れたのだ、と教授は言います。想定される結果を分析するための新たな方法には、新しい平衡近似の手法を使う必要があるのです。教授によると、相手のカードは最後までわからないため、そうした手法を織り込むことが重要だということです。

近年は、コンピュータープログラムが人間を負かす事例が次々と登場しています。それが機械学習や人工知能の進化につながっています。グーグルの親会社であるアルファベット傘下のディープマインドの研究者たちが昨年公開したプログラムは、世界最高峰の囲碁の棋士を倒しました。囲碁はとても複雑で、試合に勝つ方法は計算が難しいため、見事な成果と言えます。

こうした手法はかつて、現実的な用途を多数持つ、賢いポーカーロボットを開発するために使われました。コンピューター専門家のサム・ガンズフリードによると、ゲーム理論はすでに、電波妨害やサイバーセキュリティ、タクシーの自動ナビ、ロボットプランニングの研究に利用されています。ガンズフリードはClaudicoの開発にも貢献しており、現在はフロリダ国際大学で教鞭をとっています。

実際のカジノでもオンラインでも、自分がどんなにいい手をつくってもLibratusのようなプログラムに負けてしまう場合があります。しかしながら、オンラインでポーカーをすればいい練習になります。勝ち負けにこだわらず腕を磨き、ギャンブラーとして成長するきっかけとなればいいでしょう。