關於牌手求勝秘訣的坊間流傳 — 不僅需要玩家的靈活、直覺,更需要運氣;那AI牌手呢?又是如何做到如此地步的?  

Libratus 的特點是使用「賽局理論」訓練,採用納許均衡的對戰策略—只要其他玩家的策略保持不變,單一玩家就無法透過變換策略獲益。Libratus 跟 AlphaGo 一樣,也是藉由強化學習去提升自己的牌藝, Libratus 學習識別沒有希望的策略,從而更快地找到納許平衡(Nash equilibrium),也就是賽局中的「平衡」,找出最適合的策略,算出該以怎樣的機率出掉手中的牌,也就是知道該如何「隨機」出牌。

AI 賭神如何靠賽局理論 大勝人類職業牌手?

Duke 大學的 Vincent Conitzer 教授表示:「出牌的好壞取決於無法觀察到的事情,這也代表參與遊戲者需要變得不可預測。如果你從未虛張聲勢,那麼你不是個好牌手;如果你總是虛張聲勢,你也不是好牌手。賽局理論則是教你如何隨機化你的出牌,並找到最適點。」

Libratus 只能在特定的遊戲規則中(例如雙人德州撲克)打敗人類,如果換個玩法,像是多人德州撲克、牌七、大老二), Libratus 就得要再重新學習。

Libratus 的技術突破在真實世界中有更多的應用。一方面是賽局理論被廣泛應用在交通分析、資安防護、機器人等領域,可以提升相關領域的分析成效。第二方面則是世界的運作充滿隨機性, Libratus 在這方面做得比人類好,具有在不確定性的環境中的決策能力。此項技術可適用於金融市場的交易策略,甚至是軍事博弈上。


  圖片皆轉自網路


發佈留言