AI 賭神如何靠賽局理論大勝人類職業牌手？(下) – 大老爺娛樂城部落格亞洲現金版首選

關於牌手求勝秘訣的坊間流傳 — 不僅需要玩家的靈活、直覺，更需要運氣；那AI牌手呢？又是如何做到如此地步的？

Libratus 的特點是使用「賽局理論」訓練，採用納許均衡的對戰策略—只要其他玩家的策略保持不變，單一玩家就無法透過變換策略獲益。Libratus 跟 AlphaGo 一樣，也是藉由強化學習去提升自己的牌藝， Libratus 學習識別沒有希望的策略，從而更快地找到納許平衡（Nash equilibrium），也就是賽局中的「平衡」，找出最適合的策略，算出該以怎樣的機率出掉手中的牌，也就是知道該如何「隨機」出牌。

Duke 大學的 Vincent Conitzer 教授表示：「出牌的好壞取決於無法觀察到的事情，這也代表參與遊戲者需要變得不可預測。如果你從未虛張聲勢，那麼你不是個好牌手；如果你總是虛張聲勢，你也不是好牌手。賽局理論則是教你如何隨機化你的出牌，並找到最適點。」

Libratus 只能在特定的遊戲規則中（例如雙人德州撲克）打敗人類，如果換個玩法，像是多人德州撲克、牌七、大老二）， Libratus 就得要再重新學習。

Libratus 的技術突破在真實世界中有更多的應用。一方面是賽局理論被廣泛應用在交通分析、資安防護、機器人等領域，可以提升相關領域的分析成效。第二方面則是世界的運作充滿隨機性， Libratus 在這方面做得比人類好，具有在不確定性的環境中的決策能力。此項技術可適用於金融市場的交易策略，甚至是軍事博弈上。

圖片皆轉自網路

發佈留言 取消回覆

發佈留言取消回覆