西西文学网 > 玄幻奇幻小说 > 数学心 > 第五百七十一章 AI “赌神”完胜人类扑克冠军,以一敌五实现多人博弈里程碑

第五百七十一章 AI “赌神”完胜人类扑克冠军,以一敌五实现多人博弈里程碑

    ai在多人扑克里超越人类的表现,为ai与博弈理论发展树立了新的里程碑。

    六人无限德州扑克是世界上最流行的扑克形式。日前,卡内基梅隆大学与facebookai合作开发的人工智能程序“pluribus”,击败了六人无限德州扑克的职业选手。

    在一项包含13名职业选手的实验中,pluribus一次对战5名职业选手,共进行了10,000手牌,并最终取得胜利。这些职业选手都曾在扑克竞技游戏里赢得超过100万美元。

    在另一项实验中,每位职业选手要对阵5个pluribus。在5000手牌的对阵中,pluribus击败了扑克专家darrenelias和chris“jesus”ferguson——他们前者保持着世界扑克巡回赛冠军最多的纪录,后者赢得了6项世界扑克系列赛冠军。

    当地时间7月11日,《科学》杂志发表了描述这一成就的论文(doi:101126/2400)。

    pluribus由卡内基梅隆大学计算机教授tuomassandholm与facebookai部门科学家noambrown共同开发。

    tuomassandholm依托过去16年在卡内基梅隆大学实验室开发的战略推理技术,创立了两家公司——strategicmachine和strategyrobot。前者将这些技术应用于扑克、游戏、商业和医学领域,而后者则将它们应用于国防和智能领域。

    noambrown在facebookai工作的同时在卡内基梅隆大学攻读了计算机学博士学位。二人早前开发了双人扑克ailibratus,在2017年击败了四名扑克职业选手。

    多人博弈里程碑

    “pluribus在多人扑克里超越人类的表现,将成为ai与博弈理论领域公认的里程碑,”pluribus开发者sandholm说,“目前为止,策略推理中的超人ai里程碑仅限于两方竞争。在如此复杂的游戏中击败其他五名选手的能力为使用ai解决各种现实问题开辟了新的机会。”

    为什么科学家总是喜欢让ai在各种棋牌类游戏里进行突破?这是因为棋牌游戏自古以为都被认为是人类智力活动的象征,模仿人类的ai自然要以此为目标。

    不过根据棋牌规则,不同棋牌类型的游戏的博弈难易各不相同。根据信息的公开程度,我们可以将棋牌博弈分为“完全信息类”和“不完全信息类”。

    “完全信息类”博弈包括国际象棋、围棋等,它们的盘面信息都是公开的,对弈双方接收到的信息完全。在此类博弈中,ai每次只需要根据当前盘面,搜索计算各种情况下自己的胜率。为了提高搜索效率,一般需要对搜索过程中产生的“博弈树”进行广度和深度剪枝。就是我们平常下棋时常说的算多远和算多准。

    “非完全信息类”博弈包括德州扑克、桥牌、麻将等游戏。以德州扑克为例:每个玩家有2张牌作为“底牌”,同时还有5张公共牌。玩家选择5张公共牌里的3张,与手里的2张底牌组合,最后以期得到最好的5张牌的组合。按照“cardranking”决定最后的胜者。

    由于游戏中每个人无法看到对手手里的牌,这要求参与者具备更复杂的推理能力,不仅要看对手打了什么牌,还要猜测对手手里有什么牌,并根据对手行动暗示出的信息,来计算自己的最优出牌法。这给ai带来了更严峻的挑战。ai不仅要学会根据不完全信息进行复杂决策,还要应付对手的虚张声势、故意示弱等招数。游戏的人数的也将改变ai的应对难度。

    实验中使用的扑克游戏界面。图片来源:facebook