评论 电子

AI在扑克上战胜了人类,所以什么时候统治世界呢?

Amos Zeeberg 发表于  2017-03-18 11:45

(本文由 Nautilus 授权转载,译/Tzy)在今年年初的20天间,人工智能面对了一场在现实世界处理问题的重大能力测验。在宾夕法尼亚州匹兹堡的瑞弗斯赌场,一个名为Libratus的程序挑战了美国国内顶尖的四位扑克选手。他们玩的扑克游戏类型为一对一无限注德州扑克,游戏中两个玩家相互对决,通常在线比赛,在一系列的牌局中测试对方的策略,改善自己的战术,并且疯狂地唬牌。在12万手比赛后,Libratus完胜全部四个对手,赢取了1776250美元的模拟赌金,更重要的是,赢得了吹嘘自己是世界上最好的扑克玩家的资格。赛程过半的时候,和机器对战记录最好的人类玩家Dong Kim也已经差不多要认输了。“今天之前我都没有认识到它那么强。我觉得我好像在和一个作弊的人打牌,好像它能看到我的牌一样,”他对《连线》杂志说,“我不是在指控它作弊。它就是那么厉害。“

Dong Kim是挑战Libratus的四个扑克玩家之一。 图片来源:www.pocketfives.com

Libratus在扑克上的胜利只是人工智能战胜它们创造者的又一个例子。当计算机掌握了诸如井字棋和西洋跳棋等相对微不足道的小游戏时,除了计算机科学家之外没有人给予太多的关注。但是在1997年,I.B.M的深蓝在国际象棋上击败了国际特级大师加里·卡斯帕罗夫。国际象棋可是许多天才毕生致力的目标,因此涌起了一波关于计算机将变得多么智能的兴趣和担忧。近期人工智能领域的进步更快了:2011年I.B.M开发的Watson打败了综艺节目Jeopardy!史上最强人类冠军,而在去年,一个名为AlphaGo的程序击败了世界上顶尖的围棋手李世乭。在这个极端复杂的游戏上,人类失去统治地位的时间点,比研究人员预测的早了10年。

I.B.M开发的Watson打败了综艺节目Jeopardy!史上最强人类冠军。图片来源:bigthink.com

不完全信息游戏——与现实中的决策更加贴近

扑克看起来只是人工智能前进的又一步(通向反乌托邦全球统治,如果你相信科幻小说的话),但是这可能会是最意味深长的一步。和别的游戏不同的是,扑克是一个不完全信息游戏。在国际象棋和围棋中,你知道你和你对手的棋子都落在了哪里,并从这个完全确定的状态作出进一步预测;在扑克中,你不知道你的对手手中的面朝下的牌是什么,而且你必须在这个不确定的漩涡中作出决定。研究人员表示这场胜利更困难,并且或许更重要,因为现实中有如此之多决策都是建立在不完全信息上的。医生问诊病人,尽可能收集证据,做出事关生死的决策,但这些经常都是在不知道病人体内到底都发生了些什么的情况下完成的。外交官,商务谈判者和军事战略家不知道他们对手的真实状态和意图,但必须依据复杂的行动和后果的网络制定战略。

对于人工智能的研究专家而言,扑克程序不仅仅是赢得纸牌游戏的更好手段:它们是针对计算机如何基于不完全信息作出决策的实验。数十年以来,他们一直在改进他们的程序,试图追赶当今的顶尖标准——也就是我们人类。托马斯·桑德霍姆(Tuomas Sandholm)是Libratus的研发者,也是卡内基梅隆大学的计算机科学家,他已经专注于扑克12年了。他的上一个作品Claudico在2015年一场类似的比赛中败给了四个扑克专业玩家。来自阿尔伯塔大学的一个团队最近宣称他们研发的DeepStack是第一个在一对一无限制德州扑克上击败专业玩家的程序,虽然该赌场比赛的参与者表示那场比赛并没有那么激烈。既然计算机展示了它们的扑克牌比人类玩得更好,它们就有可能利用这项技能在现实生活中作出比我们更好的决策。

来自卡内基梅隆大学的托马斯·桑德霍姆是Libratus的研发者 图片来源:post-gazette.com

强化学习让计算机生成自己独有的策略

开发一个足够聪明到可以赢得比赛的程序,需要有巧妙的方法;桑德霍姆依靠一种称为强化学习的技巧。他和他的学生教给Libratus游戏规则,并给它简单的小目标——也就是赢钱,之后让它和自己开展数万亿手的对决,试着使用击败自己的步法。程序观察了怎样的玩法会成功,怎样的玩法会失败,并利用那些结果制定战略。这种方法的一个明显优点是Libratus不会局限于别的扑克玩家的策略,它有时会创造出自己的违反直觉的步法。例如,当Libratus手持弱牌,而对手提高了赌注,程序有时也会跟着提高赌注。这可能看起来很鲁莽,毕竟这增大了惨败的几率——要是对方是因为手持好牌而提高赌注,那可就输惨了。“如果我10岁的女儿这样玩扑克,我会告诉她别这么干。”桑德霍姆对华盛顿邮报说。“但是从结果来看,这其实是一招好棋。它可以帮忙辨识唬牌。“也就是说,如果提升赌注的对方是在唬牌,他们可能被Libratus对应提升赌注的举措所吓到,认为程序可能拿着一手好牌,并因此认输。Libratus发现,对付唬牌,可以靠一手更大的唬牌。

许多近期在人工智能领域的著名进展——例如无人驾驶车,人脸识别,和自然语言处理——依赖于一种不同的方法:“机器学习”。机器学习中,计算机读取巨量的数据集并根据它们观测到的模式作出结论。对比而言,强化学习在让计算机生成自己的有创造性的策略方面可能更胜一筹。如果这是真的,那么Libratus和AlphaGo都采用强化学习来培养它们远超人类的技能就不是一个巧合了。

战胜李世乭的AlphaGo也采用了强化学习方法。 图片来源:tastehit.com

Libratus给了我们十分诱人的想法:计算机在处理复杂和重要的问题上可能终将远远强于人类。但由于技术进步飞速,我们很难确定这样的技术在未来什么时候,或是否会被成功应用。从短期来看,这个程序甚至在它自己的领域里也算不上多大的威胁。Libratus在一对一的扑克游戏中的确优势尽显;但当它转到更多玩家的比赛时,要进行的运算将更加复杂,这将超出Libratus的能力范围。即便是一对一的线上游戏,Libratus对于运算的要求也非常之高(它在超级计算机上运行,使用的处理能力和内存分别是一台高端笔记本电脑的7000倍和17000倍),把它用在研究之外的领域并不现实。目前而言,这个程序正在通过另一种方式改变扑克游戏世界——训练人类玩家。“我们真的在学习这台电脑的想法,” 被机器打败的扑克玩家之一Jason Les说。“我认为我会通过这件事成为一个更优秀的扑克玩家。”(编辑:Ent)

本文由 Nautilus 授权果壳网(guokr.com)编译发表,严禁转载。 

编译来源

Nautilus, Computers Beat Humans at Poker. Next Up: Everything Else?
全部评论(89)
  • 31楼
    2017-03-20 18:25 方弦 科学松鼠会成员,信息学硕士生
    引用@布拉德雷祭司的马甲 的话:花牌情缘,天才麻将少女 你果然是该死的百合控对了,如果涉及到运气成分的公平游戏,计算机可以做到“在概率上不败”。 换句话说,即使这次的德州扑克是人类获胜,其实际胜利点数(或者怎么称呼)也会非常小

    不不不,花牌情缘没有百合……

    另外次要(!!)的一点是,花牌情缘里的其实不是花牌,而是歌牌,是一种体育运动(无误)……

    [0] 评论
  • 32楼
    2017-03-20 18:32 布拉德雷祭司的马甲
    引用@方弦 的话:不不不,花牌情缘没有百合……另外次要(!!)的一点是,花牌情缘里的其实不是花牌,而是歌牌,是一种体育运动(无误)……

    嗯嗯???居然不是百合……
    失望


    来自 果壳的壳
    [0] 评论
  • 33楼
    2017-03-20 19:04 小皇大大
    引用@方弦 的话:不不不,花牌情缘没有百合……另外次要(!!)的一点是,花牌情缘里的其实不是花牌,而是歌牌,是一种体育运动(无误)……

    玩花牌要是能赢的话感觉超爽。一次我愣是抽了个五光,然后还有花见酒月见酒猪鹿蝶。。。


    [0] 评论
  • 34楼
    2017-03-20 21:33 简尚风拾

    有限策略和规则游戏方面人类永远无法赢过优化算法,毕竟你一个人绝对无法战胜一个精通规则的团队和一台比你的到大脑运算快得多的计算机...不够既然已经证明了在有限策略和规则游戏中只要算法足有优化程序是不会输的(在整体概率上),那么下一步要做的事情就是在随机策略和随机规则游戏中使用有限算法自我学习战胜人类的挑战了。只有这样才能让AI真正战胜人类成为人工智能。

    [0] 评论
  • 35楼
    2017-03-20 23:53 lotus_wang

    我觉得这根本不是什么AI,纯粹就是概率计算。

    早在计算机年代以前,就有人出了一本小册子,里面是各种你已经计算好的牌面概率,你按照书本提示,放弃,跟 ,加注之类的什么照做就是了。

    后来赌场是严禁这方面的东西进入了。但总归有些记忆高手,靠这个赢钱,成了赌场的“不受欢迎的人”。


    [0] 评论
  • 36楼
    2017-03-21 09:56 question1
    引用@memberzgc 的话:NOIP斗地主……

    你好OIer

    [0] 评论
  • 37楼
    2017-03-21 13:32 自缚的普罗米修斯
    引用@天降龙虾 的话:AI:你们人类什么时候才能知道,你们想要通过我变得更优秀的想法,是根本不可能的,因为我就是为了取代你们成为更优秀的,才被创造出来的。。你们的时代什么时候结束,完全取决于我什么时候能在战场上打败你们。。...

    哇,看起来好有道理,这样的话人类认输还不行嘛。

    不过仔细想想,认输了以后AI找不到存在的价值会做些什么呢?

    [0] 评论
  • 38楼
    2017-03-21 13:33 自缚的普罗米修斯

    有种跟我玩拉火车。

    [0] 评论
  • 39楼
    2017-03-21 13:35 自缚的普罗米修斯
    引用@布拉德雷祭司的马甲 的话:数学上已经证明了,我们所玩的各种游戏,都存在不败策略。现在我们用一种方法找到了近似的不败策略,大家却恐慌起来了??? 这不科学啊

    really?锤头剪子布也存在不败策略?

    [0] 评论
  • 40楼
    2017-03-21 14:33 布拉德雷祭司的马甲
    引用@自缚的普罗米修斯 的话:really?锤头剪子布也存在不败策略?

    如果没有其他情况,石头剪刀布是个纯随机的游戏,那么只要出招没有固定规律,结果肯定时打平。
    而实际上,国内有研究(以前的旧闻),人在石头剪刀布游戏中,有一定的倾向性,而机器可就没有了。所以,机器比人厉害。

    你可以写一个随机的石头剪刀布程序,比试一下呗


    来自 果壳的壳
    [1] 评论
  • 41楼
    2017-03-21 14:35 自缚的普罗米修斯
    引用@布拉德雷祭司的马甲 的话:如果没有其他情况,石头剪刀布是个纯随机的游戏,那么只要出招没有固定规律,结果肯定时打平。 而实际上,国内有研究(以前的旧闻),人在石头剪刀布游戏中,有一定的倾向性,而机器可就没有了。所以,机器比人厉害...

    所以不是所有游戏都存在不败策略的咯。

    [0] 评论
  • 42楼
    2017-03-21 14:44 布拉德雷祭司的马甲
    引用@自缚的普罗米修斯 的话:所以不是所有游戏都存在不败策略的咯。

    随机类型的游戏,本身天然的就是不败的游戏——只要重复足够多次


    来自 果壳的壳
    [1] 评论
  • 43楼
    2017-03-21 15:16 沉薇
    引用@xml123 的话:从棋类到牌类,跨度还是蛮大的。不过这个扑克真的比围棋运算量还大吗,感觉状态空间没多大吧。

    从目前的理解看, 德州扑克其实主要是策略的博弈, 就是要针对对方的“套路”反应。

    Alpha Go的深度学习则是直接依靠图像识别,根据目前的棋型推演自己一方在哪里落子能够更早在棋盘上占据较大的份额。


    [0] 评论
  • 44楼
    2017-03-21 18:16 小皇大大

    还是想知道AI能不能在麻将或花牌上取胜

    [0] 评论
  • 45楼
    2017-03-21 18:37 Wyborowa
    引用@自缚的普罗米修斯 的话:所以不是所有游戏都存在不败策略的咯。

    ········································································································

    应该说,所有游戏都有最高胜率和利益最大化的策略,也都存在“定式”。所以任何游戏 ,人类输给机器只是早晚的问题。

    [0] 评论
  • 46楼
    2017-03-21 20:58 121121

    星零在厉害也只是大唐帝国皇后。

    [0] 评论
  • 47楼
    2017-03-22 07:33 小皇大大
    引用@Wyborowa 的话:····································································································...

    大多数人看了天麻之后都觉得强运肯定能战胜技术分析,不知道你赞不赞同?

    以前那些港片里面经常随便摸牌就自摸,不知道除了作弊之外还有没有可能达到这一点了

    [0] 评论
  • 48楼
    2017-03-22 07:39 魔道
    引用@IVV万岁 的话:alpha go战胜李世石的时候,果壳就有很多网友说真正的人...

    在围棋上的胜利是机器人更长远的运算胜利,在扑克牌的胜利是概率预判的胜利,而如果机器人学会编程,那就是起源的胜利,所以我认为机器人什么都可以接触,唯独不可以接触编程和材料,一个是脑子,一个人是身体


    [0] 评论
  • 49楼
    2017-03-22 13:18 牙丸阿不思
    引用@布拉德雷祭司的马甲 的话:数学上已经证明了,我们所玩的各种游戏,都存在不败策略。现在我们用一种方法找到了近似的不败策略,大家却恐慌起来了??? 这不科学啊

    怎么证明的?有相关文献吗?

    [0] 评论
  • 50楼
    2017-03-22 13:19 牙丸阿不思
    引用@魔道 的话:在围棋上的胜利是机器人更长远的运算胜利,在扑克牌的胜利是概率预判的胜利,而如果机器人学会编程,那就是起源的胜利,所以我认为机器人什么都可以接触,唯独不可以接触编程和材料,一个是脑子,一个人是身体

    计算机编程已经发展的很好了。虽然距离真正的大型程序还有一段距离,但是那个飞跃点对于AI来不是难事

    [0] 评论
  • 51楼
    2017-03-22 13:25 布拉德雷祭司的马甲
    引用@牙丸阿不思 的话:怎么证明的?有相关文献吗?

    博弈论的结论,一切轮流进行的公平游戏,均存在不败策略。


    来自 果壳的壳
    [0] 评论
  • 52楼
    2017-03-22 19:06 在雨夜
    引用@小皇大大 的话:还是想知道AI能不能在麻将或花牌上取胜

    记得科学松鼠会上看到的,麻将,人类早就输了。

    [0] 评论
  • 53楼
    2017-03-22 19:08 小皇大大
    引用@在雨夜 的话:记得科学松鼠会上看到的,麻将,人类早就输了。

    强运真的斗不过技术分析吗?

    [0] 评论
  • 54楼
    2017-03-22 19:10 在雨夜
    引用@小皇大大 的话:强运真的斗不过技术分析吗?

    运气本事不就是概率问题吗?

    [0] 评论
  • 55楼
    2017-03-22 19:20 小皇大大
    引用@在雨夜 的话:运气本事不就是概率问题吗?

    这年头也真的。。。要么出现港片中的那些牌场高手(随手一摸就胡的那种),要么作弊骗人,否则必输无疑。。。

    [0] 评论
  • 56楼
    2017-03-22 19:22 小皇大大
    引用@在雨夜 的话:运气本事不就是概率问题吗?

    玩骰子猜单双的话机器能赢吗?

    [0] 评论
  • 57楼
    2017-03-22 19:39 小皇大大

    以后再看看有没有精通推牌九的AI。北方人貌似比起麻将更喜欢牌九

    [0] 评论
  • 58楼
    2017-03-22 19:52 Wyborowa
    @小皇大大 的话:大多数人看了天麻之后都觉得强运肯定能战胜技术分析,不知道你赞不赞同?以前那些港片里面经常随便摸牌就自摸,不知道除了作弊之外还有没有可能达到这一点了
    ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    运气这东西来了,谁也拿你没办法,但反过来说,它不来,你也没辙。
    如果翻牌比大小,一翻两瞪眼,那的确谁也没有更高的胜率,这时总体的胜负,就要看每一把du多大,有没有上限。
    穷人和富豪比拼之所以吃亏,就是duben太少了,机会少很多。
    本人是个赛博朋克粉,深信人类文明必然走上人机合一的道路,如果人机未来有生死对抗,人类必然被灭,其中就有“duben”这个成本的原因。
    最终、最大的du本,莫过于堵命。一人一机堵命,败者死,人就算再有运气又能怎样?一条人命要多少时间、多少粮食,一个人的基础教育要几年?一架机器,制造几秒钟,基础知识几分钟。
    所以在下深信人类败于机器只在早晚而已。
    至于电影,不必较真。曾经看过哪位大家的杂文,特别有理,大意是,武侠片里面武功是不能较真的(你一较真,整个作品就不存在了),qiang战片里面的血///浆人///命是不能较真的,爱情片里面感天动地的爱情是不能较真的……看得你开心就好了。
    怎么又遇到敏感词了!真讨厌!烦透了!浪费时间!




    [0] 评论
  • 59楼
    2017-03-22 19:54 小皇大大
    引用@在雨夜 的话:运气本事不就是概率问题吗?

    上维基百科上查了一下各种牌类对运气的依赖程度

    麻将:需要运气,但以策略为主

    日式花牌:对概率和策略均有一定要求,均属于中等

    桥牌:低等至中等

    斗地主:运气要求高

    德州扑克:中等

    [0] 评论
  • 60楼
    2017-03-22 20:00 小皇大大
    引用@小皇大大 的话:上维基百科上查了一下各种牌类对运气的依赖程度麻将:需要运气,但以策略为主日式花牌:对概率和策略均有一定要求,均属于中等桥牌:低等至中等斗地主:运气要求高德州扑克:中等

    扎金花:中等

    牌九:不知道。。。应该不低

    [0] 评论

显示所有评论

你的评论

登录 发表评论

Amos Zeeberg
Amos Zeeberg Amos Zeeberg是现居东京的一名自由职业的科技记者。

更多科研事,扫码早知道

x 下载
关于我们 加入果壳 媒体报道 帮助中心 果壳活动 免责声明 联系我们 移动版 移动应用

©2017果壳网    京ICP证100430号    京网文[2015] 0609-239号    新出发京零字东150005号     京公网安备11010502007133号

违法和不良信息举报邮箱:jubao@guokr.com    举报电话:13488674940