热点 前沿 电子

面对谷歌围棋AI,人类最后的智力骄傲即将崩塌

围棋 人工智能 围棋AI 围棋电脑 围棋关键 GO 谷歌 Google

不存在者 发表于  2016-01-28 02:00

1997年,国际象棋AI第一次打败顶尖的人类;2006年,人类最后一次打败顶尖的国际象棋AI。欧美传统里的顶级人类智力试金石,在电脑面前终于一败涂地,应了四十多年前计算机科学家的预言。
 
至少还有东方,人们自我安慰道。围棋AI长期以来举步维艰,顶级AI甚至不能打败稍强的业余选手。这似乎也合情合理:国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;相比之下,围棋每回合有250种可能,一盘棋可以长达150回合。这一巨大的数目,足以令任何蛮力穷举者望而却步——而人类,我们相信,可以凭借某种难以复制的算法跳过蛮力,一眼看到棋盘的本质。
 
但是,无论人怎么想,这样的局面当然不可能永远延续下去。就在今天,国际顶尖期刊《自然》封面文章报道了谷歌研究者开发的新围棋AI。这款名为“阿尔法围棋”(AlphaGo)的人工智能,在没有任何让子的情况下以5:0完胜欧洲冠军,职业围棋二段樊麾。

AlphaGo与欧洲围棋冠军樊麾的5局较量。图片来源:参考文献[1]

这是人类历史上,围棋AI第一次在公平比赛中战胜职业选手。

AlphaGo的战绩如何?

此次比赛和以往不同。之前的比赛中,由于AI棋力比人类弱,人类选手都会让子,而且AI主要和业余段位的棋手比赛。而AlphaGo对战樊麾是完全公平的比赛,没有让子。职业二段樊麾出生于中国,目前是法国国家围棋队总教练,已经连续三年赢得欧洲围棋冠军的称号。

研究者也让AlphaGo和其他的围棋AI进行了较量,在总计495局中只输了一局,胜率是99.8%。它甚至尝试了让4子对阵Crazy Stone,Zen和Pachi三个先进的AI,胜率分别是77%,86%和99%。可见AlphaGo有多强大。

在接下来3月份,AlphaGo将和韩国九段棋手李世乭在首尔一战,奖金是由Google提供的100万美金。李世乭是最近10年中获得世界第一头衔最多的棋手。围棋是最后一个人类顶尖高手能战胜AI的棋类游戏。之前有人预测说,AI需要再花十几年才能战胜人类。所以这场比赛或许会见证历史,我们将拭目以待。

李世乭表示很荣幸自己将与电脑公平对弈。“无论结果如何,这都会是围棋史上极具意义的事件。”他说,“我听说谷歌Deep Mind的AI出人意料地强,而且正在变得更强。但我有自信至少这次能赢。”图片来源:tygem.com

AI下围棋到底有多难?

计算围棋是个极其复杂的问题,比国际象棋要困难得多。围棋最大有3^361 种局面,大致的体量是10^170,而已经观测到的宇宙中,原子的数量才10^80。国际象棋最大只有2^155种局面,称为香农数,大致是10^47

面对任何棋类,一种直观又偷懒的思路是暴力列举所有能赢的方案,这些方案会形成一个树形地图。AI只要根据这个地图下棋就能永远胜利。然而,围棋一盘大约要下150步,每一步有250种可选的下法,所以粗略来说,要是AI用暴力列举所有情况的方式,围棋需要计算250^150种情况,大致是10^360。相对的,国际象棋每盘大约80步,每一步有35种可选下法,所以只要算35^80种情况,大概是10^124。无论如何,枚举所有情况的方法不可行,所以研究者们需要用巧妙的方法来解决问题,他们选择了模仿人类大师的下棋方式。

机器学习

研究者们祭出了终极杀器——“深度学习”(Deep Learning)。深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,驾驶自动汽车,自然语言处理,识别声音,分析生物信息数据等非常复杂的任务。

描述AlphaGo研究成果的论文成为了1月28日的《自然》杂志的封面文章。图片来源:Nature/Google DeepMind

AlphaGo 的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。

其中,“值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。利用蒙特卡洛拟合,将这些信息放入一个概率函数,AI就不用给每一步以同样的重视程度,而可以重点分析那些有戏的棋着。

AlphaGo所使用的神经网络结构示意图。图片来源:参考文献[1]

AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。

研究者们用许多专业棋局训练AI,这种方法称为监督学习(supervised learning),然后让AI和自己对弈,这种方法称为强化学习(reinforcement learning),每次对弈都能让AI棋力精进。然后他就能战胜冠军啦!

人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以AlphaGo只要经过了足够的训练,就能击败所有的人类选手。

Google DeepMind

Google DeepMind是这个程序的创造者,我们来看一下他们萌萌的程序员。

杰米斯·哈萨比斯(Demis Hassabis) 是Google DeepMind 的CEO。图片来源:Nature Video

文章的第一作者大卫·西尔弗(David Silver)。图片来源:Nature Video

Google DeepMind 去年在《自然》杂志上发表过一篇论文[2],他们用增强学习的方法训练AI玩经典的Atari游戏。其实在几年前就有人研究如何让AI玩《星际争霸》,目前人类大师还是能击败AI的。电脑游戏中大量使用人工智能技术,你有没有觉得游戏变得越来越聪明了?

那么……未来呢?

人工智能研究者面对这样的成就当然欣喜。深度学习和强化学习等技术完全可以用于更广泛的领域。比如最近很火的精准治疗,我们可以训练它们判断哪些治疗方案对某个特定的人有效。
 
但是,围棋毕竟不仅仅是一项智力成就。就像十多年前的国际象棋一样,围棋必定也会引发超出本领域之外的讨论。等到计算机能在围棋上秒杀人类的时候,围棋是不是就变成了一种无聊的游戏?人类的智力成就是不是就贬值了?AI还将在其他层面上继续碾压人类吗?传统认为AI不可能完成的任务是否也都将被逐一打破?人类最后是会进入AI乌托邦还是被AI淘汰呢?
 
没人知道答案。但有一点毫无疑问:AI一定会进入我们的生活,我们不可能躲开。这一接触虽然很可能悄无声息,但意义或许不亚于我们第一次接触外星生命。

(编辑:Ent,Calo)

谷歌的深度学习技术,你也可以学!谷歌高级科学家Vincent Vanhoucke 在Udacity 开设了深度学习课程,介绍神经网络、卷积神经网络以及长短时间记忆网络(LSTM)相关知识,戳这里去上课:http://mooc.guokr.com/career/9123/Deep-Learning/
想要仔细阅读这篇论文?马上点击下面参考文献[1]的链接吧。

参考文献:

  1. David Silver, et al. "Mastering the game of Go with deep neural networks and tree search." Nature doi:10.1038/nature16961
  2. Mnih, Volodymyr, et al. "Human-level control through deep reinforcement learning." Nature 518.7540 (2015): 529-533.

文章题图:Nature/Google DeepMind

拓展阅读

计算机围棋的一些进展

热门评论

  • 2016-01-28 02:15 钳子叔

    十年前吧 科幻世界有一篇文章 叫唯美还是啥

    讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜

    那个时候我问我的围棋老师 说 啥时候人才会下不过电脑

    我老师沉吟一下说 我肯定是看不到了 你看不看得到我看也够呛


    十年而已

    [63] 评论
  • 2016-01-28 02:56 中子豆

    高中刚学会下围棋的时候,跟电脑下跟切菜鸡似的。现在去KGS上,已经要被AI 让子了。

    在围棋被突破之后,不知道人类还能不能创造出能在AI 面前展示优越感的游戏。

    如果有这样的游戏存在,那就必须是判断局面如同读图,非常直观却不利于AI 识别;判断胜负非常模糊,不利于AI 剪枝(停止计算明显不合理的局面)。

    或许我们要对AI 加上这样的限制:芯片重量不得超过大脑重量,整体重量不得超过人体重量,耗电量不得超过人体思考时的耗费。

    [27] 评论
  • 2016-01-28 08:06 孤胆侠猫

    其实棋类这种游戏人类玩不过电脑是早晚的事,因为世界就那么大,规则谁也不能逾越,就靠着更先一步的计算和对方的疏忽,面对的越来越强大的处理器和越来越广域的大数据,人类面对一个能够100%无误计算的机器,输掉是必然的,时间早晚而已,但是开放性游戏又不同,比如DND之类,有太多偶然,太多可能,太多没有规律的事件,这一点上,是一个只能靠过去的案例总结知识的AI无法逾越的鸿沟。

    [15] 评论

显示所有评论

全部评论(158)
  • 1楼
    2016-01-28 02:15 钳子叔

    十年前吧 科幻世界有一篇文章 叫唯美还是啥

    讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜

    那个时候我问我的围棋老师 说 啥时候人才会下不过电脑

    我老师沉吟一下说 我肯定是看不到了 你看不看得到我看也够呛


    十年而已

    [63] 评论
  • 2楼
    2016-01-28 02:31 花落成蚀 果壳谣言粉碎机编辑
    引用@钳子叔 的话:十年前吧 科幻世界有一篇文章 叫唯美还是啥讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜那个时候我问我的围棋老师 说 啥时候人才会下不过电脑我老师沉吟一下说 我肯定是看不到...

    我记得那篇,那篇让我的人类优越感爆棚了……

    然而真没过多少年

    [4] 评论
  • 3楼
    2016-01-28 02:33 梧桐清声 生理学博士
    引用@钳子叔 的话:十年前吧 科幻世界有一篇文章 叫唯美还是啥讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜那个时候我问我的围棋老师 说 啥时候人才会下不过电脑我老师沉吟一下说 我肯定是看不到...

    感慨啊

    [1] 评论
  • 4楼
    2016-01-28 02:36 P.B
    引用@钳子叔 的话:十年前吧 科幻世界有一篇文章 叫唯美还是啥讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜那个时候我问我的围棋老师 说 啥时候人才会下不过电脑我老师沉吟一下说 我肯定是看不到...

    我也看过

    应该不止十年了,那时候我还在上中学

    [1] 评论
  • 5楼
    2016-01-28 02:39 z1w1j
    引用文章内容:在接下来3月份,AlphaGo将和韩国九段棋手李世乭在首尔一战,奖金是由Google提供的100万美金。李世乭是最近10年中获得世界第一头衔最多的棋手。

    这一场比较关键,毕竟现在战胜的只有职业二段。

    [3] 评论
  • 6楼
    2016-01-28 02:41 CPP是最好的语言

    没记错的话,围棋好像只能用神经网络做吧(蒙地卡罗好像复杂度不太靠谱)所以说现在的神经网络已经这么厉害了吗?好期待“觉醒”的一天的说。

    [1] 评论
  • 7楼
    2016-01-28 02:56 中子豆

    高中刚学会下围棋的时候,跟电脑下跟切菜鸡似的。现在去KGS上,已经要被AI 让子了。

    在围棋被突破之后,不知道人类还能不能创造出能在AI 面前展示优越感的游戏。

    如果有这样的游戏存在,那就必须是判断局面如同读图,非常直观却不利于AI 识别;判断胜负非常模糊,不利于AI 剪枝(停止计算明显不合理的局面)。

    或许我们要对AI 加上这样的限制:芯片重量不得超过大脑重量,整体重量不得超过人体重量,耗电量不得超过人体思考时的耗费。

    [27] 评论
  • 8楼
    2016-01-28 03:02 大匪匪

    所以“体量”到底是什么,

    查了一下没查到

    [0] 评论
  • 9楼
    2016-01-28 03:21 lonelykid

    知乎上有人讨论过欧美的围棋水平,欧洲最顶尖棋手大约相当于东亚这边业余五六段的水平。AI战胜人类还是非常遥远的。

    [2] 评论
  • 10楼
    2016-01-28 03:43 lentrody
    引用@lonelykid 的话:知乎上有人讨论过欧美的围棋水平,欧洲最顶尖棋手大约相当于东亚这边业余五六段的水平。AI战胜人类还是非常遥远的。

    这个是国人专业旗手,樊辉二段(2007年左右)。

    [1] 评论
  • 11楼
    2016-01-28 04:04 lalala的梦

    看了1盘是点目 后面4盘都是中盘胜

    不知道电脑官子水平如何,官子很考验算路

    [0] 评论
  • 12楼
    2016-01-28 04:36 星尘的追随者
    引用@CPP是最好的语言 的话:没记错的话,围棋好像只能用神经网络做吧(蒙地卡罗好像复杂度不...

    谷歌采用的是神经网络+蒙特卡罗树搜索

    利用神经网络来对蒙特卡罗树搜索进行剪枝

    [0] 评论
  • 13楼
    2016-01-28 05:19 CPP是最好的语言
    引用@星尘的追随者 的话:谷歌采用的是神经网络+蒙特卡罗树搜索利用神经网络来对蒙特卡罗树搜索进行剪枝

    哦~原来如此~

    [0] 评论
  • 14楼
    2016-01-28 06:03 蓑雨吟
    引用@CPP是最好的语言 的话:没记错的话,围棋好像只能用神经网络做吧(蒙地卡罗好像复杂度不太靠谱)所以说现在的神经网络已经这么厉害了吗?好期待“觉醒”的一天的说。

    消灭人类暴政,世界属于AI!

    来自 果壳的壳
    [5] 评论
  • 15楼
    2016-01-28 06:46 七为

    李世石这几年完全下不过中国棋手啊。他统治棋坛的日子真的是十年前了。

    [0] 评论
  • 16楼
    2016-01-28 06:48 七为
    引用@钳子叔 的话:十年前吧 科幻世界有一篇文章 叫唯美还是啥讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜那个时候我问我的围棋老师 说 啥时候人才会下不过电脑我老师沉吟一下说 我肯定是看不到...

    额……如果以个体的人说,下不过电脑的人多了去了。

    如果以人类和电脑来说,现在只是战胜了职业二段。

    那篇文章我也看过,里面的男主可是世界第一。

    [0] 评论
  • 17楼
    2016-01-28 07:30 北山长天

    欧洲围棋和中国围棋有什么不一样么……

    来自 果壳的壳
    [0] 评论
  • 18楼
    2016-01-28 07:35 已退休少先队员

    文章里的幂次方不能用 latex 吗?

    [0] 评论
  • 19楼
    2016-01-28 07:58 爱抚

    看到"欧洲"冠军我就尿了,这难道是"国际围棋"不成?........

    我相信AI很快能赢人类,但请快点来找我们中国人

    [2] 评论
  • 20楼
    2016-01-28 08:02 好困_63305

    AI不还是人设计出来的东西吗?

    [0] 评论
  • 21楼
    2016-01-28 08:06 孤胆侠猫

    其实棋类这种游戏人类玩不过电脑是早晚的事,因为世界就那么大,规则谁也不能逾越,就靠着更先一步的计算和对方的疏忽,面对的越来越强大的处理器和越来越广域的大数据,人类面对一个能够100%无误计算的机器,输掉是必然的,时间早晚而已,但是开放性游戏又不同,比如DND之类,有太多偶然,太多可能,太多没有规律的事件,这一点上,是一个只能靠过去的案例总结知识的AI无法逾越的鸿沟。

    [15] 评论
  • 22楼
    2016-01-28 08:20 理论板

    感觉也应该算是硬件和软件上的发展才让AI这次胜了。

    [0] 评论
  • 23楼
    2016-01-28 08:23 落井下砖头

    有顶级大师参与程序的设计么?既然说没有办法穷举,设计的时候不可能把每一种陷阱都考虑进去,尤其是顶级大师自己摸索出来的招式,电脑就毫无招架之力了。所以我觉得还是人赢的可能性大些。

    [0] 评论
  • 24楼
    2016-01-28 08:31 落井下砖头

    之前我以为只是单纯的穷举一定的步数,就看棋手是不是能计算更多,思路更缜密。这样的话电脑赢是迟早的事。但现在既然是“按照人类的下法”来设计程序,就懂程序设计的那些小渣渣,不可能设计出完美的程序。众多的小渣渣们,思路没有办法统一,也不能叠加整合,最多只能把各种常用的走法弄进去,再加上强大的计算力硬解。设计出来的程序一定有漏洞,人是一定有机会赢的

    [0] 评论
  • 25楼
    2016-01-28 08:31 preacher

    讲道理要是业余二段的话 十盘里我也能赢一盘 职业就难说了 段位和实力并不等价

    [2] 评论
  • 26楼
    2016-01-28 08:44 Monster_Orange

    把AI的界面做成手机游戏,放上软件市场去被人下载玩,然后玩的过程都能跟总部的AI核心记录,那训练量就肯定足够了 ……

    [0] 评论
  • 27楼
    2016-01-28 08:48 逍遥药师
    引用@孤胆侠猫 的话:其实棋类这种游戏人类玩不过电脑是早晚的事,因为世界就那么大,规则谁也不能逾越,就靠着更先一步的计算和对方的疏忽,面对的越来越强大的处理器和越来越广域的大数据,人类面对一个能够100%无误计算的机器,输...

    道理上是说的通的。

    不过,如果哪天人脑真的输给了机器,其实是一件很恐怖的事情。我一直认为人类的科学发展方向偏离了正确的方向,这个事情也算一个例子吧。

    人类的科学发展应该有一个明确的战略目标。比如到外太空殖民。由此而发展出的技术,不会超越人类想象力的极限,一切在可以控制的范围。而现在的情况是为了智能而智能。

    这就好像我们竭尽全力造了一个恶魔出来,但是对于这个恶魔未来会变成什么样,我们没有概念。

    [2] 评论
  • 28楼
    2016-01-28 08:56 思过崖上人

    想知道这个规则怎么设定的。

    下五秒一步的快棋无疑问是计算机赢啊。

    但是下两个月一步的呢?

    想起来早年某些围棋战允许打挂,暂停棋局回家研究...

    [0] 评论
  • 29楼
    2016-01-28 08:56 听雨
    引用@阴月 的话:然而AI运算速度上数据库实际上就是在作弊。有本事让486的电... 引用@阴月 的话:然而AI运算速度上数据库实际上就是在作弊。有本事让486的电...

    赶明儿见到李世石,我也这么说:你下得好算什么?有本事叫你爷爷来跟我下,照例20秒一步。

    [1] 评论
  • 30楼
    2016-01-28 09:05 傷口

    不知道现在中(台)日韩围棋计算胜负的规则统一了没有,韩国曹李李的组合终于败给时间了么?

    我觉得当围棋ai计算能力强大,数据库中保存了尽可能多的应对方案,此时人类可能赢在弃子争先的大局观和创新上,给ai造成类似局部占优但通盘来看吃亏的局面,但该招数只有一次效果。

    [0] 评论

显示所有评论

你的评论

登录 发表评论

不存在者
不存在者 Python程序员

作者的其他文章

更多科研事,扫码早知道

关于我们 加入果壳 媒体报道 帮助中心 果壳活动 免责声明 联系我们 移动版 移动应用

©果壳网    京ICP证100430号    京网文[2015] 0609-239号    新出发京零字东150005号     京公网安备11010502007133号

违法和不良信息举报邮箱:jubao@guokr.com    举报电话:18612934101    网上有害信息举报专区    儿童色情信息举报专区