热点 其他

AlphaGo大战柯洁,是这么一回事

S.西尔维希耶 发表于  2017-05-23 10:30

5月23日,千年水乡乌镇将迎来一场举世瞩目的围棋峰会。在为期一周的峰会中,“世界第一围棋AI”AlphaGo将与中国围棋职业九段棋手柯洁对弈三场。并与其他知名中国棋手一起进行团队赛和配对赛。AlphaGo是什么?为什么这场对决会如此受人关注?这篇文章会为你梳理事情的全貌。

AlphaGo是什么?

AlphaGo是由英国Google DeepMind公司开发的围棋人工智能程序。它可能是有史以来最强大的围棋棋手。

图片来源:deepmind.com

DeepMind公司于2010年由杰米斯·哈萨比斯(Demis Hassabis)博士、沙恩·莱吉(Shane Legg)博士和穆斯塔法·苏雷曼(Mustafa Suleyman)共同创立。其中,哈萨比斯和莱吉相识于伦敦大学学院盖茨比计算神经科学组。

与其说是一间创业公司,DeepMind看起来更像是一家致力于新技术的实验室。他们的项目包括创造一个能够以和人类一样的方式“学习”如何玩游戏并达到高水平的人工智能。在只用原始像素和游戏得分作为输入数据的情况下,他们的程序学会了包括《乓》(Pong)和《打砖块》(Breakout)在内的多种游戏的玩法,并达到了超人的水平。

2014年,DeepMind被谷歌以4亿美元收购。同年,AlphaGo项目诞生,开始一步步向围棋游戏的巅峰发起挑战。

“在‘深蓝’战胜卡斯帕罗夫之后,围棋就成了游戏AI最后的圣杯。”哈萨比斯说。图片来源:blog.google

AlphaGo和人下围棋战绩如何?

在已公开的赛事中,AlphaGo与人类围棋选手较量的战绩是——69胜1负。

2015年10月,AlphaGo在没有任何让子的情况下,以5:0的悬殊比分击溃欧洲围棋冠军樊麾二段。

2016年3月,韩国职业棋手李世乭九段迎战AlphaGo,以1:4不幸败北。此战之初,柯洁曾断言李会以5:0的比分大胜,AlphaGo毫无胜算。但在李世乭输掉第三盘后,柯洁也不得不承认计算机的实力强大。表示“跟AlphaGo下的话,同样的条件下,我输的可能性非常大”。

2016年12月,神秘棋手“Master”登录中国弈城围棋网,以每天十盘的速度接连击败中外各大顶尖棋手,取得了空前绝后的60连胜。人们耳熟能详的职业棋手如古力、常昊等纷纷被斩落马下,柯洁也不幸成为它的手下败将。在输给Master后,柯洁身体抱恙住院。2017年1月4日,AlphaGo团队公布“Master”背后正是升级版AlphaGo的这一事实。

柯洁用“震撼”来形容AlphaGo带给围棋界的感受,但同时也表示人类还会变得更强。

在乌镇的围棋峰会上,柯洁将在5月23日、5月25日和5月27日三天各与AlphaGo交锋一局。这三番棋的胜负将会如何呢?

大家怎么看AlphaGo这次对决柯洁?

考虑到人工智能在网络快棋中的先天优势,目前人们仍未能断言AlphaGo在允许人类思考更长时间的慢棋中表现同样良好。不过,谈及乌镇围棋峰会上柯洁对阵AlphaGo的可能结果,人类棋手表现得非常悲观。

中国“棋圣”聂卫平表示,他认为柯洁会被0:3击溃。古力九段认为,如果柯洁发挥出100%的状态,那么他也许有5%的胜率。而曾经狂傲地认为“阿尔法狗战胜不了我”的柯洁,也谦虚地表示:“这次能代表人类出战是我的荣幸,我将尽全力去争胜,一决胜负,抱有必胜的信念和必死的决心,不轻易言败。”

古力(左一)、樊麾(左三)、聂卫平(右二)、柯洁(右一)与谷歌CEO桑德尔·皮蔡(左二)一起探讨AlphaGo的棋艺。图片来源:deepmind.com

哈萨比斯则在博客中期待柯洁能将AlphaGo的表现逼到极限,乃至超越极限。同时,由陈耀烨九段、周睿羊九段、芈昱廷九段、时越九段和唐韦星九段组成的团队也会与AlphaGo进行一场较量。哈萨比斯希望他们能够测试AlphaGo的创造力和适应能力到底在什么水平。

AlphaGo到底是怎么下棋的?

在一局围棋中,平均每一步的下法大约有200种可能。棋盘上可能出现的局面总数到了远大于宇宙中原子总数的地步。因此,通过暴力穷举手段预测所有的可能情况并从中筛选中最优势走法的思路,并不适用于围棋AI。

围棋棋盘上出现的可能局面数远大于宇宙中的原子数量。图片来源:Deepmind

AlphaGo选择了别的下棋方式。支撑AlphaGo提高棋力、打败人类选手的“秘诀” 有三个:深度神经网络、监督/强化学习、蒙特卡罗树搜索。

深度神经网络是包含超过一个认知层的计算机神经网络。对于人工智能而言,世界是被用数字的方式呈现的。人们将人工智能设计出不同的“层”,来解决不同层级的认知任务。这种具备许多“层”的神经网络,被称为深度神经网络。AlphaGo包含两种深度神经网络:价值网络和策略网络。价值网络使得AlphaGo能够明晰局势的判断,左右全局“战略”,抛弃不合适的路线;策略网络使得AlphaGo能够优化每一步落子,左右局部“战术”,减少失误。两者结合在一起,使得AlphaGo不需要过于庞大的计算也能够走出精妙的棋局,就像人类一样。

监督学习和强化学习是机器学习方式的不同种类。监督学习是指机器通过人类输入的信息进行学习,而加强学习是指机器自身收集环境中的相关信息作出判断,并综合成自己的“经验”。在初始阶段,AlphaGo收集研究者输入的大量棋局数据,学习人类棋手的下法,形成自己独特的判断方式。之后,在不计其数的自己与自己模拟对弈,以及每一次与人类棋手对弈中,AlphaGo都能并根据结果来总结并生成新的范式,实现自我提高。

最后,蒙特卡洛树是一种搜索算法。AI在利用它进行决策判断时,会从根结点开始不断选择分支子结点,通过不断的决策使得游戏局势向AI预测的最优点移动,直到模拟游戏胜利。AI每一次的选择都会同时产生多个可能性,它会进行仿真运算,推断出可能的结果再做出决定。

AlphaGo中的蒙特卡罗树搜索流程。图片来源:Nature

除了AlphaGo,围棋AI哪家强?

依赖于上述三大“武器”,AlphaGo成为了目前人类制造出来的最为优秀的围棋AI。连败人类棋手的胜绩就是明证。但除了它之外,世界各国也开发过不同的游戏AI,向围棋这一智力上的“绝对领域”发起挑战。

法国研发的Crazy Stone(狂石),日本研发的Zen(天顶)都曾是这一领域的翘楚。它们都曾经给人类造成过威胁,但从未像AlphaGo一样将最顶级的人类棋手打的一败涂地。在AlphaGo一举走红之后,人工智能界对围棋AI的研发热情空前高涨。

Zen的改良版DeepZenGO在2017年3月参加了日本举办的“世界最强棋手决定战”,先后负于中国棋手芈昱廷九段和韩国棋手朴廷桓九段后,战胜日本棋手井山裕太九段,取得第三名的成绩。

由中国腾讯公司研发的围棋AI“绝艺”(Fine Art)于2016年3月后完成,同年8月23日首次战胜职业棋手。11月2日,绝艺战胜世界冠军江维杰九段。11月19日,绝艺与柯洁九段交手,取得了一胜一负的成绩。如今,绝艺对世界冠军和全国冠军的胜率,已经能够维持在90%以上了。

弄一个谁都打不过的围棋AI,有什么用?

在多年的呕心沥血后,AlphaGo和一系列崛起的围棋AI一起成为了围棋界新的高峰。毋庸置疑,它们的下棋方式会改变人们目前对围棋下法的观念。许多曾经的定势将会被打破,新的格局即将开始。也许在若干年后的围棋教科书上,流传多年颠扑不破的真理将会被改写。可是,花了那么多人力物力,研究者们想做的,就只是这样一个能够下赢人类的AI吗?

当然不是。

AlphaGo是一个标志。它的诞生,意味着人们对人工智能的探索已经到达了一个新的阶段。造就AlphaGo的学习模式,将被推广到各种领域,譬如面孔识别,语音识别等等。造就AlphaGo的核心技术,也许还能在其他领域同样的帮助我们。

尽管不如AlphaGo那么有名,但DeepMind研制的AI已经在为谷歌公司服务了。他们出品的人工智能帮助谷歌减少了40%在机房冷却系统上的花费。他们还希望能够与英国国家电网合作,利用人工智能将英国的能耗减少10%。

AlphaGo和它的同伴们能走多远?这件事,可能还要时间给我们答案。不管你愿不愿意承认,人工智能的时代已经慢慢到来了。在国际象棋、在围棋、在你所知道的任何一个领域,都会慢慢涌现出能过代替人类的人工智能。

柯洁在比赛前夜谈及人工智能。图片来源:新浪微博

这是好事还是坏事?没有人能够预测。但无论人们是不是喜欢这个事实,新的时代已经降临了。(编辑:姜Zn)

来源:

  1. https://en.wikipedia.org/wiki/AlphaGo
  2. https://deepmind.com/research/alphago/
  3. https://deepmind.com/blog/exploring-mysteries-alphago/
  4. https://en.wikipedia.org/wiki/Deep_learning
  5. https://en.wikipedia.org/wiki/Reinforcement_learning
  6. https://machinelearnings.co/understanding-alphago-948607845bb1
  7. https://news.xinhuanet.com/sports/2017-04/10/c_1120783734.htm
  8. https://www.weibo.com/2865101843/Epj9ds97i
  9. https://tech.qq.com/a/20170103/021509.htm
  10. https://tech2ipo.com/63246
  11. https://deepmind.com/blog/deepmind-ai-reduces-google-data-centre-cooling-bill-40/
  12. https://www.youtube.com/watch?v=TnUYcTuZJpM&t=337s
  13. https://arstechnica.co.uk/information-technology/2017/03/deepmind-national-grid-machine-learning/

热门评论

  • 2017-05-23 15:11 CBP
    引用@咖啡饼干 的话:得,本来柯洁领先的,被翻盘了。。

    那不叫领先,那只是人类不能理解狗的全盘布局罢了,这种情况从去年就出现了,从去年还有今年年初的比赛中就可以看出,狗总是下出一些人类觉得昏招透顶的棋,然而你就是赢不了他.事实证明你以为狗傻了,你以为自己占了优势,只是你不理解狗的布局而已.

    而现在围棋界也开始学习狗的这些昏招,比如今天柯杰起手三-三,这招在狗出现之前围棋界根本不会开局用,谁用谁就会被当傻逼,而且狗这么玩之后,在这距今大半年之类人类棋手们都经常起手三-三了.就这么说,狗的整体观远胜于人类,而且人类已经理解不了了.你以为你暂时领先,只不过是AI觉得这样走就能在最后赢你而已.

    [31] 评论
  • 2017-05-23 10:49 布拉德雷祭司的马甲

    不懂围棋,只好干看着……


    来自 果壳的壳
    [25] 评论
  • 2017-05-23 20:08 布拉德雷祭司的马甲
    引用@yy2080 的话:文章写的好,一个google都不提到,足见作者是个(...)

    “AlphaGo是由英国Google DeepMind公司开发的围棋人工智能程序。它可能是有史以来最强大的围棋棋手。”


    好了,你可以把眼睛挖出来了

    [19] 评论

显示所有评论

全部评论(71)
  • 1楼
    2017-05-23 10:44 王丘山

    哪里直播?

    [7] 评论
  • 2楼
    2017-05-23 10:49 布拉德雷祭司的马甲

    不懂围棋,只好干看着……


    来自 果壳的壳
    [25] 评论
  • 3楼
    2017-05-23 10:50 钛钢具足虫

    创造出神吧

    [2] 评论
  • 4楼
    2017-05-23 10:55 傷口

    围棋入门爱好者,希望不要吐血

    [1] 评论
  • 5楼
    2017-05-23 11:00 钳子叔

    越是这种时候 越容易出雷事

    [1] 评论
  • 6楼
    2017-05-23 11:03 kender

    然而说好的直播被突然取消了是怎么一回事儿

    [1] 评论
  • 7楼
    2017-05-23 11:45 钦原 黑白纵横小组管理员
    引用@王丘山 的话:哪里直播?
    引用@kender 的话:然而说好的直播被突然取消了是怎么一回事儿

    http://www.guokr.com/post/789049/

    [1] 评论
  • 8楼
    2017-05-23 11:53 出门打工嘅肥猫

    Google,浙江乌镇,

    我就想问一句,这样公平么?

    [0] 评论
  • 9楼
    2017-05-23 12:03 姜糖Macathy

    总之小哥哥加油,被你圈粉不只是关于围棋,而是你对于花鸟鱼虫以及生活的那一份热忱❤️无论输赢,享受比赛

    [2] 评论
  • 10楼
    2017-05-23 12:18 丶Charles

    腾讯野狐 直播

    [0] 评论
  • 11楼
    2017-05-23 12:43 晴阳看果壳

    五子棋的ai就已经不太好赢了

    [0] 评论
  • 12楼
    2017-05-23 13:12 世外竹园

    文章说的不错,阿法狗只是人工智能的一种展示方式。

    [0] 评论
  • 13楼
    2017-05-23 13:47 路在前方_39619

    如是说:加油,争取打败机器!

    [1] 评论
  • 14楼
    2017-05-23 14:34 图夫航行记
    引用@广州尺度摄影xz 的话:我想说我能期待人类进化到可以匹敌人工智能吗,虽然说这很异想天开但是十分令人期待后世人能不能。

    应该是不能,因为每一步演化都是大量淘汰带来的,而现代人恐怕不会因为脑子不够极端聪明就不让人传宗接代吧。

    [4] 评论
  • 15楼
    2017-05-23 14:58 肉肉的屁股
    引用@广州尺度摄影xz 的话:我想说我能期待人类进化到可以匹敌人工智能吗,虽然说这很异想天开但是十分令人期待后世人能不能。

    我觉得不可能,就算在未来人类进化到可以匹敌现在的人工智能,那也一定会研发出新的、更强大的人工智能啊

    [1] 评论
  • 16楼
    2017-05-23 15:01 咖啡饼干

    得,本来柯洁领先的,被翻盘了。。

    [0] 评论
  • 17楼
    2017-05-23 15:04 薛定谔的大黑喵

    没大的失误,走得很稳,然而就是赢不了

    [0] 评论
  • 18楼
    2017-05-23 15:11 CBP
    引用@咖啡饼干 的话:得,本来柯洁领先的,被翻盘了。。

    那不叫领先,那只是人类不能理解狗的全盘布局罢了,这种情况从去年就出现了,从去年还有今年年初的比赛中就可以看出,狗总是下出一些人类觉得昏招透顶的棋,然而你就是赢不了他.事实证明你以为狗傻了,你以为自己占了优势,只是你不理解狗的布局而已.

    而现在围棋界也开始学习狗的这些昏招,比如今天柯杰起手三-三,这招在狗出现之前围棋界根本不会开局用,谁用谁就会被当傻逼,而且狗这么玩之后,在这距今大半年之类人类棋手们都经常起手三-三了.就这么说,狗的整体观远胜于人类,而且人类已经理解不了了.你以为你暂时领先,只不过是AI觉得这样走就能在最后赢你而已.

    [31] 评论
  • 19楼
    2017-05-23 15:17 天降龙虾

    新的风暴已经来临。。。。。。

    [0] 评论
  • 20楼
    2017-05-23 15:19 天降龙虾
    引用@CBP 的话:那不叫领先,那只是人类不能理解狗的全盘布局罢了,这种情况从去年就出现了,从去年还有今年年初的比赛中就可以看出,狗总是下出一些人类觉得昏招透顶的棋,然而你就是赢不了他.事实证明你以为狗傻了,你以为自己占...

    机器狗曰:笑到最后的,才能笑得最好。。。。

    [2] 评论
  • 21楼
    2017-05-23 15:30 kender

    等阿尔法狗收官时候还不争不抢的时候,就已经是赢定半目了。

    人类棋手想赢基本只能在中盘找那么一丝机会。

    [0] 评论
  • 22楼
    2017-05-23 15:46 果壳中的宇宙_Vin

    唉唉

    [0] 评论
  • 23楼
    2017-05-23 15:46
    引用@广州尺度摄影xz 的话:我想说我能期待人类进化到可以匹敌人工智能吗,虽然说这很异想天开但是十分令人期待后世人能不能。

    人类自己改造成智能就行

    抛弃硬件更新太过缓慢的肉身

    这样能解决一大堆问题

    比如星际航行失重环境下给肉体带来的伤害

    以及宇宙射线

    还有寿命问题

    个体的知识储备

    然后可以在宇宙中遍地开花

    最大限度减少种族灭绝的可能性

    [6] 评论
  • 24楼
    2017-05-23 15:57 A_shrimp

    未来必定是人工智能时代 科技时代

    [2] 评论
  • 25楼
    2017-05-23 16:04 路小艾
    引用@祣 的话:人类自己改造成智能就行抛弃硬件更新太过缓慢的肉身这样能解决一大堆问题比如星际航行失重环境下给肉体带来的伤害以及宇宙射线还有寿命问题个体的知识储备然后可以在宇宙中遍地开花最大限度减少种族灭绝的可能性

    什么时候实现上传意识到电脑,才有可能吧……不然也只是机械身体罢了。

    [1] 评论
  • 26楼
    2017-05-23 16:06
    引用@路小艾 的话:什么时候实现上传意识到电脑,才有可能吧……不然也只是机械身体罢了。

    也许机械或者半机械身体就够了

    某些身体部位已经可以在人为养成作为更换材料了

    反而意识上传我感觉有点危险或者捉摸不透其安全性

    也不清楚发展到那一步还在不在乎“我”这个自谓

    [2] 评论
  • 27楼
    2017-05-23 16:14 太空骑师弗兰肯斯坦

    AlphaGo:我还没出力,你就倒下了。

    柯洁:不,我要创造奇迹。人类,还不能完……

    上帝:你们考虑过我的感受吗?

    [4] 评论
  • 28楼
    2017-05-23 16:54 果壳乙烷

    所以有没有懂的大神或者编辑回答我两个问题。。

    ①果壳有必要非要用“李世乭”吗??

    ②既然你非要用“李世乭”,为啥这一篇文章又不是??不能统一吗??看着真难受人。。

    [0] 评论
  • 29楼
    2017-05-23 17:43 CBP
    引用@HeTtX 的话:所以有没有懂的大神或者编辑回答我两个问题。。①果壳有必要非要用“李世乭”吗??②既然你非要用“李世乭”,为啥这一篇文章又不是??不能统一吗??看着真难受人。。

    ←_←不同作者不同编辑写的文章,有出入很正常,毕竟人家没把这个上纲上线到必须建站以来所有文字中用字用词统一规范的地步.反倒是你这么细心还要编辑出来给你专门解答,倒是让人觉得你有一种非要把韩国汉字和中国汉字在使用时严格划清界限的动机在里面,怕是和某些整天吵吵着所谓用语规范的老学者一样钻牛角尖了.

    [2] 评论
  • 30楼
    2017-05-23 18:42 果壳乙烷
    引用@CBP 的话:←_←不同作者不同编辑写的文章,有出入很正常,毕竟人家没把这个上纲上线到必须建站以来所有文字中用字用词统一规范的地步.反倒是你这么细心还要编辑出来给你专门解答,倒是让人觉得你有一种非要把韩国汉字和中国...

    一个网站里的同一个人名起码还是要统一吧。。去年各大网站在报道还有微博也是,就果壳是一股清流用“乭”。

    [1] 评论

显示所有评论

你的评论

登录 发表评论

作者的其他文章

更多科研事,扫码早知道

关于我们 加入果壳 媒体报道 帮助中心 果壳活动 免责声明 联系我们 移动版 移动应用

©2017果壳网    京ICP证100430号    京网文[2015] 0609-239号    新出发京零字东150005号     京公网安备11010502007133号

违法和不良信息举报邮箱:jubao@guokr.com    举报电话:13691127034