热点 观点 电子

和Siri等AI相比,AlphaGo究竟有什么不一样?

人工智能 深度学习 神经网络 阿法狗 AI Watson

不存在者 发表于  2016-03-09 10:35

2016年3月9日,谷歌旗下Deepmind的围棋程序“AlphaGo”就要和职业九段李世石对决了。去年10月,这个程序战胜了中国棋手职业二段樊麾;那是围棋AI第一次在公平比赛中战胜职业棋手。这一成果登上了今年1月的《自然》期刊,也引发了极其热烈的讨论——而最常被提出的问题就是,AI是不是终于要占领全世界了?

会唱歌,更会说冷笑话的Siri.   图片来源:Apple

这个问题并不算杞人忧天,某种意义上AI已经占领了:从苹果的Siri,到日常浏览的搜索引擎,再到网络的文章推荐和商品推荐系统,这些全都是人工智能——哪怕它们不是科幻小说里那种,我们的日常生活也已经很难和它们分开。

但AlphaGo又和这些常见的AI不同。它们的差异在于学习方法和技术的通用性。

Siri:一个照本宣科的助手

Siri是一个“智能助手”,能听懂我们的口头命令,帮我们在网上搜索,帮我们在列表中找到联系人。但它的原理很简单:通过声音识别技术,将声音转化成语言的基本元素,比如元音、辅音、单词,然后和系统中内置的特殊命令比较。如果对比出来的是一个实际问题,那就执行相应的指令;如果对应上了一个空泛的问题,就从相对的段子库里挑个段子出来。

所以它的问题也就一目了然:要是你命令它去做系统中没有的命令,它就扑街了。Siri虽然是AI,但它是一个非常局限的AI:只能解决预先写好的问题。

面对东北大哥的挑衅,Siri懵逼了(也可能只是怂了。图片来源:Apple

深蓝:下棋无人能敌,但只限下棋

1997年,IBM制造的国际象棋机器“深蓝”战胜了当时的国际象棋世界冠军卡斯帕罗夫。这在人工智能历史上是一个标志性事件。但是,虽然深蓝战胜了世界冠军,它有和Siri一样的缺点:太专了。

作为程序,深蓝的软件是专门为国际象棋设计的。它评估盘面的四项标准包括子力、棋子位置、王的安全性还有布局节奏——显然,这些指标完全依赖于国际象棋本身的规则,没有任何扩展性。

卡斯帕罗夫对战“深蓝”的场景。图片来源:muse.jhu.edu

即便如此,它也还是非常依赖于“蛮力”的。深蓝的硬件是当年最快的下棋机器,虽然有系统帮助筛选,它每秒依然要评估20亿个可能局面。为了应对这一需求,IBM当时为它开发了定制的硬件。

其结果就是,与其说它是一个国际象棋程序,不如说是一台国际象棋机器。深蓝只能下国际象棋,学不会围棋,连简单的五子棋也学不会。相比之下,作为人类的卡斯帕罗夫能学围棋,能学五子棋,还能学画画。深蓝的技术就像一把专门为国际象棋设计的钥匙,有很大局限。

自动驾驶汽车:迈出新方向

自动驾驶汽车的原理可以简化为以下几步:

  • 首先它通过感应器了解周围环境,就像司机使用眼睛观察周围情况;

  • 然后通过联网获得道路的路线情况,就像我们开车时候使用导航软件;

  • 再然后计算机程序判断附近行人,汽车会如何运动;

  • 最终计算自己最佳的线路,按着这条线路控制汽车的速度和方向。

Google的自动驾驶汽车。图片来源:Google

它特定于自动驾驶领域,但是基本思想和AlphaGo已经有些接近了。

IBM Watson:泛用的智能

2011年,IBM Watson在美国的真人答题节目Jeopardy!上击败了人类选手,它的技术理念更像AlphaGo。Watson的决策由四个步骤组成:首先是观察,从环境中收集数据,然后对数据做出假设,再然后是评估这些假设,最后是做出决定。不过也有些和AlphaGo不同的地方,首先它被设计成一个问答机器,其次训练Watson的时候需要人类专家的参与——比如关于癌症的问题,需要科学家们在海量的书籍论文中剔除过时的信息、错误的信息,把整理出的资料喂给机器。但至少,它能处理许多领域的能力,让它比它的同行们具有强得多的扩展可能:现在Watson已经被用于医疗领域了。

IBM Watson的logo. 图片来源:IBM

那么,AlphaGo的技术思想是什么呢?

Deepmind创建AlphaGo,是试图通过增强学习技术(Reinforcement learning)构建通用的人工智能。它的理念中包含两个实体,一个是人工智能本身,一个是它所处的环境。人工智能和环境间的关系有两种,一种是通过传感器感知数据,另外一种是通过特定动作影响环境。因为环境的复杂性,它无法获得所有的信息,因此需要不断重复感知-反应的循环,以期望能在环境中有最大收益。绝大多数哺乳动物,包括人在内都符合这套规则。

增强学习技术不断地感知和反馈环境中的信息。图片来源:Google

在AlphaGo之前,他们已经利用这种思想,让AI打游戏。2015年,在《自然》杂志上发表的一篇论文,描述了如何让一个算法玩不同的Atari程序,包括了《太空侵略者》和《打砖块》等游戏。AI和人一样看游戏视频,和人一样操作游戏,从游戏小白慢慢学习,变成游戏专家。AlphaGo也基于同样的原理,模拟人学习围棋的方法,它和人一样下棋,慢慢学会如何像专家一样思考。

这种技术理念所要求的是原始的数据,因此比起那些需要输入人工整理后的数据的方法有更强的通用性。原则上AlphaGo去学个围棋,五子棋都不是问题。

AlphaGo的技术首先被用于游戏的原因是因为,游戏比现实问题简单很多,无论是棋类游戏还是电脑游戏。游戏也很可能是类似技术第一个投入实用的领域:毕竟,随着游戏技术的发展,游戏开发者们逐渐意识到了好的AI和逼真的图像同样重要,不管是即时战略游戏,比如《星际争霸》还是角色扮演游戏中的NPC,高级人工智能不仅能成为强有力的对手,也可以变成优秀的团队伙伴。

但是,它最强之处当然是适应力和学习力。Deepmind声称,这种技术理念很快会被运用到医疗领域,尝试解决个性化医疗的问题。而这,肯定只是第一步。(编辑:Ent)

全部评论(102)
  • 91楼
    2016-03-12 11:44 已注销用户

    如果AI也有“思维模式”的话,AlphaGo和Siri这种也好,和图形识别也好,是完全不一样的设计思路。

    AlphaGo是一种从“倒推”来取胜的程序。围棋里面很重要的一个技术,叫收官。就是最后的官子阶段,应对次序是否能做到没有任何失误。换句话说,比如一盘棋下了180手收盘。那么170手时,剩下的10手是不是就没有疑问,存在“最优解”了呢?不管人知不知道,至少AlphaGo那个时候,甚至更早,已经算出来了。所以第二盘的时候,下到离结束还有半小时的时候,程序已经汇报“它赢定了”。如果李世石那个时候就知道自己输定的话,显然,他那个时候就可以投子认负,也就没有后面的半个小时行棋了。

    从这个角度看,AlphaGo是越接近终局,就越完美越算无遗策的。只要棋盘的变化越少,程序就越能穷尽所有应对可能,走出最优解,也就是所谓的“最强手”。所以只能在中前期就确立优势,利用顶尖棋手在中前期能下出的,出人意料的妙手,鬼手,让AlphaGo出现形势判断失误,——并且,牢牢抓住这个失误,将优势尽可能扩大——然后最重要的,不出错的,下到最后。这是唯一能赢的方法,想想其实也并不简单。

    AlphaGo的算力,我们换一个比方来形容,可能更直观。比如最初级的围棋AI,可以在一局棋还差6步收尾的时候,得出最优解;那么更强一点的围棋AI,可能还差10步的时候就能算出最优解了;那么AlphaGo呢,也许是20手,30手,40手,50手?如果能有接近百分之百的概率,算出还剩50手时候的最优解的话(等于还剩50手的时候就确定输赢了),那AlphaGo留给人类的,只有在这之前的取胜机会,换而言之如果200手结束的一盘棋,下到150手的时候如果人类旗手还感觉不占优势的话,那么“你已经死了”。随着AlphaGo算力的提升,也许,100手的时候就定输赢了,AlphaGo的神经网络已经足够穷尽100手后的所有变化,那么留给人类棋手的,只有这么些落子的机会——100手之内没占到上风,就game over了,就算占到上风,想赢还得接下去的下法不要出大错,这才有获胜的机会。

    [0] 评论
  • 92楼
    2016-03-12 13:51 傷口

    [0] 评论
  • 93楼
    2016-03-12 14:20 远方的后花园

    会不会出现一个Alpha-siri

    [0] 评论
  • 94楼
    2016-03-12 15:26 Aquila_22362

    经过我的实测,siri就是怂了,你再问他瞅你咋地,他还是“哦”


    [0] 评论
  • 95楼
    2016-03-12 16:42 微红叶
    引用@yang_36857 的话:人也不是离线运行的呀,那些狼孩熊孩才能算是离线吧,各种模因还...

    人的确是独立思考,但也有他的数据库,就是每个人的大脑,如果Alphago比作人,那他大脑里的数据库就是全世界可以感知的信息,这就是可以思考和学习的人工智能可怕之处。

    [0] 评论
  • 96楼
    2016-03-12 20:47 泡沫多多啤酒花

    Siri这种弱智算了吧。。

    来自山寨果壳.wp
    [0] 评论
  • 97楼
    2016-03-12 21:33 li123h

    阿发狗可能已经想好如何用人体发电了

    [0] 评论
  • 98楼
    2016-03-13 05:38 七海-栾晔
    引用@北川映秀 的话:一个问题:这种ai可以在离线或者单机状态下运行吗,人都是独立...

    人的经历不是数据库?经验是若干经历的算法。对吧?阿尔法狗这点上很人类有什么区别?

    [0] 评论
  • 99楼
    2016-03-13 17:43 DarkEumenides
    引用@_M种子 的话:三层BP神经网络就可以用来应付自动驾驶了。。。有生之年说不定还真能看到强人工智能的出现。

    毕设就是有关这个课题,不过还没钻研

    [0] 评论
  • 100楼
    2016-03-14 14:31 EAIBOT

    大家都很关心围棋大战,但真正正在了解机器学习和AI的又有几个?

    [0] 评论
  • 101楼
    2016-09-23 09:48 _victory_海子

    前三评论太亮

    [0] 评论
  • 102楼
    2019-05-18 13:16 54434
    引用@q68257962 的话:我赌五毛,李世石5:0完胜。

    上帝视角来看,怎么说。。。。。。我都替你尴尬。。。

    [0] 评论

显示所有评论

你的评论

登录 发表评论

不存在者
不存在者 Python程序员

作者的其他文章

更多科研事,扫码早知道

关于我们 加入果壳 媒体报道 帮助中心 果壳活动 家长监控 免责声明 联系我们 移动版 移动应用

©果壳网    京ICP证100430号    京网文[2015] 0609-239号    新出发京零字东150005号     京公网安备11010502007133号

违法和不良信息举报邮箱:jubao@guokr.com    举报电话:18612934101    网上有害信息举报专区    儿童色情信息举报专区