12086
需用时 24:10
侯世达:教计算机如何思考的人

侯世达对计算机程序的描述不仅准确,还富于创意,他对“我们大脑中的秘密软件结构”的描绘,开启了整整一代年轻人对AI的探索。图片来源:theatlantic.com

(文/James Somers)“这要看你说的‘人工智能’指的是什么。”侯世达(Douglas Hofstadter)站在印第安纳州布鲁明顿的一家杂货店里,边挑选沙拉原料边说。“如果有人眼中人工智能指的是理解心智的努力,或者创造类似人的心智,他们可能会说——也许话不会说得这么绝——但是他们可能会说,这是仅有的几样好研究之一。”

侯世达这句话说得很随和,但也很有数。他这么说,是因为他坚信,IBM的问答游戏超级电脑Watson、苹果公司的语音助手Siri 这些现代人工智能领域里最激动人心的项目,被公众视为通往科幻世界阶梯的东西,其实跟人工智能并没有多少干系。在过去的30年中,侯世达和他的研究生一直在钻研一个被人遗忘的课题:通过写出会思考的计算机程序来弄清人类的思维是如何工作的。

他们的操作前提很简单:思维是一个非同一般的软件,而理解一个软件工作原理的最好方法,就是自己写一个。电脑拥有足以模拟人类神经回路的灵活性,但是却仍旧只对精确的指令有所响应。因此,如果侯世达的研究成功了话,将是一举两得的胜利:我们将终于得知我们思维的工作机理,同时制造出智能的机器。 

一鸣惊人,“集異璧之大成”

改变侯世达一生的想法,是他“在路上”时得到的。当时,在美国俄勒冈大学粒子物理系读研究生的侯世达,由于博士论文进展无望而感到“深深地迷失了”。于是,在1972年夏天,他决定收拾好东西,塞进一辆被他称为“水银”的车里,从西向东穿越美国。每天晚上都在一处新的地方(“有时在林间,有时在湖畔”)架起帐篷,就着手电筒的光看书。他可以自由思考任何他想思考的事情,侯世达选择了思考思维本身。在他大约14岁的时候,侯世达发现他最小的妹妹莫莉因为“大脑深处的一些问题”而无法理解语言(她的神经症状可能是先天的,从未得到诊断),从那时起,他就暗暗地对意识和物质的关系着了迷。心理学之父威廉·詹姆斯(William James)在1890年将其称为“世界上最不可思议的事情”:意识怎么会是基于物质的呢?几斤重的灰质是如何产生思想和自我意识的呢?

在开着这辆1956年的老车漫游的途中,侯世达认为他找到了答案——思维就活在一个数学证明的核心里。1931年,生于奥地利的逻辑学家哥德尔(Kurt Gödel)证明,一个数学系统不仅能描述数字,还能用于描述系统本身。而侯世达想说,意识正是从同样的“跨层级反馈循环”里涌现的。一天下午,他坐下来把自己的这些零碎想法诉诸文字,写信给一个朋友。但30页稿纸写完以后,侯世达决定不把信发出去了;他要让这些想法再酝酿一段时间。7年以后,这些思绪酝酿成了一部重3斤、长777页的巨著《哥德尔、埃舍尔、巴赫:集异璧之大成》(Gödel, Escher, Bach: An Eternal Golden Braid),这本书将为其时年仅35岁、头一次出书的侯世达赢得1980年的普利策非虚构类作品文学奖。 

《集异璧》甫一面世便轰动一时。这本书的成功也得益于《科学美国人》的著名专栏作家马丁·加德纳(Martin Gardner),后者在1979年的一期专栏中详细介绍了此书,并且毫不吝啬溢美之词。加德纳写道:“每隔几十年,便会有个不知名的作者带来一本书,其之深、之明、之广、之智、之美、之新,顷刻便成为文坛公认之幸事。” 第一个获得计算机科学(当时还叫“通讯科学”)博士学位的美国人约翰·霍兰德(John Holland)回忆道,“我认识的人基本上态度都是强烈的敬畏。”

侯世达似乎注定会成为那段文化不可磨灭的一部分。集异壁不仅仅是一部影响力巨大的书,更是一本完全关于未来的书。人们称它为人工智能——计算科学、认知科学、神经科学和心理学交汇处的研究领域——的圣经。侯世达对计算机程序的描述不仅准确,还富于创意,他对“我们大脑中的秘密软件结构”的描绘,开启了整整一代年轻人对AI的探索。 

但后来人工智能变了,而侯世达没有跟着一起变,于是他从公众的视野中消失了。

消失

集异壁的到来正好遇上了AI历史轨迹的拐点。1980年代初,人工智能领域正日益萎缩:长期“基础科研”的资金不断缩水,而研究的焦点也逐渐向实用型系统转移。志存高远的AI研究名声逐渐坏掉了。到处都是好高骛远、虚空夸大的许诺,这一切的源头都可追溯至人工智能领域兴起之时——1956年,达特茅斯会议的组织者,包括人工智能这个词的创造者约翰·麦卡锡(John McCarthy)在内的人宣称,“只要精心挑选出一批科学家干上一夏天”,他们就能在创造出具有以下性能的机器上面取得显著的进展:会使用语言、形成概念、解决只有人类才能解决的问题,并且自我完善。麦卡锡后来回忆说,他们失败的原因是“AI比我们想的要难”。 

随着战争压力的不断积累,人工智能研究的主要赞助方——美国国防部的高级计划研究局(ARPA)缩紧了开支。1969年,美国国会通过曼斯菲尔德修正案,规定国防部只能资助拥有“对某一具体军事行动或计划具有直接和明显的关系”的研究。1972年,ARPA更名为DARPA,“D”代表国防部,凸显其对拥有军事应用潜力的研究计划的侧重。到上世纪70年代中期,DARPA问自己:我们在10年的时间里花了5000万美元用于各种探索性研究,最终得到了哪些具体的国防进展呢? 

到1980年代初,这股压力愈发巨大。本以回答阿兰·图灵“机器能思考吗”这一疑问起家的人工智能,渐渐成熟——或者异化,取决你用什么眼光来看它——变成了软件工程的分支领域,受到实际应用的驱动。相关研究的时间尺度越来越短,常常是已经想好了特定的买主。美国军方偏好那些涉及“命令和操控”系统的计划,比如战斗机飞行员的计算机飞行辅助系统,和自动识别道路、桥梁、坦克和油罐的空中测绘软件。私人产业流行的,则是服务于各种各样专门需求的“专家系统”,比如堆选择系统可以帮助设计者选择建筑地基的合适材料,而自动线缆专家系统可以自行总结电话线维护的相关报告。

在集异壁中,侯世达呼吁将人工智能研究的重点从如何智能化地解决人类问题,拉回到理解人类智力的方向上来,但这个呼声正好是在AI研究因收获甚少而遭到世人抛弃的时节。侯世达的光环很快就消失了,他发现自己在越来越多的时候都置身主流之外,而这个主流正展开双臂,拥抱新的使命:使机器以任何方式运转,丝毫不考虑心智上的合理性。 

以IBM的深蓝计算机为例,深蓝打败了著名的国际象棋特级大师卡斯帕罗夫(Garry Kasparov),完全是凭借计算的蛮力。每走一步棋,深蓝都能思考对手的棋着、自己的回应及对手的回应……如此达到六个来回甚至更多。运用快速评估函数,它能为每一种可能的棋盘局势计算出分数,然后选择能带来最高分数的棋步。让深蓝打败最优秀人类的,是它的纯计算力。它最多能在一秒钟之内评估3.3亿个棋盘局势,而卡斯帕罗夫在下每一步棋前最多只能评估几十个。 

想通过爬树到达月球的人

侯世达想问,没有任何启示的胜利得来又有何用?“没错,”他说,“深蓝下得一手好棋——那又如何?它可曾告诉过你我们如何下棋?没有。它可曾告诉过你卡斯帕罗夫如何看待、如何理解盘上的局势?”不去尝试回答这些问题的AI,无论名号有多亮、能力有多强,在侯世达看来,都偏离了正轨;几乎从他进入AI领域的那一刻起,他就刻意与之疏远了。“对于我这个羽翼未丰的AI研究者,”他说,“这是不言自明的——我不想牵扯到那种花招里面。这很显然,我不想拿来什么华丽的程序、用它的行为冒充智能,如果我明知它和智能毫无关系的话。而我也不知道为什么没有更多的人像我这么做。”

为什么?一个答案是,AI产业在80年代初期大约有几百万美元,而到80年代末已经价值数十亿。(1997年深蓝赢棋之后,IBM的股票份额增长了180亿美元。)工程领域的人工智能越保守,其成果就越大。今天,那些和思维毫无关系的技术正是如日中天。它们的根系深植于所有的重工业、交通运输和金融产业。谷歌的许多核心功能、Netflix的电影推荐、Watson、Siri、无人机和无人驾驶汽车都是它们在推动。

“当莱特兄弟和其他人不再模仿鸟类,开始学习空气动力学时,‘人类飞翔’的探索便成功了。”斯图尔特·罗素(Stuart Russell)和彼特·诺维格(Peter Norvig)在其教科书《人工智能:一种现代方法》(Artificial Intelligence: A Modern Approach)中这样写。当人工智能不再模仿人类,AI便见效了,因为人工智能胜过了人。飞机不扇翅膀也能飞翔,电脑何必需要会思考呢? 

这是一个很有力的观点。但仔细想想我们想要的是什么,它就少了一些说服力——我们想要的,是一个真的知道你想找什么的搜索引擎,正如一个人类能知道的那样。加州大学伯克利分校计算机科学教授斯图尔特·罗素说,“网络上所有的搜索引擎公司,市值加起来能有多少?可能有4000或5000亿美元吧。能够把网络上的所有信息都提取出来并理解的引擎,价值10倍于此。”

而这,就是本领域里的万亿美元问题:如今支撑AI的技术方法,一个没有借鉴思维机制、而是建立在大数据和大工程之上的方法,能将我们带向我们想去的地方吗?如果不懂是如何理解的,你要怎么建造一个能理解的搜索引擎呢?或许,正如罗素和诺维格在他们教科书的最后一章中婉言承认的那样,选择这条实用型道路的结果,就是AI更像是一个想要爬树到达月球的人,“他能不断进步,直到树的尽头”。 

思考是什么?

想想吧,如今的计算机识别一个手写的“A”都困难重重。事实上,这个任务对它们来说难度之大,在此基础上建立起了“CAPTCHA”(区分计算机和人类的完全自动化公共图灵测试)系统,就是比方说你注册网站时要你辨认并写出的那一串七歪八扭的字符。 

侯世达认为这没有什么好大惊小怪的。他在1982年的一篇文章中写道,要了解所有“A”的共同点,就像“了解心智范畴的流体本质” ,而这,在侯世达看来,正是人类智力的核心。 

侯世达喜欢说“认知即识别”。他认为,“看作”是最基本的认知行为:你见到一些线条,把它看作是一个“A”;你见到一堆木头,把它看作“桌子”;你把一场会议看作“皇帝新衣”的场景,把朋友的撇嘴看作“酸葡萄心理”,把一个年轻人的打扮看作“嬉普士”,如此等等,全天持续不断。这就是“理解”。但是理解的机制是什么?30年来,侯世达和他的学生一直在努力寻找这个答案,试图构建“思维基本机制的计算机模型”。

“每时每刻,”侯世达在最新的书、与埃马纽埃尔·桑德(Emmanuel Sander)合著的《表现和本质》(Surfaces and Essences)中写道:“我们都同时面对数目不定的相互重叠交融的情景。”而从无序的混沌中找出意义来,便是我们人类,作为要存活下去的生物必须做的事情。我们通过让恰当的概念浮现在脑海中来完成这一任务。这一切是自动发生的,一直如此。类比是侯世达最常用的词。他的新书(封面是一大堆各式各样的字母A)的主旨,就是类比是“思考的燃料和火焰”,是我们每人每天精神生活的必须品。 

“看看你们的谈话,”侯世达说,“你会一次又一次惊讶地发现,这就是制造类比的过程。”有人说了件事情,让你想到了另外的一件事情;你说了一件事情,又让另一个人想到了又一件事情……这就是谈话。没有比谈话更直观的事情了。但是,就在每一步,我们的大脑都做了一个类比,这一个精神上的跳跃是惊人地复杂,从计算的角度上说简直可以称为奇迹。不知通过何种方法,我们的大脑能够去除其他不相干的枝叶和细节,提出出它的核心,它的“无附赘的本质”,然后从你自己过去的想法和经验中只提取出切题的那一个故事或评论。 

“注意那些平白无奇的短语,比如‘没错,这正是遇到的事情!’”侯世达写道:“在这些看似简单的说法背后隐藏着人类思维的全部秘密。” 

在集异壁出版后的这些年,侯世达和人工智能渐行渐远。如果你现在从书架上抽出一本《人工智能:一种现代方法》,一千多页的书里都找不到侯世达的名字。同行都在用过去式谈论他。集异壁的新读者看到书的初版年代,然后发现作者还活着时都很惊讶。 

当然,在侯世达讲来,故事的发展是这样:当所有其他研究AI的人都开始建造东西,他和他的团队——用侯世达的好友、哲学家丹尼尔·丹尼特(Daniel Dennett)的话说——“耐心地、系统地、高明地”远离聚光灯、一点点攻克真正的难题。“很少有人对人的智力怎么工作感兴趣,”侯世达说:“那正是我们想知道的——思考是什么?——而且我们不会迷失方向。” 

“我是说,谁知道呢?”他说。“谁知道会发生什么。也许有一天人们会说,‘侯世达已经做过这些东西、讲过这些东西了,但我们现在才发现它’。”

这听起来就像是一个迷路家伙的自我安慰。但是侯世达这样的人,就是会引诱你问这样的问题:如果人工智能(“真正的人工智能”,用侯世达的话说)的最好思想,真的就藏在布鲁明顿的一个抽屉里泛黄呢?

“每天都在探索,完全无法不去探索,完全陷在了这些东西里”

如果说有些孩子生来就注定要踏上犯罪的道路,那么侯世达就是生来就要走心智的路。他成长在50年代的斯坦福,家就在大学的校园里,北边的社区连名字都是“教授村”。父亲罗伯特(Robert)是核物理学家,后来获得了1961年的诺贝尔物理学奖。母亲南希(Nancy)对政治颇为热衷,后来成为发育性残疾儿童福利问题的积极倡导者,是艾格纽斯发育中心(Agnews Developmental Center)伦理委员会的委员,同样也是在这所机构里,他妹妹莫莉度过了20多年的时光。按笑话的说法,南希是那种“职业的教员夫人”:在她的组织下,侯世达家的客厅变成了沙龙,一群关系密切的朋友会聚在一起边听爵士乐边谈论启发性话题,“科学和艺术的圆融”,侯世达对我说——这是智力的盛宴。

侯世达照单全收。他痴迷于父母的朋友们,还有他们关于“最微小和最宏大的东西”的奇特谈话。(有一次他说,他八岁时的梦想是成为一个“零质量、自旋1/2的中微子”。)他会留在物理系等四点的下午茶,“就好像我是个12岁的小研究生”。他好奇心旺盛,永不满足,永远不会无聊,“对各种各样的想法着迷”。他的学术研究风格过去是、现在也是,用他的话说,“暴饮暴食”式的:他可以一连弹上7个小时的钢琴,背诵1200行的《叶甫盖尼·奥涅金》全诗。有一次,他花了好几个星期的时间对着录音机自学倒着说话,这样当他反向播放磁带时,听着就是正常语序的英语了。他会一连几个月沉浸在正宗法语里、写计算机程序输出荒谬的故事、或者研究几十种勾股定理的证明,直到他能“看见它成立的原因”。“基本上每天都在探索这些事情”,他说,“无法不去探索。就是完全入魔,完全痴迷于这些东西。” 

侯世达今年68岁了,但他身上仍旧有些东西永不衰老。这是一个活在论文、软件和自己大脑中的人,这样的一个人会如常人般变老吗?尽管鬓发灰白不整、刚刚过耳,身躯脆弱下垂,但侯世达那种把自己当真的劲头、急切的向人表露的坦诚,都还是非常年轻的人的气质。和侯世达交往并不容易,他不是一个平易近人的人。他是那种会让晚宴上的所有人都跟着他一起吃素的素食主义者,那种会公开纠正别人的“性别歧视的语言”的人。“他有好多规矩,”侯世达的老朋友彼得·琼斯说,两人相识已经60年,“比如他特别讨厌‘you guys’这个短语。这是个律令。如果你要和他说话,你最好是别说you guys。”

三十多年来,侯世达一直在美国印第安纳大学布鲁明顿分校担任教授。他和前年9月份刚结婚的妻子林葆芬住在距离校园几个街区的地方,他和前妻的两个孩子丹尼和莫妮卡都已经长大成人。他虽然和认知科学研究项目关系密切,在计算机科学系、心理学和脑科学系、比较文学和哲学系也有担任职务,但侯世达没有任何正式的职责。他说,“我的工作是你能想到最轻松的,我在做的就是我想做的事情。” 

他的大部分时间花在家中二楼的两间书房里,铺着地毯,有点拥挤,整洁程度总是不让他满意。书房是侯世达世界的中心。他在那里读书、听音乐、做研究、画画、写书、写邮件。(侯世达每天要花上4个小时写电子邮件。“对我来说”,他曾说过,“电子邮件和信件是一样的,每一点都跟信件一样正式、一样精细、一样字斟句酌。我重写、重写、重写、重写我的每一封邮件,向来如此。”)书房是侯世达思考的地方,那里也反映出侯世达的思想。每一堵墙都堆满了书籍、绘画、笔记本和文件夹,思想在这里凝固、成形、四处喷洒。这就像是他“暴饮暴食”经历的一座博物馆,是《囤积癖》的某一集里的场景。

“任何我思考的东西都变成了我职业生涯的一部分。”侯世达说。和他共同编辑了《心智中的我》的哲学家丹尼尔·丹尼特说,“侯世达其实就是一个现象学家,一个实践现象学家,而且比古往今来任何其他人都做得好。”侯世达研究的现象是他自己的心智——脑中的感受、脑中的内部活动。“之所以他如此擅长,”丹内特告诉我,“之所以他比任何别人都好,是因为他非常积极地寻求理论来解释后台发生了什么,来解释思考究竟是如何在大脑中发生的。

侯世达的口袋里总是有一支四色圆珠笔和一个小笔记本,向来如此。他书房边上紧邻的一间屋子曾经是厕所,现在变成了储藏室,里面的书架装满了这样的笔记本。他取下一本——这是50年代末的。里面全是语言错误。从他十几岁起,到现在他已经收集了大概一万个这些错误——把词的位置颠倒了(下电话去接楼)、把字的音发岔了(你把发说完)、把俗语弄串了(事不关己,不谋其政),如此等等;有一半都来自于他自己。他把这些笔记本页复印下来,裁剪并装订好,装在遍布书房的文件柜和标签盒子里。

对他来说,这些都是线索。“论及脑海里那些按定义是潜意识的活动,没有人是可靠的向导,”他曾写道。“而这正是这么多错误记录如此重要的原因。单独看一个错误,其涉及的思维机制只会流露微笑的蛛丝马迹;但是大量的这些痕迹加起来,就能共同形成证实(或证伪)特定机制的证据。”正确的言谈并不好玩,它就像一次成功的魔术把戏——之所以有效是因为它隐藏了实现的具体过程。而侯世达寻找的是“兔子的耳朵尖,或者暗门的痕迹。”

从这个意义上讲,他是当代的威廉姆·詹姆斯,其条分缕析的内省(正是他引入了“意识流”的概念)和清晰明了的解释让他1890年的著作《心理学原理》成为了经典。“我们大部分的思考都永远消失了,毫无找回的希望”,詹姆斯写道,“而心理学只能收集到宴席落下的一点面包屑。”如同侯世达,詹姆斯的一生也是在饭桌下度过的,兴致勃勃地检查这些洒下的面包屑。区别是,詹姆斯只有眼睛,而侯世达却有类似于显微镜的东西。

模拟思维过程的计算机程序

载人飞行器的成功不是归功于莱特兄弟在基蒂霍克的滑翔飞行,而是他们在自己的自行车店里用回收来的破铜烂铁和自行车辐条建造的两米高的风洞。当对手们都在竞相测试机翼设计的同时,莱特兄弟却用少得多的花费专注于研究空气动力学。莱特兄弟的传记作者弗雷德·霍华德(Fred Howard)评论说,他们的风洞试验是“迄今为止,用这么少的时间、这么少的材料和预算进行的最重要且最有成果的空气动力学试验”。

在布鲁明顿北费斯大道的一间旧屋里,侯世达领导着他的灵活类比研究组(Fluid Analogies Research Group),被人亲切地称为FARG。FARG每年的研究经费是10万美元。房间内的氛围很像是居家,漫游其中很容易错过橱柜后面的文件柜、起居室里嗡鸣的复印机或者书架上图书馆员的标签(神经科学,数学,感知)。但25年来,这里一直从事着目标远大的研究:一小群科学家在尝试,“首先,致力于解开创造性的秘密,其次,揭开意识的未解之谜。 ”

计算机对于FARG就如同风洞之于莱特兄弟。人脑中飞速流逝的无意识混沌可以在计算机上放慢下来,回放、暂停乃至编辑。在侯世达看来,这是人工智能最好的工具。程序的一部分可以选择性隔离掉,以便观察没有这些会如何运转;参量可以改变,来看表现是有所改善还是退步。当计算机让人惊讶时——不管是特别有创造力还是特别愚蠢——你总能看到原因。“我一直觉得,如果人类有一天能够彻底理解思维的复杂”,侯世达写道,“唯一的希望就是通过在计算机上模拟思维过程,然后从这些模型不可避免的失败中学习。 

把侯世达家中捕获、归档并记录的一种思维过程,变成一个能运行的计算机程序,就这短短的一步也要花一个专心致志的研究生5-9年的时间。这些程序都有着类似的基本架构——其组件和整体风格都可以追溯到“Jumbo”,侯世达在1982年写就的一个用来猜报纸上那种乱序字谜的程序。出题人拿一个单词,把它的字母顺序打乱,问你这个单词本来是什么。

当你听说一个程序的目的是对付报纸上的字谜,你的合理反应应该是:这对计算机来说不是太小儿科了吗?的确如此——我刚写了一个程序能对付任何单词,花了我四分钟时间。我的程序是这样工作的:它拿来被搅乱的单词,穷举尝试每一种可能的组合方式,直到它找到词典里的一个词为止。

侯世达写“Jumbo”用了两年。他关心的不是解开字谜本身,而是在解决这个字谜的过程中大脑究竟做了什么。他一直都在观察他的思维。“我可以感觉倒字母在我脑海中自己在转换位置,”侯世达对我说,“就像是跳来跳去、自己形成小小群体,然后分崩离析组成新的群体——闪烁不定的簇集。操控一切的不是我,是它们在做事情,它们在自己尝试各种事情。”

侯世达开发的架构能够模拟这种自动化的字母调换,而其基础是活细胞体内的反应。不同的字母在不同类型的“酶”的作用下相互结合或者分开,这些酶四处游走,找到对应的结构就附着其上,启动反应发生。有的酶负责重组(“pang-loss”变成“pan-gloss”或“lang-poss”),有的酶负责粘连(“g”和“h”变成“gh”,“jum”和“ble”变成“jumble”),还有的则把现有的拆散(“ight”变成“it”和“gh”)。每个反应的结果都促使新的反应发生,在任意时刻“酶”的数量和种类都会自我平衡,以反映出整个字母组合的状态。

这是一种与众不同的计算方法,最明显的特征是其流动性。侯世达本人当然也给出了一个类比:一群蚂蚁在森林地面上游荡,侦查蚁向四面八方随机探索,把结果汇报给群体,其反馈过程能够带来高效的食物搜索。这样一个群体是“鲁棒”的——一脚踩上一小群蚂蚁,其它的蚂蚁会很快恢复——而因为这种鲁棒性,蚁群是高度有效的。

《流动性概念和创造性类比:思维基本机制的计算机模型》(Fluid Concepts and Creative Analogies: Computer Models of the Fundamental Mechanisms of Thought)所细致描绘的,正是这种架构和使用该架构的程序所遵循的逻辑和机制。读到这本书时,你会想或许侯世达的惊世之作不应该是集异壁,而应该是这本。正如《纽约时报》的一名主笔在1995年的一篇评论文章中说的那样:“读到《流动性概念和创造性类比》的人都不禁会想,印地安那大学的研究小组发现了一些了不得的事情。” 

但极少有人——甚至包括集异壁的崇拜者——知道这本书,或是其中描述的研究项目。或许是因为FARG的研究实在是太过明目张胆地不切实际了。因为他们研究的是微小的、简直像过家家一般的“微领域”。因为这些程序做的事情没有一项比人做得更好。 

现代的AI数据、数据、数据,而Google拥有的数据比任何人都多 

现在这个时代的主流AI大约始于1990年代,一直延续至今。不过,在如今的稳步发展和商业上的成功之前,其实有一段被称为“AI之冬”的时期,这段酷寒几乎扼杀了整个人工智能的研究努力。 

导致这一局面的是一个简单的矛盾。一方面,我们知道怎么写的那种软件是很有序的东西,大部分计算机程序都有着军队一样森严的等级秩序,拥有层层指挥链,每层都把指令传给下一层,进程调用子进程调用子子进程。另一方面,我们希望写出来的那些软件应该是有适应性的——而为了能适应不同场景,层级规则根本就是南辕北辙。“人工智能的全部努力从根本上说就是和计算机的刚性作斗争”,侯世达总结道。上世纪80年代末,主流AI研究的资助、会议出席人数、期刊论文投稿数以及媒体曝光率都在流失——因为在这场斗争中它正在输掉。 

曾经是人工智能研究金饭碗的“专家系统”也在沉没——因为它们太脆了。专家系统的研究方法从根本上是残破不全的。以人工智能领域长期以来的圣杯——语言间的机器翻译为例。标准的做法是让语言学家和译者聚在一个房间里,然后试图将其专业技巧转化为一个程序可以遵守的规则。而这种标准做法失败的原因也很容易想到:没有一套规则可以简单地诠释人类语言,语言是个范畴太大、变化太多的东西,每有一条语法规则得到遵循,就有一条被例外打破。 

如果机器翻译要作为商业项目继续下去——如果AI要得以存续——必须找到另外的道路。或者更好的办法,一条捷径。 

人们确实找到了这条捷径。你可以说这一切的开始是1988年,那一年,IBM启动了一个名叫“老实人”(Candide)的项目。“老实人”是一个机器翻译系统,其背后的思路是承认基于规则的做法需要对语言如何产生、语义句法词形如何运作、词语如何组合成句子和段落有极其深入的理解,这一要求太高了——更不要说理解这些词语作为媒介所指代的那些意义。所以IBM把那个方法丢出了窗外。开发者的代替方法绝顶聪明,但如此简单直接,令人难以置信。 

这个方法被称为“机器学习”。其目标是制作出一个设备,输入英语句子,然后吐出对等的法语来。当然,人脑就是这样的一个设备,但IBM的计划的要旨就是完全绕开人脑的复杂性,所以我们开始要创造一台简单的、几乎毫无用途的机器:比方说,一台机器,输入英语单词后会随机吐出一个任意的法语词。

想象这样一个盒子,上面有数千个旋钮。一些旋钮控制总体的设置,比如输入10个英语单词,对应的法语单词平均该有多少个;另一些则控制更加具体的规则,比如输入英语单词“jump”后,后面跟着单词“shot”的几率有多大?问题就是,光靠调整机器上的旋钮,你能让你的机器把可以理解的英语变成可以理解的法语吗?

事实证明,能。要做的不过是喂给机器一些英语句子,这些句子的法语翻译你已经知道。(譬如说,“老实人”用了220万对句子,大部分来自加拿大国会辩论的英法双语通讯。)你一次处理一对儿。输入一对之后把英语那一半喂给机器,看看法语那半边出来什么。如果出来的和你预期的有所不同——和已知正确翻译有所不同——那你的机器就不太对劲。所以调节按钮,再试一次。经过足够多的输入、尝试和调节,再输入、再尝试、再调节,你会摸索到正确的旋钮搭配,能够得到这个英语句子的正确法语对应物。

当你把以上过程对数百万个句子重复之后,你就能逐渐校准你的机器,直到你就算输入一句你不知道翻译的英语句子后,还能输出一句过得去的法语翻译。而最美妙的地方在于,你完全不用直接为它变成;你完全不用知道,为什么要这样或那样调节这些旋钮。 

机器学习并非“老实人”首创。实际上机器学习的早已经过大量的测试,那是60年代的原始机器翻译。只不过,在它之前,无一测试谈得上成功。它给学界带来的突破,并不在于“老实人”成功地解决了问题,而是让大家发现一个如此简单的程序居然能给出像样的结果。参与了老实人项目的亚当·伯杰(Adam Berger)在项目总结里说,机器翻译是“自然语言处理、甚至整个人工智能领域里公认最难解决的问题之一,因为准确的翻译若无对文本的完整理解,看起来简直是不可能的。”可是像老实人这样直截了当的程序都能有不错的发挥,证明有效的机器翻译其实不需要理解——只需要海量的双语文本。正因此,“老实人”证明了,征服AI的另一条道路原则上也是可行的。

“老实人”以惊人的效率所实现的,是把“理解一个复杂过程”这个问题转换为“寻找许许多多这一过程运作的实例”。这个新问题,和模仿大脑实际运作不同,随着时间推移只会变得越来越简单——特别是当九十年代到来,原本是物理学家专享的书呆子避风港以几何级数扩张成了万维网。

AI在90年代得到了快速发展,这绝非巧合;Google——全球最大的网络公司——成为“世界上最大的AI系统”(彼得·诺维格语),这也不是巧合。彼得·诺维格与斯图亚特·罗素合著了《人工智能:一种现代方法》,同时也是Google公司的研究总监之一。诺维格说,现代的AI是“数据、数据、数据”,而Google拥有的数据比任何人都多。 

谷歌翻译基于跟“老实人”同样的原理,现在已经是世界第一的机器翻译系统。谷歌翻译团队的一名软件工程师乔什·埃斯特尔(Josh Estelle)说,“你可以随便拿一个简单的机器学习算法,上人工智能课程的头几周就会学到的那种,学术界早已抛弃、认为没用的那种——但你用100亿条而不是1万条样例去做训练的时候就会发现,这些算法开始见效了。数据胜过一切。”

这技术极其有效,实际上谷歌翻译的团队成员都不会说其产品能够翻译的大部分语言。“光这一事实就能让人口服心服,”埃斯特尔说。“你会想雇更多的工程师,而不是更多的说母语的人。”在翻译不过是大规模数据挖掘练习的这个时代,工程才是顶用的。

这正是使机器学习方法繁荣昌盛的原因:当语法的规则不复存在,理解的过程被各种微调的工程技术所取代,数据、效率成了一切。诺维格说,Google到处都能看到这种现象:如果让这个的运行速度再快10倍,一年就能节省几千万美元,那我们就来做这个项目吧;怎么干呢?好,我们先来看看数据,用机器学习或数据统计的方法做着,之后再想出别的更好的方法。 

Google也有指向更深一级理解的项目,受大脑生物学启发的机器学习的延伸。他们现在正在做的“知识图谱”试图将词汇和人物、事件和地点联系起来。但有10亿客户等着被服务的事实迫使这家公司不得不牺牲理解以满足便利。无需多试便能看出 Google Translate 的工程师为了覆盖率、速度和便利而做出的妥协。尽管Google Translate以它自己的方式代表了人类智力的产物,但它并不是智力本身。就像一块巨大的罗塞塔石碑,Google Translate 只是人类智力工作过的记录。 

为什么要一个叫‘人工智能’的学科制造出‘人的智能’呢?” 

“当我们坐下来建造Waston的时候有没有模拟人类的认知?”IBM的Waston开发小组的负责人戴夫·费鲁奇(Dave Ferrucci)说:“绝对没有。我们只是试图制造一台可以赢得《危险边缘》的机器。”(《危险边缘》[Jeopardy]是美国的一档电视智力竞赛节目,类似央视《开心辞典》。) 

对于费鲁奇,智力的定义很简单:看一个程序可以做什么。深蓝是智能的,因为它可以在国际象棋上击败卡斯帕罗夫。Waston是智能的,因为它可以在《危险边缘》上战胜肯·詹宁斯。“我们叫它人工智能,对不对?这就相当于说不是人类的智能。为什么你会要一个叫做人工智能的学科制造出人类的智能呢?” 

费鲁奇也并非注意不到两者的差异。他总是对人们说,Waston依靠一屋子的处理器和20吨重的空调设备赢得了比赛,而它的对手使用的,用一个鞋盒子就能装走,一个金枪鱼三明治就可以运行上几个小时。这台机器在比赛结束时,还能让它的主人与人对话,吃上一个美味的面包圈,争辩、跳舞、思考,而Waston只能呆在屋子里,嗡嗡作响,从未活着,回答关于总统和土豆的问题。 

这些系统处理的问题只是影子——“其实连影子都不是”,费鲁奇说:“我们一直以来都低估了人脑当中真正发生的事情。”上世纪50年代如此、现在也仍然这样。 

那么,为什么你不来研究人脑中发生的事情呢?这是侯世达想问费鲁奇的,也是他想问所有主流AI研究人的。 

对此,费鲁奇的态度颇为复杂,他说:“人一生能做的事情很有限,当你把时间全部投入来做某件事情的时候,你不得不问自己,这样做是为了什么。而我也这样问我自己,而我得到的答案是,我对人类智力是如何工作的非常感兴趣,能够理解人类认知也很伟大,我很喜欢看这方面的书,也有兴趣了解这方面的情况——但这样做又能怎么样呢?我真正想做的是制造出能做事情的计算机系统,而我不认为认知理论是通往我目的的捷径。” 

身为 Google 研究总监的彼得·诺维格的观点几乎和费鲁奇一样。“我认为侯世达在研究的是极其之难的问题。我猜我想做更容易一些的工作。” 

从诺维奇和费鲁奇的回复中可以看出AI研究的残破之态。早期的基础研究早已荒废,现行的计划目光短浅。对名声的顾虑束缚了一些AI研究员的思想。如果说在上世纪80年代,AI研究者在做的是试图用程序模拟出一部分的真实的数据,那现在则是将其视为任务的全部。 

我们正在允许我们的成功扼杀自己。当机器可以承受更多的数据、更快地计算出结果,人类正放任自己变得越来越笨。这就像用图形计算器计算高中微积分题目一样,这样做简单又便捷,直到你真正理解微积分的那一刻为止。给Goolge Translate输入1万亿而不是100亿个双语文本,它也不见得就会达到人类译者的水平。而同样,搜索、图像识别、问答问题,或者规划、阅读、写作、设计,或任何一个你宁愿人而不是机器来做的领域。 

诺维格和其他同处商业AI的人都清楚,能从数据中得到的终有极限。诺维格说,就像一个钟形曲线,更多的数据可以让系统变得更好,现在我们还在不断提高;但终有一天,我们获得的利益将不如过去。  

侯世达以前的研究生詹姆斯·马歇尔(James Marshall)则认为情况很简单:“最终,只有难走的那条路才能带你走向你想去的地方。” 

侯世达在他35岁时开始了他的第一次认真恋爱(他形容自己生来就“共振曲线窄”)。1980年,在度过15年地狱般惨无爱情的岁月后,他遇到了卡罗尔·布莱什(Carol Brush)。用侯世达的话说,卡罗尔“刚刚好处于他共振曲线的中心”。相遇后不久两人就结了婚,生了两个孩子。但好事不常,1993年他们一起在意大利休假时,卡罗尔突然因脑瘤去世,两个孩子分别是5岁和2岁。好友说卡罗尔去世后侯世达迷失了好长一段时间。 

30年来侯世达一直没有参加过人工智能方面的会议。“我和这些人之间没有沟通,”侯世达这样形容他的AI同行。“我不想跟那些死不妥协的人说话。你知道,虽然我叫他们为同行,但他们几乎算不上是我的同行,我们跟对方搭不上话。”他说。“我不喜欢参加会议,遇见死脑筋而且想法是错误的人,或是不了解我在想什么的人。我只爱跟和我想法更一致的人说话。” 

我只是觉得人的一生很短。我工作,但不公开。我不拼命争取。” 

从差不多15岁开始,每隔十年侯世达就会重读一遍《麦田里的守望者》。2011年秋季学期,他还给本科新生开了一门讲座“为什么J.D.塞林格的《麦田里的守望者》是部伟大的小说?”侯世达对小说的主人公霍尔顿·考尔菲德有很强的认同感。有人认为霍尔顿只知道抱怨发牢骚,侯世达的解释是“他们没有意识到霍尔顿的脆弱”。你能想象侯世达在小说的开头像霍尔顿一样站在山头,独自一人形单影只,看着他的一帮同学活蹦乱跳地在底下踢足球。“我的想法已经有很多了,”侯世达说:“我不需要外界的刺激。” 

而凌驾于战斗的坏处就是,你不是战斗的一部分。侯世达以前的学生、与侯世达交往30年之久的鲍勃·弗伦奇(Bob French)说:“科学里很少有观点是黑白分明,人们一看便说‘哦,好吧,为什么我们没有想到呢?’从板块构造到演化论,所有的这些观点都必须要有人去为之争取,因为总是有分歧。如果你不参加战斗,不去趟学术界的这趟浑水,你的想法终究会退居一旁,让位给那些尽管不如你,但是有人在角斗场中为之奋战的观点。” 

侯世达从未想过要争取,而他工作的好处和坏处也在于,他从来也不需要去真正战斗。35岁那年他赢得了普利策奖,瞬时间就成了学校的宝贵资产,印地安那大学授予了他终身教职(tenure)。侯世达不需要在期刊上发表文章,也不需要提交同行评审,更不用回复评审意见。他有一个出版商,基础丛书(Basic Books)出版公司,只要是他写的东西,一律照单全收。 

斯图尔特·罗素把话说得很直白:“学术界并不是你只要坐在澡盆子里,有了想法后大家就奔走相告、兴奋得不得了的地方。很有可能在50年后,我们会说,‘当初真应该多听听侯世达是怎么说的。’但是,想想该怎么做让人们了解你的想法,是每一位科学家都应该尽到的义务。” 

侯世达爱说“生命短暂,艺术长存”(Ars longa, vita brevis)。他说,“我只是觉得人的一生很短。我工作,但不公开。我不拼命争取。” 

侯世达打了一个比方——爱因斯坦在1905年提出了光量子假说,但是,没有一个人相信他,直到1923年。侯世达说:“18年,爱因斯坦完全是只身一人相信光粒子的存在。” 

“那一定很寂寞。” 


(Ent对本文亦有贡献。)

编译自:《大西洋月刊》,The Man Who Would Teach Machines to Think
文章图片:theatlantic.com

The End

发布于2014-03-07, 本文版权属于果壳网(guokr.com),禁止转载。如有需要,请联系果壳

举报这篇文章

果壳作者

pic