9252
需用时 18:30
Siri的诞生,也许比iPhone更重要

Siri首次向全世界展示它招牌式的机敏,是在一场坐满科技精英的媒体发布会上。

“你是谁?”苹果公司的一位高管这样问Siri。

Siri回答道:”我是一位谦逊的私人助理。”现场的观众们会心地笑了。

这场媒体见面会其实是Siri第二次与大家见面了。2010年,当Siri首次作为iPhone的第三方应用出现在苹果的App Store里。开发这个应用程序的是一个由24人组成的创业团队,随后,这个同样以Siri命名的公司被苹果收购。

那时,作为第三方应用软件的Siri说起话来语调更加随意,它能帮用户完成的任务也更多。作为Siri公司的合作创始人和首席执行官,戴格·吉特劳斯(Dag Kittlaus)像作家塑造小说人物一样仔细塑造出Siri的态度和身世。吉特劳斯创造出的这位个人助理”与众不同”、”对流行文化有粗略的了解”,还有一点点”冷幽默”。

如果你向它打听那里有健身房,Siri会嘲笑你:“没错,你手机握得的确不太紧。”如果问它:”HAL最后怎么样了?”——HAL是斯坦利·库布里克(Stanley Kubrick)1968年指导的电影《2001:太空奥德赛》中一台有头脑(还有谋杀倾向)、会说话的电脑——Siri会不高兴地回你一句:”我不想谈这件事。”当时Siri的词典里居然还有“Fuck”这样的词。

图片替换文字
最初版本的Siri,发布于2010年。

收购Siri后,苹果纠正了它说脏话的坏毛病,在赋予它一些新能力的同时,也大大限制了其他的功能。在以1.5~2.5亿美元的价格收购Siri公司16个月后,2011年10月,苹果发布了新的Siri。这时的Siri已经学会了多种语言。它现在可以在多个国家工作,为上百万用户提供服务。新的Siri还可以直接用语音回答用户的提问,而在此之前,它只能提供文字反馈。它还与iOS系统深度整合在一起,可以调用十几个iOS内置工具来完成像安排会议、回复邮件和查看天气这样的简单任务。

虽然这些新功能十分引人注目,但许多用户并没有意识到,新版Siri失去了许多曾有过的功能。毕竟,这个软件不只是一个普通的iPhone应用,它直接诞生于美国历史上最大的人工智能项目。这个项目由美国国防部资助,目标是构建一个可以推理与学习的虚拟助理。

2010年Siri首次推出时,它可以与42个网络服务相连接——从餐馆点评网站Yelp、售票网站StubHub,到电影点评网站Rotten Tomatoes和数学计算网站Wolfram Alpha——然后Siri会将各个网站上的信息整合在一起再回馈给用户。无需打开其他的应用软件,Siri就可以帮助用户买票、订餐馆或叫出租车。它几乎可以感觉到用户的好恶,按照用户的个性提供相应的建议。

在2010年的一场科技论坛上,Siri的共同创始人汤姆·格鲁伯(Tom Gruber)展示了它的能耐。他告诉Siri,“我想找一家离公司不远,情调浪漫的意大利餐馆”,后者马上把来自8个网站的信息完美地整合在一起,然后把最佳答案呈现出来。

在开发者的构想中,Siri应该是一个“任务引擎”。与呆板的搜索引擎不同,任务引擎可以与用户进行对话,然后给出相应的反馈。当你在酒吧里喝高了的时候,用谷歌搜索找车送你回家并不是件容易事;但任务引擎则可以理解你口中含糊的 “我喝高了……回家……”,然后帮你叫车。Siri 公司的目标不是打造一个更好用的搜索引擎,而是开拓一种使用互联网的全新模式。在他们的设想里,人工智能系统可以主动提供用户需要的答案,而不仅仅是找到相关的链接让用户自己做出选择。如果说搜索引擎定义了第二个网络时代,Siri的创始人则相信任务引擎将开创第三个网络时代。

任务引擎将成为你生活的伙伴——它可以预测你需要什么,并在你提出要求之前就打点好一切。Siri的开发者曾有构想过一个还未执行的功能,来帮助遭遇突发事件的旅客:当你发现你的航班被延误时,Siri早已为你准备好了其他备选航班、即将发车的列车班次和租车公司信息供你选择。

这个Siri——曾经的那个Siri——让我们看到了它的无尽潜能:越来越多的人工智能助手将融入我们的生活。软件开发者的目标,是创造出一个能帮助人们更好地生活的虚拟助手,它可以弥补人类大脑的局限,将我们从枯燥乏味的任务中解脱出来。

Siri的支持者们知道,苹果手中的Siri还没有发挥出它的全部潜能。“Siri的开发团队看到了未来,定义了未来,并打造出了第一个可以使用的未来。”摩根泰勒投资公司——第一批投资Siri的两家风险投资公司之一——的合伙人盖瑞·摩根泰勒(Gary Morgenthaler)说,“所以对我们这些创始团队的成员来说,Siri被收购后的发展速度很令人失望。”

但随着越来越多的虚拟助理争相在我们的手机上占据一席之地,苹果也开始面临更大的压力。他们需要充分利用手中的技术,把Siri重新打造成那个八面玲珑、积极主动的小帮手。曾经的Siri让我们看到虚拟助理的美好未来正在到来。也许现在的Siri只是iPhone的一个注脚,但也许用不了多久,iPhone就将成为Siri的注脚。

吉特劳斯说:“毫无疑问,一个善良温和的HAL将出现在越来越多的手机上。现在的Siri只是个开始,未来远远不止如此。”
 

SRI,Siri从这里诞生

HAL走上银幕35年后,将科幻作品中的想象正在一件件变成现实。而完成这一任务的,是美国国防部——也许只有他们的想象力可与乔治·卢卡斯和斯皮尔伯格比肩。

2003年,国防部下属的投资部门先进科研项目局(DARPA)找到了一家非盈利的研究机构SRI International,委托他们领导一项长达5年、500多人参与的项目。这个项目的目标是打造一个虚拟助理,美国政府希望利用其研究成果来帮助军队的指挥官,处理大量的战场信息和日常事务。虽然Siri并不是这一项目的直接成果,但这个叫做“可学习与组织的认知助理”(CALO)的人工智能助理,最终为Siri的开发提供了灵感与模型。

就这样,在国防部1.5亿美元的资金支持下,上百名人工智能领域的顶尖专家展开了一次雄心勃勃,但又前途未卜的探索:教计算机如何在自然环境中学习。这样的项目对大多数企业研发部门来说是几乎不可能的。这间实验室(被SRI的研究者们戏称为”技术宅之城”)的工程师们要创造的,是一套可以观察用户行为,同时收集与用户的工作相关的各种信息,并从从中学习的助理软件。CALO项目的一位研究员大卫·伊斯拉埃尔(David Israel)表示,这项任务“不论从哪方面讲,都是史上规模最大的人工智能项目”。

 

 

 

但在一些人看来,本该谨慎行事的联邦政府,这次是把宝押在了只有小学生才会相信的科学幻想上。

“CALO项目启动时,许多人并不看好人工智能项目。”科技观察家、斯坦福大学的副教授保罗·萨佛(Paul Saffo)评论说,“在此之前的许多类似项目都失败了,当时人们普遍对人工智能的前景表示怀疑,很多人都觉得这个想法十分愚蠢。”

面对这些质疑,CALO项目用令人瞩目的科学成就证明了它的价值。几十年来,人工智能领域的各个分支一直在独立发展,各自为政。许多人认为,人工智能系统的复杂性决定了不同分支之间无法有效合作。而CALO却将各个领域整合在了一起。

这个项目还证明了,机器也能像人一样从自己的经历中学习。在此之前,人工智能软件都是在虚拟环境中开发出来的。研究者会使用一套固定的数据来测试他们的学习算法,然后根据不同算法处理信息的能力来判断它们的优劣。而与之不同的是,CALO的每一个组成部分都要在真实的使用环境中学习如何利用无法预知的信息来完成任务。

在此之前,曾有许多科幻小说中的想象从SRI实验室走入现实。1946年,斯坦福大学的基金会创建了这间实验室,以开展“有益于社会”的研究。1970年,SRI实验室正式从斯坦福大学独立出来,并一直独立运作至今。这家机构领导的研究项目大多由政府机构或企业资助。随后,那些前景最光明的成果便走出实验室,成为独立的公司。SRI实验室的众多成就中包括喷墨打印机、液晶显示器和迪士尼乐园。

这家位于加利福尼亚州门罗帕克市的研究机构,还因在这里工作的众多顶尖研究者而享有盛誉。他们中就有硅谷传奇人物道格·恩格尔巴特(Doug Engelbart),他在60年代开创了电脑鼠标,同时也预见了许多如今人们已经习以为常的基本电脑部件。

早在他着手开发Siri的原型之前,SRI实验室的另一位工程师亚当·奇耶(Adam Cheyer)就已经被人们拿来与恩格尔巴特相比较了。这位有着深色头发、说话轻柔的工程师曾拿到过魔方大赛的冠军,可以在26秒内还原一个魔方。他与恩格尔巴特的相似之处不仅在于创造力,还有他们都信奉的”以人为先”的科技理念。

恩格尔巴特认为机器应该被用来扩增使用者的智力与技能。伊斯拉埃尔说,使用机器的目的”不是为了在任何方面取代人类,而是要通过硬件和软件来帮助人们更有效地完成他们的工作”。他记得奇耶和恩格尔巴特曾在SRI实验室的餐厅里进行长时间的交流。

令许多人厌烦的日常杂务,在奇耶看来却是供虚拟助理软件学习的绝佳机会。90年代在SRI工作时,当时刚刚拿到计算机硕士学位的奇耶就曾建造了一套虚拟助理原型。其中的厨房助手可以监控冰箱中的食品余量,如果发现牛奶快要被喝完了,就会自动从网上订购新鲜牛奶。

在SRI,奇耶的任务是将CALO项目下27支团队建造出的不同组件组合成一个完整的助理。每年,这个虚拟助理都要接受一次测试,来检验它在这一年的时间中都学到了什么。奇耶打造的这款”研究用”虚拟助理(名字也是CALO)十分简陋,离消费者的电脑与手机还有很远的距离。但CALO已经可以完成许多原来只能由人类完成的任务了。

举个例子,如果你的同事在会议快要开始的时候取消了会议,CALO可以根据每个人在这个项目中所负责的工作来判断是否要重新安排会议。如果需要的话,它会发出新的会议邀请,并预订会议室。如果会议如期举行,CALO可以整理出所有相关的文件与电子邮件以加快会议进程。它还会旁听会议内容,并在会议结束后将每个人的发言转换成书面记录,同时列出会议中提到的具体任务。CALO还可以帮助用户准备发言内容、整理文件夹、分类短信息、自动生成支出报告等。

这段时间,奇耶一边训练CALO,一边在SRI的先驱者计划中帮忙。先驱者计划于2003年和CALO项目同时启动,目标是帮助德国电信和摩托罗拉等公司探索智能手机的发展前景。先驱者计划中的科研人员也开发了他们自己的虚拟助理原型。这个助理虽然没有CALO那么神通广大,但可行性更高。

这个开发中的原型助理吸引了摩托罗拉公司一位经理的注意,这位经理就是戴格·吉特劳斯。

吉特劳斯是土生土长的中西部人,却曾被人形容为”长着娃娃脸的北欧版布拉德·皮特”。日常工作之余,吉特劳斯还经常参加一些惊险刺激的活动,比如追逐龙卷风和跳伞,他同时还是合气道黑带高手。他是科幻小说迷,是阿瑟·克拉克(克拉克曾帮助撰写《2001:太空奥德赛》的剧本)的忠实粉丝。吉特劳斯后来还自己动笔写过时间设定在遥远未来的小说。

吉特劳斯曾劝说摩托罗拉采用先驱者计划的技术,但没有成功。于是他便辞了职,来到SRI任职。加入SRI后不久,吉特劳斯和奇耶,以及SRI的其他几位同事一起到加利福尼亚度周末。他们的任务,是讨论如何将CALO和先驱者两个项目的精髓合并在一起,开办一家公司把它发扬光大。

旧金山南边一点有一个叫做半月湾的海滨小镇,镇上有家丝柏旅店。就是在这里,Siri的故事开始了。正如恩格尔巴特所坚信的那样,这个即将诞生的移动虚拟助理会将人们从低级乏味的日常事物中解脱出来。

这个助理的研发代号是HAL,而与之相对应的口号是“HAL回来了——这次是个好HAL”。

图片替换文字
SRI实验室的几位主要人员合影。

未尽的使命

一直以来,对于硅谷的梦想家们来说,“虚拟助理”这四个字就是他们的滑铁卢。

1994年,野火通讯公司发布了一款基于电话的个人助理:“Wildfire”。这款软件可以处理短信息、拨打电话和检查语音信箱。虽然Wildfire知道如何用生动的回复取悦用户,也得到了不错的评价,但真正使用这套软件的人却很少。几年后,微软公司随新版Office软件一起发布了Clippy,一个跳来跳去急于为用户提供建议的回形针。《时代》杂志后来将Clippy列为史上最烂的50大发明之一。1998年,通用魔力公司发布了Portico。这款软件让手机可以连接互联网,并且可以靠语音操作完成阅读电子邮件、发送短信息等任务。但不到四年后,这家公司就停止了对Portico的开发,并很快宣布破产。

十多年后的2007年秋天,智能助理软件等待已久的机会终于到来了。更高速的无线网络、更准确的语音识别、云计算的快速发展和随iPhone而来的各种全新的网络服务,这些都让智能助理成为了可能。

就在SRI的这几位员工前往半月湾度假前,苹果公司发布了iPhone。吉特劳斯们预见到这部手机将会培养出一大批随时随地都与互联网保持联通的用户,但他们却只能在手中小小的触摸屏上完成各种操作。这种情况下,一个可以语音操作的助理软件似乎是完美的解决方案。这个助理可以帮助用户完成各种各样的工作,同时也免除了在狭小的触摸屏上点来点去和等待网页加载完成的痛苦。

这几位未来的企业家们还占据着另一个很重要的优势:他们可以使用CALO项目开发出的技术。根据1980年国会通过的一项法案,像SRI这样的非盈利机构有权从政府资助的软件项目中获得收益。这项法案还允许创业公司用股权与SRI换取CALO项目核心技术的使用权。

虽然奇耶对能否将CALO项目转化成有利可图的生意还持有怀疑态度,吉特劳斯还是成功地劝说他的这位”创新伙伴”辞去了他在SRI的工作,一起成立了这家叫做Siri的公司。吉特劳斯在新公司中担任CEO,格鲁伯担任技术主管,奇耶则是负责工程开发的副总裁。

按照Siri三位创始人的要求,所有想要加入这家公司的求职者都要阅读麻省理工大学教授迈克尔·德图佐斯(Michael Dertouzos)所著的《革命未完成》。德图佐斯认为计算机应该”以人为本”,我们使用的各种设备”应该真正地为我们服务,而不是让我们伺候它”。如果某个职位的申请者不同意德图佐斯的观点,那他就不适合在Siri公司工作。

图片替换文字
Siri公司的三位联合创始人。从左至右依次是:奇耶、吉特劳斯和格鲁伯。

一旦被Siri公司雇用,新入职的员工会拿到一幅空相框,并在里面贴上对他们启发最大的人的照片。奇耶的相框里的人,是另一位坚持”以人为本”的科技梦想家:道格·恩格尔巴特。

2008年初,Siri公司拿到了850万美元的投资,而他们随后几个月里的进展,用早期投资者摩根泰勒的话说是“绝对令人激动的”。肖恩·卡洛伦(Shawn Carolan)是门罗投资的合伙人,也是Siri的投资人。他回忆说:”每一次董事会议都有重大突破。”

几位创始人将他们的Siri原型软件放在他们自己设计开发的人工智能系统里面,教它如何理解和回答用户的提问。当用户向Siri提出一个问题,Siri会将用户的语音信息传送到数据中心的服务器。这些服务器上的语音识别软件可以将语音信息“转录”成文字信息。

接着,Siri要搞清楚这些文字的含义——这一过程被计算机科学家们称为自然语言处理。人们可以用许多种不同的方式来表达同一个意思。比如说“我现在想吃羊角面包”、“这附近有没有面包店”和“现在要是有点法式馅饼就好了”其实都是在说同一件事。对于人类来说,搞清楚这么多不同的表达方式并不算什么难事,但计算机却需要一套十分精巧的算法才能理解这些。

传统的处理方法是靠识别句子里的语法成分来做出判断,但这个办法却经常出错。Siri彻底抛弃了这套系统,转而使用奇耶和他的同事们开发的另一套处理方法。他们的这套系统依靠识别句子中所指的事物来处理信息。比如当Siri听到“我想看部惊悚片”这句话时,它会识别出“惊悚片”是一种电影类型,然后调出和电影有关的信息。

Siri可以将提问中的内容与可能有关的操作相对照,然后根据它对现实概念之间关系的理解,选择看上去最稳妥的操作。(比如Siri知道一家餐厅应该有评价、地址、风格和价位等相关信息。)Siri还可以使用时间与用户的偏好和位置等信息来选择最恰当的回应,而当它无法作出决定时,它还会请求用户提供更多的信息。

你可以把Siri想象成在一间嘈杂的酒店大堂工作的前台服务员。“最近的咖啡店在哪里?”这句话穿过人群后,很可能就变成了“最近的‘快放电’在哪里?”。但前台服务员知道“最近的”这个词更有可能和地点联系在一起,而且酒店里的客人通常不会向服务员打听关于电路工程的问题。据此,他可以推测出客人想知道的是去哪里可以买到一杯咖啡。Siri也是这样工作的。它会特别注意听取那些雇主们经常会对私人助理讲的词,这样它不需要听清楚句子里的每一个词,就可以大概理解句子的含义。为了减少错误,用户也可以将他们的问题用键盘打出来。

为了获取关于咖啡馆的信息,Siri可以调用超过40家网站上的信息。这些网站就像是Siri的众多远程大脑。和此前那些只可以完成一个领域工作的虚拟助理不同,Siri的能力更加全面。不管你是想打听一本书还是想了解一棵树,只要Siri有相关网络服务的API,它就可以帮你找到答案。

一开始,开发者们没有给Siri的功能添加任何限制。他们构想中的Siri可以连接到任何网络服务。但他们也知道想让Siri成功,这个虚拟助理不仅要聪明,还要风趣。

吉特劳斯和萨德勒知道用户可能会向Siri提出各种无厘头的问题,于是他们为Siri准备了许多生动的回复。他们甚至想为Siri准备不同的“性格包”,让用户可以选择是让Siri变得贴心还是刁蛮。因为Siri可以识别出用户说话方式的细微特征,开发者们甚至希望有一天Siri可以模仿用户的性格。“喂,伙计,最近有啥片儿?”Siri会回答:“哥们儿,克林特·伊斯特伍德的新片儿不错。”

2010年2月,就在Siri首次作为独立的iPhone应用发布三周后,吉特劳斯接到一个神秘电话。因为他的iPhone出了点小问题,他差点错过这个电话。

给他打电话的是史蒂夫·乔布斯。他想第二天和吉特劳斯见面。

第二天,Siri的创始人在乔布斯家里见了面。他们聊了三个小时,讨论任务引擎的未来,以及用户如何与机器对话(乔布斯很喜欢Siri的小聪明)。很快,苹果就表示有兴趣收购这家刚刚成立不久的公司。

吉特劳斯回忆道:“按照乔布斯的描述,他和斯科特·福斯特(当时苹果移动软件部门主管)一直对使用语音识别技术为iPhone打造一个语音交互界面很感兴趣。他告诉我说,他觉得我们的会话式交互界面完美地解决了这个问题。”

Verizon公司也持同样的看法。2009年秋,就在苹果与Siri公司接触前几个月,Verizon与Siri公司签了一份合同,准备在之后一年内发布的Android手机上全部预装Siri应用。当苹果突然出手收购Siri时,他们坚持只在苹果产品上使用Siri,所以就终止了与Verizon的合同。要不是苹果出手及时, Siri险些就成为他们在智能手机领域的最大竞争对手的卖点。(当时Verizon已经为Siri拍好了电视广告,只等发布了。)

Siri公司的第一个,同时也是最后一个iPhone应用只存在了两个月。如今的Siri和它的未来都属于苹果了。

“这就是故事的结局——当然,你也可以把它当成故事的开始。”吉特劳斯说。

人工智能孤儿

随着Siri的一整支24人团队在位于库比蒂诺的苹果公司总部安顿下来,这家科技巨头马上开始着手改进刚刚收购的产品。

苹果强化了Siri的某些功能,但却切断了Siri与大部分网络服务之间的连接,大大限制了Siri的功能。2010年Siri应用发布时的主要功能之一餐馆预订,直到2012年才重新与iPhone用户见面。

科技产业内部人士说苹果的庞大规模阻碍了他们与服务网站的合作。与一家还在婴儿期的创业公司进行合作是件相当简单的事,而与世界上最具影响力的科技公司签订一份协议则要复杂许多。这样的合作风险相当大,因此需要经过无数次谈判,通过大量的成本收益分析,在许多律师的协助下才能完成。 虽然以苹果的技术实力,他们可以马上将Siri与许多网站相关联并投入使用,但他们还需要时间来说服潜在合作伙伴接受新的Siri。

同时,他们也想让更多的人用上Siri。苹果在全球100多个国家销售iPhone,而要让Siri在这么多国家提供本地化的服务并不容易。为了让Siri走出美国,苹果需要教它识别几十种不同的语言。设计计算机算法来理解人类语言需要相当长的时间。

用过Siri早期版本的用户会抱怨说苹果过分追求产品的外观与质感,让产品的设计掩盖了Siri的真正实力。为了不让用户们失望,原来的Siri应用会在用户每一次提问时显示出几个范例,告诉用户他们可以问什么样的问题。而如今的Siri却没有明确告知用户它可以做哪些事。苹果为Siri设计的口号——“都听你的”——让用户以为Siri可以满足他们的任何要求,但当他们发现Siri的能力如此有限时,他们收获的只有沮丧。

另一个苹果不得不面对的事实是Siri的语音识别能力并没有那么强,尤其是在它最经常被使用的环境中。语音识别软件在嘈杂的环境中经常出错,而且你也不要指望能在开车的时候与Siri聊天,因为分析通过蓝牙耳机传输的低质量语音信号时,Siri更是漏洞百出。不过这个问题只是暂时的,因为随着Siri拥有更多的数据和更精巧的算法,它最终可以更准确地理解人类语言。

其实Siri已经在不断进步了:在经过去年12月的一次测试后,投资银行Piper Jaffray将对Siri的评级从“D”上调到了“C”。他们在测试中发现Siri可以理解91%的提问,并正确回答其中的77%。

但随着Siri在苹果公司内部逐渐失去支持者,它的前景也越来越黯淡。虽然斯坦福大学教授萨佛曾警告说试图了解苹果公司的内部运作就像“试着搞清楚朝鲜在想什么”一样难,他还是表示在这家公司内部,Siri已经从“人工智能助理”,变成了“人工智能孤儿”。

Siri公司的三位联合创始人中,只有汤姆·格鲁伯还在继续留守。吉特劳斯在苹果重新发布Siri的三周后离开了这家公司,奇耶则在一年之后辞职。在发布会上首次向观众介绍Siri的iOS软件主管斯科特·福斯特去年被解雇,乔布斯则在Siri发布的第二天就离开了人世。代替吉特劳斯领导Siri项目的吕克·朱利亚则只在苹果待了10个月,就草草以辞职收场。

推动人类发展

Siri是市面上第一款可以理解人类自然语言,并将分散与互联网各个角落的信息组合成一条回应的虚拟助理。Siri开创的这个模式,正在被越来越多的人工智能工程师与企业家们所采用。

不断面市的许多虚拟助理所提供的服务,与早期版本的Siri和在这之前CALO很相似。就连苹果都在逐渐地恢复Siri曾经拥有过的许多功能,比如电影评论和餐厅预订。

受到Siri的启发,许多硅谷公司现在正利用CALO项目中的技术,来构建用途更专一的虚拟助理。Desti是一款专门处理旅行事务的人工智能助理,Lola则是“金融领域的Siri”,而Kuato则正在利用CALO研究项目中的技术打造一个学习助理。

仅在2012年,就有超过6款与Siri相似的服务面市。三星发布了语音控制助理S-Voice。语音识别软件供应商Nuance发布了“供应用程序使用的Siri”,Nina。两个创业公司,Evi和Maluuba,分别发布了他们自己的虚拟助理应用。IBM正在将他们的超级计算机,Watson,改装成超性能Siri,供医生、农民、华尔街交易员和高中生使用。而谷歌也模仿Siri开发了他们自己的会话式虚拟助理,Google Now。

“我们需要的不仅仅是问虚拟助理一个问题,然后从它那得到答案。我们需要它与用户对话,然后在对话过程中帮助用户完成任务。”斯科特·哈夫曼(Scott Huffman)是谷歌的工程主管,分管谷歌的移动搜索业务。他的构想与Siri创始人最初的想法惊人得相似。

科技预言家与科研工作者们预测,有了像Siri和Google Now这样的语音控制软件,人类就不再需要学习怎么使用科技,因为科技会学着理解人类。

“我们与机器之间的交互方式,正在越来越接近我们与身边其他人进行交流的方式。”萨佛说,“科技发展的趋势,是朝向越来越紧密的人机交互 。 而每经过一个阶段,机器在我们生活中扮演的角色就会变得更重要一些。”

这些更加重要的任务从处理日常琐事,到指导我们的生活。Siri的创始人曾计划通过使用CALO先进的学习系统,让Siri为用户提供个性化的建议。那时的Siri不需要收到具体的请求,就可以主动帮用户调集信息。

而谷歌的虚拟助理在这方面走的更远。在用户提问前,它就可以就主动提供信息。Google Now掌握了用户的日常活动,因此可以主动为体育迷们提供比赛动态,或者建议用户提前出发以免塞车。(谷歌公司主席埃里克·施密特在2010年接受《华尔街日报》采访时说得更直接:“(用户)希望谷歌告诉他们下一步该做什么。”)

几年之后,在你逛街的时候,你的虚拟助理会根据你的衣橱中的内容、当时的季节和你的银行卡上的余额,告诉你该去哪家店选购鞋子。当你走进鞋店时,你可以向虚拟助理咨询该选哪双鞋,它会小声告诉你那双小牛皮平底便鞋很不错,但同时也会提醒你如果买了它,你这个月的开支就会超出预算。如果你真的想买,虚拟助理会建议你选择预付现金,同时会主动联系你的银行处理相关的细节。当你付款时,你的助理会想起你最近经常去博物馆,便主动推荐最新的展览动态。有了可以根据面部表情推测出用户心情的情绪识别技术,虚拟助理能感觉到你的心情不太好,于是便讲几个笑话逗你开心。而办公室则会由另一个虚拟助理接手。在你赶赴约会之前,第三位虚拟助理可以给你的感情生活提出些建议。

那么那到时人类会变成什么样呢?

和许多人一样,Siri的投资人肖恩·卡洛伦认为我们会变得更有效率。“虚拟助理可以在30秒内完成本来需要15分钟才能做完的日常杂务。你只需告诉它你的想法,它就可以帮你完成。你的工作效率将是之前的30倍。”

凭借其强大的影响力和Siri的软件,苹果完全可以让任务引擎的梦想成真。如果苹果使用Siri早期的架构,用网络服务来不断扩展Siri的功能,它将可以自动完成许许多多的任务。

摩根泰勒认为Siri可以像亚马逊改变人们的购物方式一样,改变人们的生活方式。在苹果手中,未来的Siri将可以预订机票、订购鲜花或充当时尚顾问。按照前CALO项目主任詹姆斯·阿诺德(James Arnold)的说法,Siri将会变得和iTunes一样强大,但它管理的不仅仅是音乐,而是一个人生活中的方方面面。被收购前,每当用户通过Siri应用完成一次支付,Siri公司都会从中收取一部分的佣金。如果将来苹果也这样做,那他们将开启一片全新的利润空间。

阿诺德还认为虚拟助理会缩小人与人之间的智力差距。好记性也许将不再是一个明显的智力优势,因为智能助理将承担起记录名字、日期等零碎信息的任务。律师与医生也不再需要牢记大量的法律案例或者病情特征,因为智能助理将学会从不同的案件或者病人资料中找到不同寻常的联系。

吉特劳斯说:“将来,在虚拟助理的帮助下,我们不需要动太多脑筋就可以完成简单的工作。虚拟助理的意义不在于帮助我们生存,而是帮助我们探索未知的世界。”

虽然这些任务引擎可以变得很高效,它们也有可能带来巨大的风险。伦理与新兴技术学会的埃文·塞林格(Evan Selinger)认为越来越容易的生活有可能“让我们变得无意识”,同时也会减少让人们审视道德问题的机会。“这些本应为我们服务的数码助理将反过来主宰我们的行为,而我们自己甚至都意识不到。”

这些数码助理将比我们自己更了解我们的放纵和陋习,并有可能滥用这些信息。虚拟助理提供的建议有可能助长人们过度饮食和过度消费的习惯,尤其是当这些建议背后有广告商的身影时。你的家人了解你的心血管状况,知道该怎样劝你少吃牛排。但Siri呢?如果牛排餐馆花大价钱在谷歌上做广告,Google Now又会怎么说?Siri会劝你做一个更好的人,还是会纵容与迁就你的自我膨胀?

如果虚拟助理可以将我们从日常生活的琐事中解放出来,我们将有更多的时间与精力去实现更重要的目标。这样的智能助理将推动人类进入一个从未有过的新高度。就像数学家和哲学家阿尔弗雷德·诺斯·怀特黑德(Alfred North Whitehead)观察到的那样:“人类的进步意味着我们可以把更多的事情置之脑后。”

但这样的进步会走向何方?这也许就是虚拟助理无法回答的问题之一。

 

编译自:《赫芬顿邮报》 SIRI RISING: The Inside Story Of Siri's Origins 
作者:Bianca Bosker​

The End

发布于2013-03-07, 本文版权属于果壳网(guokr.com),禁止转载。如有需要,请联系果壳

举报这篇文章

Elefen

新加坡国立大学环境研究专业在读

pic