AI 的发展方向，应该是烤面包机，而不是机器人| 果壳科技有意思

Janelle Shane
数码
互联网

2090字
需用时 04:10

AI 的发展方向，应该是烤面包机，而不是机器人

Janelle Shane

（李子李子短信/编译）未来所有的智能算法，会不会都像无所不能的机器人——既能跟你插科打诨，给你在地图上指路，又能搞定厨房家务？还是说，我们的电子助手们会更像一个工具包，里面装满有各类特殊功用的小玩意——与其说是一个能聊能撩的大厨，不如说更像是一个装满工具的橱柜？

一个试图大包大揽的算法会陷入麻烦。下面是一个人工智能神经网络生成的食谱。这种人工智能能够从例子中“学习”，它扫描了大概3万个各种类型的食谱，有汤、派和烤肉等等，然后再试着生成自己的原创食谱。结果，怎么说，有点“新颖”。

图片来源：Pixabay

摊鸡肉饭

类型：奶酪/鸡蛋，沙拉，奶酪

辅料：

2磅心，去籽

1杯碎薄荷或者树莓派

1/2杯磨碎的卡特里玛

1汤匙植物油

1盐

1胡椒

2又1/2汤匙糖，糖

混合去叶，搅拌至混合物粘稠，然后加蛋、糖、蜂蜜和葛缕子籽，低温烹饪。加入玉米糖浆，牛至，和迷迭香和白胡椒。用奶油趁热盖住。烹饪，加入剩下的一茶匙烘焙粉和盐。用350华氏度烤2-1小时。趁热上菜。

6人份。

而如下是同一个算法生成的食谱，但是训练的数据不是所有的菜谱种类，而是只有蛋糕。生成的食谱并不完美，但比上一个要好许多了：

胡萝卜蛋糕（维拉小姐）

类型：蛋糕，酒精

1包黄蛋糕原料

3杯面粉

1茶匙烘焙粉

1又1/2茶匙烘焙苏打粉

1/4茶匙盐

1茶匙肉桂粉

1茶匙姜粉

1/2茶匙丁香粉

1茶匙烘焙粉

1/2茶匙盐

1茶匙香草

1鸡蛋，室温

1杯糖

1茶匙香草

1杯碎胡桃

将烤箱预热至350华氏度，9英寸脱底蛋糕模刷油

烤蛋糕：高速打蛋直到粘稠变黄，在一旁静置。在另一个碗里打鸡蛋白直到打发。快速把混合物倒进准备好的烤盘里，搅入黄油直到融化。在烤箱里烤40分钟，或者直到往中间插入木质牙签拔出时是干净的。在烤盘里冷却10分钟。拿出之后在铁丝盘上彻底冷却。

把蛋糕彻底冷却。趁温吃。

HereCto食谱（1989）来自《加拿大厨房生活》

16人份

当然，如果你仔细看步骤的话，它只给你烤了一层蛋黄，但这还算是有进步了。道理很简单，当 AI 被允许只处理一个限定范围之内的任务，那么需要它纳入考虑的因素就少了很多。它不用试图去搞清楚什么时候加巧克力、什么时候加土豆，什么时候烤，什么时候文火炖。如果说第一个算法试图成为一个魔法箱，里面既能煮饭，还能做冰淇淋和派，那么第二个算法只试图做一个烤面包机——只专注做一件事儿。

用机器学习进行算法训练的开发者已经发现，造一个烤面包机比造魔法箱要可行许多。这可能有点反直觉，因为西方科幻作品中的人工智能，通常会倾向于像《星球大战》里的C-3PO，或者《瓦力》里的同名主人公一样——这被称作“通用人工智能”（artificial general intelligence，AGI），这些自动装置能够像人类一样与周遭世界互动，处理各类任务。不过，许多公司很低调地——也很成功地——使用机器学习达到了有更多限制的目标。这些算法里面有聊天机器人，它能够处理一些限定话题的对话，比如回应顾客关于电话账单的常见问题。还有的算法能预测顾客打进电话来是要聊什么问题，给人工接线员展示它所预测的选项。这些都是“专一人工智能”（artificial narrow intelligence）的例子——它们只有有限的一系列功能。相比之下，Facebook最近弃用的聊天机器人“M”，想达成的目的就很多，处理旅馆预定、定戏院的票、安排鹦鹉展，等等，但却从来没有成功地完成这些目标。

为什么有烤面包机水平的专一智能，没有瓦力水平的通用智能？因为，任何试图进行一般化处理的算法，都会在遭遇越来越多种截然不同的任务时，变得越来越糟糕。比如，有一个算法接受的训练是基于一段文字说明生成一幅图。下图是它根据“这只鸟是黄色的，头部黑色，喙很短”生成的图片，当训练它的数据集里面只有鸟的图片的时候，它做得还不错（虽然头上长了个奇怪的角）。

但当任务变成了生成“任何东西”——从停车标志，到船、牛和人——机器就难以应付了。下面这幅图是它生成的“一张女孩正在吃一大片披萨的图”

一个能够把一件事情干好的算法，和一个能把很多事情都干好的算法，二者竟然有这么大的差距，这不符合我们的思维习惯。但我们现有的算法和大脑比起来思维能力还非常局限，而每一种新任务都会将有限的能力摊得更薄。想想一个烤面包机大小的机器吧：要让它能烤面包，那么可以在里面安上几个格子以及加热管，这很简单。但是这就没给别的东西留下什么空间。如果你想加上蒸米饭和做冰淇淋的功能，那么你至少需要拿走一个面包格子来腾出空间，而且它可能任何一个功能都做不好。

想要让专一智能做更多事儿，程序员们也是有窍门的。其中一个是迁移学习（transfer learning）：在训练完算法去做一个特定任务之后，只需要经过简单的重新训练，它就能做一个不同但是紧密相关的工作。比如，用迁移学习去训练图像识别算法。一个算法学会了辨认动物，这意味着他们也习得了不少探测图像边缘和质地的技巧，这些技巧可以被应用在识别水果上。但是，如果你要重新训练算法来识别水果，会有另外一个现象出现：灾难性忘却（catastrophic forgetting）。这意味着它再也不记得怎么认动物了。

另外一个现今算法领域常用的窍门是“模块化”（modularity）。与其开发一个能够解决任何问题的算法，未来的AI更有可能是一系列高度专业化工具的集成。比如，有一个学会玩电子游戏《毁灭战士》（Doom）的人工智能，它有好几个分开的模块，专门处理视觉、操作和记忆方面的任务。此外，相互连接的模块能提供一定程度的冗余，以防其中一个出问题；另外还能提供一个投票机制，从好几个不同路线中选出处理某个问题的最佳方案。这可能也是检测并解决算法中疑难问题的方式。搞清单个算法的决策过程通常很困难，但如果让好几个子算法合作进行决策，在出问题时，我们至少可以分别查看几个子算法的输出来确定问题所在。

当我们展望遥远将来的人工智能的时候，或许瓦力和C-3PO并不是我们应该找的那种机器人。相反，我们应该想象类似于有很多个App的智能手机，或者放满小工具的橱柜。在我们准备面对一个满是智能算法的世界的时候，我们该为此做计划的，不是那种能思考的、万用的，但却可能永远造不出来的魔箱做计划，而是极度专业的、烤面包机一样的智能。

（编辑：Ent）

The End

发布于2018-08-10，本文版权属于果壳网（guokr.com），禁止转载。如有需要，请联系果壳。

举报这篇文章

Janelle Shane

光学研究科学家，她用神经网络在aiweirdness.com上写段子。