3029
需用时 06:03
发生在T恤上的强奸:算法该不该做人类的替罪羊?

1.

2013年3月2日,这一天,“保持冷静,咋样咋样”(KEEP CALM and DO WHATEVER)的谜因彻底火了。


涉案公司在亚马逊上的商品销售页面,左边大图即为案发T恤,其上字样意思为“保持冷静,强奸一群”。

一家名为真金实弹(Solid Gold Bomb)的T恤公司被人发现在售卖印有“保持冷静,强奸一群”(KEEP CALM and RAPE A LOT)字样的T恤。不仅如此,这家公司还有销售印着“保持冷静,掐死她”(KEEP CALM and CHOKE HER)和“保持冷静,揍她”(KEEP CALM and PUNCHHER)的T恤。整个网络,尤其是英国的,都炸开了锅。

这事儿是怎么发生的呢?

“都是算法惹的祸!”

 

2.

来见识见识这让人彻底无语的一幕——一位业主竟以他们不知道自己在卖什么为由恳请顾客的原谅:

尽管我们不是有意制造这些冒犯性的T恤,这只是我们的一个工作人员编写的脚本程序运行的结果,不过我们会对自己的行为和过错负责,并尽最大努力去改正这一问题。我们对此次造成的不适表示歉意!

                                    ——真金实弹公司在 ITV上发表的道歉声明

 

3.

亚马逊在“SPAM”(垃圾电子信息)问题上是有案可稽的。Kindle商店里充斥着外表和畅销书混淆性相似的书籍。从事全球市场调研的艾肯策略集团(Icon Group International),他们就提供特异性极高的书籍,比如《2013年新西兰厚度6毫米以上的非针叶木锯材、刨片、夹板和去皮木片的进出口市场》 (The 2013 Import and Export Market for Sawn, Chipped, Sliced, or Peeled Non-Coniferous Wood over 6 Millimeters Thick in New Zealand)。


亚马逊的Kindle商店里充斥着垃圾电子图书。图中放大的封面即为艾肯集团《2013年新西兰厚度6毫米以上的非针叶木锯材、刨片、夹板和去皮木片的进出口市场》一书。

艾肯的书是由一个专利系统生成的,该系统的制作人菲利普•帕克(Philip M. Parker)说,他的下一个进攻目标是爱情小说。

 

4.

对于那些无法与帕克的专利内容生成器相竞争但又有想从中捞上一笔的人来说,还有其他路可走。自有品牌权利业 [1] 专门生成可供你买下并按喜好进行重包装的内容。另一种选择是直抄袭,更不用说那一整个用“内容微调器”[2] 这种简单的词库重写工具生成的亚文化产品圈了。

或者,你可以复制“一首唱不完的歌”[3] 的歌词,粘贴上个700页,存成一个Kindle文件,然后卖了它。

 

5.

亚马逊的“库存”中有50多万件真金实弹公司的货品。这些东西基本上不存在,它们全是现买现卖的设计而已。内容由某种配对算法生成,之后由亚马逊的API(Application Programming Interface,应用程序编程接口)按照天知道亚马逊的什么限制自动加入到数据库中。如果有人买了其中的一件,T恤这时候才会被印出来,然后送到顾客手中。


真金实弹公司在亚马逊上的“库存”,在买家付款后才开始进入生产。

 

6.

詹姆斯•布莱德(James Bridle)的《献给我们的时代:50册盗版书》(For Our Times: 50 Pirate Works)由50个不同版本的查尔斯•狄更斯的《艰难时世》(Hard Times)组成。每一册的内容都与原作有着某种出入,从只动几个字母到大段大段的重写,再到逻辑上的文本改动。

这些书后来都被印刷出来,装订成册,放在一家画廊里展出。最后这一步很重要。


詹姆斯·布莱德在画廊里展出的《献给我们的时代:50册盗版书》。图片:Flickr

 

7.

有这么一个关于定价的老笑话。一个男的遇见一个男孩儿在路边卖铅笔。卖铅笔哦!年轻人的创业精神打动了他,于是男的停住脚,问,铅笔多少钱一支呀,想鼓励一下这个男孩儿。

    “100万美元,”男孩儿回答说。
    “100万美元!我觉得你这样可卖不出多少支哦,小伙子。”
    “先生,我只用卖出一支就行了。”

 

8.

让这次算法在T恤上闹出的强奸案从“十分反感”上升到“令人震惊地反感”,部分原因就是T恤衫和这些文字在表面上是现实世界的物体。而人类社会的法律法规还没有将发送电子垃圾的机器人纳入考虑。

最好尽快调整这些法律法规。一大波垃圾电子信息机器人马上就要来了。
 

9.

在迎向大规模定制的时代和快速原型技术的兴起之时,人们常常很容易就激动起来。即便在谈论会发生什么不好的事情时,也总是说到“但很多业余人士在初期会产生一些失败的尝试品”就不再继续了。谈论“Crapjects” 和奇怪的 “Shaper” 亚文化,整个话题还有种手工艺品文化的感觉。垃圾电子信息的真正规模将会比这厉害许多。


“Crapjects”,用塑料等垃圾做的艺术。图片来源:new-aesthetic.tumblr.com

是的,放低进入门槛意味着将会出现更多小规模的制造和写作。是的,在家里按需求快速制造和打印将会打开闸门,放入一大批的业余设计师和作者。他们同时还会把算法的闸门也打开。
 

10.

当互联网热潮刚刚兴起,亚马逊公司成立,人们开始讥讽实体经营模式(Brick and Mortar)就像笨拙的恐龙,显然注定会走向灭绝。那时候这些新的机动的网络卖家被当成另一类东西。虽然现在那些因一时冲动而纵身下海的网络零售商大半都已经被浪花淘尽,但他们知道的比我们更加正确。

亚马逊不是一家商店,真的。它不在我们常说的商店的任何范畴里。这是一个由潜在的商品、全球供应链和外来的关联算法组成的脉冲网,它披上了商店的外皮,这样人类才不会被吓疯。

 

11.

垃圾电子信息在 Second Life 上是一个致命的问题。


虚拟现实游戏 Second Life,电子垃圾堆满了这个场景。

 

12.

打开真金实弹公司的网站,点击“关于我们”、“联系我们”和“致歉”页面,出现的都是这封道歉信,具体解释了事情发生的全过程。在“保持冷静,继续前进”(KEEP CALM and CARRY ON Ltd)申请了注册商标以后,真金实弹的创始人迈克尔•福勒(Michael Fowler)决定制作一大批的仿冒品。福勒攒了一张词汇表,把它们输入脚本,然后点击了“运行”。

福勒讲述了他是如何把生成的“数百万个”短语缩减到700个,然后核对它们与原文在语法上的相似性,很显然忘记了留意这些短语的内容

福勒称他和我们一样,震惊于最后数据库中会有这样一句冒犯性的表述。(实际上,冒犯性的表述不只一个,而是有好几个——当你把“强奸”、“掐死”和“揍”这样的词放进动词表里,生成这样的结果该是料想之中的事情。)

我们绝不会生产低级趣味或者冒犯性产品,主要以运动相关的产品和图标系列著称,它们都基于类似的技术生产。作为一个父亲、丈夫、兄长和儿子,我绝不会在我们公司推广这样的产品,这一点可以从我们提供或者应需生产的数百万件T恤上看出来。

                    ——真金实弹公司创始人迈克尔•福勒《我们的道歉》

断然否认你绝不会做一件你被抓住现行的事情,代表了一种特殊的“非道歉”行为。

 

13.

2011年2月,两个定价算法在亚马逊上干了一仗。一个想要出价比次高的价位略低一点,另一个则想比最低价高卖1.27059美元。结果双方争执不下,而一本书的售价一路飙升到了 23,698,655.93 美元,这是一本讲苍蝇的绝版书。

它们要的也只是卖出一本。

 

14.


布莱恩·恩诺与他的《7700万幅画》。文字意为:当我生成性地创作时,我实际上在制造种子。然后我会播种它们。在《7700万幅画》这个项目里,我把它们播种到你的电脑里。这些种子之后会成长为它能生成的不同种类的花。来源:vivoscene.com

布莱恩•恩诺(Brian Eno)的《7700万幅画》(77 Million Paintings)是一个由声音和图像组成的生成性艺术品。这件艺术品有着极高的价值(笑),因为它可以用很少的原创性材料制成大批的作品。

《7700万幅画》亚马逊上有卖。Second Life 里也有。

 

15.

奎因•诺顿(Quinn Norton)曾经提出过这么一个计算机程序,能生成世界上所有可能的旋律。在把这些输出变成一首完整的完美的交响乐之后,编写这个计算机程序的人就能在自己规定的版权许可下把这首歌发布出来,让所有的歌曲都失去版权,变成免费。

 

16.

乔治娜•沃斯(Georgina Voss)说得对。

你们都够了,不要再说 ‘一个大个儿算法干了这事儿然后逃跑了’ 这种说法了——算法也是有法的好不好。     ——@gsvoss

皮特•阿什顿(Pete Ashton)指出,既然这个事情是一个行为不端的脚本所犯,“作为错误而言这还是相当情有可原,假设他们已经有所行动”。阿什顿说,人们之所以会如此不安是因为缺乏数字素养。要我说,人们之所以会如此不安是由于一家公司的拙劣QA(质检)让一个强奸笑话上市销售了。

任何跟软件打过交道的人都应该知道,真正输入代码只是整个编程工作当中一个相对较小的部分。在开始编代码之前的设计程序,在代码编好后的测试BUG才是任务的重头。

生成性程序是力量倍增器。一个小的初步决定将会造成大规模的后果。触及的面越广,管理输出的责任也就越重。Facebook 犯一个涉及0.1%用户的错,就意味着将有100万人会因此而受影响。

 

17.

“我们没有导致一个强奸笑话发生,我们允许一个强奸笑话发生了。”

这不是一个有力的借口。它暴露了数字素养的缺乏。

 

18.

把算法当借口。

把算法当你没品的推诿。

 

19.

“我们为算法可能引起的任何冒犯向您道歉”,就跟“目前算法的动机尚不明确”一样,是一个奇怪的时代的奇怪的标记。

 

20.

我们对此造成的不适表示歉意!我们对此造成的难受表示遗憾!我们对此导致的恶心感觉感到抱歉!


 

内容注释:

  • [1] 自有品牌权利(Private label rights),指 作者有权对自己在网络上生成的内容声明版权,但这个版权声明并不具有法律效力。“自有品牌权利产业”是作者的讽刺,指围绕这一协议所建立的网络内容生成产 业,在很多情况下,网络上的原创内容被他人拿去用自己的文字重新描写或者对图片进行再次拍摄,就能避免侵犯版权的问题。
  • [2] 内容微调器(content spinner),一种基于词库的简单内容重写工具。通过对原文进行文字上的微调,就能输入新的“独特的”内容。
  • [3] “一首唱不完的歌”(The Song that Never Ends),类似于 “从前有座山,山上有座庙,庙里有个老和尚在讲故事……”这样的儿歌,歌词可以无限循环。

本文编译自:

Quiet Babylon,Algorithmic Rape Jokes in the Library of Babel

文章图片:

quietbabylon.com;(小图)Flying Mouse,via english.mashkulture.net

The End

发布于2013-03-15, 本文版权属于果壳网(guokr.com),禁止转载。如有需要,请联系果壳

举报这篇文章

ccyou

游戏设计师,游戏达人

pic