1853
需用时 03:42
假如外星人发来信息,我们会不会以为那是噪音?

(译 / 红猪)1961年,有十二个人在西弗吉尼亚的格林班克天文台集合,讨论寻找外星人这事里的艺术和科学。海豚学社(Order of the Dolphin)就此诞生。参加这次集会的都是来自不同科学领域的顶尖人才,其中有三位诺贝尔奖得主,有年轻的卡尔·萨根,还有一位另类的神经科学家约翰·利利(John Lilly),此人最著名的事迹是与海豚交谈。

这个团体的称号正是从利利的研究中来的。利利认为,如果人类连一起走过大半部演化史的动物都无法交流,那再说什么“识别遥远行星的信号”就有点像疯话了。从这个观点出发,海豚学社开始研究在海洋中生活的那些地球同胞,希望它们能教导我们如何与外星人交谈。

从那以后,利利的物种间交流研究就随着SETI(寻找地外智能)团体的兴衰而数度走红过气。今天它又流行起来了,这都要多亏信息论的新应用和新的技术进步,比如现在有了一种鲸类听力和遥测(Cetacean Hearing and Telemetry,简称CHAT)装置,那是一种可以在水下工作的计算机界面,能和海豚开展基本交流。

用海豚比拟外星智能的做法在1999年得到了复兴,那一年,SETI研究所的天文学家劳伦斯·道尔(Laurance Doyle)提出,可以用信息论来分析动物的交流系统,特别是宽吻海豚的各种哨声。

宽吻海豚的交流,可是相当丰富多彩的。绘图: Victor Habbick Visions

从利利开展最初的实验以来,研究者已经发现,好几个物种在交流时所用的办法,在复杂程度上接近了人类语言。至于动物间的交流系统能否像英语和汉语那样称为“语言”,这个问题还有争议。争议的焦点在于界定是什么构成了人类语言。 

首先,语言并非与生俱来,而是在文化中习得的。语言学家认为,大多数(也许是全部)人类的自然语言都能够谈论抽象概念或不在眼前的东西。人们用语言创造新词,也创造出了数量无限、长度无限的符合语法的句子。而大部分研究者都认为海豚的吱吱声和吹哨声缺少了许多这样的语言学特征。

但是道尔主张,海豚的交流模式仍可作为研究外星人交流的模型使用。比如宽吻海豚会使用所谓的“指向性信号”(referential signaling),也就是说它们的某些交流信号(听觉的、视觉的或其他感官的)和它们环境中的某些方面有对应关系。还有人主张,海豚的信号甚至可以传达它们的情绪、性别或年龄等信息。它们的语句(或者说它们的吱吱声和吹哨声)或许不及人类复杂,但同样能够表示抽象的信息。

为证明海豚的信号不是随机的噪声,道尔引用了哈佛大学语言学家乔治·齐普夫(George Zipf)的研究。齐普夫在20世纪30年代发现,各种人类语言都有一个显著特征:在大多数语言中,最常用的字词出现的频次,是第二常用字词出现频次的两倍,是第三常用字词频次的三倍,第四常用字词的四倍,以此类推。比如美国英语里最常用的单词是“the”,第二常用的是“of”,它们的出现频次分别在所有单词中占到7%和3.5%。

以单词频次的对数为纵轴,单词频次的排名为横轴,就能画出一条斜率为-1的直线。齐普夫发现,这条斜率-1的直线在大部分书面和口头语言中都很常见,从西班牙语到汉语都是如此,这个关系在今天就称作“齐普夫定律”(Zipf’s law)。

有了这样一条公式,研究者就能将有意义的信号和随机噪声区分开来了。如果一个声音序列没有语义,它的分布就会是一条斜率为0的水平线,其中每个“词语”的出现频次都完全相同。另一方面,如果斜率小于-1,就说明这个序列冗余太多,不可能是人类语言。道尔指出,目前看起来,虽然符合齐普夫定律也不绝对是复杂交流,但不符合齐普夫定律的肯定不是复杂交流。

早先的研究显示,海豚使用的信号范围很广,但是科学家无法确定它们是否能和人类的语言相提并论。如果能够,那么这些信号至少应该符合齐普夫定律。为了验证这个假说,道尔和他在SETI的几个同事考察了其他几个物种的信号系统,除了海豚之外,还包括松鼠猴和棉花植株。

这项工作中最难的部分是将每个物种的信号拆解成可以分析的单元。对于海豚,研究者寻找的是信号中的自然中断,也就是那些吱吱声和吹哨声当中的无声间隔。接着他们再用齐普夫定律检验了这些单元出现的频次。 

如果海豚能以接近人类的复杂性开展有意义的沟通,那么这些单元频次的对数就会产生一根斜率为-1的直线——就像大多数人类语言一样。道尔和同事选用了一群人工饲养的宽吻海豚,它们自婴儿到成年始终在人类的观察之下,道尔等人把它们的叫声录音绘成了图表,并算出斜率为-0.95。道尔指出,这说明“海豚语”可能是有语法的。他说,“为什么会有语法呢?原因之一是假如传输中出错,语法有助于恢复出部分正确意思,这样肯定是对生存有利的。用人类例子来比喻,这大致相当于有一份抄写潦草的手稿,可以利用拼写规律破译出其中的不明字母”。

和海豚相比,松鼠猴的齐普夫斜率从来没有低于过-0.6,这表示它们发出的信号太随机,无法在里面找到语法。棉花植株靠排放化学物质相互交流,它们的信号分布斜率接近-1.6,表示这些信号里有太多冗余。

道尔和同事的研究显示,生物间的交流是多种多样的,它们构成了一条复杂的谱系。利用数学工具,天文学家们可以判断截获的宇宙噪音中是否含有语言学特征,从而作为SETI筛选智能生物的第一步。就像道尔和同事的研究指出的那样,寻找地外智能,或许最好从我们这颗行星水下的那些奇异世界入手。不然,就算外星人发来了第一句星际问候,也可能被我们当作没有意义的噪音而忽略。(编辑:游识猷)

The End

发布于2018-05-28, 本文版权属于果壳网(guokr.com),禁止转载。如有需要,请联系果壳

我的评论

Daniel Oberhaus

为Vice、Slate、PopularMechanics和Atlantic撰稿。

pic