崛起的猩球上到底能不能有会说人话的猴子| 果壳科技有意思

氪罗钡路斯
前沿
生物

2033字
需用时 04:03

崛起的猩球上到底能不能有会说人话的猴子

氪罗钡路斯

与人类同属灵长目的猿与猴可以算是地球上除了人类以外大脑最发达、智商最高的生物之一了。那些在动物园中落寞独坐，或者在温泉里悠然自乐，又或者，在山林间剪径夺包还对着一脸悲愤的人类露出“你们都是渣渣”般嘲笑的猿猴，似乎距离人类就只有开口说一句话的距离。在科幻电影《猩球崛起》系列中，一只名叫凯撒，从母亲身上遗传了药物作用的黑猩猩，就神智全开，用一口六级水平的英语震慑了人类。然而现实之中，真的有猿猴能够学会说话吗？

出于各种各样的原因，让猿猴学习与人类交流的尝试与试验并不罕见。然而至今为止，最成功的结果，也只是手语交流。比如美国加州一只名为Koko的大猩猩，她掌握了一千多个单词，能够表达抽象感情，甚至有两只属于自己的宠物猫。然而，她从来没有开口说过一句话，似乎较之人与猿猴之间思维上的差距，“说话”才是一道难以跨越的壁垒。

尼姆•齐姆斯基（Nim Chimpsky）也是著名的“会说话”的猩猩。但研究人员仍然无法教会它发出人类的声音语言，只能让它跟着学习肢体语言。图片来源：DailyMail

猿与猴不会说话的原因是什么呢？科学界对此的解释一直分为两个流派，从达尔文时代争论至今，谁也没能说服谁。

早期的学者，包括达尔文，倾向于认为大脑的限制决定了猿猴不可能学会像人一样说话，它们并不能够自主控制声道肌肉的收缩，因而不能像人类一样灵活地发出各种声音。而1969年起，Lieberman等人的实验则逆转了舆论，提出声带的解剖学构造才是导致了猿猴不会说话的关键因素^[1]。

管风琴奏出的音符高低是由音管的形状与长度所决定，生物声道的发声原理也与此类似。因此，Lieberman 等人对一只刚刚死亡的普通猕猴（就是恍恍惚惚恒河猴里的恒河猴）进行了口腔石膏灌注，获取了猕猴声门至嘴唇的距离，然后将石膏模型切成薄片，通过薄片的重量估算了猕猴口腔内不同截面的面积。基于对猕猴口腔形状的计算，Lieberman等人认为猕猴的声道并不足以让它们发出某些元音，例如/a/, /i/与/u/——这些元音也恰巧是大部分人类语言所共有的元音^[1]。稍后，Lieberman等人利用相同的方法在大猩猩身上重复这个实验^[2]，得到了与猕猴实验一致的结果。

然而，依然有学者认为，将猴子的“失语”归结为声道构造过于武断。就像达尔文指出的——自然使用越多，发声器官就会越发强大与完善。但是显然，大脑的进化对于语言的使用更加重要^[3]。2016年，Ghazanfar实验室发表在Science Advances上的研究公然与Lieberman一派叫上了板^[4]。Ghazanfar实验室指出，Lieberman等人用一只不知道怎么被摆弄了的死猴子就得出了结论，实在是误猴子弟啊^[5]！Ghazanfar实验室的研究则采取了一种与Lieberman类似，却更为“全面”的方法——X光活体成像。在这个研究中，实验人员捕捉了活体猕猴发声、进食、吞咽以及做出咂嘴、呲牙等动作时的声道X光影像，手动提取了99组声道轮廓构象。利用与Lieberman实验相似的算法，通过计算机程序，研究人员就预测出了这99组声道构象所能实现的发音空间(phonetic space) 。

Ghazanfar实验室提取出的声道构象。A: 一只正在发出威胁性吼叫的猕猴的X光图。B: 轮廓提取。红线为声道轮廓。图片来源: 参考文献[4]

人类说话或唱歌产生的声音包含许多不同的频率，共振峰（即发出声音时可以被作为特征识别的关键频率）是使听者能够区分元音的关键泛音^[8]。Ghazanfar实验室的研究结果显示，猕猴的发音空间并不像Lieberman 五十年前用石膏模型预测出的结果那么悲观，猕猴的元音共振峰空间图谱倒是与人类女性有很大一部分重叠。

共振峰比对图谱。其中，红线轮廓为人类女性元音共振峰空间，灰线轮廓为Ghazanfar组实验得到的猕猴元音共振峰空间，蓝线为Lieberman文章中提出的猕猴元音共振峰空间。两组图谱中，横轴均为频率最低的共振峰频率，左图纵轴为频率第二低的共振峰频率，右图纵轴为频率第三低的共振峰频率。猕猴的元音共振峰图谱倒是与人类女性有很大一部分重叠。图片来源:参考文献[4]

为了进一步验证这一研究结果，Ghazanfar 实验室从电脑计算得出的猕猴发音空间中提取出了五个元音音素，并邀请了40位人类来测试他们能否分辨出这些电脑模拟出的“猕猴”所发出的元音。测试结果达到了90-98%的正确率，证明了“猕猴”的声道可以清晰地表达出英语中的不同元音。

同时，实验室的研究人员还利用猕猴的发音空间生成了“Will you marry me？”的句子，与人类的声音相比较，二者的频率图像倒也有几分相似。寂寞的小伙伴们也可以去听一听二者的音频版对比，看看到底是猕猴的声音还是人类的声音让你情不自禁地回答了 Yes.

Ghazanfar实验室进行比对实验时用的“Will you marry me?”音频。左图链接的是人类女性的声音，右图链接的是电脑模拟猕猴发出的声音。两段音频用相同的噪音源进行了技术处理。音频来源：参考文献[4]

人类与“猕猴”表达“will you marry me?”时的声波频谱对比。上图为人类版本，下图为“猕猴”版本，横轴为时间，纵轴为声波频率。图片来源: 参考文献[4]

然而，这一系列实验并没有说服Lieberman。在2017年的Science Advances上，Lieberman 公开提出了几点质疑^[6]。例如共振峰图谱恰巧说明了猕猴并不能很好地发出/a/, /i/ 及/u/三个元音；人与猕猴的“Will you marry me？”也只是轮廓相似——所以Ghazanfar的研究只不过是重复了他五十年前的结果而已。至于40个被试者参与的元音识别实验，看似统计正确，却只能唬住外行——二十世纪五十年代贝尔实验室就做过70位被试参与的、上万次元音识别测试。在那次测试中，一些元音的识别正确率可以达到99.98%^[7]，完胜“猕猴”们的数据。这恰恰说明猕猴并不能很好地表达人类语言。

看似客观中立的数据，从不同的角度阐释，也能得出相反的结论。两方你来我往，各执立场，终究也没能争出一个所以然来。猿和猴子也至今没有说过一句话。这到底是由于大脑不够发达，还是由于声道条件有限……如同生物学领域的很多问题一样，依然是一个需要争论很久的话题。也许终有一天，随着技术的发展和思路的拓宽，我们会得到一个确切的答案——只是希望，那时候的我们并不是站在破败的加利福利亚街，“猴子们”的长矛与枪口之下。（编辑：明天）

参考文献

Lieberman, Philip, Dennis H. Klatt, and William H. Wilson. "Vocal tract limitations on the vowel repertoires of rhesus monkey and other nonhuman primates." Science 164.3884 (1969): 1185-1187.
Lieberman, Philip, Edmund S. Crelin, and Dennis H. Klatt. "Phonetic ability and related anatomy of the newborn and adult human, Neanderthal man, and the chimpanzee." American Anthropologist 74.3 (1972): 287-307.
Darwin, Charles. The descent of man and selection in relation to sex. Vol. 1. Murray, 1888.
Fitch, W. Tecumseh, et al. "Monkey vocal tracts are speech-ready." Science advances 2.12 (2016): e1600723.
Fitch, W. Tecumseh, et al. "Response to Lieberman on “Monkey vocal tracts are speech-ready”." Science Advances 3.7 (2017): e1701859.
Lieberman, Philip. "Comment on “Monkey vocal tracts are speech-ready”." Science Advances 3.7 (2017): e1700442.
Peterson, Gordon E., and Harold L. Barney. "Control methods used in a study of the vowels." The Journal of the acoustical society of America 24.2 (1952): 175-184.
Wikipedia, 共振峰, (2017), available at zh.wikipedia.org/wiki/共振峰

The End

发布于2017-09-14，本文版权属于果壳网（guokr.com），禁止转载。如有需要，请联系果壳。

举报这篇文章

氪罗钡路斯

生物博士在读，线粒体