617
需用时 01:14
计算机构建原始语,历史语言学家遭遇“危机”

来自英属哥伦比亚大学和美国加州大学伯克利分校的研究人员,使用一个新的计算机系统在短时间内拟构了一组原始母语(Protolanguages)。与语言学家费时费力人工拟构的结果相比,系统的准确率达 85%。研究结果今天在《美国国家科学院院刊》(PNAS)上发表。

论文的主要作者、英属哥伦比亚大学的统计学助理教授亚历山大•布沙尔-柯特(Alexandre Bouchard-Côté)说: “我们希望我们的工具将彻底改变历史语言学,就像统计分析和计算机的力量彻底改变了演化生物学的研究那样。”

他说:“系统并不会取代在行的语言学家细致入微的工作;但颇有价值的一点是,它可以增加语言学家使用的现代语的数量,也就是他们拟构的基础。” 

历史比较语言学认为,现代具有亲属关系的语言在历史上源于一种语言,种语言就是它们的母语原始母语的拟构(reconstruction),就是将现代的亲属语中拥有共同意义的词分组,分析这些词的共同特点,然后根据音调变化等规律,推导出共同的母语。 

布沙尔-柯特和美国加州大学伯克利分校的同事一起研发了这个新的工具,它能分析声音在基本的语言单元这一层面的变化,运算规模也比以前的电算化工具要大。

拟建使用的数据库包含1.42万多个词形,来自637种南岛语系(Austronesian)语言。南岛语系主要分布于东南亚和太平洋地区,是现今世界上唯一主要分布在岛屿上的语系,包括大约1300种语言。台湾是南岛语系的源头,目前是人口分布上的地理最北端。

背景知识:大多数原始母语都没有​留下书面记录;但在一些情况下,拟构可以通过古籍或文史得到部分的验证。其中一个例子便是保有良好记录的拉丁语,它是罗曼语族(拉丁语族)的原始母语,现代法语、意大利语、葡萄牙语、罗马尼亚语、加泰罗尼亚语和西班牙语都是从拉丁语演化而来。

 

信息来源:EurekAlert!
文章图片:io9.com

The End

发布于2013-02-11, 本文版权属于果壳网(guokr.com),禁止转载。如有需要,请联系果壳

举报这篇文章

大豆包难吃

果壳译者

pic