前沿 工程

计算机构建原始语,历史语言学家遭遇“危机”

大豆包难吃 发表于  2013-02-11 20:05

来自英属哥伦比亚大学和美国加州大学伯克利分校的研究人员,使用一个新的计算机系统在短时间内拟构了一组原始母语(Protolanguages)。与语言学家费时费力人工拟构的结果相比,系统的准确率达 85%。研究结果今天在《美国国家科学院院刊》(PNAS)上发表。

论文的主要作者、英属哥伦比亚大学的统计学助理教授亚历山大•布沙尔-柯特(Alexandre Bouchard-Côté)说: “我们希望我们的工具将彻底改变历史语言学,就像统计分析和计算机的力量彻底改变了演化生物学的研究那样。”

他说:“系统并不会取代在行的语言学家细致入微的工作;但颇有价值的一点是,它可以增加语言学家使用的现代语的数量,也就是他们拟构的基础。” 

历史比较语言学认为,现代具有亲属关系的语言在历史上源于一种语言,种语言就是它们的母语原始母语的拟构(reconstruction),就是将现代的亲属语中拥有共同意义的词分组,分析这些词的共同特点,然后根据音调变化等规律,推导出共同的母语。 

布沙尔-柯特和美国加州大学伯克利分校的同事一起研发了这个新的工具,它能分析声音在基本的语言单元这一层面的变化,运算规模也比以前的电算化工具要大。

拟建使用的数据库包含1.42万多个词形,来自637种南岛语系(Austronesian)语言。南岛语系主要分布于东南亚和太平洋地区,是现今世界上唯一主要分布在岛屿上的语系,包括大约1300种语言。台湾是南岛语系的源头,目前是人口分布上的地理最北端。

背景知识:大多数原始母语都没有​留下书面记录;但在一些情况下,拟构可以通过古籍或文史得到部分的验证。其中一个例子便是保有良好记录的拉丁语,它是罗曼语族(拉丁语族)的原始母语,现代法语、意大利语、葡萄牙语、罗马尼亚语、加泰罗尼亚语和西班牙语都是从拉丁语演化而来。

 

信息来源:EurekAlert!
文章图片:io9.com

显示所有评论

全部评论(27)
  • 1楼
    2013-02-11 20:10 葡萄汀

    [0] 评论
  • 2楼
    2013-02-11 20:16 fu-80 DIYER,摄影师,电容技术顾问

    以后可以出泛宇宙自编译语言系统了········生物交流不再是梦想啊·····

    [1] 评论
  • 3楼
    2013-02-11 20:23 葡萄汀

    @Sheldon
    分析一下瓦肯人的原始语言……
    话说今后纳威人的语言也要用计算机做了吧

    [0] 评论
  • 4楼
    2013-02-11 20:26 darkbead

    暗夜巴别塔

    不知能不能找到全人类共同的母语呢

    [0] 评论
  • 5楼
    2013-02-11 22:01 钱念水

    问上帝去吧,他把人类的语言全变了

    [0] 评论
  • 6楼
    2013-02-11 22:39 Flooding

    沙发~

    [0] 评论
  • 7楼
    2013-02-11 22:50 Kepler22b

    问上帝

    [0] 评论
  • 8楼
    2013-02-12 12:20 秋纫 电子信息工程专业

    啥时候来点标准的“中古音”?

    [0] 评论
  • 9楼
    2013-02-12 12:23 耶稣爱你

    要是全地球人都说一种语言 肯定和平不少

    [0] 评论
  • 10楼
    2013-02-12 13:33 Kahaani

    计算机终于踏入历史语言学领域了,但是,难道只是做做统计之类的工作么。

    [0] 评论
  • 11楼
    2013-02-12 13:49 Tariel

    背景知识有点跑偏. 楼主看看特鲁别茨科依的<<有关问题的一些看法>>会有收获, 不长的一篇文章

    另外那个叫构拟不叫拟构.


    [0] 评论
  • 12楼
    2013-02-12 13:50 None
    引用@Kepler22b 的话:问上帝

    你发这张图想表达什么?

    [0] 评论
  • 13楼
    2013-02-12 14:32 切斯特 日语语言学 PhD 在读,设计爱好者

    好工具。假以时日……就不好说了

    [0] 评论
  • 14楼
    2013-02-12 14:38 polyhedron 分子人類學研究者,語言愛好者

    還是很懷疑。假如他們用現代各羅曼語能算出拉丁語來我纔信。不能證僞的不是科學。

    [0] 评论
  • 15楼
    2013-02-12 14:38 Metaverse 录音爱好者,万有青年养成计划入围选手

    “拟构了!”……XD

    [0] 评论
  • 16楼
    2013-02-12 15:19 jswxdzc

    啊?啊!

    [0] 评论
  • 17楼
    2013-02-12 18:52 北极燕鸥
    引用@沫然琴音 的话:暗夜巴别塔不知能不能找到全人类共同的母语呢


    哦 啊 哎 嗷嗷这些就是共同的母语

    [0] 评论
  • 18楼
    2013-02-12 19:07 慕容苏

    一种语言也有可能是多种语言混合的结果呀~

    [0] 评论
  • 19楼
    2013-02-12 20:46 aomiii.com

    坐等计算机被更牛的生物技术取代。

    [0] 评论
  • 20楼
    2013-02-12 21:19 荆棘鸟YY
    引用@风儿轻轻吹 的话:你发这张图想表达什么?

    大概是说人类古文明与天外文明有着很深的联系,就如普罗米修斯里关于人类起源的猜想一样,语言的构成来源于地外文明。

    [0] 评论
  • 21楼
    2013-02-12 22:06 清洁工 中文专业

    正如@Tariel 所说,那个词应该叫“构拟”,望改正。
    我个人对这项研究表示困惑。我无法从文章中读出这项新技术在计算机技术早已相当普及的历史语言学领域的开创性在哪里。等开学时我去看看这篇论文再说。

    [1] 评论
  • 22楼
    2013-02-12 22:26 Robert

    看上去也还好,没有MIT那个儿童语言习得全方位语料库构建那么震撼

    [0] 评论
  • 23楼
    2013-02-13 19:54 生化虫子

    同意20楼观点“
    坐等计算机被更牛的生物技术取代。”

    [0] 评论
  • 24楼
    2013-02-14 00:57 姬发控

    通过对语言学更深处的研究再与生物学等学科交叉结合,与非智慧生物的交流甚至是驾驭的日子终于要到来了

    [0] 评论
  • 25楼
    2013-02-14 01:16 None
    引用@荆棘鸟YY 的话:大概是说人类古文明与天外文明有着很深的联系,就如普罗米修斯里关于人类起源的猜想一样,语言的构成来源于地外文明。

    有点懂了,谢谢你

    [0] 评论
  • 26楼
    2013-02-14 21:34 山人03

    语言学概论又该从新编写了

    [0] 评论
  • 27楼
    2013-04-22 15:14 大妮
    引用@Robert 的话:看上去也还好,没有MIT那个儿童语言习得全方位语料库构建那么震撼

    这个是什么?能稍微介绍下么?

    [0] 评论

显示所有评论

你的评论

登录 发表评论

大豆包难吃
大豆包难吃 果壳译者

作者的其他文章

更多科研事,扫码早知道

关于我们 加入果壳 媒体报道 帮助中心 果壳活动 免责声明 联系我们 移动版 移动应用

©果壳网    京ICP证100430号    京网文[2015] 0609-239号    新出发京零字东150005号     京公网安备11010502007133号

违法和不良信息举报邮箱:jubao@guokr.com    举报电话:18612934101    网上有害信息举报专区    儿童色情信息举报专区