速读 电子

用电脑程序解读古文字

萧四无 发表于  2010-07-12 18:23
/gkimage/rm/il/bu/rmilbu.png

乌加里特语是一种非常古老的语言,它是用于腓尼基语、希伯来语和亚拉姆语的西闪米特文字家族的最古老实例。

距离它最后一次被人说出,已经3500年了。现在乌加里特语只是一堆存在于石碑上的符号,语言学家要花上几年时间和消耗大量人品才能翻译出来,但电脑只花几小时就把它破译了。

当然电脑也不是完全靠意识流就翻译出来了,先要知道些预设条件,比如语言结构,前缀后缀等等。为了寻找各个级别语句(单个的音节和字母,单词的不同部分,语言里的同源词)的相关性,建立了与希伯来语的映射,找到最可能的匹配。再重复个几百上千次,乌加里特语就被完全破译出来了。

结果是惊人的,乌加里特总共30个字母,电脑成功识别了29个,跟希伯来语同源的乌加里特语大约有1/3,电脑识别了其中的60%,错误的一半也只有一两个字母之差。而这样的成就是在完全没有通过上下文理解的达到的,这一切只发生在几个小时之内,高效的人工智能以后要入侵考古界恐怕也只是时间问题了。

来源: io9

显示所有评论

全部评论(7)
  • 1楼
    2011-01-31 09:41 安妮儿小姐

    “结果是惊人的,乌加里特总共30个字母,电脑成功识别了29个”
    识别字母和解读语言是两回事吧?

    [1] 评论
  • 2楼
    2011-08-20 14:19 zhouxq
    引用安妮儿小姐的回应:“结果是惊人的,乌加里特总共30个字母,电脑成功识别了29个”
    识别字母和解读语言是两回事吧?

    万里长征第一步啊。

    [0] 评论
  • 3楼
    2012-03-08 11:25 Lincome

    o(*≧▽≦)ツ 还要消耗人品。

    [0] 评论
  • 4楼
    2012-07-04 11:41 诶哟喂我不是木头

    > < 我能知道很久很久的人以前在想什么

    [0] 评论
  • 5楼
    2012-07-04 11:42 诶哟喂我不是木头

    他们肯定和我想过同一个问题
    “> < 诶呀明天早上吃什么”

    [0] 评论
  • 6楼
    2012-10-25 14:12 巨蟹座的木乃伊

    “消耗人品”太欢乐了~

    [0] 评论
  • 7楼
    2013-09-26 11:21 357329481
    引用@安妮儿小姐 的话:“结果是惊人的,乌加里特总共30个字母,电脑成功识别了29个”识别字母和解读语言是两回事吧?

    真智商拙计 这里的识别就是 解读的字母的含义的意思 如果光是电脑识别 用得着这么大张旗鼓的报道吗? 一个模式识别就搞定了 再者说 如果仅仅是识别字符 需要电脑干嘛?

    [0] 评论

显示所有评论

你的评论

登录 发表评论

萧四无
萧四无 经济学爱好者

作者的其他文章

更多科研事,扫码早知道

x 下载
关于我们 加入果壳 媒体报道 帮助中心 果壳活动 免责声明 联系我们 移动版 移动应用

©2017果壳网    京ICP证100430号    京网文[2015] 0609-239号    新出发京零字东150005号     京公网安备11010502007133号

违法和不良信息举报邮箱:jubao@guokr.com    举报电话:13488674940