中文真的相比其他语言更信息量大?统计方法是什么,还是纯意淫?

推荐  (0) | 15人关注关注
14个答案
10 0

gashero前果壳网工程师

2013-02-21 11:22

可参见香农的信息论,信息的量度是要看其代表的意思的在概率上的罕见程度,于是越是罕见的句子,信息量就越大。如果是一堆废话,那信息量肯定差的多,比如甄环体。另外绝对的真理往往都是废话。

举个栗子,“今天天气很好",这句话在整个语言体系中,被人们说到的概率很高,我们就可以认为其信息量很低。而老罗曾说过的"明天要么下雨,要么不下雨"这种经典的真理就更是信息量低到爆。

而另外的一句"PN结在反向截止时,施加的电压大小会影响截止区的厚度,进而影响结节电容的大小,所以可以用于调频",被人们谈到的概率就很低,是模拟电路领域的讨论。所以这句话的信息量就比"今天天气很好"的信息量大很多。

7 0

WTC.Algorithmn计算机科学专业本科生

2013-02-16 21:31

我觉得原PO的统计方法应该是错误的...如果把汉字的单个字和英文的单个字母放在相同的地位进行统计显然是很不科学的...东亚语言效率高的原因纯粹是因为单字多吧...

3 0
支持者: Robert seancai110 无名君

没论文不科学。我还可以说 I =俺,朕,我.....单样本得出这种结论?再说信息量的范围,脑补的算么。

2 0
支持者: 赵永安 大干快上

语言学里曾经提到过,单位音节可以涵盖的信息量,中文确实非常高,而粤语在中文中又最高。使用粤语作为思维语言的人比英语要快很多。

通常来说,象形文字作为基础的语言都要比拼音文字要高很多,因为学习起来就麻烦了很多。只是我们作为母语来使用的时候没有感觉到而已。用相同的时间学习英语和学习中文,进展是完全不同的……

1 0
支持者: Bcnof

代价是:汉语的描述常常比较模糊和出现歧义,需要结合背景和语境分析(或者说,汉语过于省略了,而其他一些语言又过于重复了)
btw理论上说,字母越多的语言,表达语义所需的词汇长度也越少。

1 0
支持者: 大干快上

就是请许多志愿者用尽可能快的语速朗读同样意义的文章,用各种语言。我记得中文每秒的音节不是最多,但将单个音节平均表达的涵义算是数一数二的了。

0 0

hhhhhhhhhhhh脑补的信息量很大啊

0 0

感觉日文是写起来比中文要简洁些的,但是念起来又比中文数量多

0 0

文言文。。双关义什么的
我们中出了一个叛徒什么的

0 0

苗方方作为一个腐女,要比别人有常识

2013-07-20 12:09

我觉得日语比中文暧昧多了,光一个“我”字就分男女老幼,“你”就更别说了。中文虽然也分,但是正常情况下不会在日常对话中大量使用吧。。。。

0 0

C.WhyEngineering Science

2013-10-10 11:45

你要想想以下词组的高效率:

喜大普奔
人艰不拆
累感不爱
不明觉厉
十动然拒
细思恐极
秀分快
何弃疗
人干事

等等。。中文的单音节字感觉更容易造出一些简练的词组。。
中文还有个优势是体积比较小。。虽然word count都是一样,但中文明显不那么占位子嘛。。比如这张图(误)

0 0

Yebai人机互动硕士在读

2013-10-11 16:20

我一直有一个构想,会不会有一种语言,它的字库有亿万个单字,每次人说话的时候只需一个字就能包括所有想说的含义。

查看更多

添加回答

登录 后回答问题,你也可以用以下帐号直接登录

相关问答

关于我们 加入果壳 媒体报道 帮助中心 果壳活动 家长监控 免责声明 联系我们 移动版 移动应用

©果壳网    京ICP证100430号    京网文[2015] 0609-239号    新出发京零字东150005号     京公网安备11010502007133号

违法和不良信息举报邮箱:jubao@guokr.com    举报电话:18612934101    网上有害信息举报专区    儿童色情信息举报专区