发布于:2006-05-29 22:55:29
来自:站务休闲/闲聊茶吧
[复制转发]
今天有个网友一直跟我争论汉字是个很垃圾的文字,使我不得不转载这篇文章,让大家看看。
汉语与英语的比较(此节引用自《争鸣:再谈汉语和英文的比较和评价》一文)
汉字的优势在于,汉字是二维表现方式,二维是平面媒介表达信息能达到的最高效率。中英文对照,英语的字母对应汉字的笔划,单个汉字对应的是英语的词,中文的词对应的是英语的词组,中文表达、传递信息的优势一目了然。中国国家汉字的扫盲标准是1500个字,理工科的大学生一般掌握2000个汉字。就凭这2000个字,大家可以读书、看报、搞科研。只要有小学文化就可以看懂绝大多数文章,有初中文化,其掌握的科学知识,就足以了解绝大多数产品的使用。比如高科技的电脑要求高吧,在中国那些考不上大学的高中生经过一年半载的培训就能熟练操作,一些没有条件上高中的初中生也能做到。
汉字的重复利用率非常高,历代积累的汉字总数以万计,康熙字典就收录了4万多,专家指出常用仅三千五,选取当代的常用字作为学习和使用汉字的重点,是历代历朝整理和教学汉字的一个重要内容。历史上的《三字经》《千字文》都是用当时的常用字编成的识字课本。
而英文呢?例如因为一个地名就是一个单词,想正确认识,需要的时间精力只有少数人能够应付,英文真是笨人的语言,由于在表达方面的缺陷,靠字母的一维线性组合,试图给天下每一事物起一个名字,一种东西就是一个单词。宇宙无穷,英文词汇无穷——可惜人的精力有限!
英文是发散的。
在英文世界里,一般美国高中毕业生掌握的单词量也就在三千到三千五百个左右,这样已经应付日常生活需求足矣,但是没有20000个字别想读报,没有30000个字别想把周刊读顺,大学毕业10年后的职业人士一般都懂80000字。新事物的涌现,总伴随着英文新词,例如火箭(ROCKET),计算机(COMPUTER)等,可汉语表达这些很轻松,不就是用“火”驱动的“箭”么,会“计算”的“机”么!可英文就不能这么干,不能靠组词,原因是“太长”了。如火箭将成为“FIRE-DRIVEN-ARROW”,计算机将成为“COMPUTAIONAL-MACHINE”等。人的视角有限,太长的字会降低文章的可读性与读者的理解能力。这是因为英语的字母对应汉字的笔划,单个汉字对应的是英语的词,中文的词对应的是英语的词组,中文表达、传递信息的优势一目了然。
目前英语词汇量已经超过40万,预计本世纪中叶会达到百万。而汉语则相对稳定,现在只有很少的古文知识的中学生就可以琅琅上口地读屈原的楚辞。英文就难了,太不稳定。现在的人们读沙士比亚的原著已困难重重,更不用说读400年前英国诗人乔叟的诗了。由于英语以表音为主,同时号称是讲者分布最广泛的语言。正因如此,讲英语者往往因语义词汇和地域习惯,引起误会。因此谓英语是“世上最广泛被误解语言”,也绝不过分。英语也是世界上最容易引起人事纠纷的语言。就目前英国和美国还分出了英式和美式英语,加上其他所谓的英语国家,虽然都说英语,其拼写读的差异不次于中国各地方言之间的差别,交流的难度是远超过使用表意的中文的。
现代所有学科领域,中国都有很好的学者,没听说哪位因汉语“不精确”而搞不好研究的。中国的火箭照样可以精确升空,中国的原子弹照样可以精确爆炸。所有的英文科技文献都可以翻译成汉语。个别人会说了,为什么中国现在落后,就是由于中华文化中杀气少,数百年来对杀人武器研究太少,遭到掠夺以至落后了,虽然如此,最困难的时候已经过去,中国现在正以世界最快的速度复兴。汉语文献影响力正随着国力的增强而在世界范围内增强。 .
*现代汉语的发展(本节引用自《谈汉语与英语的优劣》)
研究表明:汉字作为一个复杂的文字符号系统,其信息熵很高。研究的基本方法是:逐渐扩大汉字容量,随着汉字容量增大,信息熵的增加趋缓;汉字增加到12370以后,不再使信息熵有明显的增加。我国科学家指出:汉字的容量极限是12366个汉字,汉字静态平均信息熵的值(平均信息量)是9.65比特。通过数理语言学中著名的齐普夫定律(ZIPF’SLAW)核算,这是当今世界上信息量最大的文字符号系统。联合国五种工作语言文字的信息熵的比较如下:
法文:3.98比特
西班牙文:4.01比特
英文:4.03比特
俄文:4.35比特
中文:9.65比特
可以看出,拼音文字的信息熵小,差别不大。汉字的信息量最大。
汉字对拼音文字的这种信息熵优势是什么概念?简单的比喻就是十进制数与二进制数的差别。十进制数字系统需要人记忆0-9,10个符号,二进制只需要记忆0和1两个符号。十进制乘除要记忆9X9表,二进制只需要学会与、或、非的简单逻辑。但是,人类在日常生活中为什么不使用二进制数字系统呢?因为那样很浪费,一个数字“7”表示成二进制就成了“111”,记个大数不把人累死?反过来,人类为什么不用十六进制,或更高的进制呢?一方面是人脑智力的限制,另一方面,十六进制也未必能大幅度提高信息熵。这种信息熵反映在文字上,就是联合国文件中,中文版本一定是最薄的。信息熵高是不是就不利于计算机处理呢?这方面恐怕还很难下结论。简单的比较汉与英文的输入速度是不能说明问题的,因为“字”与“word”是不同的概念。要比较只能比较同一内容的中英文两个不同文本,计算击键数的差值。在“词”的单位基础上,现代汉语与英语是可以进行比较的。现代英语为了应付不断涌现的新事物、新思想、新科技、新概念,也在不断地造词。无非是借助拉丁词根、或重新组合已有单词,结果越是专业科技的词汇,就越长、越难记。或者是大量使用缩写:如WTO、FBI、IBM、UFO等等,缩写一多就容易混淆、难以理解。在这方面,现代汉语造词的优势就十分突出了。这就是汉字字符集信息熵高的优势。
用现代计算机技术作为信息化的标准,来衡量汉字与英文字母的优劣是件很荒诞的事情。现代计算机技术说到底就是基于“二极管”的技术,将来的发展很难预料。难道要人类高度智能的思维模式,去模仿“二极管”式的思维?那是典型的削足适履。试想,难道当年就因为发明了黑白照像术,人们就该废掉油画的色彩?难道当年就因为摩尔斯电码适合新发明的电报,人们的语言就都应该改成“嘀嗒”?
汉字在应用中遇到的一些困难,我们不应该忽视,但是没必要过分夸大。当年中国人发明了活字印刷术之后,在很长一段时间内一直没有得到真正的应用。直到清朝末年中国还在大量使用雕版印刷术。其原因就是汉字数量太大,要制造一套足够印书的字模难度太大,也不经济。最后还是20世纪初,西方人引入了机制字模,中国才实现了活字印刷。在20世纪,人类进入计算机时代的初期,汉字处理软件的缺乏也曾经是一种阻碍,但是很快也就解决了。现在在计算机技术的帮助下,汉字的传播比以往更方便了。
全部回复(17 )
只看楼主 我来说两句回复 举报
回复 举报