汉字组词的数量优势
2019-10-08褚秋砚陆培恩
褚秋砚 陆培恩
摘 要:从排列组合的角度,分析比较汉字和英文字母的组词能力,估算出3个常用汉字比7个英文字母可以拼出更多的不同词汇。随用字(母)数的增加,可拼出的汉语词汇和英语单词的数量之比呈几何级数增长。
关键词:汉字; 英文字母; 拼词
中图分类号:H313.2 文献标识码:A 文章编号:1006-3315(2019)07-147-001
众所周知,英语有26个字母。那么汉语有多少常用字呢?有说1000字的,也有说3000字或3500字的。为了讨论和计算方便,姑且假定常用汉字为2600个。
学习2600个汉字,当然比学习26个英文字母费劲。从数量上来说,前者是后者的100倍。
但是辛勤学习付出的代价是可以得到回报的,而且是意想不到的巨大的回报。
用26个英文字母,组成两个字母的单词,一共可以组成26×26=676个不同的单词(为简化计算,不排除字母重复,不区分元音字母和辅音字母。下同)。
用2600个汉字,组成两个字的词,一共可以组成2600×2600=676×104=676万个不同的词汇(含同字叠用,如“妈妈”。下同)。
用26个英文字母组成三个字母的单词,一共可以组成26×26×26=17576个不同的单词。
国际航空运输协会机场代码,由3个英文(大写)字母组成,不允许有数字。由国际航空运输协会对全世界的机场进行编号。比如北京首都国际机场的代码是PEK,香港国际机场的代码是HKG,芝加哥机场的代码是CHI,等等。均由3个字母组成,是最常用的机场代码,多用于对公众的场合。根据上面的计算,这种由3个英文字母组成的代码最多可以代表17576个不同的机场。一旦世界上的机场数超过17576个,就不得不使用四个英文字母组成的代码(已经有四个字母的机场代码了。)。而如果用汉字来组成代码,则两个汉字足矣,因为用两个汉字可以组成676万个不同的代码,可以代表6百多万个不同的机场。
用2600个汉字,组成三个字的词,一共可以组成2600×2600×2600=17576×106=175.76億个不同的词汇。
用26个英文字母组成四个字母的单词,一共可以组成26×26×26×26=456976个不同的单词。
用2600个汉字,组成四个字的词,一共可以组成2600×2600×2600×2600=456976×108=456976亿个不同的词汇。
用n个常用汉字组成的不同词汇的数量,是用n个英文字母组成的不同单词数量的102n倍,也就是100n倍。
上述结论是基于最初的假设:常用汉字的个数是英文字母的100倍,即102倍。
抛开这个假设,可以有更加一般的结论:如果常用汉字的个数是英文字母的a倍,即26a个,则用n个常用汉字组成的不同词汇的数量为(26a)n,而用n个英文字母组成的不同单词数量是26n个。前者是后者的(26a)n/26n=an倍。
对于变量n而言,函数f(n)=an是一个指数函数。或者说,这是以a为公比的几何级数。
从上面的估算可见,给大千世界各种事物起名字,每个名字不超过三个汉字,可以命名的数量达到百亿级,足以应付千奇百怪、光怪陆离的宇宙万物了。而用三个英文字母是绝对不够的。即使使用七个英语字母构成英语单词,数量都达不到百亿级。(267≈80亿)
三个常用汉字的词汇好记,还是七、八个英文字母的单词好记?汉字的优点显而易见。
从上面的讨论中也可以理解,为什么四个字的汉语成语无穷无尽。
汉字还有其他优点,例如:1.每个字都是单音节。2.词汇音节少。3.像一幅幅图画,看惯后,目击瞬间就能萌发联想。4.书写时容易美化。等等。这些就不在本文赘述了。