数词定名研讨会纪要
2013-03-29本刊
本 刊
随着当今科学技术的迅猛发展,人类已经步入了数字时代。在科学探索研究过程中,用于计量物质特性的数字也不断突破着应用的极限,而超大规模数字和超小规模数字也随着科学技术的信息化和商品化走出了实验室与记录本,融入了社会生活,例如我们经常可以看到有关天文学、数字计算机、纳米技术等方面的报道。然而,由于东西方文化差异及历史方面的原因,中国社会在超大数字与超小数字的实际使用过程中遇到了诸多新的问题。
一是大数的命名问题。需要站在现代科学技术的视角,对我国古代和现今国际上已有的数词确定相应的中文名称,并尽快为数词与词头系统中交叉数字的数词定名。
二是确定数词定名原则。自明清以降,中国古代数词“万”以上都采用十的四位进制,而国际上则采用三位进制,因进位法则的不一致,导致在相互交流与文献互译方面产生了种种障碍。确定一个统一的数词定名原则,明确一致的互译规则,将有利于中外科技工作者的相互理解,也有助于科学知识在普通民众间的传播,不致造成混乱。
三是需要对一些重要的常用数词尽快取得共识。例如,目前信息技术领域人们已习惯将百万称为“兆”(106),如“兆赫兹”“兆字节”(约为 106)等。一方面,如果按照中国古称,将百“万亿”次计算机称为百“兆”次计算机,很容易当成100M(108)主频一样看待,即认为是“亿次机”;另一方面,“万亿”则变成没有单位名称数词,1018只好读成“百万万亿”。在中国大陆信息技术领域中,“兆”已经被普遍接受,“吉”“太”虽然还没有被普遍使用,但英文名称已经开始进入我们的日常生活,现在的硬盘一般都是几百“吉字节”(Gigabyte),很快就要进入“太字节”(Terabyte)。 现在自然语言处理中,语料库的规模也达到了“吉词”(Gigaword)和“太词”(Teraword)数量级。 所以审定这些汉语的数词用法确实非常有必要。
为逐步解决与科研工作乃至人民生活密切相关的大数数词使用问题,全国科学技术名词审定委员会于2012年1月组织召开了数词定名研讨会,请数学家牵头,物理学、化学、天文学、电子学、微生物学、分子生物学、细胞生物学、计量学、计算机科学技术、纳米技术等领域专家学者共同讨论,基本取得了统一认识。
经与会专家热烈讨论,全国科技名词委进行整理,取长补短,提出了有关数词定名的初步建议:
1.考虑到在实际生活中数词的使用范围,数词定名的范围限定在10-24~1024,此范围已可满足目前社会对数词的使用需要,尽量使用中国古代数词名称。在此范围之外的数词定名建议使用科学计数法进行称谓,例如,1030称为“10的30次方”,10-26称为“10的负26次方”。
2.数词和词头两套系统并行,词头系统执行《中华人民共和国法定计量单位》(1984年发布)的相关规定,数词可沿用中国古称;同时,中国古代的数词系统并没有词头概念,词头可以说是舶来品,因此普通民众在使用时并不会区分数词与词头。由于数词和词头的定名大不相同,所以建议应在初等教育阶段即将数词和词头系统进行区别教授。
3.建议依循“尊重历史、避免混淆、改动最小”的原则进行数词定名。保留“兆”作为106的词头,106数词采用“百万”;为避免与“兆”混淆,1012的数词采用“万亿”,词头使用“太”。“兆”在大陆地区表示106的词头,而在台湾地区表示1012的数词;从中国古代数词来看,“兆”的量级一直大于“亿”,现在大陆地区用“亿”表示108的数词,而用“兆”表示106的词头,在量级上与中国传统用法不一致。然而,因为词头和数词分属于两个系统,在词头系统中并没有“亿”作为词头名称,故而如果能够分清“亿”与“兆”所属的系统也比较容易进行区分。“兆”在中国大陆的社会生活中已经成为习惯用法,故在词头系统中保留“兆”符合改动最小的原则。
4.为尊重历史、沿用传统,不建议中国数词定名采用三位进制,同时,为了避免与已定为词头的“兆”混淆,1012的数词可跳过“兆”命名为“万亿”。即采用中国社会比较习惯的四位进制与八位进制的混合命名法。“亿”以下采用四位进制,“亿”以上使用八位进制进行命名。以此原则,1016的数词定名为“京”;1020的数词跳过“垓”,定名为“万京”;1024的数词定名为“秭”。故而,中国数词定名建议如表1。
表1 大数部分的数词定名
小数部分的数词定名,由于10-6以下的数字在日常生活中基本很少遇到,且根据目前对小数使用的习惯,故建议10-6到10-1采用中国古称,10-24到10-9部分可采用中文词头首字作为数词。如表2。
表2 小数部分的数词定名