APP下载

《现代汉语词典》收录的字母词使用情况调查与分析

2016-11-16王秋萍

关键词:现代汉语词典词条年份

王秋萍

(沈阳师范大学 国际教育学院,辽宁 沈阳 110034)

《现代汉语词典》收录的字母词使用情况调查与分析

王秋萍

(沈阳师范大学 国际教育学院,辽宁 沈阳 110034)

字母词指汉语中单独由字母构成,或者由字母、数字、符号、汉字混合构成的词,在《现代汉语词典》(第6版)中总计收录字母词242条。此次调查将关注这些字母词在汉语中的使用情况,尤其关注高频、低频字母词,第6版新增字母词在汉语中的使用情况,并对调查结果做出比较分析。拟展示不同频段字母词在汉语中各异的使用面貌,量化其发展变化规律,总结其使用特点和成因;剥离低频字母词,补充使用程度较高的字母词,为词典修订提供参考。

《现代汉语词典》;字母词;使用;调查;分析

一、引言

自20世纪90年代以来,字母词在汉语中广泛和大量使用已是不争的事实,它也已成为汉语词汇系统引进外来词和产生新词的重要形式之一[1-4]。然而,字母词使用却也一直惹争议[5][6],这些由字母构成的词,是否可以与汉字词同等视为汉语词,即便作为借词的一种形式接纳了它们,可这些很难见其形而度其义的字母词接受起来是否跟学习和使用外语一样。其实,一项通过对1990-2014年(以下25年均指此时间段)汉语书面语中字母词使用情况的大规模调查发现①在王秋萍博士学位论文《近二十年来汉语书面语中字母词使用状况调查》的基础上,加入近五年的语料后调查得出的数据和结论。,其字母词使用量总计8 000多个,其中,使用频次为1的字母词占至50%左右,这说明字母词的一过使用率非常高,稳定性差。累计使用总频次大于100的字母词仅有不到200个,却可以覆盖字母词总使用频次的70%以上。这表明,高频使用的字母词数量相当有限,了解起来根本不能与学习外语等而视之,更不必产生过于强烈的因字母词的使用而导致人们阅读理解障碍的担忧。

为了方便查阅字母词,《现代汉语词典》自1996年第3版起,除收录“阿Q”“卡拉OK”“三K党”3条字母词外,首次在“西文字母开头的词语”题录下收录39个字母词。又分别在2002年第4版,2005年第5版和2012年第6版中,总计收录字母词145个、185个和242个。

本文将以《现代汉语词典》(第6版)(下文简称“《现汉6》”)中收录的242个字母词为调查对象[7],拟通过对其使用情况的调查展示字母词在汉语中的使用面貌,量化其发展变化规律,总结其使用特点和成因,为字母词使用规范和入典提供参考。

二、《现代汉语词典》收录的字母词使用情况概述

《现汉6》收录字母词总计242个,其中,同形词2个,形成244个统计词条。将244个字母词分别在1990-2014年历时25年的《人民日报》语料中检索,并统计出各词条25年总使用频次和各年度使用频次,以及在语料中出现的年份等信息,形成字母词使用情况的25张年表和一张总表。

频次是衡量词汇常用程度的一个最直观的统计量,25年总使用频次可以反映出字母词自20世纪90年代以来在现代汉语中累计使用量的多寡,其统计结果见表1。

表1 244条字母词不同频次段词种、词次分布

从表1可以看出:第一,《现汉6》中所收录的244个字母词,25年使用总词次为110748次。1990-2014年这25年《人民日报》中使用的字母词总共有8 000多个,近200 000词次,相当于每近2 328个汉字词,就会出现一个字母词①在王秋萍博士学位论文《近二十年来汉语书面语中字母词使用状况调查》的基础上,加入近五年的语料后调查得出的数据和结论。。而所收录的244个字母词词种数仅占25年《人民日报》使用总字母词词种数的3%左右,却覆盖了总使用词次的近50%,总体上看,这244个字母词中涵盖了大多数汉语中常用的字母词,而且在现代汉语中常用字母词的数量并不多。

第二,244个字母词中,25年总使用频次在300以上的词条有66条,占收录总词种数的27.05%,500以上的词条有44条,占18.03%,1000以上的词条有25条,占10.25%。25年总使用频次在300以下的词条有178条,占收录总词种数的72.95%,100以下的词条有132条,占54.1%,50以下的词条有99条,占40.57%。

第三,25年总使用频次在300以上的66条字母词仅占收录总词种数的27.05%,其25年总使用频次覆盖率却可达89.39%,这说明这一小部分字母词的使用频次很高。而25年总使用频次在300以下的178条字母词占收录总词种数的72.95%,其25年总使用频次覆盖率仅达到10.61%,可见这些字母词中很大一部分的使用频次较低。《现汉6》收录的244条字母词中,高频词与中、低频词的比例约为1:2。

三、《现代汉语词典》收录的高频字母词使用情况调查

在《现汉6》所收录的244个字母词中,25年总使用频次在300以上的字母词有66条,各词条25年总使用频次见表2。

表2数据显示:25年总使用频次最高的字母词是“GDP”,位居第二、三位的是“WTO”和“APEC”,这三个字母词覆盖了244条字母词总使用频次的30.45%,66条高频字母词总使用频次的34.06%。

表2 高频字母词词表

GDP的汉译词是“国内生产总值”,我国从1985年起建立GDP核算制度,1993年正式取消GNP核算,从此,“国内生产总值”成为国民经济核算的核心指标。20世纪90年代以来,世界上绝大多数国家也纷纷放弃GNP而重点采用GDP作为国家经济核算指标。这一经济领域的变化马上反映在词汇的使用上。图1所见,GNP在25年各年度的使用量均不高。而且,1994年以后,其使用频次呈现下降趋势,除个别年份外,基本降至年总使用频次10次以内,而GDP的使用频次却逐年迅增。图2则反映出汉语系统对这一经济概念采用字母词还是汉字词形式的选择趋势。1998年以前,“国内生产总值”这一词形占据频次优势,以后则字母词GDP使用频次优势凸显。25年总体而言,汉字词形式年度使用频次相对不高,且呈下降趋势,字母词形式反之呈上升趋势,2004年以来,年度使用频次均高于800次。这一变化趋势不仅体现出国家对经济发展的重视,也体现出词汇系统在接纳这一经济领域术语的博弈中,字母词形式所表现出的表达优势。

GDP一词25年总使用频次非常高,年度使用频次总体呈上升趋势,这反映了高频字母词使用的一种变化类型。类似的字母词还有PMI,指“制造业采购经理指数”,在2005年语料中首次出现,2009年开始进入使用频次的上升期,累计至今成为高频词。近些年来,PMI已发展成为衡量世界经济运行活动的重要评价指标和世界经济变化的晴雨表,使得其使用频次持续高升。这类字母词还有:NBA、CBA、A股、CPI、IPO。

图1 “GDP”和“GNP”25年使用频次变化

图2 “GDP”和“国内生产总值”25年使用频次变化

WTO即“世界贸易组织”,其25年总使用频次也非常高,但是它的高频使用则反映了字母词使用频次历时变化的又一种类型。图3所示,WTO一词在2001和2002年使用频次特别高,年使用频次1700以上,在其前后一两年是频次的骤升期和骤降期,呈现此变化趋势与2001年底中国正式加入WTO这一事件息息相关。又如字母词APEC、PM2.5和SARS,2001年APEC会议在上海召开,2003年SARS疫情爆发,2012-2014年,长时间悬浮于空气中,直径小于等于2.5微米的细颗粒物与空气质量的话题成社会热点,使其使用频次呈现出陡峰突起之势。伴随非典疫情的有效控制,SARS一词也渐渐淡出人们的视线。而2014年APEC会议再度在中国召开,APEC一词又迎来了第二个陡峰突起。可以想见,若PM2.5得到有效治理,空气质量好转,PM2.5一词也将淡出人们的视线。这类字母词还有:F1、CEPA、B股、NMD、ECFA、H股。

有些字母词虽然25年总使用频次很高,但是正经历年度使用频次变化的下降期,进而可能进入低频期,如图4,卡拉OK一词从1996年开始进入使用频次下降期,并逐渐转入低频期,这反映字母词历时变化的第三种类型。这类字母词还有:ISO、VCD、 CDMA、IC卡、CD、PC、GSM、BBC、MBA、BP机、SUV、CAD、CIMS、IP电话。

图3 “WTO”和“APEC”25年使用频次变化

图4 “卡拉OK”25年使用频次变化

还有两类字母词,一类是经过逐渐升温的关注期后趋于稳定使用,图5所见,IT一词从1999年至2001年是其使用频次的增长期,2002年以来稳定在一个较高的频次范围内。这类字母词还有:DNA、GPS、LED、DVD、M2、M1、GMP、ATM机、CNN、IP地址、POS机、VIP。

图5 “IT”25年使用频次变化

图6 “CT”和“X光”25年使用频次变化

另一类字母词是25年间使用频次历时变化趋势不明显,或者年度使用频次不高,频次历时变化不大,趋于稳定。图6所见,前者如CT,后者如X光。这类字母词还有:CCTV、IMF、QQ、B超、CEO、ST、X射线、CPU、QFII、CBD、WAP、PPI、MTV、T恤衫、BBS、SCI、ABC、HIV、阿Q。

(2)C-E mistranslation of publicity materials of red tourism in Hunan Province will hinder Hunan Province from boosting its Red Tourism

高频字母词在汉语中的历时发展状态显示,它们有些成为字母词中的常青树,有些伴随社会关注度的冷热程度变化而时隐时现,有些则将渐渐退出交际的舞台。

字母词的“首次出现年份”记录了其出现年代的早晚,而“累积出现年份”则可以反映其生命力,它们也是字母词在汉语中使用情况的体现。

如表3所见,66条高频字母词中,56个字母词于20世纪90年代已经在汉语中使用,占高频字母词词种总数的85%。根据语料统计得到的字母词累计出现年份数据,66条字母词中,累计使用20年以上的字母词有36个,约占高频字母词词种总数的55%,累计使用15年以上的字母词有50个,占高频字母词词种总数的76%,累计使用10年以上的字母词有62个,占高频字母词词种总数的94%,累计使用年份不足5年的高频字母词为0。可见,这66个高频字母词在汉语中的使用已经经历了很长一段时间,绝大多数已经发展成为汉语词汇中成熟而常用的组成部分,已经具备了相当的生命力。

表3 高频字母词首次出现年份和累计出现年份分布

如果将字母词分为组织机构名、专业术语和一般名词3种类型,那么这66个高频字母词的类型分布见表4。

表4 高频字母词类型分布

从表4的统计结果看,在高频字母词中,术语所占比例最大,其次是一般名词,专名所占比例最低。如果将高频字母词按照其使用的领域划分,其分布情况见表5。

表5 高频字母词领域分布

在高频字母词中,反映国家政治经济和人民生活的最多,其次是科技文化及医疗卫生,反映农业生产的没有。这一方面与国计民生、社会关注息息相关;另一方面,从语言学角度看,也和字母词所对应的汉译词的有无关系也非常大。有些字母词至今没有可替代的汉译词,如:卡拉OK、CT、X光、CD、B超、X射线、T恤衫、B股、A股、BP机、IC卡、H股、M1、M2、VCD、DVD、F1、IP电话、QQ。它们有些用到了字母的构形特点,有些用到了字母的分类排序作用,有些因为汉语释义繁琐晦涩,难以推广而积极使用字母词形式,有些是专名,总之,这些因素都构成字母词高频使用的原因。可见,字母词是汉语产生新词语的一个重要途径,有些新词语最早产生就是一个字母词。

四、《现代汉语词典》收录的低频字母词使用情况调查

25年总使用频次小于50的字母词被划入“低频字母词”,列入表6,总计98个,占收录字母词总词条的40%。其在不同频段分布见图7,其中,25年总使用频次为0的字母词有9条,25年总使用频次小于20的有66个,占低频字母词的67.3%。

低频字母词的首次出现年份分布见图8。首次出现年份分布于 1990-1999年间的有 58条,1990-2009年间的有85条,2010-2014年间的有4条。可见,绝大多数低频字母词并非新词,其25年累计使用频次小于50次的确表明它们是低频字母词。

这些低频字母词,除了其指称的事物或概念本就不常用以外,从语言学视角分析,导致低频的原因还有:第一,其汉译词使用占优势,如:AI(人工智能)、DC(数码相机)、APC(复方阿司匹林)、Wi-Fi(无线网络)等。第二,在口语交际中使用占优势,如:NG、K歌等。第三,在非大众传播媒介,如专业领域交际中使用占优势,如:SSD、HDMI、OLED等。第四,其另一种书写形式占优势,如:hi-fi(HIFI)、CCC(3C)等。

①“PE”是同形字母词,释义为“市盈率”的频次为1,释义为“聚乙烯”的频次为57。

五、《现代汉语词典》新增字母词使用情况调查

与《现汉5》相较,《现汉6》新增字母词60个,形成61个统计词条,其25年总使用频次见表7。其中,中、高频字母词有31个,成为词典收录字母词的重要补充。其余30个为低频字母词,占新增字母词的近50%,约占低频字母词的1/3。

表6 低频字母词词表

仅就统计得到的25年使用数据而言,低频新增字母词收录的理由并不十分充分。通过对1990-2014《人民日报》中字母词使用情况的调查发现①在王秋萍博士学位论文《近二十年来汉语书面语中字母词使用状况调查》的基础上,加入近五年的语料后调查得出的数据和结论。,其中有些使用程度较高的字母词《现汉6》并未收录。这里“使用程度较高”的筛选规则为:25年累计使用总频次不低于50,并且累计分布总文本数不低于50或者累计使用总年份不低于10年②25年累计使用总频次、分布总文本数和使用总年份三个统计量的阈值是通过对1990-2014《人民日报》中字母词使用数据的统计分析以后得到的经验值。。并且,将得到的字母词进行人工甄别,去掉产品品牌名、公司名等部分专名,去掉频次虽高,但缺乏时代感,已然面临淘汰的词,列入表8中。

图7 低频字母词频段分布

图8 低频字母词首次出现年份分布

表8使用程度较高而《现汉6》未收录的字母词词表《现汉6》除了在汉字词条目中非常谨慎地收录了3条汉字开头的字母词以外,其它字母词均收录在“西文字母开头的词语”题录下。因此,表8中以汉字或数字开头的字母词仅基于词形上的客观条件考虑即没有被选录其中。然而,通过大规模语料的调查统计,表8所列字母词仅从统计数据角度比较,的确比《现汉6》所收录的部分中低频字母词常用,入典的理由也更充分些。

表7 《现汉6》新增字母词词表

表8 使用程度较高而《现汉6》未收录的字母词词表

六、结语

统计采用《人民日报》语料,因受到新闻语料所限,新闻事件中涉及到的字母词,其使用频次可能会高些。但是,调查采用历时25年语料,语料量和历时跨度均较大,会削弱新闻语料这种语料属性的局限性;且词典所收录字母词均遵循在汉语中已经使用很成熟的原则,这也会削弱语料性质的影响。因此,调查结果在一定程度上可以反映《现汉6》中所收字母词在汉语中的使用面貌。

虽然绝对频次在反映字母词使用量方面受语料量影响较大,但是它依然可以客观反映出该版词典所收录的244个字母词之间相对使用量的关系,即哪些是高频的,哪些是低频的。

研究结果显示,《现汉6》所收录的字母词中,高频使用的字母词仅占约27%,而40%左右是低频字母词,另33%是中频的。然而,高频字母词虽少,其覆盖率却很高,66个高频字母词覆盖字母词使用总量的近90%。即使是高频字母词,其致高频的原因也存在不同情况,还有些使用频次已呈递减趋势。由此可见,在汉语系统中,真正高频稳定使用的字母词词种数并不多,词次覆盖率却可以很大,并通过反复使用而渐渐为人们所熟知。

[1]沈孟璎.浅议字母词的入典问题[J].辞书研究,2001(1):30-38.

[2]刘涌泉.关于汉语字母词的问题[J].语言文字应用,2002(1):85-90.

[3]郑泽芝.字母词语跟踪研究[J].语言文字应用,2009(1):69-78.

[4]侯敏,滕永林,刘俊,刘欣斐.广播电视语言外文缩略词使用状况调查[J].北华大学学报:社会科学版,2011(4):18-25.

[5]国家语言资源监测与研究中心.2006中国语言生活状况报告:下编[M].北京:商务印书馆,2007:40-43.

[6]刘佳,邹煜,侯敏.如何引导媒体语言规范——以外文缩略词在广播电视语言中的使用为例[J].语言文字应用,2011(4):78-83.

[7]中国社会科学院语言研究所词典编辑室.现代汉语词典:第6版[M].北京:商务印书馆,2012:1,716,1117,1750-1755.

Research on Letter Words in Modern Chinese Dictionary

Wang Qiuping
(College ofInternational Education,ShenyangNormal University,ShenyangLiaoning110034)

Letter words consist of either a single letter or numbers,punctuation and Chinese characters.There are 242 letter words in Modern Chinese Dictionary(6thedition).This research focuses on the usage ofthese letter words and the frequency as well as the newly added words in the 6thedition.It also makes a comparison and analysis of the results so as to showthe frequency of the words used.The regularity of development,features and possible reasons are discussed as well.Hopefully,it will provide references for revisingthe dictionary.

Modern Chinese Dictionary;letter words;usage;survey;analysis

H 08

A

1674-5450(2016)02-0081-06

2016-01-08

辽宁省教育厅科学研究一般项目(W2013148);辽宁省社会科学基金规划项目(L11DYY051);沈阳师范大学博士科研项目启动基金经费资助

王秋萍,女,辽宁沈阳人,沈阳师范大学讲师,语言学博士,主要从事语料库语言学及语言监测研究。

【责任编辑:杨抱朴责任校对:王凤娥】

猜你喜欢

现代汉语词典词条年份
特殊的一年
现代汉语中艺术类行业语泛化现象研究
《现代汉语词典》字母词收录与修订情况分析
2016年4月中国直销网络热门词条榜
2016年3月中国直销网络热门词条榜
什么是闰年?
一样的年份
2016年9月中国直销网络热门词条榜
大数据相关词条
更正