APP下载

军语用字的计量分析

2014-04-03杨晓黎

中国科技术语 2014年3期
关键词:首字词目常用字

原 媛 杨晓黎

(安徽大学文学院,安徽合肥 230039)

“字是汉语社团中具有心理现实性的结构单位。”[1]军语用字,则是指《军语》词目中使用的汉字,不包括阿拉伯数字、字母、标点符号。作为军事人员、群体使用的专用词语,军语和一般社会语言相比有着自身的特点,这在其用字方面有所体现。笔者以2011年版《军语》收录的8587个词目为主要研究对象,分析其字量和字序,并与“现代汉语常用字表”和1972年版、1982年版、1997年版《军语》的用字情况进行比较,期望能够较为系统地揭示军事领域相关汉字的构成和应用规律,为研究制定军语中汉字的应用规范以及相关政策提供参考,对于探索军语定名的语言学规律,以及开展军语信息检索、提取和识别等,做出理论和现实意义上的贡献。

一 军语用字的使用次数

通过建立描述性的语料库,并对其中的汉字信息进行统计,可知2011年版《军语》中的8587个词目一共使用汉字1454个。这1454个汉字在2011年版《军语》中的使用次数从1次到1279次不等,其中,出现次数大于等于1000次的有1个字,为:战(1279)(注:数字1279为该字的使用次数),这也是使用次数最多的字。而使用次数仅为1次的字有339 个,例如:埃、隘、鞍、凹、八、把、摆、败、般、斑、绊、帮、雹、奔、逼、匕、彼、必、壁、臂、辩、飑、滨、玻、剥、播、簸、钚、彩、颤、彻、惩、吃、池、虫等。

为了进一步分析2011年版《军语》的用字差别,把1454个军语用字按照使用次数分为5个等级,统计军语用字使用次数分级情况如表1所示。

表1 军语用字使用次数分级表(2011年版)

如果将使用次数大于等于100次的汉字称为军语常用字,使用次数在10~99次的汉字称为军语次常用字,使用次数在10次以下的汉字称为军语罕用字,则2011年版《军语》中用字的具体情况如下:

军语常用字。共有109个,占全部军语用字的7.50%。使用次数按降序排列的前20个汉字依次是:战(1279)、军(746)、装(692)、备(607)、空(579)、弹(565)、兵(561)、导(527)、机(500)、地(498)、防(468)、术(456)、击(417)、炮(394)、队(384)、射(375)、作(369)、信(357)、技(346)、事(308)。

军语次常用字。共458个,占全部军语用字的31.50%。例如:突(99)、扰(93)、警(86)、抗(83)、争(77)、炸(77)、御(65)、救(63)、坦(58)、率(54)、袭(45)、打(42)、令(39)、巡(32)、敌(29)、枪(24)、轰(19)、靶(10)等。

军语罕用字。共887个,占全部军语用字的61.00%。除了上面列举的使用次数为1次的汉字以外,还包括使用次数在2~9次的汉字,例如:俘(9)、榴(9)、胁(8)、杀(8)、革(7)、诱(7)、侵(6)、逐(6)、摧(5)、掠(5)、撤(4)、虏(4)、缴(3)、驱(3)、溃(2)、夺(2)等。

这个结果表明,2011年版《军语》中军语常用字和次常用字加起来的比例为39.00%,也就是说,军语中最主要、最频繁地被使用的汉字只集中在560个左右的军语常用字、次常用字上,这些汉字主要与作战行动、武器装备和军事力量有关,充分体现了军语的领域特色。另一方面,60%以上的军语用字使用次数在10次以下,换句话说,军语罕用字出现的频率低,但占军语用字的比例反而较高。

二 军语用字的位置分布

一个汉字在术语中的位置可能有多种,但是如果从术语的临界点(就是术语的第一个汉字和最后一个汉字)来看,汉字所处的位置可以分为临界汉字和非临界汉字两类[2]。军语研究中,可将临界字分为首字和尾字,例如“中国人民解放军”中的“中”和“军”,非临界字就是这两个字之间的汉字,即“国、人、民、解、放”。需要说明的是,仅由一个汉字构成的军语词目不存在临界位置,所以在对2011年版《军语》中处于临界位置的汉字进行考察时,应首先将其排除。

2011年版《军语》中,首字、尾字出现的字数以及占全部军语用字的比例,如表2所示。

表2 军语中临界字分布情况表(2011年版)

考虑首字和尾字存在重叠情况,进一步统计可知,出现在临界位置的汉字共有1164个,占全部军语用字的80.06%,包括三类:一是首临界字,即作为临界字时只出现在术语首字的位置。二是尾临界字,即作为临界字时只出现在术语尾字的位置。三是首尾临界字,即作为临界字可以出现在术语首字,也可以出现在术语尾字的位置。例如“地”,首临界字是“地”的军语有“地境”“地面侦察”等;尾临界字是“地”的军语有“阵地”“训练基地”等。这三类临界字的数量和占全部临界字的比例如表3所示。

表3 军语临界字数量表(2011年版)

首临界字有454个,占全部临界字的39.00%,其中使用次数大于等于10次的有49个。使用次数降序排列的前20个依次是:直(111)、反(105)、指(80)、特(78)、侦(65)、无(63)、第(55)、野(44)、对(41)、边(40)、预(32)、基(31)、联(31)、单(29)、专(29)、登(27)、干(27)、非(26)、大(25)、自(25)。

尾临界字有323个,占全部临界字的27.75%,其中使用次数大于等于10次的有61个。使用次数降序排列的前20个依次是:术(300)、练(174)、察(130)、度(97)、力(97)、斗(94)、员(64)、役(59)、达(58)、置(57)、务(54)、挥(53)、扰(49)、式(43)、站(42)、所(41)、率(40)、准(39)、材(35)、团(35)。

首尾临界字有387个,占全部临界字的33.25%:

首字为主的临界字。作为首字与作为尾字的使用次数之差按降序排列的前20个汉字依次是:军、装、战、海、导、炮、空、核、舰、防、电、航、国、后、火、飞、通、水、陆、高。

尾字为主的临界字。作为尾字与作为首字的使用次数之差按降序排列的前20个汉字依次是:备、击、队、障、统、理、区、量、器、图、制、车、报、场、弹、护、划、线、兵、点。

这个结果表明,2011年版《军语》中有八成左右的军语用字可用作临界字。这些临界字中的军语常用字、次常用字,又大多是构成军语能力强的汉字,通常用于指称系列化的军事事物,易于形成以这些字为共同语素的军事词族。另外,首尾临界字在使用中存在不均衡性,如“军”作为首临界字,共使用了498次,作为尾临界字,只使用了21次,这说明“军”作为军语词条首字的概率远远超过作为尾字的概率;再如“备”作为尾临界字的使用次数是205次,而作为首临界字的次数只有2次,说明“备”主要用于军语词条的尾字,出现在首字位置的只是“备”的偶然运用。有些字适合作首字,有些字适合作尾字,既可以作为首字也可作为尾字的情况中,出现在首字和尾字的概率也还是各有侧重,这些可以认为是军事语言者的使用习惯所决定的。

三 军语用字同常用汉字比较

为了考察军语用字同常用汉字的关系,将军语用字与《现代汉语常用字表》进行对比分析。《现代汉语常用字表》由国家语言文字工作委员会和国家教育委员会于1988年1月26日联合发布,对于1988年以后颁发的军语有对比参考价值。

通过将2011年版《军语》中1454个军语用字和《现代汉语常用字表》中的3500个常用汉字进行比较,可以发现:有1420个军语用字在常用汉字中,占军语用字的97.66%。

超出《现代汉语常用字表》的军语用字只有34个,占全部军语用字的2.34%。这34个军语用字的使用次数从1次到8次不等。其中,使用次数等于1次的汉字有24个,分别为:飑、钚、觇、猝、磋、硐、匐、骸、岬、喀、殓、霾、毗、匍、堑、氰、泅、陀、舾、霰、贻、弋、铀、纂;使用次数等于2次的汉字有4个,分别为:箔、漕、戍、湍;使用次数等于3次的汉字有2个,分别为:汐、砦;使用次数等于4次的汉字有2个,分别为:狙、曳;使用次数等于6次的汉字有1个,为:慑;使用次数等于8次的汉字有1个,为:佯。另外,经统计,《现代汉语常用字表》有2080个汉字不在军语用字中。这类汉字称为非军语用字,占常用汉字的59.43%,如:乙、丁、厂、卜、几、乃、又、于、亏、寸、丈、巾、千、乞、川、亿、勺、凡、及、夕、丸、么、尸等。

这个结果表明,2011年版《军语》中的用字处于常用汉字范围之内的比例在97%以上,军语词目基本上是按照通俗易懂的原则来定名的。超出《现代汉语常用字表》范围的军语用字大多与地理、气象水文、物理、化学等学科有关,这些学科原有的术语进入军语行列,或是与其他词语结合构成军语时,给军事领域带来了一些非常用字。比如“喀斯特地貌”“飑线”“硐室爆破”等,大多来自“军事地理·测绘·导航”“军事气象·水文·空间天气”等专业性较强的类目,以及由物理、化学专业术语衍生构成。精选出非军语用字,对于运用计算机来进行军语信息处理工作有一定的价值。

四 4个版本《军语》用字的演变

为考察军语用字的演变,对1972年版《军语》的1342个词目、1982年版《军语》的5227个词目、1997年版《军语》的6562个词目中的军语用字进行统计,依次为813个、1344个、1408个,与2011年版《军语》的1454个用字在数量上进行比较,呈明显的随年代递增的趋势。这主要是受军语辞书收词数量增加的影响,但也说明了军语用字的覆盖面正在逐渐扩大。

从使用次数来看,在前3个版本的《军语》中,使用次数大于10次的常用字和次常用字加起来的比例依次为:15.87%、32.22%、35.30%,如表 4 所示。加上2011年版《军语》中的39.00%,都不超过40%,也就是说军语用字的60%以上的使用次数都在10次以下,且4个版本的《军语》中使用次数为1次的汉字均在300个以上,而最主要、最频繁地被使用的汉字则集中在500个左右的军语常用字、次常用字上。另一方面,随军语的年代变化,军语常用字和次常用字都呈明显的递增态势,而军语罕用字在20世纪80年代出现一次增长后(1982年版《军语》较1972年版《军语》词目数量有大幅增长)即逐版减少,这个结果表明,军语用字在数量整体增加的情况下,更倾向于集中使用一些更为常用的汉字。

表4 军语用字使用次数分级表

通过计算4个版本的《军语》中军语用字的使用次数,按降序排列的前20个汉字中,重合的有11个,分别是:战、军、备、空、兵、地、防、击、炮、队、射,说明这些汉字在军语中大量使用、长期存在,尤其是“战”作为使用次数最多的汉字,更是直接反映了军语服务作战的特性。其他汉字也都与作战行动、武器装备和军事力量密切相关,比如1972年版《军语》中用字的使用次数按降序排列的前20个汉字依次是:战(136)、地(103)、击(82)、队(68)、军(64)、通(58)、射(57)、兵(56)、防(54)、备(50)、空(50)、线(47)、信(47)、炮(44)、察(41)、方(41)、火(40)、力(39)、路(38)、坦(37),都能充分体现军事领域特色,对于军语构词有重要意义。与1972年版《军语》相比较,后3版《军语》在前20个汉字中都出现了“弹、机、导”,这也从一个侧面反映了20世纪80年代以来,战场形态由传统作战转向以空中力量实施精确打击为特征的现代作战。

五 结语

通过统计分析,从字量上看,军语用字的数量随年代发展而递增不大,但总体数量不多,且集中使用了一些军事人员耳熟能详的常用汉字。从字序上看,军语用字的位置分布具有不均衡的特征,一些汉字出现在首字和尾字的概率差别较大。计量分析军语用字的字量、字序等方面的情况,不但有助于制订科学的军语用字表,助推军语规范化工作,还能够降低军语信息检索、提取和识别的难度,特别是对用字位置分布的分析,能够为军语词缀分析提供基础数据,为临界点的确立提供范围更小的可选字集。当然,由于军语用字偶有超出常用汉字范围、临界字呈无规则等情况出现,军语信息处理上的技术细节还有待深入研究。

[1]徐通锵.语言论[M].长春:东北师范大学出版社,1997:自序.

[2]邢兴兵.信息技术领域术语用字分析[J].术语标准化与信息技术,2005(1):43.

猜你喜欢

首字词目常用字
藏语传统辞书词目编排法探析
关于常用字覆盖率统计算法的研究
直销企业家群情激昂(以姓名首字拼音为序)
日语中“V1+V2型复合名词”的分类
——基于《广辞苑》从有无对应动词形角度
谈常用字词的选取及其等级划分
“一三五不论”之我见
汉语双字听觉词高频首字通达中的字形激活
《汉语大词典》漏收宋代笔记词目补释
《汉语新词新语年编2003-2005》词目年代研究——兼论《编年本〈汉语新词语〉系列词典部分词目的著录年代》
片名连环谜