多语种国防缩略术语库研究
2013-12-28易绵竹刘伍颖刘万义
易绵竹 刘伍颖 刘万义 王 琳
(1.解放军外国语学院,河南洛阳 471003;2.军械工程学院,河北石家庄 050003)
引 言
20世纪40年代以来,在国际政治、军事和科技领域大量涌现缩略术语,主要由于缩写能使语言简练紧凑,节省篇幅,便于相关专业领域人员交流,如“二战”后用GI(government issue)指代派驻世界各国的美国兵,凸显了其雇佣特色[1]。20世纪70年代以后,在社会生活各个领域缩略术语空前剧增,大有泛滥成灾之虞,百姓对层出不穷的缩略术语不知所云,有碍于正常的交际。我国著名语言学家王宗炎先生曾撰文将缩略术语比喻为英语词汇中的暴发户[2]。
目前,缩略术语作为国防科技领域各种新事物、新概念和新知识核心载体,呈爆炸式剧增之势,这既是在新军事变革背景下世界主要军事大国调整军事战略、创新军事理论、更新武器装备和革新体制编制的结果,也是以美国为代表的西方国家军队文化的一种体现,更是信息网络时代复杂概念的简化组合以及新思想和新观念的高度浓缩。当前,包括缩略术语知识库在内的术语知识管理体系建设已纳入许多国家的发展战略,计算术语学和术语知识工程学等跨学科综合研究术语知识库的构建被摆在信息化建设的优先位置。然而,与西方发达军事大国相比,我军在术语知识管理体系建设方面还相对滞后,尚未完成具有中国特色且能有效满足各种需求的术语知识库建设,存在术语不统一、翻译不标准、译出多门等混乱现象,这已成为严重制约我军多语言信息处理能力提升的瓶颈。
本文拟就国防科技领域的缩略术语构成机制和规律进行探索研究,旨在构建多语种国防缩略术语查询系统,以期为我国国防科技工作者和多语言军事信息处理研究者提供一种行业化服务。
一 国防缩略术语的研究现状
本文所指的国防缩略术语主要以军事缩略术语为主,它是军事术语词、词组或句子经过压缩或简略而形成的一种特殊词语形式。
目前,专就军事缩略术语应用研究而论,国内最新出版的双语词典主要有:(1)李宁主编的《英汉军事缩略术语大辞典》收录20万词条,内容涵盖外军军事思想和军事战略、战役和战术以及航空航天、电子信息、生物核能等高、新、精、尖科技领域,涉及外军编制体制、作战指挥、训练教育、军兵种运用、后勤保障、维和行动、军控与裁军、反恐、非正规战争等方面,反映近年来具有一定战略意义的最新尖端武器项目和装备研发状况;(2)张汉宽主编的《俄汉军事缩略术语大词典》收录32 330词条,兼具俄汉双向对照检索之功能,其主要特色是所收录的缩略术语涵盖军事理论、信息技术、作战指挥、武器装备、体制编制、教育训练与后勤保障等领域;力图体现信息化战争、联合军事演习、国际维和与反恐行动等领域的新概念、新知识、新技术,所有词条引文有据,注释简明,释义准确;(3)潘永樑主编的《英汉军事术语大词典》收录24万词条,每条英语军事术语包括全称和缩略术语,所有条目统一按照字母顺序排列,并配备英汉、汉英双向检索电子词典,实现缩略术语和全称的相互查找,具有精确检索、模糊检索和全文检索等功能。
近年来,我国开始重视国防科技用户信息的知识化组织问题,从“大资源观”研究用户信息的管理问题,重点关注如何利用知识组织的理念和方法管理用户信息资源,并明确提出了用户信息知识化组织的内容架构及其重点任务[3]。2006年我国7个国家级情报研究机构联合开通中国国防科技信息网站,汇聚国防科技工业领域多年积累的资源,嵌入了DPS国防术语智能定位系统,并提供国防术语的在线翻译服务[4]。
出于加强反恐作战和信息作战的战略需求,我国与世界主要国家的军事交流日趋频繁,特别是上海合作组织成员国之间定期举行军事技术合作、联合军事演习等活动,我军外事部门和各业务单位已积聚含有大量缩略术语的多语种军事素材,仅仅依靠传统的手工查询方式,远远不能满足日益增长的海量信息处理的现实与潜在需求。有鉴于此,在以网络中心战为最新表现形式的一体化联合作战背景下,我们探究多语种国防缩略术语的基础理论和应用技术,合理利用静态与动态知识源,研发可实时更新的国防缩略术语库,不仅能够推动国防缩略术语使用进入标准化和规范化轨道,而且对于面向网络空间的国防科技信息自动化与智能化处理,具有重要的学术探索意义和实际应用价值。
二 国防缩略术语使用的主要特点
由于国防科技和军事素材具有使用场合特殊、保密性高、信息传递速度快等特点,因此在不影响内容真实性的前提下,使用缩略术语能够压缩文件篇幅,提高信息传速率。与其他领域相比较而言,国防和军事领域不仅大量使用现成的缩略术语,而且往往需要对新出现的术语词组进行缩略从而产生新缩略术语,比如美国防部的军事及相关术语词典(The Department of Defense Dictionary of Military and Associated Terms)[5]所附缩略术语词表(abbreviations and acronyms)每隔几年就修订更新一次,足见该领域的缩略术语产生和使用频率之高。
在国防和军事领域,缩略术语使用的主要特点有:
1.使用密度高。在某些军用文函和素材中,缩略术语的覆盖率超过一半,有的甚至高达90%以上。
2.缩略范围广。在军事素材中不仅使用比较固定的缩略术语词组,而且还对大量单词和少量句子乃至段落进行缩略。
3.隐蔽性大。军事素材所用缩略术语不容易被理解,读者需要根据经验进行判断,由此造成理解难度大,且有的缩略术语常用作代字仅在一定范围内使用,对局外人具有保密性。
4.语义确定。尽管军事缩略术语构成不够规律,同一缩略术语可代表两个及两个以上母体,但在某一具体文本中,其母体及所表达的意义是确定的,不可能产生歧义。试举例说明,如:Hey,the CO wants to see the PFC down at the MP shack abut a DWI in a POV.(喂,指挥官要在宪兵处召见一等兵,因为他酒后驾驶私人汽车。)在该句中出现5个缩略术语,通过词典查询CO对应着Commander或Commanding Officer(指挥官)、 Course(航线)、Cut Out(阻断)、Current Order(即时指令)、Commando Operations(突击作战)、Conscientious Objector(非战主义者)、Crystal Oscillator(晶体振荡器)等10多个全称形式,但在一定的语境条件下,CO只能理解为指挥官。
5.新词生成快。国防科技文献和军事素材中的新词汇、新词组一经面世,相应的缩略术语随即生成,比如在一次军事行动开始之前,一批新的军事缩略术语便已出现[6]。
可见,在国防科技和军事素材中出现频率极高的缩略术语具有专业性强、隐蔽性大、新词生成快等特点,使翻译处理人员常常面对层出不穷的缩略术语而感到无所适从。国防缩略术语的翻译处理并非简单的双语解码,有时一条缩略术语的表现形式相同,内涵却相差甚远,难以查明其根源,有时由于缺乏必要的背景知识资源作支撑,难以获得准确的释义。
因此,合理整合利用各类多语种国防缩略术语数据资源,将其转化为计算机可理解、可操作的缩略术语知识库系统,可有效解决自然语言处理中词性标注、词义判定与歧义排除、命名实体识别和实体共指消解等诸多难题。
三 国防缩略术语构成的机制和规律
研究国防缩略术语的构成机制和规律涉及缩略形式与全称形式关系确定、缩略术语预测、缩略术语歧义消解等各个方面,其中每项研究都具有广泛的应用价值,比如缩略术语预测就可应用于信息检索,在加入缩略术语作为关键词扩展查询时,能够大大降低漏检率。
一般认为,缩略术语构成应遵循美国学者齐夫(G.K.Zipf)提出的“省力原则”(the principle of least effort),其基本思想是以最小的代价换取最大的收益。法国语言学家马丁内特(A.Martinet)认为“省力原则”和“交际需要”(the requirements of communication)是构成语言经济的两个主要因素。一方面,言者需要传递自己的信息;另一方面,又要尽可能地减少自己的脑力和体力付出。据此,有学者在讨论缩略术语的理据时提出了言者的省力原则——最简化原则和听者的省力原则——邻近性原则,后者包括词首要素优先、语义凸显性、区别性和习俗性等几个次原则[7]。冯志伟先生提出的术语形成经济律是揭示语言经济机制的一种重要规律,术语形成的经济律可用“FEL公式”表示为:F=EL。其中F表示单词的术语构成频率,E表示术语系统的经济指数,L表示术语的平均长度[8]。
国防和军事缩略术语的构成规律与其他领域大致相同,但在某些方面有其特色。根据文献[6]可以总结出三条规律,简述如下:
1.单词缩略规律。主要采用截成法(如SUB— submarine/潜水艇)、取辅音法(如FLT— fleet/舰队,SKDN—shakedown/试航)和谐音法(如VQ— vehicle/潜水艇)。
2.词组缩略规律。主要采用首取法(如MAF— marine air force/陆战航空队)、混成法(如BOMRON—bomber squadron/轰炸机中队)。
3.句子缩略规律。如句子(We)have not yet begun tof ight(尚未开战)可缩略为HOTBUN。
通过对国防和军事缩略术语构成机制与规律的深入研究,可以发掘多语种国防和军事缩略术语的语言特性和认知基础,寻绎缩略术语生成与还原、编码与解码、猜证与理解的新途径,制定合理实用的释义标准和翻译规范。
四 国防缩略术语库设计与实现
构建国防缩略术语查询系统所要解决的关键技术包括网络环境下多语种缩略术语的自动抽取与自动识别技术,缩略术语数据资源整合化、规模扩大化和汉译规范化技术,缩略术语流通度调查与动态更新技术等,唯此方可使缩略术语查询系统能够满足有效管理、有助开发、有利扩充、快捷实用的要求,进而形成“基于网络、流程驱动、面向服务”的国防缩略术语信息管理新体系。
多语种国防缩略术语查询系统构建是语言信息处理应用研究的一项基础工程,它也可从术语知识工程学中吸取营养、获得启示。作为近年来兴起的一门交叉学科,术语知识工程学涵盖两个领域:一是术语学在人工智能应用中的角色作用;二是在术语学应用领域和术语管理中知识的组成部分。术语知识工程学是术语学和知识工程学的结合,而语言工程学和计算语言学则是该学科的重要基础。应用信息技术,术语知识工程学将传统的术语库与知识库结合起来,可使之成为一种术语知识库(Terminological Knowledge Base, TKB)[9]。
冯志伟先生通过介绍计算术语学这一新学科,讨论了术语发现、术语充实、术语受控标引、术语自由标引等问题,对于我们设计构建多语种国防缩略术语查询系统具有重要的指导意义。我们尝试采用计算术语学的理论方法和技术,设计并实现多语种国防缩略术语查询系统。计算术语学研究的问题主要有[10]:(1)如何抽取术语以满足信息检索的需要;(2)如何抽取术语以便使用双语语料库来进行翻译;(3)如何进一步完善原有术语抽取的工作(例如,如何建立概念层级网络,如何搜索语义信息或概念信息)。
在多语种国防缩略术语查询系统的功能设计上,力求凸显其集成化、自动化和交互性的特点,采用基于在线相同使用的模式,以实现分布式、可路由、更新快等功能。
五 结 语
总之,研究多语种国防缩略术语构成的机制性和规律性问题,开发缩略术语查询系统,可为国防科技工作者和军事信息处理人员提供一种实用化的工具,为我国与世界主要国家的国防科技交流合作提供统一的缩略术语翻译标准及交换格式。以此为基础,还可研发一系列信息增值服务产品,如多语种军事信息检索系统、机器辅助翻译系统、军事语言教学系统等。
在下一步工作中,我们将多语种国防缩略术语作为一种重要的知识源,从“大资源观”和“大数据观”着眼,注重采用面向网络空间的本体工程技术对缩略术语数据资源进行挖掘研究[11],为推进国防科技信息处理共享平台建设和纵深发展贡献一份力量。
[1]韩常省.缩略语及其查找[J].科技文献信息管理,2001(3):28-31.
[2]王宗炎.回春楼谈英语[M].西安:陕西人民出版社,1983.
[3]周倩,孙颖,刘勇.关于国防科技用户信息的知识化组织问题研究[J].情报理论与实践,2011(1):51-54.
[4]国防领域首家门户网站开通[N].每周电脑报,2006-08-31.
[5]Department of Defense Dictionary of Military and Associated Terms[M].Joint Publication ,2001.
[6]金经国,魏孟宏.军事素材中的缩略语[J].解放军外国语学院学报,1995(1):30-34.
[7]黄元龙,刘宇红.试论缩略语的理据:省力原则[J].河南理工大学学报,2009(3):442-447.
[8]童毅见.也谈术语形成的经济律[J].中国科技术语,2012 (2):17-21.
[9]梁爱林.论术语知识工程学的发展[J].术语标准化与信息技术,2007(2):4-12.
[10]冯志伟.一个新兴的术语学科——计算术语学[J].术语标准化与信息技术,2008(4):4-9.
[11]Suárez Figueroa M C, Gómez Pórez A, Motta E,eds.Ontology Engineering in a Networked World[M].Berlin Heidelberg:Springer-Verlag,2012.