APP下载

建立多语种军事术语数据库系统的基本构想

2013-03-28张国君吴晓燕丁国瑞

中国科技术语 2013年5期
关键词:多语种数据库系统术语

张国君 吴晓燕 丁国瑞

(全军军事术语管理委员会办公室,北京 100091)

迅猛发展的世界新军事革命,正在加速推动全球军事一体化进程。多国家、多军种、多维度联合训练,一体作战,将是未来军队建设与战争的主要样式。特别是随着各国军事思想、军事技术和作战理论的花样翻新,新军事术语如潮水般涌现。作战人员迫切需要知道有关新军事术语的定义和来源是什么、外文新军事术语的汉语对应词又是什么等。传统的、滞后的军事术语规范模式已很难适应新军事革命的形势。只有通过建立多语种军事术语数据库系统,及时准确地对相关新军事术语进行描述,才能满足国家实施军事转型、开展联合训练

和作战的需求。

一 多语种军事术语数据库系统的定义

术语数据库(terminological database)即“存储术语数据的数据库”[1]。冯志伟教授在《现代术语学引论》中指出:“存储在电子计算机中启示概念和术语的自动化电子词典,叫作术语数据库(terminological data-bank)。”[2]实际上,术语数据库不同于一般意义上的电子词典,而是一个以术语概念系为基础的知识网络。在这个网络中,可以对每个词条都提供基于多维定义的全面知识介绍,用户可以通过关系数据库机制和超级链接进行多途径检索。早在1994年,徐文堪教授就提出建设《汉语大词典》语料数据库的建议。他说:“为了做好《汉语大词典》的增补和修订工作,可以在条件成熟的时候,建立一个计算机化的《汉语大词典》语料数据库,把全部正文输入计算机,并为每一个词目立一份档案,内容包括相关词目、词源、释义、说明、例证、参考文献等……并使之与全国乃至全世界的各种有关信息库、术语数据库联网。这样词典编纂或者就能跟上时代发展的步伐了。”[3]

根据《建立术语数据库的一般原则与方法》(GB/T 13725—2001),术语库可分成三级:第一级为:国家标准化术语库;第二级为:专业领域术语库;第三级为:基层术语库。如果照此划分,军事术语数据库只能算是专业领域术语库。然而,兵者,国之大事。在“国家”这个特定术语尚存的情况下,军事通常为国家行为。特别是随着现代信息技术在军事领域的广泛运用,战争形态、作战样式正在发生着根本性的变化,战略、战役、战术行动相互交织,互为作用。未来各国的军事行动很难再用战略级、战役级、战术级来区分。也就是说,军事术语数据库系统建设,不能再往下细分层次,而应该像联合作战指挥体系一样,形成以国家军事术语数据库为中心的扁平式网状结构。它的建立必须以有利于服务国家、地区或联盟国的整体军事建设,有利于打赢未来战争为目的,通过及时准确的军事术语描述,促进新技术、新思想、新理论、新战法在各国军事领域的普及与运用,确保联盟之间、军种之间在语言及语义上的畅通无阻。这就要求,军事术语数据库的建立必须具备国家一级术语库的标准。

综上所述,多语种军事术语数据库系统,即用于存储多种(国)语言的军事术语数据库,是集军事术语数据存储、规范、发布、检索、开发于一体的大型综合性信息服务网络。

二 多语种军事术语数据库系统的功能作用

早期,人们建立术语数据库的目的主要是为了方便各种专业辞书的编纂。后来,人们渐渐发现建立术语数据库的好处,不仅可以为各种辞书的编纂和修订提供方便,更重要的是有利于协调、规范和统一各种术语的使用。如欧洲共同体在研制“EURODICAUTOM术语数据库”时就明确提出,要在建立该数据库的基础上,“把欧洲共同体所使用的各种官方语言的文件中的术语协调和统一起来”[2]。再比如,瑞典技术术语中心研制“TERMDOK术语数据库”的主要目的,就是为了解决北欧斯堪的纳维亚国家比较复杂的语言给科技交流和进出口贸易带来的困难。因此,该数据库对每一条概念的表述,均采用了瑞典语、英语、法语、德语、西班牙语、挪威语、芬兰语等多种语言。事实证明,“这个术语数据库的建立,对克服北欧国家的语言障碍大有好处”[2]。

随着时代的发展,人们对术语数据库又有了新的认识和需求,尤其是在全球经济一体化带动下,世界各国政治、军事、文化日趋融合,你中有我、我中有你的格局初步形成。语言作为人与人、人与机器、机器与机器交流的基础工具,及时规范和统一各类术语,开发更为便捷的术语交流产品,显得尤为重要。每个术语库,虽然都是由数据的输入功能、储存功能和输出功能三个部分组成[4],但输出功能是无限的。只要数据系统完备,用户即可根据需求提取所需要的信息。

1.军事术语数据输入。军事术语数据输入,也称军事术语数据采集。通常包括三部分内容:即军事术语规范化处理部分、检校部分和信息处理部分。如图1:

图1 军事术语数据输入

图中左侧三个方框,分别标有L1、L2和L3,它们分别代表三种不同术语数据的馈送源。

L1,主要由军事术语工作者从各种军事文献中析取军事术语,并在必要时创造新军事术语。这是军事术语数据库的主要数据源。

L2,主要由其他术语数据库提供相关数据信息。

L3,主要由军事术语信息用户提供。如军事理论、军事技术专家,军事指挥员、战斗员,军事翻译工作者和专业语言工作者等。

军事术语规范化处理,主要是军事术语工作者依据军事术语工作规则,对每条拟录入的军事术语进行规范化处理。如:定名(译名)、定位、定义(多语定义)、配制图表等。

军事术语检校,主要分两步进行。第一步,由军事术语工作者检校每个词目的名称(译名)、位置、定义(多语定义)、配图等要素是否完整齐备;第二步,由数据库管理人员运用程序系统检校拟录入的军事术语数据是否完备、规范和准确。

军事术语信息处理,主要是由数据库管理人员用机器语言对拟录入的军事术语数据进行翻译,并按照预先设计的程序系统,对相关数据进行分类并储存在存储器内。

2.军事术语数据存储。根据术语数据库建设的一般规律,军事术语数据库在存储阶段,通常应产生三个文件,即作业文件、转移文件和主文件。如图2:

图2 军事术语数据存储

作业文件,是供军事术语工作者包括数据库管理人员随时添加或修改的文件。通常情况下,只供后台编辑使用。

转移文件,是军事术语工作者包括数据库管理人员为完备相关数据信息,在库内或库外“搬移”“调整”而形成的文件。因为,它介于作业文件和主文件之间,通常也称关联性文件。

主文件,是完全符合军事术语数据库要求,并且每一条军事术语的所有数据项已达成规格化,可以随时输出或向前台发布的文件。

3.军事术语数据输出。建立多语种军事术语数据库的目的,是满足所有用户尤其是军事领域各级各类人员对军事术语信息的需求。实践证明,用户需要从军事术语数据库中提取的信息无外乎两类:一类是局部问题答案,即针对某一个军事术语或某一组军事术语相关问题的答案。另一类是专题问题答案,即提供军事术语数据库所具有的属于任何一个领域的全部术语信息答案。如图3:

图3 军事术语数据输出

三 多语种军事术语数据库系统流程

多语种军事术语数据库系统的流程设计,应以向用户提供方便、快捷的服务为目的。基本构想是:以国家多语种军事术语数据库为中心,通过国家(军事)信息传输网和合作协议,有效整合其他相关术语数据库,建立国家级术语数据库联合体,形成结构合理、优势互补、功能齐全、面向各级各类用户的多语种军事术语数据库系统。如图4:

局部问题答案,通常由用户直接通过数据库检索、视听(语义、语音)、打印等方式获取。主要是通过视听设备浏览、听读和制作纸质版词典等。专题问题答案,通常由军事术语工作者利用现代信息技术,对数据库输出的军事术语信息进行进一步加工,向用户提供更为直观,方便用户视、听、说、读、写、译的新数据源。如电子词典、作战指令显示器、语音翻译器等。

图4 多语种军事术语数据系统运行流程

该数据库系统建成后,基本实现可供各级各类用户在网络终端浏览、提取或上传相关军事术语信息,实现对军事术语的规范化、可视化、实时化管理的目的。如图5:

图5 军事术语数据库系统管理服务流程

具体工作模式为:

首先,全军军事术语专家委员会根据国际军事理论和我军军事实践的发展,以及现实需求,依托多语种军事术语数据库系统,对新出现的军事概念进行实时收集、整理(包括汉语定名、定义,多语译名、释义等),并通过多语种军事术语数据库系统向各用户发布,广泛征求各用户(重点是相关领域专家、学者)的意见建议,进一步研究规范和完善每一条军事术语的数据信息,为形成数据库文本奠定基础。

其次,在不断完善国家多语种军事术语数据库系统的同时,全军军事术语管理委员会办公室将根据国防和军队建设、训练及作战需求,适时(1~2年)将数据库中相对成熟、稳定的军事术语数据信息输出给相关用户。输出形式主要有:纸质版军事术语词典(包括电子文本)、网络版军事术语词典和多语种电子军事术语词典,以及根据不同用户发布的纸质版、网络版军事术语集等。

第三,在完成以上两项任务的基础上,全军军事术语管理委员会办公室将紧紧围绕建设信息化军队、打赢信息化战争的目标,组织有关专家和技术人员,进一步研究开发更为便捷的军事术语信息服务产品。例如:常用作战指令多语种显示器、多语种军用语言语音同步翻译设备等。

四 多语种军事术语数据库系统建设

由于术语信息是现代社会发展必不可少的信息资源,而且建立术语数据库则为信息资源共享提供了更便捷的途径。术语数据库的研究与开发,是术语学与术语标准化工作的重要内容之一,也是术语信息管理与使用的重要手段[5]。因此,建立多语种军事术语数据库系统,既是实现军事术语管理信息化的基础工程,也是未来国家或世界军事建设和发展的大势所趋。1959年,德国国防部就已经开始研制 LEXIS术语数据库(LEXIS terminological data-bank),并于1966年投入使用。该数据库年均生产术语35 000条,存有德语、英语、法语、俄语、波兰语、荷兰语和意大利语等七种语言[2]。美国、俄罗斯、日本等国也相继启动了多语种军事术语数据库建设,并且取得了十分可观的政治、经济和军事效益。

对我国来说,建立多语种军事术语数据库已不再是难题。早在1986—1988年,中国科学院软件研究所就派遣冯志伟先生到德国夫琅和费(Fraunhofer)研究院参与“GLOT术语数据库”的研究开发工作,并首次在DEC-VAS11/750计算机上建立了世界上第一个中文术语数据库GLOT-C,从规范化和标准化的角度,为中文术语的计算机处理提供了十分宝贵的经验。在此基础上,建成了我国机械工程术语库、化工术语数据库、百科术语数据库、应用语言学术语库和科学技术术语数据库等。

根据中外术语数据库建设的经验教训,建立国家级多语种军事术语数据库,必须在具备科学性、易用性、经济性、可靠性、可扩充性和安全性的同时,还要保证其存储数据的系统性、准确性、一致性和适时性。尤其是有关术语数据项,必须做到项目齐全、分类科学、排列有序。一是主条目术语有全称,也有简称(略语);有同义术语,也有与其他语种相对应的术语;有汉语语法信息、注音,也有其他语种的相关信息和读音。二是描述概念的数据,既要有定义描述,也要有上下文语境示例,以及公式、表格、图形、声像等。三是所有概念要学科分类,既包括上位概念、下位概念,也包括广义概念、狭义概念和同位术语。四是要便于管理、检索和利用。特别是录入标志、语种代码、生成日期、修订日期、责任代码、学科(专业)代码等要齐备完整。五是表示文献的数据要符合国家及国际标准,如文献信息代码要标明著者、题目、出版日期、出版机构、出版物的卷号和期号、标准号、术语信息在文献中的页码等。

鉴于多语种军事术语数据库的功能、作用和发展趋势,要求该数据库的计算机系统必须具有较强的文字处理能力和支持处理多种语言和图形、符号、公式的功能。其硬件最好选择先进的国家型谱系列计算机,同时还要考虑到与外围设施的兼容性和可维修性。其软件不仅要做到完整、配套,形成系统(包括系统软件、汉字支持软件、数据库管理软件、通信控制软件和其他应用软件),而且还应具有较高的可移植性、较强的环境适应能力和数据管理功能,以便数据库管理人员能够方便地存取、检索、补充、修改、删除相关数据。同时,该计算机系统还应当具备强大的网络通信能力,能够向其他应用或者用户开放网络接口,使之成为面向全军的军事术语服务网络的一部分,进而成为提高我军信息化作战能力的“倍增器”。

[1]全国术语标准化技术委员会.GB/T 13725—2001建立术语数据库的一般原则与方法[S].北京:中国标准出版社,2004.

[2]冯志伟.现代术语学引论[M].北京:商务印书馆,2011:244,248,252,255.

[3]徐文堪.略论汉语大词典的特点与学术价值[J],辞书研究,1994(3):44-47.

[4]隆多 G.术语学概论[M].北京:科学出版社,1985:138.

[5]刘青.中国术语学研究与探索[M].北京:商务印书馆,2010:538.

猜你喜欢

多语种数据库系统术语
语联世界,言通天下
数据库系统shell脚本应用
多语种《中级军事汉语》教材的编写思路与指导思想
微细铣削工艺数据库系统设计与开发
实时数据库系统数据安全采集方案
核反应堆材料数据库系统及其应用
北美“新清史”研究的基石何在——是多语种史料考辨互证的实证学术还是意识形态化的应时之学?(上)
从英语硕士到法国博士——我的留学规划和多语种学习之路