APP下载

中国高铁“出海”术语库建设与应用

2022-07-08单宇曹悦琪汪韵

中国科技术语 2022年3期
关键词:出海

单宇 曹悦琪 汪韵

摘 要:术语规范及相关标准国际化成为中国高铁“出海”的重要基础。文章以概念系统为切入点,阐述了多语种高铁术语库建设的内容与方法,包括术语的收集、提取、翻译与审核,术语库的创建、维护与管理等。术语库建设完成后,可应用于高铁相关翻译实践、高铁术语词典编纂与BTI、MTI翻译教学等领域,促进术语标准化建设,完善术语规范与统一。开展中国高铁术语库建设具有重要现实意义,有利于中国高铁产品、技术和服务真正“走出去”,打造中国高铁国际竞争话语权,彰显中国智造和文化自信,提高中国国际影响力。

关键词:中国高铁;术语库建设与应用;高铁术语;高铁术语库

中图分类号:H083;H059  文献标识码:A  DOI:10.12339/j.issn.1673-8578.2022.03.012

Construction and Application of China’s High-speed Rail “Going Global” Termbase//SHAN Yu, CAO Yueqi, WANG Yun

Abstract:Standardization of terms and internationalization of relevant standards have become an important foundation for China’s high-speed railway “going global”. This paper expounds the contents and methods of the construction of multilingual high-speed railway termbase from the perspective of conceptual system, including term collection, extraction, translation and review, termbase construction, maintenance and management. The termbase completed could be applied to the various fields such as translation practice related to high-speed railway, compilation of high-speed railway term dictionary and teaching of BTI and MTI. The termbase can promote the standardization, specification and unification of terms, and will be conducive to the enhancement of China’s high-speed rail’s international competition advantages, enabling China’s high-speed rail products, technologies and services to “go global” indeed, which demonstrates China’s intelligent manufacturing and cultural confidence and improves China’s international influence.

Keywords: China’s high-speed rail; construction and application of termbase; high-speed rail related terms; high-speed rail termbase

收稿日期:2021-10-07  修回日期:2022-04-14

基金項目:2019年教育部人文社会科学研究规划基金项目(19YJA880004);2020年度湖南省哲学社会科学基金重点项目(20ZDB032);2020年国家社会科学基金重大项目(20&ZD312);2021年湖南省研究生科研创新一般项目(CX20210139)

引言

从“制造”到“智造”,从“输血”到“造血”,从“引进来”到“走出去”,中国高铁实现了由引进、消化、吸收到自主创新发展的飞跃。放眼国际,中国铁路已经在美洲、非洲、亚洲、中东等地区落地生根,推进包括术语规范在内的高铁相关标准国际化,加速“中国标准”的世界化,是中国高铁“出海”的重要基础。

1 研究背景

国外多语种术语库的建设历史悠久,如德国国防部投入开发的LEXIS术语库(LEXIS Terminological Data-bank)、欧洲共同体委员会术语库(Eurodicautom)、西门子公司投入建设的多语种术语库 TEAM 、联合国术语库UNTERM(The United Nations Terminology Database)、欧盟 IATE 互动型术语库(Inter Active Terminology for Europe)、加拿大政府术语数据库TERMIUM等。

1989 年以来,国内多个机构陆续建立不同类型的专业术语库。经过多年的发展,国内重要的多语种术语库有中国特色话语对外翻译标准化术语库、中国关键词、中国核心词汇等。相比而言,国内术语库建设从语种和规模上来看都不甚完善,大多仅包括汉英两种语言,且所涉领域较为单一。

2 术语及概念系统

术语学探讨的概念是同某一知识领域所研究的客体相对应的,因而有其内在的系统性。在一个知识领域中,概念用定义描述,被赋予约定的指称即术语。概念体系反映相应的知识体系。

概念系统的研究是术语工作不可缺少的一个环节,它可以揭示专业领域内各个概念之间的结构关系,因而为系统研究高铁专业的术语提供了条件。例如,通过研究高铁相关术语所表达的全部概念,可帮助研究者核查所收录术语有无重大遗漏;通过透彻理解概念系统中各个概念之间的各种关系,可构成新的术语;通过研究汉、英、西、法不同语言之间的概念系统是否协调一致,可发现这些语言中相应的术语是否等价。根据概念系统编纂而成的词典有很强的系统性,将其应用于术语系统,便于进行联机检索,利于术语含义的理解,颇助于术语工作者的培训和术语教学。

3 中国高铁术语库建设

3.1 总体目标

高铁术语本体库是以中国高铁概念系统为基础,建设以汉语术语为核心,英语、法语、西班牙语对应术语为映射,涵盖术语知识各类相关条目的集合。多语种高铁术语库构建的基本思路是:收集高铁相关权威资料,建成高铁语料库,从语料库中提取核心术语,根据高铁概念系统扩展术语的相关知识条目,如定义、例句、属性关系等。

3.2 建库原则

目的性。根据用户对术语库功能和数据的需求,充分考虑社会效益和经济效益,开发术语库,避免盲目追求系统的大规模、高技术和多功能。

科学性。深入研究术语库开发中涉及的各种学科的理论与技术,在科学的基础上建设术语库。

可扩充性。根据新的需求,对术语库的数据、软件与硬件等进行扩充。

3.3 术语提取

术语来源为国家铁路局发布的铁路工程施工安全系列技术规范等14项工程建设标准英文译本。选择Sketch Engine工具对所得语料进行术语提取。Sketch Engine作为一种在线语料库索引工具,用于描述总结词汇的语法知识,如關键词与词语搭配的使用频率、显著性,相关例句以及语法关系,同义词辨析等功能。生成词目表(lemma list)可从候选术语中选取有效术语,根据关键值(keyness)生成的词表可过滤功能词,Sketch Engine的“Word sketch”功能可以识别词的搭配和语法行为,其中“Extract keywords and terms”功能可以通过N连词(n-gram)精确索引。

在术语条目存储格式方面,录入建库后,为了保证后期能够将多语种词目及对应关系顺利导入本体知识库,所有词目均以xls格式存储,方便使用OWL语言进行批量导入。

3.4 术语库建设

3.4.1 建设工具

为方便后期转向本体库建设,选择Protégé作为术语库工具。Protégé是目前主流的开源本体构建工具,也是语义网中本体构建的核心开发工具,由斯坦福大学医学院生物信息研究中心基于Java语言开发,支持  DAML+OIL、OWL、XML、RDF(S)等多种本体描述语言,可实现类的建模、实例编辑、模型处理以及模型转换等功能。

3.4.2 术语库结构

本研究将高铁术语库设计为包含6大类以及31个子类的领域本体,具体分为工务工程(桥梁工程、站场工程、路基工程、轨道工程、隧道工程),牵引供电(供电系统、变电系统、接触网系统、电力系统、远程监控系统),通信信号(地面子系统、联锁子系统、调度集中控制系统、车载子系统、通信系统),动车组(列车网络系统、制动系统、总成、牵引系统、车体、转向架),运营调度(供电管理、客运调度、综合维修、车辆管理、运行管理、运输计划),和客运服务(客运组织管理、市场营销策划、旅客服务系统、票务系统)。使用Protégé创建类(Class)并构建类之间的关系(Description)所得可视化本体结构如图1所示。

3.4.3 属性结构

根据Protégé工具的功能模块,研究将术语条目分为三类来存储:对象属性(Object properties)、数据属性(Data properties)和注解(Annotations)。其中对象属性定义实体对象之间的关系,包括“isKindOf”“isPartOf”“isCharacterizedWith”“isPrototypeOf”“isEquippedWith”“isAssignedTo”等;数据属性定义实体本身的属性,除Protégé自带的30余种数据类型外,自定义“Type”“Standard length”“Quantity”“Material”“Cycle”“Apply to”等;注解条目包括词法信息(lexical information)、变体信息(term variations)、概念信息(conceptual information)、管理信息(administrative information),注解条目结构如图2所示。

3.4.4 实例录入

将术语作为实例录入术语库中,术语相关信息包括对象属性、数据属性和注解。由于语料库产生的本体知识数据规模十分庞大,手工构建方法显然效率太低,Protégé内置的Cellfie模块可以实现半自动化导入数据信息,用户需使用MappingMaster[1]领域特定语言(DSL)自行编写转换规则[2],它可以定义从Excel工作表内容到OWL本体的映射。正确规范编写的转换规则可以实现创建类、定义类之间的关系、添加实体、定义实体属性等批量操作,显著提高导入效率,同时减少手工输入的错漏情况。

引用Excel工作表的单元格内容以字符“@”为前缀,字母表示列,数字表示行。工作表左上角的单元格为A1,其余依次向纵横方向扩展,字符“*”指定一行或一列,如“@B*”表示引用第二列的单元格内容,“@3*”表示引用第三行的单元格内容。

声明类与类之间的关系和实体及其属性时,可以使用<CLASS> <INDIVIDUAL><ANNOTATIONS><TYPES><FACTS><SAME_AS>等语句,编写转换规则时可以限定需声明单元格范围,转换规则声明界面示意如图3所示。应用转换规则批量导入术语后的注解条目如图4所示。

在“Individual”模块点击术语“pantograph”,“Description”显示术语所属类别以及对应的中文(受电弓)、西班牙语(pantógrafo)和法语(pantographe)术语,“Annotation”模块显示术语的语种、词性、定义、例句等信息。应用转换规则批量导入后术语的对象属性如图5所示。

“Property assertions”模块显示术语“sleeper”的对象属性(Object property assertions)和数据属性(Data property assertions)。如图5所示,其对象属性显示“sleeper”应具有必要的“soundness”(坚固性)、“elasticity”(弹性)和“durability”(耐久性),数据属性显示“sleeper”的常用材料、单位长度铺设数量和标准长度。

3.5 术语库实例

经以上各步骤建设完成的中国高铁“出海”术语库数据集,基本描述信息如表1。

4 结语

中国高铁“出海”有利于建构连接丝绸之路经济带的交通运输网络(欧亚、中亚、泛亚、中俄美加),促进中国“一带一路”倡议构想的早日实现。高铁“出海”应是产品、技术和服务三个层面全面“走出去”,语言先行,高铁项目的招标、谈判、修建及运营,都离不开明晰、准确、融洽的沟通,实现多语种术语的规范与统一,培养优秀的专业化语言服务人才是“走出去”战略实施过程的一个重要环节。

中国高铁“出海”术语库建设完成后,可应用于多个领域。在高铁相关翻译实践方面,将高铁术语库与计算机辅助翻译技术工具相结合,利用软件的翻译记忆和计算机匹配技术,既可以提高翻译效率,又可提高翻译的准确性和一致性。

在高铁语言相关教学方面,高铁语料库可提供有效资源。高鐵多语语料库包含汉语、英语、法语、西班牙语,其中收录具有代表性的期刊论文和新闻等正规语料,可供查询语言特征、检验语言设想、统计词频或进行纵横对比分析等。

在高铁术语词典编纂方面,由于术语库内容丰富,可实时更新,利用动态术语库编纂词典可以反映语言的真实变化,还可大大缩短编纂周期。

中国高铁“出海”术语库既可成为术语标准化建设的有机组成,也可成为中国高铁参与国际经济竞争的战略武器。加快术语的规范与统一,进一步推进中国高铁术语库建设,将促成中国高铁的产品、技术与服务真正地“走出去”,提升中国国际影响力。

参考文献

[1] MappingMasterDSL[EB/OL]. (2020-10-29) [2021-04-13]. https://github.com/protegeproject/mapping-master/wiki/MappingMasterDSL.

[2] Transformation Rule Language[EB/OL]. (2020-03-07)[2021-04-13]. https://github.com/protegeproject/mapping-master/wiki/Transformation-Rule-Language.

作者简介:单宇(1977—),女,博士,中南大学外国语学院教授。主要研究方向为科技翻译、语料库翻译学、语言教学、翻译史。先后主持教育部人文社会科学研究规划基金项目,湖南省哲学社会科学基金项目,参与国家社会科学基金重大项目。公开发表学术论文35篇,出版学术专著3部、译著2部、教材5部。通信方式:yushan@csu.edu.cn。

《中国科技术语》杂志社

曹悦琪(1997—),女,中南大学外国语学院硕士研究生。研究方向包括科技翻译、专用语料库、术语库等。主持中南大学中央高校基本科研业务费专项资金资助项目1项。通信方式:cao123yq@sina.com。

汪韵(1999—),女,中南大学外国语学院硕士研究生,研究方向为科技翻译。通信方式:wangyun12399@163.com。

猜你喜欢

出海
童士豪我为什么把“出海”当作自己投资生涯的重要策略
险资汹涌“出海”
高铁“出海”:梦想如何到现实