术语管理工具的应用
2015-05-11梁爱林
摘 要:文章依据描述派的方法,以术语数据库的构建模式为切入点,对什么是术语工具及其相关的问题做出回答,目的是探讨技术对于术语工作的影响。术语工具应用带来的启示是,技术改变了术语工作与研究的方法,在构建中文的术语库时需要充分利用国内外的术语工具,并研发自己的术语管理工具。
关键词:术语管理工具,术语库,术语抽取
中图分类号:H083;N04 文献标识码:A 文章编号:1673-8578(2015)02-0027-05
Application of the Terminology Management Tools
LIANG Ailin
Abstract: Based on the descriptive approach, the paper discusses the models of establishing the term data bank as a starting point and then deals with questions like what is terminology tool and other related problems with effects of technology on terminology work. The implication is that technology changed the ways and means of terminology work and research. When establishing the Chinese term database, terminologists need to make full use of the terminology tools, including the research and the development of Chinese unique terminology management tools.
Keywords: terminology management tools, term bank, terminology extraction
来稿日期:2014-01-07 修回日期:2014-12-15
作者简介:梁爱林(1962—),男,惠州学院外语系英语副教授,研究方向为术语学与翻译研究。通信方式:alliang@hzu.edu.cn。
引 言
术语工具的应用关系到术语学研究、术语翻译与术语管理工作的质量和成效,关系到一个国家与组织的术语基础设施的建设,例如术语数据库的构建。在大数据时代多语术语库的构建需要术语工作者能够知晓并且善用各种术语工具,包括术语数据的管理工具。术语工作的工具一般分为文献查询工具、术语抽取工具、术语研究工具、术语记录工具、术语电子出版工具、数据库管理工具、语料查询工具等[1]。本文的分析重点是术语管理工具和术语抽取工具两个类别。
一 术语管理工具分析
1.术语管理工具
术语管理工具(terminology management tools,TMTs)是用于管理语言或者术语数据的计算机软件程序,用工具管理意味着对术语的数据进行记录、处理、存储、使用与服务并且发挥术语数据在科技写作、翻译、本土化、内容管理和术语工作等领域中的应用,或者说,软件应用程序之类的工具能够以词典的方式对术语资源进行存储与解码。图1说明术语管理工具在本土化内容管理中的作用。
图1 术语管理工具的作用
术语管理软件能够手工输入查询术语,直接查找文本中的术语,直接从文本中输入新术语,在数据库中对现有的术语进行编辑,在线(外部的用户通过与服务器连接的工作站或者直接登录网页界面)或者离线进入术语电子文档(从一个局部工作站),能够与授权的用户一道分享术语资源。
术语管理工具既可以基于概念派的方法也可以依据于术语词义派的方法,应该既能够处理单语的术语资源也可以处理多语的资源或者特定的语言,当今多语的术语资源是主流。管理工具的差异性主要体现在数据结构与数据模拟的方式方法上。术语管理工具能够具备多种不同的功能,例如术语查询、过滤、处理、输入输出及数据库构建与服务。
2.术语管理工具的类型
术语管理工具可以是独立的术语管理系统,比如SDL MultiTerm,可独立于翻译记忆工具使用;也可以是翻译记忆软件的组成部分,如英国的SDL TermBase和瑞士的TermStar。另外,一些术语管理工具既能够作为独立的解决方案也可以作为多用户的系统,但是多数的术语管理工具都已融入了计算机的翻译环境中,与翻译记忆软件工具、对齐工具、编辑工具、文字处理软件,或者术语抽取工具等,整合为一体,实现了一体化的管理系统。实践上,翻译记忆软件经常作为术语管理系统应用,翻译记忆软件与术语数据库的差异在于前者涵盖完整的翻译单位,如句子、标题、字符串等,而后者则只能包括术语的单位,如独词术语、复合术语或者短语单位。有些工具,如Déjà Vu X,它只是翻译记忆软件的组成部分,不能作为独立系统使用的术语管理工具。了解不同类型与功能的术语管理工具,对于术语工作的开展十分重要。
在线术语管理是当今的发展趋势,基于网络的术语管理工具会采用云计算模式,它可以让世界各地的术语工作者、翻译工作者和各类专家同时间在一个术语数据库中工作。
术语抽取工具可用于术语的汇编或者是建立术语集,它从语料或者特定的文本中抽取备用或者备选的术语,而后建立术语的清单。术语抽取工具用于翻译流程的准备阶段或者用于新学科领域的术语库研发。术语抽取可以单语也可以双语,双语的术语抽取在平行的文本中进行[2]。部分术语抽取工作涉及在文本语料中确认概念及其所指,包括概念的相关信息(定义、语境等),包括关于术语具体用法的信息,包括术语辨识(辨认新术语或者已有的术语)和术语抽取(挑选术语作为备用术语)。术语抽取是获得某个特定专业领域及其专业语言的最佳方式,一般在用工具抽取了备用术语之后,还要依靠专家人工决定抽取的结果是否合适。自动抽取术语的途径分为语言和统计的方法,还有统计加语言的混合法。endprint
3.术语数据库的结构
术语数据库的建设一般是基于概念派的模式或者是基于术语词义派的模式。好的软件应该考虑下列特征:即有语言设计和图像等多媒体设计,用户友好,有教学辅导和帮助功能,有网络化的互联互通能力,有数据输入与输出的功能等。构建术语库时需要定义数据库中结构层面的依附关系:即宏观结构、微观结构和数据类型的内在结构关系,如图2所示。
(1)宏观模式中的结构与方法。首先确认目标群体及其需求,因为它关乎术语库是否能够满足用户的需求,然后再依据两种模式来创建术语库。基于概念而非词形或者说以概念为导向的方法是:一个概念一个条目,一个条目一个概念;而基于术语的词义派或者以术语为导向的方法则是:一个条目有若干个概念,即一个词条下可有多个意义,它是词典和百科全书通用的词义派的组织方法。
概念派模式一般用于翻译目的的术语库,译者查询术语以找到该术语在特定语境中准确的概念意义,目的是在目标语中确定对等的术语。然而,译者在查询术语时,一般会习惯于词义派的方法,即以词形作为切入点得其意,然后找到目标语的对等术语。实际上,基于术语的模式是在术语库的设计中先遵循概念系统,按照术语专家所用的方法,然后才是词义派的方式。概念派方法只是比词义派的方法更加注重宏观的结构与系统。
(2)微观模式中的结构。主要是包含术语属性方面的信息,或者说是对术语条目的信息再分类。它会根据术语库的类型而不同,比如单语、双语还是多语;会根据用户群体而不同,如面向翻译还是面向领域专家或者面向术语工作者,术语信息与何种组别的人相关,又为哪类人使用,这些都会影响微观结构。另外,每个类别的信息是否用一种单独的数据类别表示,数据类别与数目包括哪些术语条目信息、语法信息、管理信息和概念信息,也至关重要。
微观结构工具可以大致分为表述层次、概念层次和客体层次,如图3所示。
(3)数据类别的内在结构。在结构合理的数据库中,数据类别中的各条目都应该有其固定的结构与位置。为了确定数据类别的内在结构,术语管理工具会提供称之为“条目领域的模型”或者“输入模型”之类的模板,以便控制数据输入并确保数据在数据库中的协调一致。这类模板会预先设定条目领域的标准值 (如在词性域中可以根据词性分出次类别,英语名词用N表示, 动词用V, 形容词用A) 及其状态的说明(如信息是否为必备的还是可选的)。根据领域类型及其内容,领域有不同的格式与设计,如文本、语境、选择单(pick list)等。它还可以决定条目中信息应该出现的次序与频率。定义数据类别时应该注意一致性,即所有的数据元素都应该与数据类别的定义一致。
4.术语数据库的内容与术语库的维护
术语库的内容需要考虑方法模式和目标用户群体。在概念派的数据库中,所有的术语信息都属于一个概念,即以概念为核心,所有语言在同一概念下的所有的术语都用一个条目存储,例如:属于概念“个人用计算机(personal computer)”下的全部术语信息,包括术语缩写的“PC”和“微计算机(microcomputer)”,这些术语的变体形式都应在一个概念条目中存储。而描述同形异义术语的信息,如老鼠“mouse”(生物学)和鼠标“mouse”(信息技术)必须以两个条目存储,因为它们是两个不同的概念。术语独立的原则说明:一个概念下的所有术语都应该作为数据类别的独立板块得以存储,这样所有的术语才能够以必要的数据类型方式描述。
术语数据的输入是指一个术语库中的术语数据向另一个术语库迁移。所有的术语管理工具都内含输入与输出的功能,都容许在一个预先设定的格式中能够快速有效地检索数据,同时也提供了给不同的数据类别界定标记的可能。
术语库的维护任务包括:现有或者已有术语数据的添加、删除、修改与更新。维护工作需要根据所要修改的数据类型,有些任务可做,有些则不可以,例如人们可以添加文字,但是不能删除文字;可以添加领域,即在条目结构中添加新的领域,但是不能改变领域,特别是现有的学科领域。术语库维护可以确保无重复的术语,确保条目的完整,同时消除不一致或者冗余的条目。它是确保术语信息存储的协调一致并且保持不断的更新。
5.不同术语管理工具之间的术语交换
术语库交换(TermBase eXchange,TBX)格式能够确保不同的术语管理工具之间的术语交换。TBX是一种开放式的基于 XML的标准格式,主要用于术语数据的交换[3]。具体来说,它是机读术语交换格式(MARTIF)的子集,也是作为统一的数据类型集,即术语条目的统一结构和术语信息统一的编码标准。术语交换的意义在于促进术语信息流动,例如在组织机构内外,在组织之间与外部的服务提供商之间,可以让公众获取、使用与分享术语,促使术语数据更好地整合到现有的术语资源中。
为了确保术语信息的顺畅交流,数据类别的兼容性选择、应用上的一致性以及对条目格式创新构建的可能,均十分重要。图4是欧洲术语网的数据结构与交换的格式[4]:
二 基于网络的术语管理工具和基于云计算系统的术语服务新模式
1.基于网络的术语管理工具——以Termweb术语网为例
Termweb术语网特征是一体化的术语管理[5]。该术语网的功能是把术语管理整合到现有的公司流程中,它带有SDL/Trados,能够与Translators Workbench、 Microsoft Office、 Adobe In Design和 QuarkXPress 以及客户的网页组件和许多出版的系统兼容。其一体化的功能能够让译者和内容创建者,包括产品文本的作者及版权人员,随时直接进入到术语库中,用户也可以选择术语网的词典或者术语部分,开展工作。当用户想与SDL/Trados Translators Workbench 同步工作时,若是输入了错误的术语,TermWeb 能够发出通知并且提出一个较为一致的术语或者建议用的术语。术语用错的话,TermWeb会发出通知,告知或者建议使用规范的术语。endprint
具体来看,该网的特征是:用户管理的功能操作更便捷;词典管理功能简便实用;信息的追溯能力强,即每条术语都有历史记录,具有概念和词典的回查功能;能够适用于公司企业;数据领域不限;灵活应变;语种不限;直接与国际上主要的翻译记忆软件系统相连接,例如 SDL/Trados Translators Workbench;支持主要的出版系统;它有概念关系的创建与图示功能;有定义查询,输入与输出功能;具有标准的兼容性;还具有打印功能 (PDF文档打印,直接与打印机连接);采用TermBase eXchange 术语库交换格式,TBX 可促进信息的交换;术语库中带有不同的数据模型,TBX文档可以在包含术语库的大多数软件包中完成数据的输入与输出工作。
TermWeb 是一个基于网络的术语管理系统。任何一个组织的所有成员,无论在何地,都可以通过互联网的浏览器或者公司自己的内联网或者局域网获得公司的术语集与特定行业的术语集。任何人都可以在一个集中的数据库中获得更新的术语集与综合的词汇,目的是确保术语集的准确性和一致性。
TermWeb 还是一个独立的平台,能够让授权的用户创建自己的术语集或者词典。任何用户,只要发现了新术语,都可以提交到现有的术语集,即数据库中。除去术语的定义之外,每个条目术语的意义和用法都配有多媒体的文档(有声音和图像)。新术语经过审核认定后,其他授权的用户也可以获取、公开、出版或者宣传新的术语。
2.基于云计算系统的术语服务——以欧洲的TaaS术语项目为例
欧洲的TaaS(terminology as a service)术语作为服务项目能够提供基于云计算系统的术语服务[6]。它可以从用户的文本中自动抽取单语的备用术语;自动识别现有术语资源中的对等的翻译;从网页数据中自动获取对等的翻译;术语工具可以整理已获得的术语集,可以在用户的应用程序中促进术语的分享,完成术语的使用与循环使用。TaaS术语服务项目兼容性强,能够与现有的国际术语网互联互通,如与IATE(互动术语库),与ETB(欧洲术语库),与TAUS和其他行业的术语数据库,包括万维网,一道在线分享外部的术语资源。
三 结 语
术语学研究一直是技术的支持者和受益者,特别是信息技术。技术改变了术语学的研究方法和术语工作的方法,改变了我们的术语观,还改变了我们看待术语工作的目标,包括服务的术语用户。我们在构建中文的术语数据库时,一方面需要善用国内外的术语工具,另一方面通过研发自己的术语管理工具,提高术语管理工作的水平与效率,用术语管理工具满足用户对术语资源的需求。新技术会继续给术语工作、术语理论和术语工具带来变化,技术与术语理论和术语工作之间的关系是相互促进、相互影响、互惠互利。术语管理工具带给我们的启示还包括在术语教学中应充分体现术语工具的技术价值,并且要在教学中强化术语管理工具的作用。
参考文献
[1] Pavel,Silvia,Nolet,etc. Handbook of Terminology[M].Canada: The Translation Bureau of Canada,2002:61-84.
[2] TRADOS Term Extract[DB/OL].[2014-01-05]. http://www.translationzone.com/product.asp?ID=100.
[3] TBX Standard[DB/OL].[2014-01-05]. http://www.lisa.org/standards/tbx.
[4] Rirdance, Signe, Andrejs Vasiljevs.Towards Consolidation of European Terminology Resources: Experience and Recommendations from Euro TermBank Project[M]. Riga:Tilde, 2006:96.
[5] Termweb[DB/OL].[2014-01-05]. http://termwebdemo.termweb.se/termweb/app.
[6] Terminology as a Service[DB/OL].[2014-01-05].http://www.termnet.org/english/about_us/news_archive.php?we_objectID=958.endprint