术语资源的质量评估
2016-05-30梁爱林
梁爱林
摘要 术语资源的质量关系到术语管理的成败。术语资源的质量评价研究涉及什么是术语资源以及依据何种标准评价术语资源的组成要素等问题。文章采用术语学描述派的方法,试图从术语、术语数据、术语条目、术语数据库和术语服务等方面来概述术语资源质量评估的要素与指标,目标是建立一个定量与定性分析相结合的科学的术语资源质量评估体系。
关键词 术语资源 质量评估 术语数据 术语数据库
一、 引 言
在信息社会,信息是决定社会发展的重要资源,术語的数量也伴随着网络信息量的不断增加而与日俱增。信息资源,包括信息科学,都不能缺少术语,术语信息是所有规范活动的重要组成部分,例如技术标准化,质量管理和知识产权的条例[1]。任何新技术的发展同样也离不开术语这样的专业性工具,术语作为一种特殊的智慧产品已经被广泛地应用于科学技术和日常生活之中。如果我们把术语资源视为智慧产品的话,就要考虑这种产品的质量、信度、效度及其特殊的属性。术语资源的质量关系到术语管理工作和术语管理系统的成效,而对术语资源的评价自然会涉及诸多的问题: 首先术语资源是什么?评估术语资源包括术语、术语条目、术语数据、术语数据库这类术语产品及术语服务的内容吗?仅评价术语的质量就会遇到是评价单个的术语还是某一个学科或者多个学科领域的术语集的问题。要回答这些问题,不是那么简单,因为组成术语资源的各个要素之间既相互关联又有差异,而且还会涉及“标准”的问题,是依据国家标准还是国际标准?以何种方式评价?评价中文术语的质量自然是依据我国自己的标准,若是要评价术语数据和术语数据库的质量,则需要遵循国际标准,不然术语库中的数据不能达到互联互通、资源共享的目标。可见术语资源的质量评价研究关系到术语库的建设,它影响着术语管理工作的质量与效果,也影响着一个国家的术语规划与术语战略。
由于现阶段人们对术语评价所引发的种种问题还认识不足或者说本身就对这类问题认识含糊,例如一提到术语资源的评价便会认为只是评价“术语”的质量而非其他要素,结果导致对这一问题的研究缺乏系统性。国内的术语学文献对术语资源评价问题的研究迄今还没有给予充分的关注。国外的术语学者如西哥妮·瑞德内斯和安德烈斯·瓦西列维奇(Rirdance & Vasiljievs 2006: 83—86)依据欧洲术语库项目的经验与做法,提出了术语资源评价的标准与架构,但是没有具体描述组成术语资源各个要素的质量评价。ISO标准23185: 2009描述了有效使用术语数据的基本概念和术语数据的功能,虽然罗列了评价术语资源的标准,但主要是从资源使用性方面,即术语数据、数据输入、数据输出和数据管理四个要件给用户评价术语资源提供指引帮助。在大数据的背景中,我们的术语工作者如何创建适合于中文术语资源的评估体系,是一个有待解决的问题。本文采用术语学描述派的方法,试图从术语、术语数据、术语条目、术语数据库和术语服务等方面,系统地阐述术语资源质量评估的要素与指标,目标是建立一个量化与定性相结合的科学的术语质量评估体系。
二、 术语资源质量评估
1. 术语资源的定义
根据ISO标准23185: 2009的定义:“术语资源一般包括结构化的(例如术语数据库)术语数据,用置标语言(例如一种XML数据文档)标识或者与一种结构化的设计(例如一种词典)相关。术语资源可以包括甚至是普通的文本(例如有不同的语言风格的文本),借助现代的内容处理技术,可以从文本中抽取能够应用的术语数据。”[2]一般来说,术语资源是通过专业的术语活动创建的,术语资源中的术语数据组织有序、呈结构化,质量高并且完全具备可用性的特征,而通过其他程序或活动而创建的术语资源,其质量与可用性,则往往难以预测。简单来说,术语资源是由涵盖一个或者多个专业领域的单语、双语或者多语的术语记录所组成的。术语记录是关于概念、术语的数据以及管理术语所需的一些数据。英文术语(terminology)本身就有“概念和术语集”之义,因此与每一个概念相关的信息都应以一条术语记录的方式构建,术语记录可以是纸质格式的,比如用词典、词表存储与管理;也可以是电子格式的,比如用术语数据库方式存储与管理。“数据的主要记录形式即是术语记录(terminology record)。挑选的数据与所呈现的数据,其最低限度要求是应告知用户有关概念的专业领域、描述概念所用的语言、每种语言中指称这一概念的术语、概念的定义(或任何其他类型的文本支持)以及记录信息的来源。”(Pavel & Nolet 2002: 9)记录由领域(fields)组成,每个领域均包括一个特定类型的数据(或数据元素)。领域会包括一个条目术语(entry term)、语法参数、原创者代码等。术语库及网络的发展已经使术语记录演变为电子文档格式,现今术语资源的呈现形式以计算机化的术语库为主,它为人们在线使用或者内容管理提供便利,而纸质的术语产品已基本被电子产品所取代。术语资源中的术语记录可以是术语、术语集、术语数据、术语数据库或涉及术语服务的内容。究竟需要多少个单语、双语或者多语专业领域的术语记录才能构成术语资源?目前没有定论,也没有对构成完整的术语资源所需的最低数目的术语记录以及一种语言或者多语中术语记录的最低数目有明文的硬性规定。若是对低于50条概念的术语记录进行管理的话,是没有必要建立术语数据库的。以下是有关记录的基本数据元素的示例,这个示例来自Pavel & Nolet《术语手册》关于英法双语“术语记录”的条目。(参见2001: 11的原图5b)
以下是对《术语手册》第10页5a图记录的基本数据元素的描述,可以帮助读者了解上文的条目。在比较术语学中,一条记录包括至少两种语言的模块,每一个模块都包括相同系列的领域,与重要的数据元素一一对应,即
元素1: 主专业领域,应用的领域
元素2: 语种标识
元素3: 主条目+来源+使用参数(见5b表)主条目是推荐用的术语、表达法或者正式的名称,在语言模块的若干条目中最先输入。
元素4: 主条目的缩略形式+来源+使用参数
元素5: 次属条目+来源+使用参数 次条目术语是不同于主条目的术语、表达法或者正式的名称,但是它们均指称相同的概念或者事物。可能在使用(频率,语言层面等)方面与主条目有差异,用参数(标记)表示,也可能在拼写(包括句子变体)方面有差异。
元素6: 次属条目的缩略形式+来源+参数
元素7: 文本支持标识+文本支持+来源 文本支持的主要类型即是定义(用DEF标识),语境的解释说明(CONT),用法示例(EX),补充性的术语管理或者技术方面的信息(OBS),及短語(PHR)。
元素8: 来源
元素9: 原创者
元素10: 记录创建日期
元素11: 修订者
换言之,术语记录即是对所收集的信息进行分析、过滤、结构化及浓缩提炼的过程与结果(Pavel & Nolet 2002: xix)。
2. 术语记录的原则
在定义术语资源时,我们已经描述了术语记录的概念,随之而来的问题是: 什么是术语记录的原则?术语记录的原则是一个概念一条记录,一条记录一个术语。如果术语指称的概念不止一个的话,那么每一个概念都应该独自设立一条记录,这是术语学的概念派方法所决定的,也是与词典学的词义派方法的不同之处,鉴于术语资源的评价涉及术语学的方法论与术语管理的质量问题,作者会另撰文论述。术语资源一般都是基于概念的资源,以术语数据库的形式呈现,因此,每一个术语都应该设立自己的记录,属于一个术语所有的同义术语和术语变体也应该归入到这个单一的条目术语之下加以记录,包括术语的出处、用法与状态等信息[3]。例如,英文术语“生物多样性”的记录可以是:
术语: biodiversity
状态: 推荐使用
同义术语: ——
术语变体: biological diversity
biodiversity
术语资源中的信息应该以结构化的术语记录方式呈现,无论术语集是以数据库的方式抑或是传统的纸质方式存储,都应该能够很容易地融入到术语数据库中,前提是遵照术语记录的国际标准化数据格式。术语记录的标准关系到术语资源诸要素的质量,特别是术语条目内容。我们会在下文中专门描述术语条目应该包括的基本项目。
辩证科学地看待术语记录中的条目非常重要。一般来说,术语记录包含的数据越多,数据库的信息价值就越大,应用也就越广泛,但是问题也会随之而来。随着数据类型的增加,术语记录会变得更为复杂,管理与维护数据库所花费的时间也越多。另外,数据过多、五花八门,会使得数据库的查询以及对术语工作者的培训更加困难。术语数据的属性与数量还应该与术语库的类型,如翻译为导向的术语库、描述性的信息数据库或者是规定性的标准信息,以及用户的需要相一致,比如,术语的语法信息对教师与学生有好处,但是对专业的翻译人员来说则意义不大,因为他们已了解这类语法信息。在面向翻译人员的术语数据库中若是包含术语的语法信息,则会是多余的。对于译者来说,记录中即使只有一个术语,若是包括了该术语的对等翻译与来源,就具有价值。而对于普通用户来说,他们需要更多的可信度高的信息,特别是有关专业领域的信息。为了应对各种复杂的情况,国际标准化组织已经公布了40个国际术语标准(包括更新),另有一些标准在制订中,这些标准中有专门的术语数据和术语数据类别的国际标准[4]。
我们在了解术语资源和术语记录的情况之后,才能够对构成术语资源的一些要素制订质量评价标准。
3. 术语资源要素的质量评估
(1) 术语的质量评价
本文所谈的术语既包括单个的术语(term),也包括由单个术语所构成的术语集(terminology),评估术语是针对专门用途而非通用目的的语言,专业语言是指用在某个特定专业领域中的语言,有其特定的语言表述形式及特征。术语之所以不同于词就是透过专业领域中特定的语境和具体的用法来确定其准确的含义的。一般来说,评价术语质量的标准是: 1) 清晰性,指术语能够揭示概念意义并且帮助理解与认知概念,或者说术语指称的概念不用具体定义即可推测出其含义,如英文计算机术语firewall(防火墙),virus(病毒),data network identification code(数据网络标识码,缩写DNIC);2) 一致性,指术语使用的一致性与定义的准确性,它既包括新术语名称与专业领域中的名称或者命名的一致,也包括术语翻译的一致。一致性是由术语概念的单一性原则所决定的,即一个术语一个概念(避免同义术语)与一个概念一个术语(避免同音异义术语)。一致性至少应该体现为: 在一个组织或者公司中、在一个特定的产品中及在一个具体的文本文件中能够保持术语的一致性。应避免术语不一致带来的混乱问题,如英文计算机网页操作的术语“热键”有: hotkey, hot key, shortcut key, keyboard shortcut, access key, accelerator key,都指同一个概念;3) 得体性,指术语的使用能够遵守语言区与学界业已确立的意义规范,使用大家都熟知的术语,不会造成混乱或安全隐患,如医药术语和安全操作手册,使用了中性与政治正确的术语,无负面的含义;4) 简洁性,指语言上尽可能简洁与经济,例如缩略术语的使用,事实上,术语是用简洁的“符号”形式来表示其内在的概念,而定义则是以“描述”的形式来表示其概念的特征属性,两者都要简洁;5) 准确性,指术语的语言形式正确,应用也正确,新的指称符合语言的音形义规范要求,术语的构成符合规范与构词的规则;6) 词的衍生能力强,指词的衍生与合成能力强,容易组合派生出其他的术语,如复合术语和新术语。像“门”(gate)的组合,Watergate, Irangate, Zippergate等,把英文“herb”(草本植物)与“medicinal plant”(药用植物)相比,前者的衍生能力强,可派生出herbal, herbalist 等;7) 本土化,指倾向于本族语的术语,包括新术语,以及术语的指称不是借自另一种语言,或者说术语能够被本族语的定名原则或指称所取代,例如偏爱用中文微博(Weibo)而非英文的twitter或者tweet。我们需要考虑的问题是: 如果中文遇到外来语的影响,本族语中有词、有指称能够取代外来的说法吗?有规范的命名与定名原则吗?关于英文缩略词进入中文所引发的争议即是一个例证。术语质量的高低会涉及术语定义的质量和定义概念的方法,术语学界已有标准,不在此赘述。
以上标准可以用来评价单个术语,包括新术语。简言之,优质术语所表现的特征是: 清晰、一致、得体、简洁、准确、衍生能力强、本土化。依据上述七条标准,评价单个术语问题不大,但是对术语集或术语表的评价则不那么容易。对术语集的评价应该在七条标准的基础之上,再看术语集概念系统的完整性和严谨性。若从翻译工作者的角度来评判术语集的话,则要查询方便,术语之间有关联性,语境合适,有具体的用法说明,可以用自动化或者半自动化电子方式检索术语,查询翻译中的源语术语与目标语术语的匹配对应情况。译者查阅的内容还包括术语有无变体、不对等和不清晰的情况。术语的分享和使用的一致是确保当今世界多语言无歧义交流的前提。
(2) 术语数据的质量评价
术语数据有许多功能,最为突出的功能是:“知识表达(概念),知识的组织顺序(概念分类),获得其他类型的结构化内容或者非结构化的内容,以及交流与知识传播的方式或者元素。”(ISO标准23185: 2009)术语数据是指与概念或者指称相关的数据,包括元数据(关于数据的数据)和数据类型等的评价。术语数据可以指术语学领域不同出版物的文献书目数据和术语学领域组织机构、专家、程序员及其他活动的事实性数据,又称纯的术语数据,还包括特定领域概念的信息、用语言与非语言方式表述的概念及相关数据的补充信息。描述术语数据或者说明术语用法不可或缺的基本项目有: 术语、术语对等程度、来源出处、同义术语的程度、专业领域、语境、定义、短语搭配、图示、术语的缩略形式、拼写、注释说明等。按照ISO标准23185: 2009的说法,术语资源被视为术语数据的一体化的动态系统。术语资源的评价依据对资源创建的分析,管理的分析和潜在用途的分析。从用户的角度看,可用的术语数据的兩个基本要求是: 术语数据满足了用户获取术语信息内容的需要,术语数据的设计使得获取或者处理数据达到了理想的状态。
ISO 12620数据类别的国际标准把术语库中的数据类别选择分为三类[5]: 1)与概念相关的数据类别: 专业领域的信息,概念表示(概念系统与关系的信息),定义,示意图;2)与术语相关的数据类别: 术语(同义术语,缩略术语等),语法信息(词性,数,格),项目代码/客户代码/公司代码,文本类别/语域/地区变体,定义,语境;3)技术与管理数据类别: 日期(创建与修改),作者(术语工作者或审定者),源,参考文献,可信度代码,注释或说明。
评价术语数据质量的前提是能够明白术语数据的“价值”是什么。术语数据的价值取决于: 1)术语数据创立者的权威性;2)术语数据文本与参考资料的质量,即可信度如何;3)由谁准备与提供的术语数据,是由专家组、少数专家或者单个专家还是由专业的术语工作者或者词典编纂者或者其他人;4)数据的完整性,会因不同专业领域的不同规范而有所不同;5)数据的更新,在动态快速发展的专业领域中数据的输入或者更新应该是不断持续的过程;6)有效的内部与外部的认证机制的设立。这些决定术语数据价值的元素是确保术语数据质量的关键。
若从术语数据的内容层面看质量的话,主要看: 1)数据的完整性: 定义、注解等;2)术语数据的一致性: 术语的概念关系与应用是否保持一致;3)符合ISO 704: 2000版国际标准[6]。若从术语的意义层面看质量的话,主要看: 1)知识本体表示概念的形式化关系: 概念的形式表达,术语集中术语间的一致性和概念的一致性;2)概念体系中术语逻辑关系与意义的一致性,术语的概念结构即是知识结构的表述;3)经过专业领域专家的认证。
最后,术语资源的质量取决于两方面的质量,一是术语数据的内容质量,它与语言的质量有关;二是专业知识的内容质量,它与专业化的知识水准有关。
(3) 术语条目的质量评价
评价术语条目的质量主要看是否以概念为导向,是否坚持术语分立的原则,是否有技术和管理项目,必备的条目项是否齐备,术语条目是否完整一致。为了方便评价术语条目,现把必备的项目列成表格,表格中不包括选择类的术语条目。
(4) 术语数据库的质量评价
术语库是由关于专业语言概念与指称概念的术语所组成的信息数据库,与概念、术语和管理相关的信息都应列入数据库[7]。术语库管理是术语工作与数据库管理工作的结合,它有助于系统收集、描述、处理及传播概念及其指称。从广义的角度来看,术语数据库、知识本体技术和术语管理系统又都是术语工具的范畴。我们先对术语库的基本形式有个了解,然后再看评价问题。
Rirdance & Vasiljevs(2006: 84—85)罗列了术语库专业领域的评价标准。他们把专业领域的评估分为综合的学科领域和某个特定的专业领域。涉及各专业领域的综合评价主要看: 1)术语数据文本的质量高: 数据的有效性;2)数据的完整程度: 术语结构的清晰透明;术语数据的多重功能;3)权威性(包括准备的费用): 术语数据权威机构中的专家组或者团队要比零散的个体费用高,系统的方法、文本文献的方法要比非系统的方式费用高,专家的费用比非专家的术语工作者费用高。涉及术语资源描述的标准主要看: 1)参考书目数据: 参考文献(系列的书目、单行本、文章、专业杂志、论文等),术语集(纸质的词典、术语表、词库、词类表、术语库等);2)实际的数据: 组织机构的数据,专家组或者个人,术语项目,术语管理软件,术语活动(学术会议和研讨),教学与培训的机会。涉及单一的学科领域主要看: 1)术语数据的权威性: 根据术语数据原创者的身份地位、官方机构或者公共机构的法律效力、标准化组织机构、专业领域的权威性;实际上,以上所有数据的创立者也没有绝对的“权威性”,因为权威性在多数情况之下会受到限制(或明或暗地);2)法律性: 是由国际,欧洲或者国家层面的法律机构确定?3)标准化组织: 是官方授权的标准化组织还是术语的协调机构?4)准标准化机构: 某个公认的专业权威机构(如: 国际理论和应用化学联合会IUPAC)或者中立的机构,它不属于官方的公共组织(例如公共行政管理部门发布的技术规范等),是致力于标准化工作的工作小组或者委员会吗?5)由专业领域的权威机构发布: 工作委员会准备;代表专业领域机构的专家、个体或者小组;根据正确的术语方法论,如ISO标准,由专业领域之外的人员完成;文献中收录的数据,包括文献来源,原创者的组织或者专家等;有专业领域的专家或者个人完成;由术语工作者或者语言工作者完成,如专业词典编纂者、翻译人员等类型的专家;6)非权威性的术语: 工作委员会;代表机构(如出版商)的专家;7)由专业领域之外的人员完成,根据正确的术语方法论,如ISO标准,由专业领域之外的人员完成;文献中收录的数据,包括文献来源,原创者的组织或者专家等;由专业领域的专家或者个人完成;由术语工作者或者语言工作者完成,如专业词典编纂者、翻译人员等类型的专家。
我们可以根据Rirdance & Vasiljevs所罗列的上述内容要素来评价术语库的专业领域质量,但是对术语数据库的评价会比单纯评价术语与术语数据更为复杂,因为它会涉及其他的因素,如术语管理软件程序的应用、技术参数、互动性、服务客户、信息完整、组织架构与设计元素等,仅最后一项组织与设计方面,就要看结构、层次、完整性、清晰、美观、人性化、功能、一致、用户友好(包括界面)、进入与获取方便、易使用、反馈及时等。若是评价术语知识库的质量,便会涉及术语知识的含量、知识覆盖面、关联性、内容支持、内容呈现、内容的广度与深度、严谨性、可靠性和正确性(validity)、专业信息、得体性、跨学科属性、学术性与能够重复使用。现今术语知识库还有一个重要的标准,即兼容性强,能够互联互通,能够多语言、多模态、多媒体和多渠道传播,符合国际术语库的参数标准并且经过了标准化的认证。
术语库的发展已经从第一代到了第三代。第一代的术语库是以术语为导向,即术语数据以一个术语为中心,将术语作为一个词汇单位,罗列出这个术语所有可能的意思,是词典编纂的词义派方法,如早期的EURODICAUTERM、TEAM;第二代的术语库采用概念派的方法,即概念是术语数据组织的中心,术语依附于一个概念为中心的条目,一个概念一个条目,如丹麦的DANTERM,挪威的NOTE石油术语库等。目前新一代的术语库由于知识本体的应用,已经成为以知识为导向,以专业化知识表述为特征的专家系统,如EUROTERM BANK,歐洲术语库以在线服务为特征,实现了术语知识的分享与使用[8]。对三代术语库的发展变迁了解后才能够有针对性地评价术语库。
(5) 术语服务的质量评价
术语服务主要指术语咨询与教育服务、服务外包和术语的信息服务。术语服务是在应用术语原则、方法、数据、工具基础上的服务,包括术语需求的方法、术语资源和术语培训服务、术语信息与文本文献、术语工作任务和信息服务外包、术语服务的技术支持、技术手段、术语系统化的标准、术语查询快速高效,反馈及时,服务贯穿于全过程及结果。术语服务和技术: 联合信息系统委员会的最新进展评论(Terminology Services and Technology: JISC State of the Art Review)给术语服务的定义是:“术语服务是呈现与应用受控词汇与非受控词汇的系列服务,包括所属的术语、概念和关系。其目的是为了信息的搜索、浏览、发现、翻译、映射、语义推理、主题标引和知识分类、获取、提示等。服务可以是机器对机器或者人机互动面向用户,可应用于检索过程的各个阶段。”[9]这个定义主要针对图书信息领域,术语服务在不同的领域有不同的看法,一般情况下,提供术语的选单(pick list)也是一种术语服务。
术语服务的重要性在于共享术语知识,术语是信息知识社会的一项基础工程,没有术语,信息与知识就不可能实现准确而有效的传播。评价术语服务质量的前提是先要区分术语服务的对象。术语消费者也分专业与普通用户两类。专业用户: 术语集创立者(研究人员,行政管理者)、术语数据制造者(术语数据库开发者,专业词典编纂者)、术语数据发行者(词典出版商,在线信息服务);普通的术语用户: 科技翻译者、口译员、标准化专家、语言规划者、技术编辑者、领域的专家、文献专家、信息中介、知识工程师、信息检索专家、机器翻译专家;虽然国际组织在制订术语服务的评价标准,但是对服务与服务的质量,不同的组织与专家,会有不同的定义且定义方式也不同。术语服务会涉及术语工作的流程,如提出设想、准备、概念构建、查询与审阅、标准、公布等过程与结果的评价。深入探究的问题有: 术语服务是否应包括术语的基础设施条件、内容保障条件、服务保障条件和术语资源管理的工具;是否用多媒体手段与用户展开了在线即时的互动性交流沟通并且提供了有价值的客户服务;是否满足了不同用户的需求;质量评价是否指对术语资源产品的前期、中期与后期的评价;反馈是否及时并达到预期的目的;是否具备了解决术语问题的能力。这些问题都有待量化的计分标准。术语服务势必会涵盖从过程到结果的程序,会关系到服务者的能力建设问题。术语服务的目标应该是给客户提供有价值的服务,有增值的服务,能够满足不同客户的不同需求。
三、 问题的讨论
今天,术语都会以术语数据库,简称术语库的方式加以记录与管理。术语本身就是资源,因为它是知识的结晶。传统术语观把术语视为表达专业意义的载体,与表达普通意义的“词”不同。然而在当今全球化的商业环境中,任何词语,只要是对公司的业务有利,都可以视为“术语”而囊括在公司的术语库中,不再理会其意义是否有具体而特定的所指。在商业的环境中,即使没有专业意义的词,如品牌商标,也可能会被视为“术语”,因为这类词同样需要管理,公司文本材料中经常出现的术语更需要使用上的一致与翻译的一致。术语库中的术语条目会描述具有专业意义的词语,如科学技术、政治、市场营销等,也会描述服务于客户材料的重要词语,如宣传口号、产品名称、特征、软件程序、零部件名称、用户界面的标记、包装等。术语资源的管理会涉及术语创建(研发活动)、术语使用(专业文本)、术语记录(术语库、术语表)、术语传播(教学与培训)、术语实施(技术、知识传播)、术语翻译等环节。ISO标准23185: 2009把术语资源的用途概括为: 查询专业语言中与概念或者概念表述相关的知识内容(比如查阅词典中的术语、数据库查询、术语门户网的搜索);管理确定领域的信息(比如电子商务、电子政府、电子学习的管理);有效交换术语的数据(比如在各活动之间、各信息系统之间和术语机构之间交换数据,给翻译记忆软件输入术语数据,为编纂专业词典输出术语数据);促进术语工作的流程(比如为术语工作者的工作提供便利);把分散的平行术语资源融合为一体以保障数据服务(比如在线服务带来客户化的数据输出、合作式数据输入或者管理、语义网的方法)。
研究术语资源的评价需要了解国内外两个层面的问题所在。目前国内术语资源存在如下问题: 1)我们的一些术语资源虽然以结构化的系统呈现,但还不是基于概念系统的术语知识库,大多还是术语表或者是术语的清单,即以表格的形态呈现;2)一些术语资源不是根据术语原则来记录术语的各种信息,这导致许多术语条目实际上是单义性的词条格式或者是双语的条目,术语记录项目不完整。国际术语资源的问题: 1)术语资源分隔化。不同类型的术语资源采用不同的方法、不同的技术解决方案、不同的获取能力;2)还没有协调统一好国家、地区、国际层面的各种术语资源,兼容性还不强。解决途径是采用国际术语标准来整合术语资源,达到使用一个通用的界面和共用一个术语端口的目标,例如欧洲术语库的一个入口可以进入多个多语的术语资源,是整合术语资源的一个范例。
解决国内外术语资源问题需要按照标准建立相应的质量保证措施。1)就术语条目而言,意味着根据准确、清晰、一致的标准,验证每个条目术语的信息,术语的条目符合数据管理的概念导向原则、术语分立原则和数据精细化的原则,单个术语符合术语构成规范和使用指南,术语更新速度快;2)就管理机制而言,能够协调组织中不同组别的术语,达到术语资源协调,即术语概念与术语一致,术语概念体系中的概念、概念数目、概念结构之间协调一致。术语质量高意味着术语管理的原则有效,能够持续一致,做到清晰、全面、精细,被人们广泛接受;3)就术语资源共享而言,术语资源的共享是建立在数据交换的原则和方法之上,外部的用户也可以使用资源。
创立术语资源的机构或作者与术语资源质量的高低有着密切的关系。术语资源的信度和效度高,往往是因为创立术语资源的机构和作者已经在术语工作中建立了声誉和名望。如果一个机构与作者不被人知晓或者认可的话,其质量自然成问题。术语数据创立者的权威来自: 1)有法律效力或者权威的国际或者国家的组织,如国家名词委员会,国际标准组织;2)官方授权的标准化组织与机构;3)某个专业领域的权威机构;4)正式或者非正式认证的专业委员会;5)非权威的术语源。术语资源的创建采用了何种方法,用何种标准建立,也是一个重要的评价标准。术语资源的创建工作是依据国际标准还是相关的国家标准?是否为概念派的目标导向?概念的选择是否成体系?专业领域的标识,术语用法的注释,所选语言的排序标记,缩写,定义,目标用户,包括文法语音等语言信息也要考量。术语资源的公开使用状况,用户可否免费使用术语库资源及术语数据的真实性,也都是指标。术语评价的主体是专家、术语学家还是用户的满意度?质量认证和术语评价的机制又该如何建立与完善?这些因素都需要统筹考虑在内。
若是按照西方的评价指标,我们研究中文术语资源的质量评估,是否应把术语单位也列入其中?国外术语学界对术语单位还没有一致的定义,若把它作为一个评价指标会有争议。术语单位指术语与词一样,既有系统的一面(形式、语义和功能),因为它们是业已确立的代码的单位,又具有语用的一面,因为它们是专业交流中的单位,用来指称现实世界的物体。(Cabr 1999: 80—81)卡布雷(Cabr)认为若是从词形或者语义的视角看术语,术语与词没有什么差异;若是从语用与传播单位的视角看术语,术语便不同于词。在术语单位的概念涉及术语评价的时候,是把术语作为系统单位还是语用单位对待,这涉及一些具体的组成单位的元素,评价术语单位时要把这些元素综合来考量,(Cabr 1999: 80—114)即把术语单位视为语言单位、交流单位、认知单位和思维单位的多维度问题。鉴于其复杂性,我们可以不把它列入评价术语资源质量的要素。
四、 结 语
术语资源是国家的一个基础设施,是国家知识工程体系的组成部分。术语资源的质量评估关系到知识系统的质量。我们应该从战略高度认识这个问题,因为它涉及术语工作的流程与行业的发展,涉及术语资源共享与信息的透明,涉及对术语资源的科学管理与知识系统的管理,涉及术语的标准化与技术的标准,涉及国家的术语规划与术语战略,更是术语工作者和术语学界应该关心与关注的课题。本文从术语、术语条目、术语数据、术语数据库和术语服务这些术语资源的组成要素层面回答了与质量评价相关的问题,也尝试对术语资源进行量化的评价。术语资源的评价本身就是个系统工程,各要素之间是相互依存的关系,参数指标既相互关联重叠又有差异性;既有共性,如准确、一致、透明、完整的标准,又有个性差异,如术语库的技术标准等。术语资源的评价要符合国际或者国家的标准,既要看信息的准确度也要看术语工作方法的一致性,包括术语工作的流程和术语的产品质量等。建立可以量化的质量评估标准,还有许多问题有待解决与探究,如术语资源的评分标准,评估的主观标准测量及术语资源的管理等,这又涉及术语测量学的建立。在计算机术语学和面向翻译的环境中创建、发展与应用我们自己的术语资源,提高术语管理工作的质量,我们同样还有很多事情要做。
附 注
[1][2]ISO标准23185: 2009: ISO 23185: 2009(E).http:∥portal.tee.gr/portal/pls/portal/PORTAL.wwsbr_imt_services.
[3]在若干个术语变体形式中,用哪一个术语形式最为“得体”呢?在术语工作实践中,术语多个变体形式并存是无法避免的,如复合术语的简略形式,儀器设备的名称等。在几个变体中,一般遵循以下标准来界定术语变体的得体性,即: 1)是否依国家标准定义的术语?2)是否为国际专家组织推荐使用的术语?3)是否已经在广泛地使用?4)是否只局部使用?
[4]国际标准化组织ISO/TC37的网址: http:∥www.iso.org/iso/home/standards_development/list_of_iso_technical_committees/iso_technical_committee.htm?commid=48104.
[5]ISO 12620数据类别: http:∥www.ttt.org/clsframe/datcats.html.
[6]ISO 704: 2000Terminology work—Principles and methods: http:∥semanticweb.kaist.ac.kr/org/tc37/pdocument/standards/ISO%20704.pdf.
[7]ISO 300422008术语,知识和内容管理系统.术语库电子交换(TBX): http:∥www.iso.org/iso/catalogue_detail.htm?csnumber=45797.
[8]欧洲术语库网: http:∥www.eurotermbank.com.
[9]Terminology Services and Technology: JISC State of the Art Review.http:∥www.jisc.ac.uk/media/documents/programmes/capital/terminology_services_and_technology_review_sep_06.pdf.
参考文献
1. Cabr M T. Terminology: Theory, Methods, and Applications. Amsterdam and Philadelphia: John Benjamin, 1999.
2. ISO 23185: 2009.Assessment and Benchmarking of Terminological ResourcesGeneral Concepts, Principles and Requirements.Geneva: ISO, 2009. Available at: http:∥portal.tee.gr/portal/pls/portal/PORTAL.wwsbr_imt_services.GenericView?p_docname=17928513.DOC&p_type=DOC&p_viewservice=VAHWSTH&p_searchstring=#bmk45.
3. Pavel S, Nolet D. Handbook of Terminology. Canada: The Translation Bureau of Canada, 2002.
4. Rirdance S, Vasiljevs A.(eds.) Towards Consolidation of European Terminology Resources: Experience and Recommendations from Euro TermBank Project. Riga: Tilde, 2006.
(惠州學院外语系 广东 516007)
(责任编辑 李潇潇)