APP下载

框架术语学的三大研究焦点

2021-01-22卢华国

中国科技术语 2021年1期

摘 要:框架术语学对普通术语学进行了反思和批判,是描写术语学的最新流派之一。文章介绍了该学派的三个研究焦点:主张基于事件概念组织,从而把术语的句法和组合特征纳入研究视野;考察了术语概念的多维性,突出了语境要素在术语概念表征中的重要作用;把专业语料库作为提取概念知识的主要来源,采用自下而上为主的研究路径。

关键词:框架术语学;术语句法特征;概念多维性;专业语料库

中图分类号:N04;H083  文献标识码:A  DOI:10.3969/j.issn.1673-8578.2021.01.001

Three Hot Topics in the Research of Frame-Based Terminology//LU Huaguo

Abstract: Frame-based terminology (FBT) reflects and criticizes general terminology theory, and marks one of the latest developments of descriptive terminology. This paper describes the three tot topics in the research of FBT: the event-based organization of concepts that makes it possible to discuss the syntactic and combinatorial features of terms in terminology; the multidimensionality of concepts that highlights the role of contextual factors in conceptual representation; the bottom-up approach with specialized corpora as the main source for knowledge extraction.

Keywords:frame-based terminology; the syntactic features of terms; conceptual multidimensionality; specialized corpora

收稿日期:2020-07-20  修回日期: 2020-11-20

基金項目:江苏高校哲学社会科学研究项目“英汉学习词典中多义词认知表征及习得效果研究”(2020SJA0193)和国家语委汉语辞书研究中心开放课题“基于描写术语学的英汉专科学习词典语境化设计研究”(CSZX-YB-202013)阶段性成果

引言

普通术语学创立的初衷就是借助术语标准化消除专业语言中的歧义,确立术语的单义性,使术语成为高效的交际工具。为了使标准化具有理论上的可行性,普通术语学把术语视为概念的抽象语言标签,认为术语与概念之间的关系可以人为进行标准化。在普通术语学看来,术语与概念之间理应存在一一对应的关系,这与普通语言中的词语是内在不同的。然而,普通术语学倡导的专业交际只是一种理想化的交际模式。在现实中,术语的多义现象(同一个术语也可能指称多个概念)和同义现象(同一个概念可以由多个术语指称)比比皆是。此外,术语与词语一样,在文本中有不同的句法表现形式,因凸显的概念焦点变化而不同,同时还受到语境的制约。对普通术语学的批判和反思开启了术语学的描写转向。

框架术语学(frame-based terminology)由西班牙格拉纳达大学的LexiCon研究团队提出,是描写术语学研究的最新流派之一。该流派借鉴了语言学和心理学的相关研究成果和工具,在术语概念的组织方式、术语概念理解和术语概念知识提取方式等方面均提出了与普通术语学不同的观点。本文将从基于事件的概念组织、概念多维性和基于语料库的知识提取三方面介绍这一术语学研究流派。

1 基于事件的概念组织

术语是表征专业领域概念的语言符号,普通术语学十分重视研究概念的组织方式。普通术语学认为,概念系统为理解概念提供了必要的知识结构和背景,只有确定概念在系统中的位置,明晰概念之间的关系,才能界定概念的内涵。卡布雷曾指出,“概念系统由一系列概念分类后形成,呈现出一定的结构。基于共同特征或者通过实际应用,概念的主要类别和子类别以及属于同一类别的概念被联系在一起。……概念系统的结构经常以树形图表示”[1]135。具体而言,概念系统树形图呈层级布局,通常基于概念之间“属—种”关系和“部分—整体”关系构建而成。

框架术语学在概念组织方面另辟蹊径,认为每一个专业领域都有属于本领域的事件模板(event template),这些反复发生的行为或事件可被人的概念系统轻松捕捉到,从而构成了概念事件的结构基础,主张在这样的理想框架中对新的事件或行为进行范畴化处理[2]。框架术语学借鉴了认知语言学中的原型概念,把反复发生在某专业域中的事件称为原型域事件(prototypical domain event),认为正是原型域事件把专业域中的基础层面范畴配置在一起,产生了一个适用于所有层面信息架构的模板,把体现专业域特色的典型状态和事件以及参与其中的实体都纳入进去,确立了一个组织具体概念的框架。范畴中的具体概念被置于网络中,通过层级和非层级关系联系在一起。框架术语的实践应用——生态词库(EcoLexicon)[3]就是按照这种方式组织概念的术语库。其中的环境事件(environment event)有两类施事可以发起过程:无生命施事(自然力量)和有生命施事(人类)。自然施事(如地球运动、大气现象)在某个地域引起自然过程,而这些过程又影响其他实体或受事,造成的结果是后者因此被改变。人类施事能够使用工具实施人为过程(例如建造),从而产生或阻止通常由自然过程施加的影响。施事、受事、结果和工具是专业域中最典型的语义角色,环境事件则表征了它们之间的关系。在环境事件中,还有一些边缘范畴,包括用以指称测量、分析和描述主事件过程的概念。因此,事件中的每一个子域(如BUILD-EVENT建造事件,EROSION-EVENT侵蚀事件,SEDIMENTATION-EVENT沉积事件等)都以具有原型系列概念关系的模板为特征。按照在环境事件中所扮演的语义角色,可把概念分为施事、过程、受事或结果、描述四个版块,版块内是纵向的层级关系。例如,过程版块被进一步分为自然过程和人为过程以及实施过程,自然过程还可以继续分为运动、流失、增加和转换等小类,其中的流失则包含overflow(溢出)、differential erosion(差异侵蚀)、avulsion(急流冲刷)、evaporation(蒸发)、glacier abrasion(冰蚀)等导致减少或流失的术语。

借助版块内部的层级关系,术语被赋予施事、受事、结果、工具和地点等语义角色。由环境事件可知,角色之间通过CAUSES(造成)、CARRIES OUT(实施)、AFFECTS(影响)、CREATES(产生)、BECOMES(变成)等谓词联系在一起。不同角色之间的互动关系在术语层面表现为概念之间的Result of(结果)、causes(造成)、affects(影响)、has-function(功能)(具体可分为measures测量、studies研究、represents表征)、effected by(实施)等非层级(non-hierarchical)关系。这一基于事件的概念组织方式与传统概念组织方式之最大的不同就在于它不仅使用了层级分类,而且基于事件把各个版块横向关联起来。例如,manure(肥料)可以被看作是一种工具,被用于fertilization(施肥)这一人为过程。事实上,术语学家早就意识到有必要表征诸如 manure 和 fertilization 之间存在的这种非层级关系[4]53,但是只有框架术语学赋予这些关系以非常重要的地位,而且在概念组织表征中把它们明确地体现出来。

普通术语学把术语看作是用以命名概念的抽象标签,认为其功能类似普通语言中的专有名词[5]11,仅对术语的命名功能感兴趣,认为术语的形态和句法应由普通语言规则提供,因而把这些信息排除在术语学研究之外。相比之下,框架术语学从事件角度入手,得以对术语的句法维度展开研究。例如,从long-term erosion、river bank erosion和storm-induced erosion這几个复合名词可知erosion在环境事件中扮演了过程角色,由特定的施事(storm)引起,有特定的发生地点(river bank)并持续一定的时间(long-term),而这些往往被其他术语学研究流派所忽略。此外,框架术语学还借鉴了角色参照语法中的题元关系和构式语法中的论元角色,对环境科学中经常出现的谓词(尤其是动词谓词)进行了细致的描写[6]。例如,在EcoLexicon中,strike(袭击)、hit(袭击)、blast(摧毁)、crash(撞毁)等四个词被置于to_come_against_sth_with_sudden_force(猛烈冲击)这一框架中。它们是属于同一框架的近义词,可用于“名词短语+动词(+名词短语)”句式中,其中第一个名词短语是施事,指一种自然力量(自然灾害),充当了事件的施动元;第二个名词短语是受事,可以指区域、建筑或者人类,在事件中充当了受动元。

2 术语概念的多维性

传统术语学研究中,在基于“属—种”关系和“部分—整体”关系构建层级树形图时,每一层都按照同一个标准对概念进行分类,最后在逐级分类的基础上建立起概念系统表征。在这样的树形图中,概念仅占据一个位置,概念之间的关系貌似一目了然。然而,如此构建的层级表征常常只是一种理想的状态。术语学家在表征概念系统的过程中注意到在同一层面上对概念进行分类时,往往可以基于多个区别特征从多个角度入手。例如,对与“管子”有关的概念可用如图1表示[7]124:

图1中,分别按照 “材料”“功能”和“其中流动的物质”三个特征把管子分成三类。

不仅上位概念可以根据多个特征进行分类,下位概念也可以根据多个特征进行归类,从而导致一个概念有多个上位概念,存在于多个层级结构中。塞杰把这种关系称为多层关系(polyhierarchical)[4]33。例如,既可以基于多个特征对wine(葡萄酒)这一上位概念进行分类,也可以基于不同的特征对其下位概念夏布利酒和马得拉酒进行归类[8]40-41。根据颜色、含糖量和产地,可以把葡萄酒分别分为红葡萄酒和白葡萄酒,淡葡萄酒和甜葡萄酒以及法国葡萄酒和西班牙葡萄酒三个类别。夏布利酒和马得拉酒是两种具体的葡萄酒,前者既是一种红葡萄酒,又是一种甜葡萄酒,同时还是一种西班牙葡萄酒;后者既是白葡萄酒,又是淡葡萄酒,同时还是法国葡萄酒。鲍克认为所谓分类就是基于共同的特征把相同概念聚合在一起,把不同的概念分开[8]40-41。因此,从逻辑上讲,哪些概念相同和哪些概念不同取决于所选择的特征。他把基于某一区别性特征对概念的分类称为维度(dimension),把在同一概念系统中可以基于多个特征对概念进行多种分类的现象称为概念的多维性(multidimensionality)。

多维性还可以指从不同视角对同一对象的概念化[9]89。例如,在化学中可把二氧化碳定义为由碳和氧构成的化合物。就环境领域而言,二氧化碳虽然还是化合物,凸显的却是在温室效应形成中发挥的作用。视角不同,与二氧化碳产生关系的概念也不同。不同视角下的二氧化碳概念化如图2所示[9]89。在化学中,与二氧化碳关系密切的很可能是碳和氧,也可能是其他碳化合物,如一氧化碳。在环境领域中,二氧化碳被视为一种温室气体,其同类概念有水汽、沼气等概念。

框架术语学重视探讨术语概念的多维性,但是更关注前述第二种概念多维性对表征术语概念的影响。费伯引入了认知语法中的域矩阵(domain matrix),对概念的多维性进行了全新的阐释[2]55:一个表达可能唤起一系列的认知域,它们相互重合,共同构成了这一表达的域矩阵。在具体的场景中,有些认知域更容易被激活[10] 47-49。与认知域类似,概念可能同时属于多个不同但是相关的专业域(specialized domain),其概念关系因而呈现出多维性。在具体的专业域中,只能激活概念的某些维度,而不是全部维度。具体而言,根据是否被激活可把概念关系分为活跃(active)和怠惰(inactive)两类。前者与特定专业域相关,后者要么与该专业域无关(被称为潜伏(latent)关系),要么与该专业域中的处于活跃状态的其他关系抵触(被称为不相容(incompatible)关系)[11]579。

框架术语学认为可以把专业域看作是专业学科。当同一概念出现在不同学科中时,就产生了概念的多维性。学科不同,围绕概念形成的概念关系也不同。莱昂阿劳斯、雷梅林克和加西亚·阿拉贡以water为例研究了概念的多维性[12]46,发现:(1)因为water(水)在有的学科中比在另外一些学科中重要,所以围绕water形成的概念关系数量各不相同。例如,在水利学中,water的概念关系就比在其他学科中密集和复杂。(2)在不同学科中,围绕water形成的概念关系类型也不一样。例如,在工程学中,与water相关的概念关系以made_of(材料)和 affects(影响)为主;在地质学中,突出的概念关系是causes(造成)和type_of(种属)。(3)在不同学科中,与某一概念发生关系的概念类型不同。例如,在工程学中,与water发生关系的概念主要有人造实体和人为过程(如pumping泵送、 concrete水泥土、culvert涵洞),在地质学中则是自然实体或过程(如erosion侵蚀、groundwater地下水、seepage渗流)。

专业域还可以看作是概念范畴。框架术语学借鉴生成词库相关理论[13] 1-3,把概念分为实体(如atmosphere,大气)、过程(如erosion,侵蚀)和特征(如altitude,海拔)三大类型,每一大类又细分为自然类(与物性结构中的形式角色和/或构成角色相关)、人造类(与功用角色或施成角色相关)、合成类(由自然类和人造类组成,从两三个自然类和/或人造类继承角色)三个小类。框架术语学还根据概念所属的类型,把概念关系与具体的物性角色对应起来[14]。例如,glacier(冰川)属地理客体,其组成部分包括blation zone(冰融带)(构成角色,has_part),但是不涉及人造类客体才具有的功能、用途等關系。相比之下,instrument(仪器)属于人造客体,有着特定的用途和功能(功用角色,has_function)。框架术语学认为,根据所属的类别,概念表现出不同的组合潜势(combinatorial potential),能够激活不同的关系组(a set of relations)。

为了反映概念之间的互动关系,框架术语学把概念范畴与语义角色结合起来。概念能够激活什么样的概念关系,不仅取决于概念所属的类型,还受制于概念在原型域事件中扮演的语义角色。当同一概念在不同事件中承担了不同的语义角色,概念也表现出明显的多维性特征,激活的概念关系也互不相同。例如,在环境科学领域中,water(水)属于合成类概念,凸显的是施成角色,参与了自然发生的事件erosion(侵蚀)和人为实施的事件salination(盐化作用)。在第一个事件中,water造成了erosion,扮演了agent(施事)的角色,激活的概念关系是causes;在第二个事件中,desalination影响了water,water扮演的角色是patient(施事),激活的概念关系是affected_by。

框架术语学特别关注概念多维性对术语使用者理解和学习专业知识的影响:一方面,多维性从不同角度对概念进行展示,可以促进对专业知识的学习。然而,多维性又容易造成信息过载(information overload),最终妨碍对专业知识的学习[15]15。因此,框架术语学主张对概念进行语境化表征,即对概念的专业域施加限制,把不相关或不兼容的概念关系排除在外,以减轻学习负担,提高学习效果。例如,在环境科学中,water(水)虽然不是一个专业特有(domain-specific)概念,但是参与了环境科学的诸多自然发生的事件和人为实施的事件。由于water在各个分支学科中都发挥了非常重要的作用,因而围绕该概念形成的关系网络非常复杂,信息密集度高,术语之间出现大量重合,致使概念关系网络在视觉上辨识度非常低。如此庞杂的信息如果不结合语境加以限制,用户势必无所适从,也就不可能对与water有关的专业知识进行有效地学习。为了解决这个问题,EcoLexicon根据语料来源把环境工程科学分为水文学、地质学、气象学、生物学等领域,以这些领域为基础对概念网络进行语境化处理。例如,从meteorology(气象学)的角度对与water有关的概念关系进行限定,即排除与气象学无关的概念关系之后,围绕water形成的概念关系网络的信息密集度有所降低,但是还存在一定程度的信息过载。基于water的受事角色对有关概念关系进行再次筛选之后,排除了所有围绕water形成的affects(影响)关系后,概念网络得到进一步简化,其表征清晰度和辨识度均明显得到改善,从而方便了用户学习与具体文本相关的概念知识。

3 基于语料库的知识获取

术语编纂是传统术语学研究的一项核心任务。梅耶尔总结了术语学家在编纂词条之前必须完成的三项任务[16]279:(1)术语辨识,即哪些是应该描写的学科术语;(2)术语的概念分析,即这些术语的意义是什么;(3)术语的语言分析,即怎么在语境中使用这些术语。她认为在这三项工作中,概念分析是术语编纂的基石。如何获取概念分析需要的数据是术语编纂中需要考虑的重要问题。梅耶尔认为术语学家可以通过咨询学科专家或者查阅专业文本获取概念信息,特别指出由于电子文本从网络上容易获取,基于专业文本的数据获取方式正日益受到术语学家的青睐[16]280。

梅耶尔的看法对框架术语学影响最为明显。费伯认为可以借助以下两种工具获取信息[2]101:(1)系列半结构化(semi-structured)的访谈,用以从专家那里获取所需的信息;(2)由电子文本构成的语料库,可借助词汇分析从中提取信息。他们认为这两种方法互相之间并不排斥,但各有利弊。第一种方法的缺点是所咨询的专家数目少,只能依靠有限的看法获取信息。此外,专家虽然熟悉与某一学科相关的知识,但是他们未必擅长以内省方式获取概念分析所需要的全部信息,也不一定擅长以文字表述所获取的这些信息,对于应该提供哪些信息也很容易受到个人因素的影响。因此,费伯主张从专业文本中提取需要的信息[2]。他们使用的文本不仅包含普通专业文本,还包括专科词典文本,认为基于前一种文本的是一种自下而上的提取方法,基于后一种文本的是一种自上而下的提取方法,主张把这两种方法结合起来用以提取概念分析所需要的专业知识。具体讲,自上而下方式是指参考词典和其他工具书,在专家的帮助下对其中的相关信息进行比较、取舍和整合;自下而上方式则是指使用术语提取软件和语料索引工具从专用语料库中提取信息,以验证、修正或充实通过自上而下方式所获取的信息。

[10] LANGACKER R W.Cognitive Grammar: A Basic Introduction [M].Oxford:Oxford University Press, 2008.

[11] LEN-ARAZ P, SAN MARTNa A. Distinguishing po-lysemy from contextual variation in terminological definitions[C]//Actas del X Congreso de la Asociación Europea de Lenguas para Fines Específicos: La investigación y la enseanza aplicadas a las lenguas de especialidad ya la tecnología.Valencia: Universitat Politècnica de València, 2011: 173-186.

[12] LEN-ARAZ P, REIMERINK A,GARCA ARAGN A. Dynamism and context in specialized knowledge [J]. Terminology, 2013 (1): 31-61.

[13] PUSTEJOVSKYJ, HAVASI C, LITTMAN J, et al. Towards a Generative Lexical Resource: The Brandeis Semantic Ontology [C]//WITTENBURG P, BRUGMAN H, RUSSEL A, KLASSMANN A, SLOETJES H. Proceedings of the Fifth International Conference on Language Resources and Evaluation, Genoa, 2006.

[14] FABER P, LEN-ARAZ P,REIMERINK A. Representing environmental knowledge in EcoLexicon [C]//BRCENA E,READ T, ARS J. Languages for Specific Purposes in the Digital Era . Springer Science & Business Media, 2014(19): 267-301.

[15] LEN-ARAZ P,FABER P. Natural and contextual constraints for domain-specific relations [C]//BARBU MITITELU V,PEKAR V, The Workshop Semantic Relations, Theory and Applications, Valletta, Malta, 2010:12-17.

[16] MEYER I. Extracting knowledge-rich contexts for terminography [C]//BOURIGAULT D, JACQUEMIN C,LHOMME M C. Recent Advances in Computational Terminology. John Benjamins Publishing Company, 2001(2): 279

[17] LEN-ARAZ P, REIMERINK A,FABER P. Knowledge extraction in multidimensional concepts: Corpus pattern analysis (CPA) and concordances [C]//Proceedings of the 8th International Conference on Terminology and Artificial Intelligence. Toulouse, France, 2009.

作者簡介:

卢华国(1979—),男,博士,副教授。加拿大蒙特利尔大学(导师Marie-Claude LHomme)和英国曼彻斯特大学访问学者,长期从事术语翻译和专科词典学研究,2017年当选为中国辞书学会双语词典分会理事;担任International Journal of Lexicography期刊匿名评审;在国内外刊物发表学术论文33篇,其中SSCI论文3篇,CSSCI论文7篇;主持翻译类、词典类各级各类课题7项,参与翻译类国家社会科学基金重点项目、一般项目和教育部人文社会科学研究项目各1项;合作撰写专著1部,参与编纂辞书2部,合译书籍3部。通信方式:louisluhuaguo@163.com。