术语词典编纂中词条重复问题的解决思路
2022-11-03霍春雁
霍春雁
(全国科学技术名词审定委员会,北京 100717)
0 引言
全国科学技术名词审定委员会面向自然科学和社会科学各学科的名词审定工作,最终都是以编纂术语词典的成果形式公布并出版的。审定工作中的第一个重要环节就是收词工作。为保证科技名词工作的科学性、代表性和系统性,收词必须在概念体系下进行。根据概念体系来确定名词框架,这关系着收词的范围、深度、重点、分支学科名词的比例以及接下来的定名、定义和出版编排等工作[1]。
尽管在词条收录之初,制定了学科框架并划分了内部分支学科间的收词界限,但是在词条汇总后往往还存在各分支学科间词条的交叉重复现象,也就是笔者要着重讨论的学科术语词典中词条自身重复问题。存在此类问题不仅影响名词审定工作的质量,还会给使用者在获取学科知识的过程中造成一定程度的理解错误。因此,对汇总后的词条进行查重以及对查出的重复问题进行解决,就成为收词工作最关键的一个环节。目前,学术界对这一问题的解决思路却鲜有论述,笔者将在实践工作的基础上,对此问题的解决思路提出个人的点滴思考,供大家商榷。
1 概念与学科概念体系
收词工作是根据学科概念体系展开的,而学科概念体系就是一组概念之间的关系。
1.1 概念、名词和术语
概念既是人类思维的单元,又是知识的基本单位,任何科学研究的成果,都要以概念的形式固定下来。而所有科学概念的外在表现形式是通过人为地给其一个指称来表示的,这个指称就是术语,也作名词。从理论上来说,在同一种语言中,指称与概念之间的关系应该是单参照性的。因而,对于任何一个术语来说,一个指称应该与一个并且只与一个概念相对应,简称术语概念的唯一性[2]。
1.2 术语概念体系
“一组概念可依据概念间的相互关系构建成概念体系。一般来说,概念体系反映相应的知识体系。”国家标准《术语工作原则和方法》(GB/T 10112—959)中指出“术语学探讨的概念是同某一知识领域所研究的客体相对应的,因而又有其内在的系统性。”[3]概念系统担负着两个任务:一方面,给出了有关专业领域概念总体的概貌;另一方面,也为一个术语资料汇编中概念位置的排列提供了一个框架[4]。
在概念体系中,各个概念之间的关系有层级关系和联想关系等类型,层级关系又分为属种关系和整体—部分关系两种。名词审定工作中依据的学科概念体系指的就是概念之间的属种关系,这种关系可以用树形图来表示。以已公布出版的《古生物学名词》学科概念体系为例,具体如图1所示。
图1 古生物学学科概念体系树形图示意[5]
图1只展示了古生物学学科概念体系的4个层级,其余下位层级在此省略了。层级高的概念涵盖层级低的概念,如“古生物学”为这个系统中最高层级的概念,同时也是“古无脊椎动物学,古脊椎动物与古人类学,古植物学,古生态学、埋藏学、遗迹学,地球生物学与分子古生物学”这5个下位概念的上位概念。上位概念也称为“属概念”,下位概念则称为“种概念”,二者是相对的,为种属关系。属概念包含所有种概念的共同特征,而种概念则是由属概念+区别性特征衍生出来的。在图1中,“反鸟类”和“鱼鸟类”这两个概念的共同特征都是“鸟类”,所以“鸟类”就是它们的属概念;二者又各自有不一样的类群特征,故分属于两类鸟,“反鸟类”和“鱼鸟类”就成为“鸟类”的种概念。这种概念间的种属衍生关系,使得每个概念在整个概念体系中只能是独一无二的。因此,这种基于学科概念体系编纂的词典,属于类义词典中的层级或者系统词典。它既可以直观反映出学科领域内的知识结构和体系,同时也展示了各术语概念间的系统联系。
总之,术语概念具有的唯一性和系统性这两个特征,决定了一个术语在一部词典中只能是作为对应一个概念的词条被收录一次,而不能两次以上地出现在词典中,除非对应两个以上的概念,否则就被认为是重复词条,需采取必要的措施进行处理。
2 词条自身重复的类型
全国科学技术名词审定委员会目前审定的各学科术语词典中,每一条词基本上都是由三部分构成——中文名称、外文标注和概念释义。中文名称即术语,是该学科中某一个科学概念的指称;外文标注是赋予术语对外交流时的一个与中文术语概念等同的外文名称;概念释义则是对这个科学概念进行的类似下定义式的规范性阐述。在此,中文名称与外文标注可合并称为“名”,概念释义则称为“义”。
对汇总后的词条进行查重工作,一般是由计算机完成的。大致工作原理是设计一个程序来比对所有词条在“名”和“义”两项上的文字及符号的表面相似性,然后判断并筛选出重复的词条。
这些重复词条大致可分为两种类型:第一种是显性重复类型,即名和义完全重复;第二种是半显性重复类型,即名同义不同或者义同名不同的半重复。还有一种类型的重复,不是计算机通过查重能够筛选出来的,而是通过人为工作经验判断才能发现的,这就是第三种重复,即隐性重复类型——名和义都不相同的重复。三种重复类型的举例如表1所示。
表1 术语词典中词条自身重复类型举例
3 解决思路
解决以上3种类型的词条重复,第一步是不管这3种重复类型在“名”和“义”的字面上看起来有多少相似度,都要依据术语概念进行人为的再判断,只有在概念上完全相同的才是真正的重复词条。第二步是根据术语概念体系来决定这些真正重复的词条的去留问题以及在该体系中的位置。
第一步工作好理解,但是3种类型的词条重复又是如何进行第二步工作,描述起来就有些复杂,但如果借助中国式家谱图修撰思维作类比的话,就容易理解了。
3.1 中国式家谱图及与学科概念体系图的相似性
家谱,是中国百姓家族记载其宗族世系繁衍的谱牒,又称宗谱或族谱。目前,流传下来的家谱种类繁多,但修撰模式则大体一致。这种私谱修撰模式的奠定者是北宋的欧阳修和苏洵,故称“欧苏法式”。欧阳修创立的五世一提谱图法,在其《谱图序》中做了详细说明:“上自高祖,下止玄孙,而别自为世。使别为世者,上承其祖为玄孙,下系其孙为高祖。凡世再别,而九族之亲备。推而上下之,则知源流之所自。”[6]
这种“五世一提谱图”如果用现代树形图示意的话,则如图2所示。
图2 简化中国式宗谱树形图示意
与图1对比可知,首先,中国式宗谱树形图与学科概念体系树形图的构架完全相同,都是层级关系。其次,宗谱里各构成元素之间的关系也属于种属关系。最后,二者都是由单一且唯一的因素来决定图中构成元素的定位的,这个因素在宗谱图中是血缘,在概念体系图中则是概念。
3.2 借用中国式宗谱思维来理解第二步的解决思路
既然中国式宗谱树形图与学科概念体系树形图有着极高的相似性,那么借用宗谱修撰的思维方式来解释上述问题处理方法中的第二步,应该完全可以,具体尝试步骤如下。
3.2.1 针对第一大类型的解决思路。显性重复类型的词条是从名词到释义都完全相同的类型,相当于在一本家谱上有两个名字和血缘关系都完全一样的记录,属于重复记录,但是在实际生活中拥有完全一样的名字和父母血缘关系的只能是同一个人,所以修订家谱时就会只保留一个记录,且这个记录的位置根据血缘关系只能在其父之下紧邻其父的位置。同理,显性重复类型的词条也只能保留一个,其所在位置则根据种属关系找到其上位概念,并置于其下紧邻位置。
3.2.2 针对第二大类型的解决思路。半显性重复类型的词条有两种情况,一种是名称相同释义不同,还有一种是名称不同释义相同。
前一种情况经过辨析后概念也相同的,则实属第一大类重复类型,处理方式也同第一大类;而概念确系不同的,相当于在一个家谱上有两个名字一样,但是血缘关系不同的记录。家谱中出现此种情况时,一般会按照血缘关系远近起名用字的不同重新改名来处理(当然在现实中,降生之初起名字时就已经避免了此类问题的发生),而位置不变。同理,在此类重复词条中也要重新审视词条的定名是否规范,不规范的需重新定名,从而解决了重复问题。但在实际工作中,还有例外情况,即词条确实无须重新定名时,则二者不属于真正的重复词条,理应以相同的名称分别保留在不同的分支学科中,相当于家谱上有两个名字相同、血缘相距较远的家族成员同时记录在家谱不同世系位置上的现象。这种情况无论是在学科术语词典中还是在家谱上都是极少见的,一般在概念体系比较庞大的学科中,或者世系旁支很多的大家族合谱中才会出现。
后一种名称不同释义相同的情况,属于同一个概念以两个不同的名词出现。相当于在家谱上同一个人有两个名字,结果两个名字分别都被记录,那其中肯定有一个记录的位置是不对的,所以根据血缘关系排查清楚之后,删去不合理的记录,当然此记录的名字在日常生活中还可以使用。同理,此类重复词条也只能保留那个种属关系正确的词条,另一条则删除,或仅保留下名称,作为前者的异名使用。
3.2.3 针对第三大类型的解决思路。隐性重复类型的词条是从名称到释义字面完全不同的类型,根据概念辨析后,如果确实不同,则为不重复词条,分别保留;如果概念相同,则属于第二大类中名称不同释义相同的类型,参照此类处理方式即可。
总之,词条自身重复问题就是要根据概念的异同来判断并区分其重复的真实性,然后决定重复词条的去留,同时确定保留下来的词条在术语系统中应有的位置。
4 结语
笔者借用中国式宗谱图修撰思维来解释词条重复问题的处理方法,是因为术语学属于比较抽象的逻辑思维范畴,不便于理解,而中国式宗谱图思维在某种程度上与其契合,可以形象表达出二者的共性。血缘关系繁衍过程中的远近亲疏直接决定着个人在家谱中的层级位置,同理,概念之间衍生关系的逻辑紧密程度也决定着某个术语在学科概念体系中的层级位置。应用这种类比思维方式,能很好地解决词条自身重复问题,对于术语词典编纂的初级工作者来说很容易理解和操作。