基于词间关系的叙词表术语翻译
2019-09-11
多语种叙词表是信息组织与信息服务中一种重要的知识组织工具。多语种叙词表的建设实现了不同语种信息资源的集成,是实现跨语言检索的基础,但目前常用的方法是将单语种叙词表通过术语翻译编制成多语种叙词表。词间关系是叙词表中重要的组成部分,主要包括等同关系、等级关系和相关关系3种,在叙词表的构建与维护中也极其重要。在词表更新时,编制者可以通过词间关系判断其更新术语是否属于某一词族,是否分类正确;在对单语种词表翻译时,编制者可以根据词间关系判断其术语翻译是否正确。在实践过程中发现,对于单义术语,网络翻译软件一般给出一个对应术语翻译,其翻译含义也多数都是正确的。但对于多义术语,其给出的中文翻译一般都有多个,且术语之间的含义大相径庭,或者给出的术语翻译是短句而非术语。叙词表中要求术语一词一义,其中文翻译也应该是术语而不是歧义术语,所以需要在给出的中文翻译中选取最适合的术语翻译。在一般的翻译中,术语都存在于句子中,有具体的语境。在词表中,术语的语境指的是术语所在的词族以及所拥有的词间关系。
本文结合叙词表更新维护项目实践,在叙词表术语翻译过程中,探讨基于词间关系的叙词表术语翻译方法。
1 叙词表术语翻译的调研与分析
随着世界的多元化发展,叙词表也呈现出多元化的形式,多语种叙词表成为了研究热点,国家标准GB/T1390.1-2015中认为多语种叙词表的编制可以通过翻译单语种叙词表实现[1]。国际上存在大量的多语种叙词表,并且每部多语种叙词表都具有丰富的词间关系。如农学类多语种叙词表AGROVOC在2010年时语言种类为22种,而目前其语言种类达33种[2],其中主要包含等同、等级和相关关系,并将相关关系进行细化;“Commonwealth Agriculture Bureau Thesaurus”(以下简称“CAB Thesaurus”)有11种语言,其中以英语为主,其词间关系除了等级关系、等同关系和相关关系之外,还有其他关系,如与其他词表的精确匹配和近义匹配等[3]。医学领域的“Medical Subject Headings”(简称“MeSH”)语言版本多达15种,其中主要有等同、等级和相关关系[4]。“UMDNS: product category thesaurus”的语言种类主要有英语、德语等,主要包含等同、等级和相关关系等词间关系;理学类叙词表中的“UNESCO Thesaurus”,其语言种类有英语、西班牙语、法语和俄语4种,主要包含注释、等同、等级和相关关系等词间关系,并将等级关系细化为上位和下位关系[5];工学类词表中的“GEneral Multilingual Environmental Thesaurus”,其语言种类有20多种[6]。中文叙词表中,多语种叙词表多以英汉两种语言为主。如《汉语主题词表(工程技术卷)》[7]和《农业科学叙词表》[8],主要包含等同、等级和相关关系,同时为优选词赋予英文翻译;《中文医学主题词表》(Chinese Medical Subject Headings,简称“CmeSH”)[9]是美国国立医学图书馆MeSH词表的中译本,同时也收录了中医学和中医药学相关术语,包括主题词、副主题词,其主题词还通过一定的树状结构和参照系统显示主题词之间的关系;“十二五”科技支撑计划所建的“英文超级科技词表”(以下简称“英表”)实际上也是一种以英汉两种语言为主的多语种叙词表,填补了我国外文大型集成词表的空白,为外文信息自动处理的科学研究提供研究基础,提升我国对外文海量信息资源组织的能力和效率[10]。每个多语种叙词表中都包含等同、等级关系、相关关系,其中一些多语种叙词表还根据具体情况将等级关系、相关关系进行细化,为与其他词表或者知识组织系统之间的互操作奠定基础。多语种叙词表中术语的不同语种的表现形式,实际上也是一种等同关系的表现。
无论叙词表的概念翻译还是概念映射,或者涉及术语翻译的词表研究,都可以借助词间关系进行细化和优化。常春在研究多语种叙词表的汉语翻译和维护方法中,提出了基于概念、词间关系、词频、概念范畴及汉语叙词优先的汉语翻译原则[11];石泽顺等对LISTA叙词表进行SKOS格式转化,并以此构建图书情报学叙词表检索系统,实现了其领域内知识概念的中英文浏览和检索[12];王刘安在基于叙词表用代关系的概念语义研究中发现对同形异义词进行翻译时,结合来源词表中的等级和相关关系进行分析翻译,从而提高其翻译准确度[13];宋培彦等通过英汉等值翻译词对进行跨语言术语同义关系的识别[14];邓盼盼等在基于精确匹配的中英文概念映射关系规则研究中,认为可以通过词间关系来进行等级映射和相关映射的探索[15];陈白雪认为词间关系可以帮助学者识别同形异义词[16];刘丽斌等从本体构建的角度,将叙词表中的词间关系进行细化,为以后不同领域的叙词表与本体间的映射提供便利[17]。
综上所述,词间关系是叙词表中特有的术语关系,虽然在各个多语种叙词表中其表现形式不同,但每一部词表中都含有丰富的词间关系,且无论从理论上还是实践中,词间关系在叙词表的研究中都得到了不同的应用。所以利用词间关系可以对叙词表中的术语翻译进行优化,使叙词表中术语的翻译更加准确,同时也为多语种叙词表的建设与维护提供一定的参考。
2 词间关系术语的翻译研究
“英表”在编制结束时,已有概念61万,其中医学领域26.4万(交叉概念5.3万),医学领域概念数量所占比例最大;“英表”中总概念的入口率(入口词/优选词)为2.13,相应的入口词大约为130万。“英表”编制初期,对优选词进行了翻译,但由于入口词数量庞大,大多数入口词是没有中文翻译的。为了完善“英表”,对“英表”进行了更新维护,一方面对未翻译的入口词进行翻译,另一方面对更新添加的新术语进行翻译,其中包括优选词和入口词。对于术语的翻译,本文不仅探讨了入口词的翻译,同时也探讨了优选词的翻译。
对“英表”中的术语翻译,首先借助网络翻译软件对术语进行翻译,然后人工辅助判断。通过翻译实践,最终选取Norm原形化工具作为原形化软件。网络翻译软件主要有Bing翻译和百度翻译,当两种翻译软件给出的翻译相同时,任选其中的一种翻译软件给出的中文翻译作为候选翻译;当两个翻译软件给出的翻译结果有差别时,则根据术语之间的词间关系选取其中最合适的中文翻译;当两种翻译软件给出结果相同,但候选翻译是多个时,可根据词间关系对这几个术语翻译进行择优选择,选择最合适的候选翻译作为术语的中文翻译。
2.1 基于等同关系的翻译研究
等同关系在叙词表中主要表现为用代关系,指一组概念相同或相近的术语,选取其中的一个术语为优选词,其他为入口词,优选词与入口词之间的关系就是等同关系[18]。而基于等同关系的术语辅助翻译指的是术语中的用项或代项已经有了中文翻译,或其含义是我们熟知的,则可以借助其代项或用项对术语进行翻译。
在“英表”中,若优选词已经有了中文翻译,在对入口词进行翻译时,就可以借助其用项进行翻译;若入口词被原形化工具处理之后,其原形与优选词的原形相同,则入口词可以直接采取优选词的中文翻译。如优选词“handcrafts”,其中文翻译为“手工艺”,而入口词是“handcraft”,因此入口词可以直接选取“手工艺”作为入口词“handcraft”的中文翻译。
若在“英表”中,其优选词的中文翻译有歧义,而其代项即入口词无歧义,则可以借鉴其入口词的中文翻译,选择优选词的中文翻译。如优选词“academic gifted”,网络翻译软件给出的中文翻译为“学业天赋”“资优生”,其代项为“gifted students”“superior students”“gifted person”,指的都是“优等生”“天才”。根据其含义可知,其主要是形容学生中的一类,因此可根据其代项,将“academic gifted”译为“资优生”。
若在“英表”中,其优选词包含入口词,则其入口词可以直接选取优选词中相对应的中文翻译为其翻译。如优选词“yeast one/two-hybrid system”的中文翻译为“酵母单/双杂交系统”,而其入口词分别为“two hybrid”和“yeast one hybrid system”,则入口词“two hybrid”的中文翻译为“双杂交”,入口词“yeast one hybrid system”的中文翻译为“酵母单杂交系统”。
2.2 基于等级关系的翻译研究
等级关系在叙词表中指不同专指度的上位优选词与下位优选词之间的关系[18],在词表中是比较常见的词间关系,主要分为属项和分项。基于等级关系的术语辅助翻译指当术语中的中文翻译无法确定时,可以向上追溯其属项或者向下借鉴其分项,进行中文翻译的确定与选择。
根据属项进行判断。如“natural”,其一般翻译为“自然”,在百度翻译和Bing翻译中,发现还有“还原音”的中文翻译。“natural”在“Schools Online Thesaurus[19]”中属项为“accidentals”和“musical notation”,其含义为“变音记号”和“音乐符号”,所以根据其属项可以将其意译为“还原记号”。如“wall of uterine body”的属项为“body of uterus”,即“子宫”。“wall”一般含义为“城墙”“围墙”,则此时可以意译为“壁”,即“wall of uterine body”可翻译为“子宫壁”;如术语“warmers”,一般情况下会理解为“warm”的比较级,原形化后可能会取“warm”的中文翻译,但“warmers”的属项是“biomedical equipment”,此时根据属项可知,“warmers”表达的应该是一种仪器,则可以将其译为“取暖器”。
若属项的颗粒度较大,根据其属项无法判断其术语含义,此时可以向下追溯其分项,根据其分项进行术语的翻译。如“person(grammar)”的属项为“inflection(grammar)”,中文翻译为“屈折(语法)”;但其分项为“first person”“second person”“third person”,表达的是叙述人称的分类,则“person(grammar)”表达的含义应为“人称”,因此应该将其译为“人称(语法)”。
若术语同时拥有等同关系和等级关系,而等同关系无法判断其含义时,可以考虑利用等级关系进行辅助翻译。如“large diameter hose”的一般翻译为“大口径软管”,但“大口径软管”既可以用在医学上,也可以用在消防上,因此直接翻译为“大口径软管”概念范围太大,不合适;而其代项为“large diameter hoses”,根据其代项是无法确定其含义的,而其属项为“firefighting equipment”,则可以根据此属项进行判断,翻译为“消防馈线软管”。
综合考虑术语的属项和分项,如果是部分和整体的关系,则可根据其属项及属项的其他分类进行判断。如“left falling strokes”的属项是“character strokes”,其中文翻译为“汉字笔画”。汉字笔画其实也是一个词族,由此可以推断“left falling strokes”是笔画中的一项,且“character strokes”的分项有“dot strokes”“horizontal strokes”“vertical strokes”,每一个分项应该是笔画中的一种类型,因此可以简单地将其做一个映射。如“dot strokes”的重点是“dot”,其含义为圆点,可以由此推断出它应指“笔画”的“点”;而“left falling strokes”在网络翻译软件中给出的是“左落杆”和“左落中风”,明显不属于汉字笔画,但由其含义可知,“left falling strokes”主要表达的是“左落下”,而在汉字笔画中具有“左落下”之意的笔画是“丿”,即“撇”,所以可以将“left falling strokes”意译为“撇”。其他分项的中文翻译具体如表1所示。
表1 英汉笔画映射表
2.3 基于相关关系的翻译研究
相关关系指概念间除等级关系以外的、具有强烈语义关联的关系,在词表中主要表现为参(C)[18]。根据其相关关系进行术语的辅助翻译,主要分为两类:一类是术语关系单薄,只有相关关系参考,没有等同关系和等级关系;另一类是虽然有丰富的等同或等级关系,但等级关系颗粒度较粗,仅依靠这两种关系无法准确判断其含义,因此可以参考其相关关系进行判断。
若术语没有上下位关系,只有相关关系,则此时只能依靠相关关系判断,尤其是多义词的判断。如“tempo”的中文翻译有“速度”“节拍”,而这两个中文翻译表达的含义是不同的,因此要依靠词间关系进行判断。而其来源词表“Thesaurus of Psychological Index Terms[20]”中“tempo”的词间关系只有相关关系,其相关术语有“music”“rhythm”等,可以由此判断出“tempo”的中文翻译应为“节拍”。如“weight observation”,网络翻译软件给出的翻译是“加权观测”“体重观察”,其相关词为“weight finding”,指“体重测定”,则“weight observation”的中文翻译为“体重观测”。
若术语中有上下位关系,但因为其颗粒度较粗,根据其上下位关系无法准确判断其中文翻译,而其相关关系却有明确的指示,可根据其相关关系进行判断。如“beads”一般翻译为“珠”,此翻译所指太广泛,不适合作为术语的中文翻译。而其上位词是“objects”,其中文翻译为“物”,并不能判断出其中文翻译,但“beads”的参项为“jewelry”,因此“beads”的中文翻译可以为“串珠”。如“watery”,网络翻译软件给出的翻译是“多水的,无力的”,将其视为“water”的形容词形式,而术语一般是名词,因此可以推断其翻译是不准确的,此时可以参考其词间关系进行判断。而“watery”的属项为“consistency finding”,与其翻译无关,而参项为“evaluation procedure”,其含义为“评估程序”,而在有关实验的“评估程序”中一般都有“提取水样”的程序,由此可以推断“watery”的中文翻译为“水样”。
3 结论
随着叙词表应用环境的变化,多语种叙词表的编制与维护成为叙词表的重要研究方向。在编制与维护过程中,不仅需要发现新术语,还应该重视术语翻译问题。本文从词间关系的角度出发,针对叙词表术语翻译过程中遇到的问题,借助叙词表特有的等同、等级和相关3种词间关系,辅助叙词表的术语进行翻译。若叙词表中术语具有用代关系,其中用项已经有了中文翻译,而入口词和优选词只是词形不同,或代项是熟知的术语,则可以依据等同关系进行辅助翻译;若叙词表中的术语无法直接译出中文翻译,而其中的等级关系可以辅助术语进行翻译,则依据其属项和分项进行翻译;若根据等级关系无法进行判断或者其词间关系比较单薄,无等级、等同关系,则可借助相关关系进行辅助翻译;若术语拥有丰富的词间关系,即同时拥有等同关系、等级关系和相关关系时,由于具有等同关系的术语一般都是同义词,因此可以首先考虑根据等同关系进行辅助翻译,等级关系和相关关系作为参考;当等同关系无法判断而等级关系可以进行判断时,可以考虑利用等级关系进行辅助翻译,最后考虑相关关系。