国内外术语研究主题分析
2025-01-10章锦雯林晨熙陈好陈一诺那日松
摘 要:文章为探讨国内外术语研究的差异性,基于知网(854篇)和Terminology期刊(216篇)论文数据,利用CiteSpace工具从关键词角度对比分析了近20年国内外术语研究的主题。研究发现国内更加注重术语翻译研究,国外则更关注术语抽取相关的研究。基于以上的差异性,又利用语料库分析工具Antconc对论文摘要中“术语翻译”和“术语自动抽取”进行了检索和搭配词分析,进一步对中外术语研究的差异性进行了深入、细微的探究。该项研究丰富了术语研究主题相关探讨和国内外术语研究的对比分析。
关键词:术语主题;术语研究;术语抽取
中图分类号: H083;C04" DOI:10.12339/j.issn.1673-8578.2025.01.017
Analysis of Terminology Research Theme in China and Abroad//ZHANG Jinwen, LIN Chenxi, CHEN Hao, CHEN Yinuo, NA Risong
Abstract: In this study we aimed to investigate the disparities in terminology research between the domestic and international domains. Utilizing data from CNKI (854 articles) and the journal Terminology (216 articles), we employed the tool CiteSpace to conduct a comparative analysis of terminology research themes over the past two decades from the keyword perspective. The research revealed that the domestic terminology study are more focused on term translation, while foreign research leaned towards term extraction. Based on the above distinction, a corpus analysis tool, Antconc, was utilized to search and analyze terms such as “term translation”/“terminology translation” and “terminology automatic extraction” in abstracts of these papers, allowing for a more nuanced exploration of the differences. This study contributes to enriching the discussion of terminology research topics and promoting a comparative analysis of terminology research at the national and international levels.
Keywords:terminology themes; terminology research; terminology extraction
收稿日期:2024-05-05" 修回日期:2024-07-23
作者简介:章锦雯(2004—),女,杭州师范大学人文学院本科在读,省政府奖学金获得者。通信方式:1935683600@qq.com。*通讯作者:那日松(1980—),女,博士,杭州师范大学人文学院副教授,硕士生导师。研究方向为术语学、术语库和语料库研究。通信方式:narsujin@hznu.edu.cn。
0 引言
随着科技进步推动人类文明向前发展,术语研究也经历着持续的演变和发展,如从早期的特定领域专业术语研究,到术语的分类标准化,以及到目前全球范围内的术语统一和标准化。术语数量的增长和复杂性的提升也推动了术语研究的深化和拓展。为了更好地了解国内外术语研究的主题有何特点,本文基于中国知网论文库和Terminology期刊,通过观察术语研究论文中关键词的分布特点,对国内外术语研究主题及其差异进行研究和探讨。
前人对国内外术语综述性的研究较少,冯志伟[1]曾指出,“与欧洲及加拿大的术语学研究相比较,汉语使用汉字而不是字母体系,而外来术语的借用往往有一个从音译到意译的复杂过程,这就使得中国术语的研究和翻译具有更大的复杂度和挑战性”,这不仅说明了术语研究的重要性,同时也强调了术语翻译在国内术语研究中的地位。此外,黄忠廉 [2]以改革开放后的外语界术语学研究为例,探求了外语界术语学基本理论研究和应用研究的发展趋势与不足,得出术语理论本土化研究有待深入的结论;刘青[3]追溯了中国术语学研究的兴起及其发展历程,从理论研究和应用研究两个方面,分别描述了术语学发展历程及发展状况。相较于综述性的研究,近年来面向某一领域术语的知识图谱、可视化、研究热点和趋势研究越来越多,如白秀敏等[4]以1992—2022年民航术语翻译研究为例,通过可视化方法,分析了国内民航术语翻译研究领域的现状与不足,展望了该领域的研究前景;孙晨霞等[5]分析了高频术语的大数据技术前沿与研究热点;孔逸雯等[6]对国内标准化护理术语进行了研究;梁红和李浩宇[7]对国际术语翻译研究的热点及动态进行了分析;孙丽丽[8]进行了中医术语翻译的研究;张千等[9]对2008—2017年10年间的中医翻译进行了对比研究。以上研究,探讨了国内术语研究的热点和趋势,对术语的研究动态进行了概述,对术语应用提出了展望和相关建议。然而,关于国外术语研究主题以及中外术语研究主题有何异同,目前的研究并未涉及。
基于上述研究成果,为了更加全面地探究术语研究的主题和特点,本文选择更长时间段(24年)内发表的论文,从宏观和微观相结合的视角,对国内和国外术语研究主题进行探究,旨在回答三个问题:(1)国内术语研究的主题主要集中在哪些领域?(2)国外术语研究的主题主要集中在哪些领域?(3)国内外术语研究主题之间差异主要是什么?
1 数据来源及研究工具
1.1 数据来源
1.1.1 国内术语研究论文
本文以“术语”作为主题检索词在中国知网中对中文学术论文(包括期刊论文和各类学位论文)进行检索,然后对获得的论文集进行了人工筛查,去除了未将术语作为讨论主题的论文,最后共得到854份论文提要(包括论文题目、摘要、关键词等),检索到的论文发表时间分布于2000—2024年。由于术语研究是自然科学和社会科学都关注的主题,中国知网中也包含CSSCI收录期刊的论文,因此将中国知网检索结果的论文提要作为本研究的主要数据来源。如图1所示,从1980年开始,术语研究的论文数量一直在稳步增长,受到越来越多学者的关注。
1.1.2 国外术语研究论文
国外术语和术语学研究论文数量庞大,特别是面向医学领域的术语研究非常集中。作为国际上影响力较高的一本专注于术语学研究的国际期刊Terminology,其研究范围广泛,涵盖了术语学、词典学、语言学、认知科学等多个领域,主要研究方向有术语学基础理论、领域术语研究、术语标注与规范化、术语教育与传播、术语与认知、术语与语言技术等。因此本研究选择该期刊所发表的全部论文的摘要(共216篇)作为国外研究数据来源,论文发表的时间跨度为2007—2023年。
1.2 研究工具
Law et al.[10]曾指出文献对于把握学科研究结构和发展的作用与优势,大部分研究领域的主要学者都将研究成果贡献于科技文献,这也是本文选择学术论文作为数据来源的出发点所在。文献统计分析是了解一个学科领域研究现状的一种途径。由于关键词是学者们从论文中精心挑选用来代表全文研究内容的关键,所以术语类论文中的关键词可作为了解术语研究的一个切入点和视角。通过分析高频关键词、关键词共现、突发关键词、关键词聚类、关键词聚类时间线图,可以分析和讨论术语领域的研究主题。高频出现的关键词,一定程度上体现了术语研究领域内被高度关注的主题;关键词共现可以挖掘关键词间的关联性,如果两个关键词同时出现的论文数量较大,可以说明关键词间的亲疏关系;关键词聚类可进一步揭示关键词根据共现的数量不同所产生的多个分组,这些分组代表了不同的研究主题;聚类时间线图可以在时间轴上看到聚类后的每个分组(研究主题)随着时间的发展状态。
CiteSpace[11-13]工具非常适合于实现关键词相关数据的生成。目前该款软件已经更新到了6.1.R6版,适合于研究学科知识图谱和文献的知识挖掘。本研究利用该工具获得与论文关键词关联的统计数据,如高频关键词、关键词聚类、关键词聚类时间线图、突发词等,从而进行术语研究主题分析。
由于CiteSpace只能宏观展示关键词的分布及共现情况,无法说明关键词在论文中的详细分布,因此本研究中也将结合Antconc[14]工具,从微观视角完成论文主题特点的挖掘。
2 术语研究主题分析
2.1 国内术语研究主题
2.1.1 高频关键词
汇总所提取的854篇论文提要中的1642个关键词,对一些相近的关键词进行合并后,高频使用的关键词集合主要有:“术语学+术语+专业术语”(364次,三个关键词出现频次的和,下同)、“术语翻译+翻译+翻译方法+英译+典籍英译+俄语”(285次)、“定义+概念”(146次)、“构成方式+术语构成”(144次)、“标准化”(74次)、“功能”(58次)、“分类”(57次)、“语言学”(28次)、“医学术语+中医术语”(175次)、“法律术语”(54次)、“体育术语+俄国体育术语+体育”(116次)、“农业术语+农业科技英文术语”(64次)、“佛教术语”(37次)、“人文社科术语”(37次)、“军语”(35次)等。这些高频关键词几乎覆盖了目前国内术语研究的主题,同时揭示了术语研究概况。
2.1.2 关键词聚类
设置CiteSpace参数K为100,利用LLR聚类方法对论文中的关键词进行自动聚类分析,可宏观了解术语研究领域的主题。通过聚类分析获得了20个类,如图2所示。这些聚类之间不是严格分开的,它们同属于术语研究,但是又显示出各自不同的术语研究方向。
由于关键词只是了解术语研究的一个视角,这种方法仍存在较多缺陷,如一个关键词的词义在不同的使用语境中体现出不同的词义特征,关键词之间关系紧密且词义界限模糊,所以本研究中只是通过关键词对术语研究分类进行简要讨论,试图发现术语研究的主题特点。
图2中聚类的名称即每个聚类中频率最高的关键词。这些聚类分别为:术语学、中医术语、框架术语学、概念、术语修辞、标准化、术语翻译、单义性、术语学理论、术语学培训、国际化、术语构成、功能、知识框架、术语规范、意译、术语定义、汉语术语学、术语编纂、医学术语学。以上关键词是各个聚类的重要代表,虽然有些聚类名称(即关键词)含义非常相近,但是聚类是根据关键词之间的共现关系总结获得,一定程度上体现了主题之间的关联程度及术语研究主题的特点。从聚类时间线图(如图3)看,有些研究主题近年来无论文产出,即基本没有使用这些关键词的论文,比如国际化、知识框架、术语定义、功能、意译、术语构成、术语编纂、术语学理论,其相关的论文输出较少。但是围绕关键词“翻译术语”的论文产出一直持续较好的势头,围绕关键词“医学术语”“中医术语”“框架术语学”“概念”“术语修辞”“标准化”“单义性”“术语学培训”的研究一直在持续发展。
2.1.3 突发关键词
突发关键词如图4所示,与聚类结果有重合,进一步证实了“术语翻译”是目前国内最热的研究趋势,同时也说明了“术语学”“定义”“标准化”在2000—2009年间是被高度关注的研究主题。
2.2 国外术语主题研究
2.2.1 高频关键词
从Terminology期刊的关键词分布来看,高频关键词主要集中在术语变化(“term variation”+“terminological variation”+“dynamics”(71次))、 英语(“language”+“English”(65次))、自动术语抽取(“automatic term extraction”+“term extraction”(58次))、法律术语(“terminology”+“legal terminology”(51次))、语料库语言学(“corpus linguistics”+“comparable corpora”(50次))、知识(“knowledge”(35次)+“knowledge patterns”(28次))、话语(“discourse”+“research articles”(34次))、框架术语(“frame-based terminology”(29次))、概念关系(“conceptual relations”(23次))、本体(“ontology”(22次))、乳腺癌(“breast cancer”(18次))、女性(“women”(18次))等方面,聚类图如图5所示。
2.2.2 关键词聚类分析
图5所示的聚类名称,即每个聚类中的代表性关键词(13个类)分别是:自动术语抽取、论元结构、知识丰富的语境、术语变异、法律术语、感官感知、情景认知、应用语言学、概念关系、语料库语言学、概念分析、本体工程、分类学等。
综合高频关键词和关键词聚类名称的特点,可以看出国外术语研究更多集中在基于语料库的术语研究以及知识本体研究、术语自动抽取等方面。
从时间线图(如图6)来看,国外近年来无围绕语料库语言学、感官感知、法律术语、分类学相关的术语研究成果产出。但是围绕术语自动抽取、论元结构、应用语言学、概念关系的论文产出一直在持续。
2.2.3 突发关键词
从下图7的突发关键词数据来看,关于“自动术语抽取”“术语学”相关的主题是近年来的研究热点,而“术语变异”在2010—2014年间曾是被热点关注的研究主题。
3 中外术语研究主题对比
前面从高频关键词、关键词聚类/时间线图、突发关键词等角度对国内和国外术语研究的主题进行了分析。汇总以上研究结果(见表1)和关键词在论文摘要中的分布数据,可以对国内和国外术语研究的差异进行对比和分析(表中标注下划线的聚类名为更具国内和国外各自特色的主题)。
从关键词角度的分析结果来看,国内术语研究主要围绕关键词“术语翻译”展开,这也证实了“中国术语翻译具有更大的复杂度和挑战性”这一论述 [1]。国外术语研究除大量集中于“医学术语”研究之外,其术语研究主题还主要集中于“术语抽取”方面。鉴于国内外术语研究的差异性体现在多个方面,本文只对其中最重要的两点差异进行详细分析和讨论。
3.1 “术语翻译”研究主题方面的差异
关键词统计数据(CiteSpace知识图谱)更适合于宏观了解术语研究的概况和趋势。为了详细了解国内外术语翻译研究方面的差异,我们选择了可以概括和体现“翻译”这一主题的关键词,即以“翻译、英译、音译、直译、意译、译、俄语”为检索词对论文摘要(进行了分词处理)进行检索分析(检索数据来源同上文,即中国知网的854篇论文提要)。图8展示了三个论文摘要集合文件(按论文发表时间顺序分为三组)中“翻译”相关检索词的分布情况,前2个摘要集合文件中“翻译”相关研究较为密集(图8中的plot部分,如ABdownload1集合中论文的发表时间距现在更近),揭示出越来越多的研究涉及 “术语翻译”,而早期对“翻译”的讨论较为分散(ABdownload3.txt),且论文数量较少。图9是以Terminology为数据源的检索结果,检索词为translate的所有词形。可见英文论文摘要中“术语翻译”相关研究的分布相对均匀和分散。
我们利用Antconc软件生成国内外“术语翻译”这一检索词的搭配(Collocate)词,从而继续解读国内外研究在“术语翻译”方面的差异性特点。表2和表3中分别列出了国内和国外论文摘要中与“术语翻译”关系最近的搭配词(表中数据以loglikelihood值大小排序)。借此可以了解国内外术语翻译研究方面的细微差异,如国内更重视术语翻译的策略、实践、方法等,研究内容广泛,而国外的术语翻译除了中文术语研究外,多探讨术语翻译标准化问题。
3.2 “术语抽取”研究主题方面的差异
同样的方法,我们以“抽取、提取、自动”/“automatic、extraction、recognition”(英文检索词还纳入其变化词形)为检索词对论文摘要进行检索分析,结果如图9、10。与上文的“术语翻译”相关研究对比,中文“术语抽取”研究相对较少,而与英文“术语翻译”研究相比较,英文“术语抽取”研究的数量则相对更多。
研究中也发现国内外术语研究差异中的共同点,如国内外术语抽取都在探讨单语或双语术语抽取(见表4、5),同时基于语料库的技术和方法也是重点关注的方向。
除以上两方面的差异之外,国内术语研究覆盖了多个领域(按出现频率,先后有中医、体育、武术、科技、佛教、医学、物理、会计、社会科学、政治、器材、典籍、建筑、照相、服装、航海、军事、农业等),而国外更多关注医学、法律等领域。术语研究本身与所有领域的术语都相关,只是给予的关注度不同。由于医学是全球人类最关注的学科之一,医学术语的准确性和规范性对于医疗实践、医学文献的撰写和阅读都具有重要意义。从Web of Science论文数据库搜索的结果来看,由于国外对医学术语的研究规模庞大,以至于将术语研究的其他方面都掩盖了。
值得一提的是,国内术语研究中“术语学培训”旨在培养学者和实践人员对术语的深入理解和应用能力,以适应不同学科和领域的交流需求,而国外则不同,这也是国内外术语研究主题的差异之一。
4 结语
本文以论文关键词作为了解术语学科研究主题的切入点,通过多种方法(词频、聚类、突发词、分布、搭配)对比了研究国内外术语相关学术论文中的关键词,以探讨国内外术语研究主题的差异。研究发现,国内外术语研究的侧重点不同,国内较多聚焦术语翻译的策略、实践和方法,而国外重视探究基于语料库方法的单双语术语自动抽取研究。以上对比发现可以丰富目前国内的术语研究,有利于扩大术语研究范围,从而发现更多术语研究主题。当然很多术语研究主题国内外都在开展,只是有些更多地被关注,有些则受到研究者不同程度的关注。了解国内外术语研究主题的动向能够更好地服务于今后术语研究的发展,也可为今后的研究提供方向指导,帮助研究者把握目前的研究热点和动向,更好地推进术语学向前发展。
由于术语研究横跨文、理学科,研究范围广,我们在选择学术论文时难免有疏漏和搜集不全的情况,特别是为了筛选更符合术语主题的国外论文,国外文献只选择了Terminology一本期刊所发表的论文作为数据源,存在局限性。在今后的研究中将进一步扩大检索范围,以期得到更为全面的研究成果。
参考文献
[1] 冯志伟. 现代术语学引论[M]. 北京:语文出版社, 1997: 8.
[2] 黄忠廉.我国外语界术语学研究综述[J].辞书研究, 2010(2): 100-109.
[3] 刘青. 中国特色术语学研究历程回顾[J]. 中国科技术语, 2024, 26(1): 3-10.
[4] 白秀敏,王杭.国内民航翻译研究综述:基于172篇中国知网(CNKI)文献的计量可视化分析[J]. 民航学报. 2023, 7(2): 123-128.
[5] 孙晨霞, 施羽暇. 近年来大数据技术前沿与热点研究:基于2015—2021年VOSviewer相关文献的高频术语可视化分析[J]. 中国科技术语,2023, 25(1): 88-96.
[6] 孔逸雯, 韩琳秋, 沈鸣雁. 基于CiteSpace的国内标准化护理术语研究可视化分析[J]. 护理与康复, 2023, 22(8): 44-48.
[7] 梁红, 李浩宇. 基于CiteSpace的国内科技翻译研究动态知识图谱分析(2000—2020)[J]. 长春理工大学学报(社会科学版),2022,35(5): 165-170.
[8] 孙丽丽. 2010—2019年中医术语翻译研究现状分析[J]. 科技视界, 2020(10): 211-213.
[9] 张千, 吴青, 凌武娟,等. 2008—2017中医翻译对比研究现状及展望[J]. 世界中医药, 2019, 14(3): 633-637.
[10] LAW J, BAUIN S, COURTIAL J, et al. Policy and the mapping of scientific change: A co-word analysis of research into environmental acidification [J]. Scientometrics, 1998, 14(3-4): 251-264.
[11] 李杰.《Citespace科技文本挖掘及可视化》[M]. 北京:首都经济贸易大学出版社, 2017.
[12] CHEN C. Science Mapping: A Systematic Review of the Literature [J]. The Journal of Data and Information Science, 2017(2): 1-40.
[13] CHEN C, HU Z G, LIU S B, et al. Emerging trends in regenerative medicine:a scientometric analysis in CiteSpace [J]. Export Opinion on Biological Therapy, 2012 (12): 593-608.
[14] ANTHONY L. AntConc: A learner-friendly, multi-platform corpus analysis toolkit [C]//Proceedings of the 11th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2014). 2014: 102-107.