APP下载

法律翻译的数字人文转型研究

2024-06-20宋丽珏

外语学刊 2024年2期
关键词:数字人文术语数据库

提 要: 专题数据库建设是数字人文实现的重要手段,也是数字人文基础设施建设的关键。法律翻译数据平台是以数字化手段支持中外融通、促进“海外中国”健康前行的重要工具。该数据平台不仅为法律翻译教研与实践提供宝贵的数据资源,还通过应用自然语言处理技术进行数据建模,构建了集应用层、业务层和数据层于一体的法律翻译数据检索平台。与基于ChatGPT的智能翻译结果相比,平台检索的翻译结果更加精准,能够弥合知识域与语言域之间的差距,为翻译教学及研究提供可靠的翻译数据支持。该平台的建设过程包括选取重点国家和贸易领域的立法文本,完成目标语言的翻译工作,并运用自然语言处理技术进行数据建模。

关键词: 数字人文;法律翻译;ChatGPT;数据库;术语

中图分类号:H319"""" 文献标识码:A"""" 文章编号:1000-0100(2024)02-0051-7

DOI编码: 10.16263/j.cnki.23-1071/h.2024.02.008

Innovative Practices of" Digital Humanities Technology in Legal Translation: A Case Study" on the Construction and Application of the BRI Legal Translation Data Platform

Song Lijue

(School of Foreign Studies, East China University of Political Science and Law, Shanghai 201620, China)

Specialized database is an important means to achieve digital humanities and a key component of digital humanities infrastructure. The Legal Translation Data Platform is an important tool that supports communication between China and BRI countries and promotes the healthy development of “Overseas China” through digital means. This data platform not only provides valuable data resources for legal translation research and practice but also utilize Natural Language Processing techniques for data modeling, constructing a legal translation data retrieval platform that integrates the User Interface layer, Business Logic layer, and Data Access layer. When compared to the intelligent translation results based on ChatGPT, the translation results retrieved by the platform are even more accurate, thereby bridging the gap between different knowledge domains and language domains. This makes the platform an optimal support system for translation teaching and research, offering dependable translation data support. The construction process involves selecting legislative texts from key countries and trade sectors, completing translation work in the target language, and utilizing natural language processing techniques for data modeling.

Key words: Digital Humanities; Legal Translation; ChatGPT; datebase; terms

法律文本翻译数据库作为专题数据库在法律翻译领域的应用,主要借助自然语言处理相关技术,并通过B/S模式实现的检索平台。其核心是基于英汉、阿汉多语对照法律文本,通过倒排索引功能,实现跨库精准检索,形成数据层、业务层和应用层的数据库结构。本研究构建的法律文本翻译数据平台具备4个主要功能模块,为用户提供法律翻译实践的查询便利,同时实现中外法学知识的传播,为相关法律翻译研究提供数据来源和语境。在研究领域方面,数据库平台可以深入探讨法律翻译相关问题,如翻译语言特征、翻译策略与方法,以及拓展翻译单位或翻译学的知识体系。在技术开发方面,数据库平台实现了多语言对的支持,提供英汉和阿汉多语对照立法文本。此外,更可待进一步研发数据挖掘和精准术语提取技术,以提高检索的准确性和精确性。

1 数据库研制

数据平台的重点在于翻译“一带一路”共建国家的主要立法文本,以满足日益增长的合作国家对法律文本的获取需求,并重点解析合作国家的法律环境。同时,该数据平台还能用于辅助识别对外合作中的法律风险,为相关主体提供真实可行的防范和应对策略,克服跨境法律文本的语言障碍,促进“一带一路”倡议的可持续发展。此外,该平台还将重点研究和明确参与国的法律规则体系,作为开展对外合作事务的关键环节。到目前为止,尚未存在具备动态性和多语对照性质的法律翻译数据库,为此,该数据平台不仅能实现主要法系立法的互动和汉译,还将推广中国法律的外译(目前主要以英语为主),以促进学术交流和知识传播。

数据平台主页采用“一镜到底”式呈现,实现了用户友好、信息全览、便捷检索3项功能。平台包含项目介绍、法律法规、关键词、学术研究和行业咨询等5个主要应用模块。目前,“法律法规”模块包括公法、私法和社会法3个分类,包括以投资法、贸易法、竞争法、知识产权保护法等为主的相关法律96件,英汉/阿汉语共计335万词频;以“海南自由贸易港公平竞争条例”等为代表的中译英法律法规32件,共计102万词频。通过遍览,用户可以在“项目介绍”模块中检索数据平台设计的主要思路和逻辑关联。“关键词”模块包含关键法律术语106条,每一条术语都细分为词条、双语例释、知识库以及相关理论4个部分,共计17万词频。此外,“学术研究”和“行业资讯”两个模块则包含与数据库主题相关的研究成果,以及学界关于“法律翻译”为主题的研究动态和重要行业会议、活动的信息。结合语言数据,平台架构由上至下可以划分为三大层次,即应用层、业务层、数据层,如表1所示:

数据平台可存储法律法规、法律术语、学术研究、行业资讯4类数据。数据类型不同,数据库存储的内容也各不相同。

2 数据平台的应用与法律翻译教学

数据平台在法律翻译教研中的应用潜力巨大,通过翻译结果和语料库,研究人员可以分析语言特征、探究翻译技巧。同时,语料库也提供了丰富实例,助力研究人员总结翻译规律和策略。数据平台还能为教研提供实时参考和反馈,促进教学内容的更新和改进。数据平台的广泛应用将推动法律翻译教研的发展与进步,以下将具体分析数据平台在法律翻译教研活动中的潜能。

2.1 分页面的详细内容与法律翻译实践教学

构建法律翻译语料库是数据平台建设的基础,准确的翻译结果和真实的语料数据可以为法律翻译教学与研究提供有力支持。平台结合多种编程语言(如表1所示),实现了分页面检索功能,为有效开展法律翻译实践与教学提供了便利。具体而言,在项目介绍模块中分别对录入数据平台的文本类型进行了说明,以便用户快速浏览平台选录文本的分类,以及明晰彼此之间的逻辑关联。“法律法规”模块选录的类目分别是公法、私法和社会法。文本均为双语对齐的全文版本,在页面右上方会显示相关背景信息,包括名称、总句对、地区、领域和语言对方向,如图1所示:

在“关键词”模块中所录入的是基于平台建设过程中翻译语料库提取的术语集合,也包括涉外法治相关术语及其英译。在每条关键词下方,均包含由例释(example)、法学知识(knowledge)、相关理论(theory)3个部分组成的解释性双语说明,为法律翻译教学与实践提供便利。以“原告”(原告人)词条为例,该词条含两条例释、两项法学知识(主要是关于诉讼费用的承担问题)和一项中外对比的相关法学理论依据,也对在不同区域,比如英国、美国、欧洲对应原告(或原告人)相关术语做出详细区分,如图2所示:

由于相同概念在不同国家的法律制度中含义不尽相同,从而造成法律术语翻译过程中难以对等的问题(赵军峰" 薛杰" 2022:27)。数据平台的内容不仅为法律翻译实践提供查询便利,同时也实现中外法学知识的普及。例如,在法学界有关民事诉讼或行政诉讼中的原告或刑事诉讼领域原告人使用之差异,于翻译学界而言是难以逾越的专业知识壁垒,类似难题在平台上均可查询并应用于翻译教学。

此外,还有两个模块可以辅助法律翻译教学和实践活动,学术研究模块主要是将法律有关的研究成果数字化,便于知识传播。行业咨讯则是实现相关学术动态的传播和宣介。正如前文所述,检索功能是数据库平台建设的一个关键技术实现,用户既可以对语种限定进行简单检索,也可以针对不同子类展开高级分类检索。譬如,在全文法律法规库中检索关键词“投资法”,勾选“全文检索”以及“模糊检索”后,页面下方便会显示出跨库检索的结果。再比如,摘自“埃及投资法”的句对,点入后会得到埃及投资法全文。同时,用户可以发现在分别进行精确检索和模糊检索后的词条数目存在较大差异,分别是421条与921条,说明不同层级检索功能的实现。再以阿拉伯语的检索效果为例,如选用“卡塔尔投资法”中的阿拉伯语词作为检索词,在高级检索中加以分级限制,对没有“区域”设限时的检索结果和设定“非洲”为检索目标时候的结果,分别是855条和580条,说明检索功能实现。

根据屈文生等(2021)的研究,翻译质量对域外传播效果有直接的影响。数据平台所收录的立法文本和译文都经过高质量审校,是原创作品。这就为研究法律文本的翻译语言特征、翻译技巧和方法提供了可靠的数据支持。在教学过程中,学生可以配合语料库和统计学分析软件,进行定量统计分析,挖掘法律文本及其译文的语言使用特征。通过对原文和译文的比较,可以进一步总结法律文本中常见的翻译策略和技巧的应用规律。数据平台还包含大量词块、法律术语和程式语言,教学中可以进一步分析这些法律语篇中的典型语言特征,并总结翻译文本中使用的策略和方法,以促进学生对法律语言的熟悉,并便于总结法律文本翻译的规律。

2.2 平台的功能架构与法律翻译研究

法律翻译不是两种语言之间的简单转换。法律翻译可以使跨越法律体系的源语言主体的知识转化为目标语言知识。(张法连" 崔璨" 2023:23)一切语言、翻译研究均寓于实际使用中,其包含的意义势必在实际使用中寻求证据(濮建忠" 2014)。以翻译单位(translation unit)研究为例,20世纪中叶以降,学者们从语言、文化和功能的角度对其展开过研究(如JeanPaul Vinay,Jean Darbelnet,Gyorgy Radó,Irma Sarvali,Stepan Grigorevich Barkhudarov,Susan Bassnett,Christiane Nord,Teubert,王德春、罗选民、王克非、司显柱、蓝红军、濮建忠、卫乃兴等)。虽对于翻译单位的“跨度”仍有争议,但至少有3个共同要素已达成共识:无歧义、尽可能精简、在译语中有翻译对等(卫乃兴 陆军 2014,蓝红军" 2021)。此外,还有一个重要的判断标准是它是否与共文(cotext)形成更大的、稳定的语言单位,能够在译文中找到稳定的对应单位。学者们也认识到,在翻译领域中,翻译单位是具有显著区分特征或标识作用的实体,亦具有动态性。在翻译过程中,译者可以灵活选择并处理翻译单位。(郑冰寒" 谭慧敏" 2007;Alves" 2013)。众所周知,翻译的先决条件是理解“意义”,而语言学界对于“意义”一直抱有谨慎态度。如何探寻话语意义不外乎在(语言)内部求索,亦或是由(语言)外及内。在以往的研究中不难发现,物指、心指和话语自指的意义观往往是泾渭分明(濮建忠" 2019)。但无论是单纯地从语言外部寻求意义,或是仅仅是在话语内部观察、总结都无法掌握全面、精准的意义,更遑论翻译了。

翻译平台的建设则是从多元关系观出发,通过不同功能模块在知识网络中擘画具体意义单位和翻译单位。但无论是何种论证都需要在双语界面下收集、观察语料证据。通过表1可知,平台的应用层(界面)通过可视化的方式展示平台内部数据,建设中使用的是Flask框架①,主要基于它完成对业务层数据的传输工作。业务层顾名思义,是平台的业务处理核心,该功能也需要对语料进行处理并建立索引。最底层则是平台的数据层,该层对于平台至关重要,是平台的支撑组件,负责数据的存储、提取、修改等数据交互工作,其中主要包括语料数据库和索引数据库。信息检索模块负责处理客户端(Browser)的请求,根据请求在数据库中检索数据并返回。语料库管理模块负责在服务端(Server)预处理语料和语料库的更新工作。平台的功能架构确保了在检索过程中完整的语义、翻译单位呈现,便于开展法律翻译的相关研究(具体示意参见表1)。

除外国法的汉译之外,数据平台同时包含国内法律、法规的外译。正如黄友义(2022:143)指出的那样,“过去我们是‘翻译世界’,现在在继续‘翻译世界’的同时,我们更加重视‘翻译中国’”。不同于简单的翻译语料库等研究方法,数据平台集合了多个数据模块,从而实现跨库检索。这样的关键词检索功能可以实现跨语体、全语境(fullcontext)的翻译单位研究。以在法律文本中颇具代表性的civil一词为例,通过关键词检索得到“法律法规”模块中包含92条结果,“关键词”模块中2条结果,“学术研究”模块中20条结果。通过观察检索行,常见搭配包括civil law( 民法 )、civil juristic relationship/act( 民事法律关系/行为 )、civil liability( 民事责任 )、civil action( 民事诉讼 )、civil servant( 公务员 )和civil( 文明 )等。显而易见,civil一词在法律中的使用与普通词典或日常语境中存在一定差异。只有在具体知识观照下②,去观察词汇的搭配、类连接、语义趋向,甚至是语用功能,才能在文本层面发现具体的翻译单位及其应用。

再如,在“法律法规”模块中的出现的双语对应检索行信息:《塞拉利昂公司法》中的Power to bring" civil proceedings ( 提起 民事诉讼 的权利 ),或是the company shall not incur" civil liability" to any person if [...]( 公司无须承担 民事责任 ,若…… ), 又或Provided that the Court before which any such" civil proceedings" are instituted[...]( 前提是受理任何此类 民事诉讼 的法院,…… )。在术语模块也会出现包含civil作为中心词的所有内容,如civil law和civil liability. 值得一提的是,在每个术语项下都包含法律翻译的例句和法学原理的解析,civil law对应的3种译文分别是民法、大陆法和国法,这实则是在3个层面上的翻译结果,若译者不善法学知识则很难判断正确形式③。

这些法学知识的补充对于法律翻译理论与实践而言至关重要,可以从知识论的角度拓展翻译理论,亦可实际指导法律翻译实践。李瑞林(2015:11)指出:“知识联结是第一性,语言转换是第二性,语言转换是翻译的表象特征,知识联结是翻译的内在特性。”④陈大亮(2022:2)也提到,“翻译什么文本,就需要什么知识,需要什么知识,就研究什么知识。”可以说,语言域与知识域共同作用于翻译实践,而翻译本身又是知识从地方性通达世界的桥梁。通过将数据结构化,可以进一步将隐藏的知识提取出来,等于生产出新的知识,这种转换也是一种翻译的过程(耿强" 2021)。需要注意的是,在大型语言模型ChatGPT横空出世的时代,人工智能已经实现了3个关键技术和4个主要维度上的突破,即知识、数据、算法、算力的升级。其中,知识生成的能力使得ChatGPT相较以往所谈及的人工智能已产生了本质性跃升,这使得译者、学者、学生不可避免地采用智能翻译实践与研究,那么在法律翻译领域,智能翻译、人工翻译、数据平台的差异性、互补性是否存在?存在于哪些方面?恰是需要进一步深入讨论。

3 ChatGPT与数据平台翻译结果对比分析

ChatGPT的全称是“生成式预训练转换器(Chat Generative Pretrained Transformer)”,虽然在基础算法上并未有新突破,但实现了运算的“工程性”胜利(胡加圣" 戚亚娟" 2023:4)。ChatGPT在自然语言处理领域具有广泛的应用前景,其能够处理各种类型、各种领域的文本交互,并具有提高人工智能多样性和独创性的能力。但目前鲜有研究在法律翻译领域的表现进行评述,尤其是进行多译本的对比分析。下文拟就不同例句对应的ChatGPT译文、学生译文,以及平台检索后人工审校的译文进行比较分析,进一步说明数据平台在法律翻译领域的教研应用价值。

下例中Judgment Notwithstanding the Verdict实则为一例法律术语,译为“ 径直判决 (JNOV)”,特指在陪审团已作出裁决后,法庭对另一方当事人作出判决的法律程序。JNOV的原理是,如果陪审团的裁决没有法律根据、违反公共政策或者明显有误,法院可以推翻陪审团的裁决,直接作出判决。另外一个术语Arrest of Judgment,特指一项法律程序,其目的是为了请求法院撤销已经定谳但尚未宣布的判决,或在宣布后立即启动程序以撤销此判决,主要是为了纠正裁决错误或者判决违法的情况。这个程序通常会寻求法院裁定,以确定是否需要撤销原判。翻译时尤其需要注意verdict和judgement的译名统一与规范化⑤。裁定(verdict)是指由陪审团在听取证人证词和法律分析后做出的协商一致的决定,判决(judgment)则主要是指法官在审理案件后做出的决定。通过表3所示的翻译对比不难看到,ChatGPT在翻译法律专门知识域中的效果有限,尤其在法律术语的翻译上均存在较大偏误。同时,在程式语、句式等翻译单位的处理上亦存在多处失误。学生译文是在ChatGPT翻译之后的审校版本,在法律术语的翻译方面仍存在较多问题,翻译中也存在一些搭配失误的情况。可见,法律翻译的难点主要是中外法学知识缺失(导致术语使用误译),以及翻译单位(程式语、搭配、句式)处理不当两个层面。

翻译是融通中外、通往各个学科的知识进路。翻译在不同学科中起着重要的作用,帮助传递知识和思想发展,促进学科间的交流和发展。(杨枫 2021)诚如是,翻译活动的要义是知识生产。(屈文生" 徐琨捷" 2023:83)法律翻译作为垂直领域翻译,需要处理涉及法律知识域(legal domain)和语言域(linguistic domain)之间的复杂关系。法律知识域包括法律概念、规则、原则等,而语言域则包括特定语言中的词汇、语法、文化话语表达等。数据平台能够通过整合大量的法律文本和专业术语,为翻译研究和实践提供可靠的语料库和翻译记忆库。同时,数据平台能够深入分析法律文本间的关联性和语言结构,识别出法律领域的特定术语、常用词汇以及短语结构。这些都可以很好的弥合在法律翻译中存在的知识域与语言域之间存在的障碍。

4 结束语

数字人文是使用计算机技术和网络技术来研究传统人文科学的一门新型交叉学科,它的产生与发展得益于计算机科学和数字技术的进步及其在科学领域的普及应用(冯志伟" 张灯柯 2023:1)。专题数据库建设和数字化数据平台的创建是数字人文发展的关键手段和基础设施建设。它们为学术研究提供了更加全面和丰富的数据支持,并为学术交流和国际合作提供了更加有利的环境和基础。通过数字化数据平台,专题数据库能够更高效地组织、管理和共享,从而提高研究效率,并提升成果转化的潜力。本文以法律翻译数据平台的创建及应用为例,探讨了专题数据库建设和数字化数据平台创建在数字人文发展中的重要作用和价值,以期为数字人文发展提供有益的参考和启示。

注释

① Flask是一个使用Python 编写的轻量级 Web 应用框架。

②参见陈大亮(2022:2),“知识在翻译系统中始终都是翻译实践的核心、翻译研究的本体、翻译元素中的核心要素、翻译变量中的常量、动态翻译场中的稳定因素”;杨枫(2021:2),“惟有知识是一切翻译行为中的每个元素都受其驱动的最基本的原动力”。

③民法是指部门法,用于调整平等主体的自然人、法人和非法人组织之间的人身关系和财产关系。大陆法与普通法(common law)共同组成两大法系的概念,大陆法系又称罗马法系。普通法系又称英美法系。国法是与道德律、宗教法或教会法相对的由世俗国家实施的法律体系。

④转引自覃江华,“翻译与知识生产、管理和转化——知识翻译学刍议”,《当代外语研究》2022年第1期,第61页。

⑤摘自法律翻译数据平台(hitmitlab.cn),详见屈文生、万立著《涉外法治法律英语教程》,法律出版社,2021,第79页。

参考文献

陈大亮." 关于知识翻译学的元反思[J]. 当代外语研究, 2022(2).‖Chen, D.L." Metareflection on Translation Studies of Knowledge[J]. Contemporary Foreign Language Studies, 2022(2).

冯志伟 张灯柯." 数字人文、元宇宙与自然语言处理[J]. 外语学刊, 2023(6).‖Feng, Z.W. ," Zhang, D.K. Digital Human, Metaverse and Nature Language[J]. Foreign Language Research, 2023(6).

耿 强. 从观念的旅行到知识翻译学:一个谱系学的考察[J]. 当代外语研究, 2022(3).‖Geng, Q. Genealogical Review of" How Travelling Theory Develops to Transknowletology[J]. Contemporary Foreign Language Studies, 2022(3).

胡加圣 戚亚娟. ChatGPT时代的中国外语教育:求变与应变[J]. 外语电化教学, 2023(1).‖Hu, J.S. , Qi, Y.J. When Confronted with ChatGPT, How will Chinas Foreign Language Education Policy React: Seeking Changes and Adaption[J]. Teaching Educational Foreign Language Education, 2023(1).

黄友义. 从翻译世界到翻译中国[M]. 北京:外文出版社, 2022.‖Huang, Y.Y. From Translating World to Translating China[M]. Beijing: Foreign Language Press, 2022.

蓝红军. 国家翻译能力的理论建构:价值与目标[J]. 中国翻译, 2021(4).‖Lan, H.J." The Theoretical Establishment of National Translation Capacity: Values and Goals[J]. Chinese Translators Journal, 2021(4).

李瑞林. 关于翻译终极解释的知识论探索[J]. 东方翻译, 2015(3).‖Li, R.L. The Epistemological Exploration of Translation[J]. East Journal of Translation, 2015(3).

濮建忠. 语料库驱动的翻译研究:意义单位,翻译单位和对应单位[J]. 解放军外国语学院学报, 2014(1).‖ Pu, J.Z. Corpusdriven Translation Studies:Units of Meaning, Translation Units and Correponding Units[J]. Journal of PLA University of Foreign Languages, 2014(1).

濮建忠. 探寻意义的本质:从物指到话语自指[J]. 外语教学与研究, 2019(2).‖Pu, JZ. Exploring the Nature of Meaning: From Referent to Discourse Selfreference[J]. Foreign Language Teaching and Research, 2019(2).

屈文生 万 立. 涉外法治法律英语教程[M]. 北京:北京大学出版社, 2021.‖Qu, W.S. , Wan," L. English Vocabulary for International Legal Practice: A Coursebook[M]. Beijing: Peking University Press, 2021.

屈文生 徐坤捷. 法律知识的全球环流与近代中国法形成的重塑[J]. 探索与争鸣, 2023(10).‖Qu, W.S. , Xu, K.J." The Global Circulation of Legal Knowledge and Remaking of the Image of Modern Chinese Law: Revisiting the English Translations of" The Chinese Supreme Court Decisions[J]. Exploration and Free Views, 2023(10).

卫乃兴 陆 军. 对比短语学探索——来自语料库的证据[M]. 北京:外语教学与研究出版社, 2014.‖Wei, N.X. , Lu," J. Phraseology in Contrast: Evidence from EnglishChinese Corpora[M]. Beijing: Foreign Language Teaching and Research Press, 2014.

张法连 崔 璨. 知识翻译学视域下的法律翻译[J]. 当代外语研究, 2023(3).‖Zhang, F.L. , Cui, C." On Legal Translation from the Perspective of Transknowletology[J]. Contemporary Foreign Language Studies, 2023(3).

赵军峰 薛 杰. 法律翻译的概念移植与对等阐释——《中华人民共和国民法典》物权编术语英译探究[J]. 上海翻译, 2022(1).‖Zhao, J.F. , Xue, J. Conceptual Transplantation and Equivalent Interpretation in Legal Translation — Translating Key Terms on Real Rights of the Civil Code of the Peoples Republic of China[J]. Shanghai Journal of" Translators, 2022(1).

郑冰寒 谭慧敏. 英译汉过程中翻译单位的实证研究[J]. 外语教学与研究, 2007(2).‖Zheng, B.H. , Tham, W.M." An Empirical Study of Translation Units in EnglishChinese Translating[J]. Foreign Language Teaching and Research, 2007(2).

Alves, F. Investigating the Conceptualprocedural Distinction in the Translation Process[J]. Target: International Journal of" Translation Studies, 2013(1).

【 责任编辑" 孙 颖】

作者电子邮箱:stella2002@163.com

猜你喜欢

数字人文术语数据库
数字学术与公众科学:数字图书馆新生态
数据库
跨界与融合:全球视野下的数字人文
跨界与融合:全球视野下的数字人文
大规模古籍文本在中国史定量研究中的应用探索
数据库
数据库
数据库
有感于几个术语的定名与应用
从术语学基本模型的演变看术语学的发展趋势