体认翻译学下对人工智能的翻译动态模式构建的探究<br/>——以ChatGPT为例

体认翻译学下对人工智能的翻译动态模式构建的探究
——以ChatGPT为例

2023-04-18张慧玲

文化学刊 2023年12期

张慧玲

引言

体认翻译学作为一种新兴学科理论,批判继承了传统的语言学与翻译理论,将翻译视作体认的产物,而不仅仅是语言符号与意义的转换[1]。从体认翻译学的视角来看,翻译活动中的“同”与“异”可分别从“体”和“认”的角度进行分析。“体”是马克思主义哲学唯物论的表现,强调翻译过程中译者的互动体验;而“认”表示人类对于语言的认知加工,凸显认知的重要性。体认翻译学着力对于翻译过程中“现实—认知—语言”的动态建构,而非单一的静态考察。人工智能软件 ChatGPT 风靡全球,它是人工智能技术驱动的自然语言处理工具,能够学习人类语言来进行对话以及翻译。作为机器,它并不能从现实生活中获取生活经验及互动体验,不能完成“体”。作为人工智能,ChatGPT的工作机制是人类使用者输入提示后,其再输出答案。不过,ChatGPT集成了Grammarly、Phrase Bank、Collocaid等软件的校对、替换、改述功能[2],并且ChatGPT可对译文进行校对和润色。那么,ChatGPT 能否从“体”和“认”来处理翻译文本,它的内在的认知机制以及它是否能够完成翻译的动态构建,这是本文将要探究的重要议题。

一、体认翻译学概述及研究现状

体认翻译学是王寅结合了认知语言学与翻译学研究,分别从“体”和“认”两大要素对翻译进行研究的新兴翻译学理论。这一理论重点突出语言是由“体”与“认”两个过程产生的,即先有“体”后有 “认”。王寅认为传统翻译理论过于重视“语言层面”上的转换,而忽视其背后的体认机制[3]。而体认翻译学旨在弥补这一缺陷。翻译是一个从现实到认知,再到语言的动态构建过程。体认语言学认为,认知和语言来源于人类对客观现实的“互动体验”和“认知加工”。在体认翻译学的框架之下,翻译的过程并非将现实、认知、语言三个层面分隔开来,而是凭借体认机制,强调各层面的互动性,三个层面的动态转换。语言的转换是现实世界和认知世界共同作用的结果,“体”是由于人们对现实世界的体验存在共通之处,“认”是由于各民族的文化背景和思维模式不同,所以,受其影响而形成的认知世界也不同。针对体验的普遍性和认知的差异性,译者作为体认主体,以现实世界为基石,分析认知世界的异同,巧妙地将源语映射为目的语。体认翻译学是整合体验哲学、认知语言学、体认语言学及翻译学的创造性成果。体认翻译学作为一种新兴的翻译理论,是中国本土化特色的翻译理论[4]。

目前,体认翻译学的研究现状主要分为以下三方面:理论建构、动态建构以及与传统理论的衔接。第一,理论建构。“体认翻译学”是由王寅在2021年首次提出的,形成了系统的理论体系,但其思想萌芽于20 世纪末接触认知语言学,他意识到可将认知语言学与翻译研究相结合。2010 年,马丁(Martin)在书中正式提出了“Cognitive Translatology(认知翻译学)”,因此,国内学者融合了认知语言学与翻译学,于 2012 年在《中国翻译》上首次使用认知翻译学这一术语。紧接着,中国学者尝试将哲学(传统哲学、马列主义、语言哲学、后现代哲学、中国后语哲等)与语言学研究结合,就将“认知翻译学”修改为“体认翻译学”。第二,动态建构。体认翻译学主要从“现实、认知、语言”三个层面进行研究。“语言”是对现实世界进行“互动体验”和“认知加工”的结果[5]。就目前对于体认翻译学的应用,主要是从三个层面的其一或其二来进行分析的,对于翻译过程中 “现实—认知—语言”的相互作用的研究并不多见,体认翻译学的研究方向应着力于动态建构,而非单一的静态考察[6]。第三,与传统理论的衔接。体认翻译学理论基础包括马列主义唯物论、语言哲学、体验哲学、认知语言学、体认语言学、后现代哲学及认知科学。如今,西方翻译理论被广为使用,我们要努力建构我国自己的译论学派。我国传统的译论“文质之争”和“信达雅”是中国学者接受和学习的译论,而新兴的中国特色译论却略显争议。在西方译论的统摄下,中国传统译论逐渐淡出公众视野。我们的翻译研究只能跟着西方理论走,从“文化转向、多元理论”到“异化—归化”等等都是如此。我们创立了我国的特色翻译理论,不应仅限于和西方译论的衔接,应该加强与中国传统译论的融合。

二、ChatGPT时代下翻译发展现状

ChatGPT 是2022年美国人工智能研究实验室 OpenAI 开发的一种新型人工智能聊天机器人。该机器人在对大量数据进行整合与训练应用的基础上,通过“监督学习”与“强化学习”的方式,具有了较强的自然语言理解和生成能力,并能与人类进行高质量对话。在此基础上,可以完成相对复杂的工作,包括连续问答、摘要生成、文档翻译、信息分类、代码编写、论文撰写等多种任务。ChatGPT与以往的人工智能聊天机器人有本质区别。ChatGPT的出现标志着人工智能从低级智能阶段逐步迈入高级智能阶段。ChatGPT在超大规模预训练语料的基础上,通过深度学习机制,获得了强大的语义分析能力,已具备进入人类语境和理解人类语言的功能。在运行逻辑上,ChatGPT应用了“基于人类反馈的强化学习”训练机制,可在与人交互的过程中习得人的语言特征和思维方式,从而获得能力的进化。

ChatGPT仿拟人类神经网络运作机制进行知识生产,但尚不具备人的思维、逻辑能力和认知水平,其逻辑基底是由人设计和构建的。ChatGPT不是原创性的知识生产者,而是按照先置算法对人类知识进行加工和重组的知识搬运工。翻译是一个复杂的知识生产转换过程,对翻译目的的理解、对原文语言风格的体悟、对原文文化信息的领会、对原文知识的创造性转换和翻译方法与策略的使用等与译者的知识储备、文化底蕴与专业素养密切相关。

三、ChatGPT的运行机制

(一)ChatGPT的技术内核

ChatGPT,即生成式预训练转换模型。ChatGPT 类语言模型的特点之一是对词语序列的概率相关性建模,即根据输入的语句预测接下来不同语句出现的概率分布。简而言之,ChatGPT 可以根据上文预测下一个词出现的可能性,所以也可以看作统计语言模型。笔者通过对ChatGPT 的主体架构和主要组件的分析,发现语料体系、预训练算法与模型、微调算法与模型构成了ChatGPT 的技术核心,其使ChatGPT可承担模仿人的思维模式、自由创作、文档翻译等逻辑性更强的工作。

(二)语料库是基础

ChatGPT 的运行必须要有庞大的语言语料库,要有大量功能强大的运算模型作为逻辑推理的支撑,才能够实现其功能[7]。语料库是生成内容的原始素材来源,语料库的大小直接决定了所生成内容的丰富性及全面性,其覆盖面越广、内容越详尽,内容生成可选择的空间就越大;而其中模型和参数是基于实际需要不断变化和更新的,用户规模越大,他们需求的差异化就越会表现出来。大型语言模型不仅是涵盖了多种语言的模型,还是能够对各类语言进行推理运算并实现内容筛选所呈现的模型,它也是 ChatGPT 的核心模型。

(三)预训练算法与情景交互

ChatGPT 的预训练分为无监督预训练和有监督微调。ChatGPT通过有监督的调优、模拟人类偏好、近端策略优化来进行强化学习。无监督预训练是通过学习数据间的内在结构和模式来提取信息,ChatGPT是通过阅读大量的对话数据,学习语言的语法、语义和上下文的联系。微调是在无监督训练之后,在一个特定任务上对预训练模型进行重新训练。对ChatGPT的微调阶段,研究者使用了监督学习和强化学习相结合的方法。学习与用户的实时情景交互是ChatGPT内容生成能力的重要体现,它能够根据不同情景给出相对应的答案,并且能就某一内容的系列问题展开持续对话。由于用户规模巨大、个体差异明显,ChatGPT 所面临的交互情景也就更为复杂多样,要想解决这个难题,可以采用不断更新优化模型和补充、更新与完善语料库的方式。基于现实情景的调整进行相应模型的优化,通过精准的参数设置来实现与用户对话的匹配性。语料库的改进是基于用户的需求,加入新的内容,对老旧内容进行补充,对有误的内容语义进行改正,从而保证语料的数量和质量。

(四)微调算法与语言表达

ChatGPT的微调一般是通过两种方式。一种是指导模型生成更符合用户期望的语言表达,我们可以通过提供一些优秀的对话样本,告诉模型哪些回答是正确的,模型会根据示例样本生成更加准确的回复。另一种是通过强化学习来微调,我们可以通过奖励模型生成高质量回复来提升性能,将ChatGPT的回答与人类生成的参考回答进行比较,并根据相似度来奖惩模型,通过更新迭代来改善模型。ChatGPT的语言表达的好坏,主要是用户对 ChatGPT 的感知,即相较于与真实的人会话所感觉到的差异,这种差异越小表明 ChatGPT 的表达越接近于人,其语言表达越真实。这也会受到外界的影响,如果对话内容来源于较权威的专家学者,并且已是成熟的学术概念,那么生成的语言表达就更接近人;而面对复杂情景下的个人情感或新出现的学术研究概念,ChatGPT 的回答便跟人有了差距。所以,ChatGPT 语言表达的人化程度是其功能发挥的重要考量,其不仅要具备专业知识,在知识储备上甚至要能够超过领域内的专家,而且还要具备人的逻辑推理及表达能力,从而形成用户所需要的内容。ChatGPT 在内容生成以及信息传递过程中,提供给用户的是真实的内容,生成的内容是客观的,能够根据会话完成具有逻辑性的内容生成与传递。

ChatGPT 的兴起,源于人工智能技术的普及,在不同场景下,其可根据用户的需要完成情景交互和互动体验,能够满足用户的即时需求,并以可见的内容呈现出来,实现了由浅向深、由虚向实的转变。随着相关领域的进一步拓展,其会被应用于更多的行业。综上所述,语料体系、预训练算法与模型、微调算法与模型构成了ChatGPT 的核心技术,情景交互和语言表达是ChatGPT的一种能力,我们要利用好、发挥好ChatGPT强大的功能,实现人与机器的和谐发展。

四、动态构建

ChatGPT 利用深度神经网络对大规模文本数据进行训练,对信息进行归纳、整合和完善,其本质上属于词和句序列的自动输出。这种模型以模仿人类自然表达为目的,能够生成符合语言逻辑的文本,其算法逻辑并不关注信息的真实性。相反,它能够修正杂乱的语法或错误的翻译,并变换为更适合的表达方式,使虚假的信息显得更具说服力和可信度。OpenAI首席技术官米拉·穆拉蒂认为,ChatGPT可能会“编造事实”,并表示这是当下基础的大语言模型共同面临的挑战。

ChatGPT作为大型语言模型具有强大的通用语言理解和生成能力,能够遵循人类指令完成不同类型的自然语言处理任务。ChatGPT在尊重除了美国的其他国家的文化背景和使用习惯上仍有欠缺,看似客观中立的技术背后隐藏了平台资本的操控。翻译具有价值观构建功能,世界虽然是相似的,但是各个地区的自然环境不完全相同,人们认识世界、理解世界、表达思想的方式也不尽相同,那么翻译时自然会融合译者的人生观、价值观、世界观,由于译者的地区不同、经历不同、感受不同,那么其所翻译出来的译文自然各不相同,这是处于体认翻译学下对翻译的探究,我们在翻译过程中必须透过语言的现象看到体认的本质,才能将翻译做好。对ChatGPT来说,它的翻译是和语料库进行比对,再结合用户的需求而生成的一个语言产物,并不会考虑到体认翻译学的三大核心内容“现实、认知、语言”,从而不能实现三者的动态构建。

五、结语

ChatGPT 类生成式人工智能不具备理解能力。ChatGPT 本质上是基于语料库的数据积累和概率计算进行的输出,尽管在形式上已非常接近于人的表达,但其本质仍然是一种计算机语言的计算和转译[8]。本文从体认翻译学和ChatGPT 翻译内容生成的角度,探讨了ChatGPT能否实现体认翻译学的动态构建,从发展现状、运行机制、案例分析几个方面进行研究,提出了ChatGPT产出译文的方式,以期对翻译理论的发展提出一种新模式。当然,ChatGPT的应用要充分发挥其知识创造能力,着重其创新模式的培养。在翻译知识创造过程中,人依然是主宰,人工智能只是被应用的工具和手段[9]。