ChatGPT 下自然语言处理新进程与生态翻译理论指导下的译文相关性探究
2024-01-06郭爱娜
郭爱娜
(山东科技大学,山东 青岛 266590)
基于事物发展的规律,语言是一门有逻辑性的学科,也是灵动的、主观的表达,在胡庚申先生提出生态翻译理论时,正是结合了中文语言下的基本结构以及语言的表达习惯。 而新兴事物ChatGPT,当下作为一款可沟通的聊天机器人,在对话中所遵循的逻辑亦是如此。 不同的是,前者更多的是理论的总结、文本语言学的研究,后者则更多地基于互联网信息时代下汇合的数据集。
一、 研究背景
(一)ChatGPT 的简介
ChatGPT 是由人工智能研究实验室OpenAI 在2022 年11 月30 日发布的全新聊天机器人模型,一款人工智能技术驱动的自然语言处理工具。 其既能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至完成撰写邮件、视频脚本、文案、翻译、代码等任务。
ChatGPT 出世时,各大媒体争相报道,谷歌震动,微软裁员,央视新闻和半月谈,包括一些跟数据行业,人工智能AI 相关的公众号知乎号文章层出不穷,知网上也已经有了关于ChatGPT 的评论文章,人工智能“自然语言处理”增加了里程碑式的一幕。上线仅2 个月,ChatGPT 的活跃用户突破了一亿。
(二)生态翻译指导理论
生态翻译理论由胡庚申先生在其2004 年的《翻译适应与选择论》一书中首次提出,后来在2013 年时发表的《生态翻译学:诊释与构建》中变得成熟。他将达尔文著名的生物进化论结合到了翻译的研究中,并形成了名为翻译适应选择论的观点,即译者为了适应语言的生态来筛选词句的翻译。 其是当下中国首个被独立创造出来的翻译理论,也叫翻译生态学[1]。 其中,“三维转换理论”表现的是该理论具体的翻译方法,一共分为语言维度、文化维度以及交际维度。
二、 ChatGPT 应用与生态翻译的异同
(一)ChatGPT
1. 背景
ChatGPT 之父Altman,29 岁联合马斯克创办OpenAI,其现价值290 亿美元。 当微软宣布投资100 亿美元与ChatGPT 母公司OpenAI 合作后,谷歌就宣布与OpenAI 竞争对手、人工智能(AI)初创公司Anthropic 建立新的合作伙伴关系。 AI 兑现红利的标准之一是现实的应用场景。 而搜索引擎,就是这个场景之一。 ChatGPT 付费版的推出,可以使得生成式人工智能 AIGC ( Artificial intelligence generated content)在商业化上有望再进一步。 代表人工智能构思内容的AIGC,是新一轮内容生产方式变革,而且AIGC 内容在Web3.0 时代也将出现指数级增长。
2. 发展历程
如表1 所示,GPT 家族经历了三代的时间,其中GPT 家族与BERT 模型都是知名的NLP 模型,都基于Transformer 技术。 GPT-1 只有12 个Transformer层,而到了GPT-3,则增加到96 层。
表1 GPT 模型发展历程
InstructGPT/GPT3.5 是ChatGPT 的前身,它与GPT-3 的主要区别在于,新加入了被称为RLHF(Reinforcement Learning from Human Feedback,人类反馈强化学习)。 这一训练范式增强了人类对模型输出结果的调节,并且对结果进行了更具理解性的排序。 为了让GPT 3.5 初步具备理解指令的意图,首先会在数据集中随机抽取问题,由人类标注人员,给出高质量答案,然后用这些人工标注好的数据来微调GPT-3.5 模型(获得SFT 模型,Supervised Fine-Tuning)。 2022 年12 月,Anthropic 再次发表论文Constitutional AI:Harmlessness from AI Feedback介绍人工智能模型Claude。
3. 应用领域
第一,ChatGPT 可以帮助各行各业的从业人员提高工作效率,及时地获得有效有逻辑的实时信息。作为辅助工具,它的优势在于精准搜索,有效排序,客观及时且准确,为专业人员省去了烦琐的信息筛选过程,充分发挥主观能动性,提高思考和分析能力。
第二,ChatGPT 在输出时,符合大众的表达习惯,可以跟人一样可以实现语言的自然化处理,实现人机高效互动和信息急速处理。
4. 局限性
ChatGPT 可贵在其半监督学习算法,目前的“干货较少”,逻辑强于内容,逻辑推理暂且没有显式的应用。 所以可以说ChatGPT 只是对话质量高,在商业化的道路上仍然艰难。 ChatGPT 既不是知识系统,知识不够准确,也不是陪伴系统,情商没有那么的高,现在还处在蛮荒时代。 ChatGPT 涉及自然语言处理NLP/NLU 领域时,已知局限包括对重复文本、对高度专业的主题的误解以及对上下文短语的误解。 对人类或AI,将需接受多年的训练才能正常对话。 对NLP 类模型,GPT 不仅要理解单词的含义,还要理解如何造句和给出上下文有意义的回答,甚至使用合适的俚语和专业词汇。
尽管ChatGPT 确实能让查找信息的过程更加直观,当下时代知识正在变得更加容易获取,学习门槛降低,学习过程也在缩短。 但ChatGPT 在很长一段时间内只可以达到互补的关系,并在此基础上发展AI 助教,智能医疗,智能金融等,既能实现人机的更大交互,也能进一步联系好人机关系。
(二)生态翻译理论的理论结构以及具体体现
1. 三维转换体现在对译文的处理上
第一,在语言维度上,又可以分为词法结构和句法结构,那么人们会需要考虑源语和目标语的文化和社会差异,如中英文的修辞方式等,从而调整目标语的表达形式,使得译文符合读者的阅读习惯。
第二,在文化维度上,可能会存在文化差异的问题,这要求译者充分地理解两种语言的文化意义,并在内涵和形式上都进行转换,使得受众的审美要求得到满足。 并且,译者在翻译过程中需要具备文化意识,注意文化差异导致的阻碍[2],从而保证信息的正确交流。
第三,在交际维度上,交际维度的适应性体现在选择转换上,译者在进行翻译时,需要合理地结合上下文以及语境,使目的语读者能够理解原作者想要表达的深层次含义,甚至再建立感情上的链接,让译出语的读者可以理解作者所想,甚至产生共鸣,达到交际的目的。
2. 生态翻译理论指导下的翻译方法
(1)词法层面
第一,换词转译。 有些语境下,中文里存在引申意义,译者可能需要因此调整表达方式,修改表达内容。 同时,由于表达习惯有所不同,同一个中文也会被翻译成不同意义的英文(如中文里的多义词)。
第二,词性转换。 由于中文中多用动词以及副词,而英文则使用更多的名词。 在翻译过程中,动词名词化和名词动词化实属于常见的两种翻译技巧。当然使用翻译技巧的前提是保持原文意义的不变并应用来提高译文语言地道性和可读性[3]。
(2)句法层面
中英文是不同语系,需要特别处理一些特殊的句法结构。 因此,必要时需要运用以下翻译技巧,用来最大化地实现译文的转换。
第一,语序转换。 英文表达中,一般习惯将重点放在前面,而中文将重点放在后面。 中文多动词,而英文句子中只能有一个谓语动词。 因此,笔者需要在翻译过程中,采用语序转换的翻译技巧,以使译文表达更加合适各自语言的表达习惯。
第二,语态转换。 中文句子中多使用主动语态,而英文表达中则被动语态使用较多,且常缺少主语,所译的内容皆需要根据具体情况,将原文中部分主动语态转换成被动语态。
第三,拆句重组。 长句如果直接按照原文形式翻译,会使译文显得十分冗长,所以此时需要将长句拆成短句后重新组合,但前提是保留原文的逻辑不变。 使译文在准确传达的基础上,同样条理清晰,减轻读者的阅读负担,提升关注译文的内容信息的水平。
(3)语篇的层面
文化维度和交际维度的适应性选择与转换是指译者需要将原文蕴含的文化信息在翻译的过程中进行传递且应当是较大程度地传递到译文中。 也就是说,译者不仅需要关注语言的形式和语言的内涵,还要考虑原文存在的交际功能。
(三)生态翻译理论指导下的译文与GPT 下文本翻译的相关性
生态翻译是指在原文的生态结构中,不特别强调翻译过程,然后选择文本来翻译并且反复实行这样的做法,所以,生态翻译是带有语言特色的翻译[4]。 生态翻译是以生态的视角和眼光来对翻译进行综合观察的理论,有一定的主观性。
而Siri、安卓、华为以及其他智能手机下的语音助手,相比几年前的功能,也已经相对人性化,人工智能更加贴切生活必然是未来的趋势。 当下人工智能已经涉及更大范围的应用。 除了各种翻译软件,国内的抖音、小红书,国外的谷歌搜索、Ins、Youtube,皆涵盖深度学习下的神经网络的应用,包括个性化推荐、大数据、大数据下数据叠加、卷积神经网络等。而在自然语言处理下,像ChatGPT 这样的应用模型是人工智能应用进程中的“最后一公里”。 对机器来说,它无法完全遵循人类的语言去表达,因为机器人是基于客观的数据集去归类的,并不能主观能动地去思考。 相对的,主观思考和能动性,这对人类来说很简单。 反之,人类在复杂数学计算上暴露的短板,用机器就能更加快捷和高效。 机器和机器人的出现是因为技术的进步,使得生产力达到原先全靠人力而不能达到的水平,这也理解为“自然语言处理下的发展”。 播客里“Round table”播音员的一句话:“如果未来,50 岁的我可以跟25 岁的我聊天,那真的是太诡异了。”从客观角度来讲,这是时间上的穿越。 比如《流浪地球2》里面的MOSS,也投射这是ChatGPT 的应用的影子。 把人的某阶段的记忆封存为数据的形式,就可以达到数据层面的永生。 而影片中的小女孩,她的记忆是一串数据,通过与外界不断地交互信息,产生每隔两分钟,这也体现出灵活的自然语言对话形式,尽管它实际是基于数据的、客观的。 但影片的父亲,便可以这种方式让他觉得自己的女儿永远生活着,即便现实情况下,他清楚地知道,这是人工智能“自然语言处理”的数千万种结果的一次次呈现。
回到生态翻译理论,生态翻译理论强调的是从原文固有的生态结构出发,最后达到适应的目的,在翻译的过程中反复遵循其内在的生态结构,并表现在另一种语言中,实现最终三维的转换。 生态翻译对文本,就好比ChatGPT 对人类语言,或者说自然语言处理对人类语言而言。 以《流浪地球》系列的影片为例,其字幕翻译部分便充分展示了生态翻译理论的应用。 如:在中华语言文化中,多音字、形近字、同音不同形的字、多义词、四字短语、成语、歇后语、谚语、俗语、俚语再配上各种修辞手法,可能还有隐喻等。 地道的中文表达,直译往往是不正确或不准确的,为了更多地基于文化专项、文化负载,站在生态翻译理论下三维转换语言,可以帮助外国的观众在该翻译方法下理解翻译的内容,并以英文惯用的表达形式,最终准确理解影片中表达的意思,从而实现文化的输出和文化交互。 在字幕翻译过程中产生的语言转换,由于其本身所有的特点以及影片面向观众的特性,则常会出现自然语言,基于上述的成语、歇后语以及修辞手法,翻译的译员需要像自然语言处理一样,先做到NLU(Natural Language understanding ), 再 做 到 NLG ( Natural Language generating),翻译出英文的或其他语言的字幕,与“encode”和“decode”同理。 与字幕翻译相同的是,字幕翻译和ChatGPT 皆有一定的信息即时性。 字幕翻译在影片播放时一闪而过,ChatGPT 在聊天对话框即时性输出。
三、 结论
正如生态翻译理论指导的译文,既可以应用这样的理论,也可以让理论引导我们,但是想要完全吃透人类语言,搞定一切固有结构,还有十分长的路要走。
实现更好的机器辅助,将是长期的主题。 目前要做的就是如何生成和适应自然的固有结构,遵循底层的逻辑,就如同生态翻译理论所表达的这样。从人类语言文化的角度来看,中国语言文化积累上下五千年,没有什么机器可以瞬间打破文化的积淀,人脑的创新思维以及人类的好奇心所可能拓展的能达到的领域。 即便是人工智能,也同样是人类智慧的产物。