论人工智能机器翻译时代下机译与人译之关系
2021-01-05王希铭
摘 要:近年来,神经网络机器翻译的应用极大提升了翻译效率,开启了机器翻译的人工智能时代。技术的进步促使我们在人工智能时代下重新反思机译与人译的关系。一方面,机译与人译呈现出充满张力的博弈关系,技术全面参与的翻译环境型塑行业图景,但归根结底机译的发展仍有局限、人译把握着主体性;另一方面,机译与人译的未来期待更平衡的自由关系,翻译技术应当在注重实用、商用的同时,兼顾对自然语言本质的探索,译者则应该在保有自己主体性和价值感的同时,将技术作为一种通向真理的方法,进而实现人与技术之间良性的互动。
关键词:人工智能;机器翻译;机译与人译
中图分类号:H059 文献标识码:A
古往今来,翻译之于文化交流与文明发展有着重要的意义。近年来,随着计算机深度学习的广泛应用,机器翻译技术也尝试与人工智能相结合,出现了以神经网络机器翻译(Neural Machine Translation)为代表的新模型。人工智能为机器翻译技术带来了全新的跃进,揭开了人工智能翻译的新时代。技术的飞跃似在预言机器翻译的大好前景,但技术挤占的空间需要传统来让渡,技术的发展也需要人去适应,翻译行业中复杂的人机关系值得关注。在这样的背景下,关于机译与人译、技术与人的思考再一次被推至眼前。
一、机译的发展:人工智能翻译新时代
回望机器翻译的线性历程,机译的发展可以简单地划分为两个阶段:第一阶段是20世纪40年代至90年代,以基于语义规则(Rule-based)的早期机器翻译为代表;第二阶段是90年代后广泛运用统计数据(Statistics-based)的近期机器翻译。而如果将近年来,以谷歌团队为首所实现的神经网络翻译技术视为全新的突破,那么现在可说是机器翻译的最新阶段。
在机器翻译构想之初,寻求语言学上的“语言规则”是普遍的思路与方法。早在17世纪就有人提出可以通过制作“机器词典”来实现不同语言之间的互译。[1]这种希望借助机器以类似“查词典”的方式来实现翻译的尝试,都属于基于语言规则的机译。在早期的研究中,机器翻译由语言学家共同参与,他们与工程师和设计人员共同合作,基于自然语言表述的规律,尤其是通过总结主流语言之间的规则,形成一套类似“中间语”或“通用语”的规则,最后交由计算机执行完成翻译。在这之后,从一开始的词对词翻译,机译逐渐发展至注重源语言和目标语言之间句法结构关系的翻译,最后再到实现语义上的互译。可见在这一研发过程中,机译的研发逐步深入语言的内部,渐次涵盖更为复杂的语言关系,机器技术与语言知识的探索是共同进步的。
然而,尽管“句法、词法和语义等深层次自然语言特性”得到充分挖掘,但语言之间的通用规则毕竟难以把握,这直接导致了“程序开发难度大、人工成本高”[2]等问题。普通语言学的艰深探索不及技术开发的要求和速度,因而随着计算机运算能力的提升,把握语义规则的方法逐渐被统计计算替代。
2003年,时任南加州大学工程学院信息科学研究所研究员的弗兰茨·约瑟夫·奥赫(Franz Josef Och)利用统计的模型改进了传统机译方法,其研发的统计机译系统在美国商业部国家标准与技术研究所的测试中取得了最高的成绩。赛后,奥赫效仿阿基米德的口吻表示:“只要给我充分的并行语言数据,那么对于任何的两种语言,我就可以在几小时之内给你构造出一个机器翻译系统。”[3]正如奥赫所说,统计技术堪比克服语言翻译障碍中的“力学杠杆”。统计的翻译方法不再完全致力于寻找语言规律,而是设法建立数学模型,通过导入大量的多语言文本数据库来训练机器提高翻译的准确度。计算机经由上百亿次复杂的数学公式运算,通过统计概率最大化的方法得到语言之间的对应规律,得出翻译结果。统计的方法既使翻译效率大幅提升,又回避了对自然语言的深层开掘,可说是轻松绕过了通用语言规律的“巴别塔”,凭借计算机和数学的“捷径”,实现了不同语言之间的互译。
而神经网络机器翻译的原理又是什么,其突破在哪里?如果说统计的应用使机器摆脱了对人工编写语言规则的依赖,人们无须“告诉”计算机如何翻译,而是让它自己弄清楚,那么人工神经网络技术就是让机器翻译的这种自主性更进一步。人工神经网络是一种仿生物神经网络结构的数学模型,在机器学习及认知科学领域有着广泛的研究与应用,其最主要的特点在于它通过众多人工神经元的联结模拟大脑神经结构,从而实现机器的自主学习。神经网络机器翻译就是通过建立编码器与解码器的模型框架,借助模拟递归神经网络来实现翻译的自动化。这是一种端到端的翻译技术,也就是说机器翻译的中间过程被弱化了,乃至于“人类的语言知识已经被大规模的语言数据替代了,语言规则的作用已经不那么明显了”。[3]
人工智能的运用使得翻译机器能像人一样直接面对完整的句子,因此较之于统计方法,这种技术极有效率地实现了机器翻译的智能化。2016年谷歌关于神经网络机器翻译的实验结果表明,比起以前基于短语的翻译系统,神经网络模型的错误率平均下降了60%,其质量超过了现今所有已发表的成果。[4]有着如此卓越表现的神经网络翻譯技术,因其开发周期短、人工成本低、效率高等种种优点,一经开发便迅速“取代了统计机器翻译成为谷歌、微软、百度、搜狗等商用在线机器翻译的核心技术”。[5]目前以谷歌为例,其线上翻译系统已经支持超过100种语言的通用翻译,而微软、百度、搜狗、腾讯等多家互联网公司也竞相在神经网络方向上积极研发,翻译效率大幅提升,机译进入人工智能时代。
二、人机博弈:人工智能与技术焦虑
今天不借助机器的翻译已是不可想象,而翻译这项原本的译者事业,也在全球化翻译需求激增、机译与人译的交互下,发展出人机共存的新图景。但发展与隐忧并存,机译极具冲击力的新发展引起了更多关于人工翻译何去何从的思考,甚至有学者预言,翻译的未来或许会由译后编辑来取代现在大多数的翻译工作。[6]那么,人工智能助力下机译与人译的关系为何?效率大增、应用极广的机译能否有朝一日替代人的工作呢?
从人机共生的翻译图景来看,在强大技术的影响下,翻译这一古老的行当已经有了全新面貌,机译环境极大影响着翻译实践。翻译行业除了传统的人工翻译外,逐渐发展出机器辅助翻译、译后编辑等人机交互的模式。如今大多数的翻译需求已经可由机器来完成初稿,甚至部分文本可由机器独立地完成翻译工作。由于翻译需求量和信息实效性要求的提升,机译已经能够独立承担起那些交付时间短、翻译质量要求相对较低的内容翻译,如天气预报、网页翻译等。而机器辅助翻译和译后编辑这类“机助人译”和“人助机译”的类型,也在市场上广泛应用。因而,如今“以翻译技术为核心的计算机辅助翻译、机器翻译和翻译管理系统集成在一起,构成译者的集成翻译环境”。[7]技术的便捷、高效,既满足了需求也创造了更多的需求,塑造了今天人机交互的集合环境。
另一方面,技术的蔓延并非漫无边际,机译尚有其局限,人译仍把握着主体性。就技术而言,目前神经网络机器翻译属于“弱人工智能”范畴。何为弱人工智能?人工智能的强弱之争是该领域的重要问题,持“强人工智能”观念者认为“由数字计算机操作的二进制数字串能代表任何东西”,[8]人工智能能够思维、能够自主行动;相信“弱人工智能”者则认为“心是语义的,人心不仅仅是一个形式结构,它是有内容的”,[9]人思维的本质是无法被形式、运算所涵盖的,不能为程序所设定。而类神经网络确实使机器具备了自主学习能力,但仍必须借助人所预先设定的程序与目标进行工作。而且,目前的人工智能翻译“要依靠成百万的现成翻译文本作为参照分析的基础”,[10]且这些文本大多来自于标准化的机构、取用主流的语言,因而使得翻译趋于标准化的表达,适用范围有限,也无法满足多元创造的表达需求。
最为重要的是,翻译本身的创造性要求构成了机译的根本局限。翻译活动从来都不能被简单地视作是一项从“源预言”到“目标语言”的转化工作,尽管译者的实际工作确实是语言间的互译,但译者翻译的初衷、创造性的译法,以及译本在流通阅读中的流变等,都是极为复杂的过程。在翻译理论中,不乏类似“创译”“异化”或“归化”等理论,无不是在强调作为“中介”的翻译实际上是译者的再创造。正如本雅明所说,“译者的任务就是用自己的语言去释放藏于另一种语言表达之下的纯语言,用自己的再创作解放原先作品中被束缚的语言。”[11]这种“释放”与“束缚”不仅仅指翻译过程中因文化差异而产生的表达困难,更暗示了把握“纯语言”、对“纯语言”进行再表述是翻译之要务。
创造性也意味着翻译本身是一项“不可为”的任务。因为两种语言的互译并不存在绝对正确、完美的答案,这一点恰恰与追求准确率的机器翻译背道而驰。再创造的能力是预先设定好翻译目标、依赖现有语料数据库的机器所不能企及的。我们并不是希望通过翻译得到完美、精准的对应文本,而是为了在翻译的过程中完成深层的文化互动。这是机译和人译之间的根本不同,也是人机关系之中人占主体地位的原因。
三、反思构建:机译与人译的平衡
在人工智能助力机器翻译的时代下,人机共存、共生将是可以预见的未来。在这样的背景之下,如何平衡人译与机译二者的关系成为重要的命题。
反思技术的本质。随着技术的发展,现代社会中关于技术理性的话语渐占上风,技术至上也渐趋主流。这在翻译的研究中也是如此。翻译研究中的“技术转向”已成共识,[12]但更值得注意的是,为了应对技术讨论维度的过度膨胀,翻译技术研究对人与社会的问题有了更多的关注,形成了一个关于人的转向。[13]这种转向的背后是对技术与社会的深刻反思。不轻视机译的发展、不否认机译产生的积极意义,但也不任由技术无限膨胀,进而丧失人的主体意义。把握机译与人译的平衡,首先需要对技术本质进行有时代性地反思。
海德格尔曾以《技术的追问》为题,用哲学的方式追问现代技术的本质。尽管海德格尔对现代技术总体上持批判态度,但他也认为,技术的本质中蕴含着积极的因素。他认为技术是人的一种工具性手段,其本质是一种“解蔽”[14]。
机器翻译也是如此,其“解蔽”的本质在于更好地认识理解语言、交流文化。但机器翻译从基于语义规则,到依赖统计数据,再到人工智能,技术研究者们的研发思路发生了转向,从最开始把握自然语言本质规则,转向了基于经验实例的数据运算和统计,再到如今的类神经网络技术,技术渐长而离语言的本质越远。机译本身的表现也能说明这样的问题。机器在处理“信息型”文本时的效率,要远高于其他“表情型”和“操作型”,参考孙瑾《基于文本类型理论的机器翻译研究》一文中对德国翻译家卡塔琳娜·赖斯(Katharine Reiss)所提出的文本类型三分理论:信息型(informative)、表情型(expressive)、操作型(operative)。其中,信息型文本指自然科学、工商经济、科技类文书文本;表情型文本以诗歌、小说等文学作品为代表;操作型文本以广告、宣传手册为主,多用于商业活动的文本,这是因为机器翻译的“语言技术的研究已滞后于计算机技术”,[15]在隐喻、歧义、感染力、文化内涵及其他等创造性方面的问题存在极大的技术门槛和开发不足的问题。
在现代机器翻译中,语言本身被预置为语料库、编码器和解码器、一串串并行数据。语言的问题不再被关心,如何通过技术实现语言互譯的准确性则喧宾夺主。当翻译变得标准,译者的能动性顺从于不断扩大的翻译需求,其存在感也被不断解构。面对不断发展的翻译技术,译者的社会认同和自我认同逐步降低。在译后编辑等机器辅助翻译的模式下,译者的工作更是呈现了“去技术化”的趋势。[16]
翻译的任务不是为了消灭语言之间的障碍,翻译是一项具有生命性的活动,它不应该作为一种模板而存在,而是应该随着时代语境的变化而改变,因主体创造性的活力呈现出不同的色彩。标准化不应该是翻译的未来,机器应当成为“解蔽”而非“蒙蔽”的工具。
摆正人的主体创造性。在海德格尔看来,面对技术,人并没有被“囚禁于一种昏沉的强制性中”[14]。在技术的时代下,唯有不断地追问“我们被带向何方”了,才能获得人与技术的自由关系。这一切的前提,便是人的主体性。在把握机译与人译的平衡时,摆正译者的主体地位,提高译者在翻译工作中的主体意识是关键。
首先,面对去技术化与边缘化的主体危机,译者应当正确理解机译的工具意义。当人处于困惑之时,自然会转向工具,就像远古时代早期人类借助燧石生产生活一样。而燧石等一系列工具也正如海德格尔所说的,最终实现了人类文明的“解蔽”。机译同样也是这样一种解蔽工具。机译自诞生之初便是为了追赶、模仿人类的翻译,二者在实际任务上具有一致性。机译借助大数据、数学逻辑、信息技术实现了对内涵较直白的信息型文本的互译,既满足了全球化的翻译需求,也创造出了更多的交流互动,这是机器翻译的积极意义。因此,译者应当将其视之为一种可利用的方法,既不是一种危险,也不代表权威,无须焦虑但也要警惕机译标准化的翻译倾向,以人为主体创造性地把握技术的意义。
其次,主体意识要求译者应当更积极地适应技术集成的语言环境,在其中创造主体价值。学者王佐良认为,除非让“机器人充满文化意识”,否则机译将始終无法取代人工的翻译,因为“译者必须是一个真正意义的文化人”。[17]译者的主体性价值正是体现于文化意识与创造精神,人的能动性便是适应现实环境乃至于为现实赋予意义。因此,译者既需要去适应技术语言环境的现实,又要能“借助机器寻找意义”[18],超越技术去深入理解语言文化的复杂性,发挥译者主体的创造价值,从而实现人工与机器的共存共生。
参考文献:
[1]冯志伟.机器翻译——从梦想到现实[J].中国翻译,1999(4):37-40.
[2]高明虎.神经机器翻译综述[J].云南民族大学学报(自然科学版),2018(1):72-76.
[3]冯志伟.机器翻译与人工智能的平行发展[J].外国语,2018(6):35-48.
[4]Wu Y,Schuster M,Chen Z,et al.Google's Neural Machine Translation System:Bridging the Gap between Human and Machine Translation[J].arXiv preprint arXiv:1609.08144,2016.
[5]刘洋.神经机器翻译前沿进展[J].计算机研究与发展,2017(6):1145-1149.
[6]多萝西·肯尼.译者与机器[J].东方翻译,2017(2):18-21.
[7]崔启亮.论机器翻译的译后编辑[J].中国翻译,2014(6):68-73.
[8]玛格丽特·博登编.人工智能哲学[M].刘西瑞,王汉琦,译.上海:上海译文出版社,2001:418.
[9]约翰·塞尔.心、脑与科学[M].杨音莱,译.上海:上海译文出版社,1991:23.
[10]叶子南.又想起了斯坦纳——写在新版“谷歌翻译”诞生之际[J].中国翻译,2017(1):89-91.
[11]Walter Benjamin.The Task of the Translator.Lawrence Venuti ed.The Translation Studies Reader[M].London and New York:Routledge.2000:22.
[12]张霄军,贺军.翻译的技术转向——第20届世界翻译大会侧记[J].中国翻译,2014(6):74-77.
[13]李晗佶,陈海庆.翻译技术研究现状、问题与展望[J].北京科技大学学报(社会科学版),2019(4):112-118.
[14]马丁·海德格尔.演讲与论文集[M].孙周兴,译.北京:生活·读书·新知三联书店,2005.
[15]张政.机器翻译刍议[J].中国科技翻译,2004(1):23-28.
[16]李晗佶,陈海庆.翻译技术时代译者的身份认同探析[J].上海翻译,2020(6):35-39.
[17]王佐良.翻译中的文化比较[J].中国翻译,1984(1):4.
[18]杜磊,刘和平.“优秀的译者应借助机器寻找意义”——刘和平教授访谈[J].东方翻译,2020(6):48-57.
作者简介:王希铭(1997— ),女,浙江温州人,上海师范大学人文学院都市文化研究中心硕士研究生,研究方向:都市文化学、中外文化比较。