机器翻译和跨文化交际:发展、问题及思考
2019-09-10周春芳
周春芳
摘 要:文章收集整理了机器翻译和跨文化交际的相关概念、机器翻译的进程和机译系统的分类,对机器翻译的发展和现状进行了简要介绍,对机器翻译和跨文化交际的关系以及机器翻译在跨文化交际应用中存在的问题进行了简单梳理和思考,希望有对有兴趣了解机器翻译和跨文化交际及其应用的人士有一定的参考意义。
关键词:机器翻译;机译系统;跨文化交际
Alphago先后打败李世石和柯洁这样世界一流围棋高手,打开了人们的想象空间。经济全球化、互联网用户爆炸式增长和AI技术的快速发展使机器翻译技术在促进不同文化之间的人们进行政治、经济、文化交流等方面发挥着越来越重要的作用。中国经济的快速发展,人们生活水平的不断提高,越来越多的国家和地区成为了中国人的旅游目的地,越来越多的人走出国门,去世界各地旅游观光和购物。但由于受到外语能力的制约,很多人在进行跨文化交流时无法使用同一种外语进行流利顺畅的沟通,往往只能借助翻译机器或翻译软件进行简单的交流。机器翻译技术的进步使得人们通过智能手机等手段就可以方便地获得以往难以想象的高质量的翻译结果,大大方便了普通人进行跨文化的交流,然而可能随之出现的对机器翻译工具的依赖,又会使得人们学习外语的兴趣降低,进而减少了通过长期的语言学习了解异国文化的兴趣和机会,这将使得跨文化交际的深度受到限制。如何在二者间取得平衡需要进行思索与探讨。
一、相关概念
机器翻译,又可称为自动翻译,是利用强大的计算机技术将一种自然语言转换为另一种自然语言的除理过程。它是计算语言学的一个重要分支,是人工智能发展方向和重要目标之一,有十分重要的科学研究价值。相较于人工翻译,机器翻译具有三个明显的优势:成本低、易把控以和翻译速度快。机器翻译技术的发展一直与计算机技术、信息论、语言学等学科相互交叉,相互促进,学科之间联系紧密。机器翻译发展初期,由于计算机性能低下,存储能力小,只能进行简单的词典匹配,后来又产生了词典结合语言学专家知识的规则翻译。互联网的出现,产生了大量的文本和语音数据,大数据带来了基于大型语料库的统计机器翻译,随着计算机技术的快速发展和计算机计算能力的不断提高,多语言信息也出现爆炸式增长,机器翻译技术已经在谷歌翻译、Youtube视频字幕自动生成等方面得到广泛应用,能够为广大普通用户提供各种实时便捷的翻译服务。
跨文化交際(cross-cultural communication 或inter-cultural-communication),是指本族语者与非本族语者之间的交际,也指在语言和文化背景方面存在差异的人们之间进行的任何交际,简单说,就是和外国人打交道时,如何有效得体地进行沟通交流,同时还要注意哪些问题。跨文化交际包括言语交际和非言语交际。
二、机器翻译的发展进程和分类
上个世纪的三四十年代人们就开始了对机器翻译的研究。从机器翻译诞生以来,一般来说,学界认为机器翻译经历开创期(1947—1964)、受挫期(1964—1975)、恢复期(1975—1989)和新时期(1990至今)四个阶段。1954年,IBM公司与美国乔治敦大学(GU)展开产学研合作,通过计算机史无前例地进行了英文翻成俄文的尝试,向社会大众和科学界揭示了运用机器进行翻译的是可行的,机器翻译研究的从此走进了人们的视野。美国科学院1964年成立了语言自动处理咨询委员会(Automatic Language Processing Advisory Committee,简称ALPAC),对机器翻译的研究进展情况进行长期跟踪,对该领域取得的成果进行有效评价,并对其展开综合调查分析和各种性能测试。进入二十世纪七十年代后,科学技术的发展一日千里,跨文化交际时语言障碍对正常的交际形成掣肘,传统的人工翻译方式由于翻译人才不足等原因已经远远不能满足人们在日常工作生活中与日俱增的巨大需求,运用计算机来从事或辅助翻译工作可以缓解对人工翻译的需求。新世纪以来,互联网的进一步普及,信息量暴涨,数据量呈几何级递增,科学统计方法也得到具体而充分应用。为了满足日益增长的需求,各互联网公司纷纷成立机器翻译研究机构,不断加大人员和资金方面的投入,着力研发基于互联网和大数据的机器翻译系统,机器翻译不再是少数群体使用的工具,真正走向社会,走向实用,例如如今为人们广泛使用的“百度翻译”,“谷歌翻译”等。
计算机翻译系统事实上是计算机科学中机器学习技术的一个重要应用。与机器学习可以分为基于规则的流派和基于统计的流派类似,相应地机译系统一般也可以被划分为基于规则(Rule-Based)和基于语料库(Corpus-Based)两大系统。基于规则的机译系统以语言学总结的现有的词典和规则库构成知识源,通过知识源由人工设计相应的翻译算法;而基于语料库的机译系统则是由经过人工整理、划分与标注的大量语料库构成知识源,主要通过运用机器学习中的统计学习相关方法,由机器学习算法自身通过训练学习到语料库中存在的各种模式与统计规律,而不再需要人工通过词典或规则构建。在早期为了设计机器翻译系统需要收集高质量的语料库并对这些语料库进行深入的分析与研究,而这些对语料库的研究又反过来推动了对机器翻译系统的认识,可以说传统的机译系统与语料库语言学是相互促进地发展起来的。多数传统的机译系统主要是由基于规则的策略发展出的,这些系统可以被划分为语法型、语义型、知识型和智能型四类。这些林林总总的机译系统的区别主要在于核心的算法以及构成系统的组成部分的不同。
三、机器翻译的应用
从应用层面上来讲,机器翻译一般可分为词典翻译软件、计算机辅助翻译软件和机器翻译软件。
词典翻译软件是最基本的日常网络查词工具,人们在阅读时碰到生词、不熟悉的词组或固定搭配,有时会查电子词典。
计算机辅助翻译软件是利用计算机的强大记忆功能将译者之前翻译的资料进行存储整理,以后再出现类似翻译能够迅速进行查询。CAT软件已经是一个比较成熟的产业,例如GoogleTranslator Toolkit、Microsoft LocStudio等,Trados在计算机辅助翻译软件领域占有绝大多数的市场份额,微软等国际巨头都是它的用户。
机器翻译软件(MT)运用计算机根据一定规则把一种自然语言转换为另一种目标自然语言。目前我们所使用的大部分翻譯软件,如谷歌翻译、金山词霸和有道翻译等都属于机器翻译软件。当前机器翻译在跨国的互联网巨头中已经得到了广泛的运用,搜索引擎巨头如google和百度等都对搜索的网页内容提供了翻译的功能选项,而视频巨头Youtube也为视频内容提供了由机器翻译自动生成的字幕,这些大大方便了用户对外语内容的获取。最重要的,随着智能手机的广泛普及和语音识别技术(TTS)的发展,机器翻译软件在智能手上机得到了广泛的应用,以苹果公司的手机助手Siri为代表。如今智能手机为用户提供了便捷易得的机器翻译服务,使得机器翻译得到了前所未有的广泛应用。
四、机器翻译与跨文化交际
在跨文化交际的一些正式场合如外交谈判、经贸谈判,由于涉及文本的重要性,对翻译质量的要求很高,为避免出现错误、歧义和不符合这类正式场合的结果,目前很少用到机器翻译,人们更多看到的是使用高质量的人工翻译,如由同声传译员担任翻译任务。
人们在出国旅游和购物这样一些跨文化交际的非正式场合,机器翻译则得到广泛运用。最近热播的电视剧《带着爸爸去留学》中,主人公黄成栋(孙红雷饰)在送儿子赴美留学时,由于儿子所在语言学校发生枪击案等一系列事件,爱子心切的黄成栋决定留下来陪儿子。所以他打算在儿子就读学校找一份工作。他与校方沟通交流时,由于语言不通,就使用了便携式翻译机。由于智能手机的普及,许多外语程度不是很好的人出国旅游都会在智能手机上下一个翻译APP,帮助他们与老外进行简单的跨文化交际。随着近年来我国经济的高速发展,每年有越来越多的家庭选择出国旅行或者将子女送到国外接受教育,而这些便捷易得的机器翻译技术使得跨文化交际不再是由外交、翻译人员等掌握外语技能精英所垄断,也使得留学中介等相关机构不再能够利用客户缺乏外语能力所带来的信息不对称获取不合理的高额利润。从这一点看,机器翻译在跨文化交际中不仅有着广阔的应用前景,还会广泛而深刻地改变整个跨文化交际的形式以及内容,而目前探讨机器翻译对跨文化交际所带来的影响以及二者之间的关系的研究还比较少。
五、机器翻译在跨文化交际应用中存在的问题
机器翻译仅仅是解决语言的转换问题,使得一种语言所携带的基本的信息能够传递给使用另一种语言的人,然而众所周知语言本身除了传递信息这一基本功能之外,它更是文化的载体。对于在语言中所包含的这类历史、文化的信息、仅仅依靠机器翻译是难以准确传递的。比如习近平主席在讲话中会经常引用中文的古诗词、外国的经典名著、名人名言,机器翻译对这种有着丰富文化内涵的东西进行翻译质量并不高,对于长期从事某一种语言翻译的译员也是一种挑战。
机器翻译很方便、快捷,也可能降低一部分人学习外语的积极性。随着各种语言翻译APP的出现,以及这种资源获取的便捷性,深入学习一门语言的人可能变少,人们会把机器翻译当计算器一样使用。但是不去花大量时间和精力学习一门语言会失去深入了解这个国家文化和历史这样的信息的机会,这使得跨文化的交际的深度被限制,只能停留在较低层次的交际水平,难以真正实现通过跨文化交际取得文化上的共鸣。
有人说,人们在交际时,语言交际只占35%或者更低的比例,更多的是进行非语言交际。对于非语言交际,机器翻译目前几乎无能为力。除非人工智能发展到一定阶段,机器翻译软件在翻译语言的同时还能判读语言交际者的非语言行为,比如面部表情、手势等肢体语言,并对其进行准确有效的分析和理解,再还原为语言向对方进行信息传递,才能达到基本的交际目的。
另外,由于语言本身的复杂性,人们在交际时,自然语言因为语义模糊、上下文背景不清楚,有时会产生歧义。有的自然语言存在一词多义的情况,在理解和翻译时,也让人无所适从。比如:老师罚他砍树。这句话就可以理解为:老师因为他砍树而罚他;或者老师让他砍树作为对他的惩罚。再比如:
A:来张火车票?
B:去哪儿?
A:成都
而另外一段对话:
A:这首歌很好听
B:哪一首?
A:成都
以上两段对话,第一个成都是地名,第二个成都则是歌曲名。
还有:这树枝怎么会这样长?这句话里“长”字既可念成“zhang”,也可以念成“chang”,一字多音也会给人带来困扰。
机器翻译是将文本或语音从一种语言自动翻译为另外一种语言。互联网的出现,产生了大量的文本数据,大数据的发展使得目前主流大型互联网公司开发的机器翻译工具采用的主要都是基于大型语料库的统计机器翻译。语料库的大小、质量,收集语料的来源、可靠性,也制约着机器翻译输出的质量。对有些小语种而言,由于使用人群数量小,现存语料库资源不足,使得这些小语种的机器翻译工具的开发比较困难,而且机器翻译的质量普遍不高。并且目前互联网上的内容主要都是以英语、中文、法语等大语种所展现的,对小语种使用者而言要想在互联网上进行跨文化的交流,高质量的机器翻译工具的缺失将迫使他们不得不选用一种主流语言作为第二语言以实现将信息传递给使用其他语言的对方,这将更加加剧大语种和小语种在互联网交流上的不平衡,使得小语种的内容更难得到积累。长期来看会使得小语种在跨文化交际上处于“失语”的境地,甚至影响到小语种的生存。小语种本身携带了很多文化信息,比如苏格兰的盖尔语,是苏格兰最古老的语言。公元五世纪罗马结束对英国的统治后,盖尔语成为苏格兰大多数人使用的语言。到了十九、二十世纪,盖尔语逐渐退出苏格兰学校教育和公众生活领域。如果你去苏格兰深度旅游,了解一点关于盖尔语的知识会帮助你加深对苏格兰人文、历史等的了解。小语种的缺失也影响跨文化交际。少数民族的文化很丰富,但缺少了高质量的机器翻译,使得这些文化难以被更多人了解。
六、对机器翻译和跨文化交际的几点思考
语言本身是复杂的,自然语言在缺少语境的情况下有很大的歧义性和多样性,自然语言對历史遗存和现存知识也有很高的依赖性,在很多情况下对自然语言的理解受到上下文的制约。语言是人类特有的一种能力,是人类区别于其他动物的本质特征。人类的许多智能都与语言有着这样那样的关系。人类如何进行逻辑思维以及人类几千年来遗留下来的绝大部分知识也是以语言文字的形式保存和流传下来的。所以,自然语言也是人工智能必须突破的一个重要部分。
我们知道,在市场经济中,用户至上。机器翻译能否快速发展,取决于用户是否对译文的质量满意。机器翻译发展的快慢很大程度上取决于译文的质量的好坏。就目前已经取得的成就来看,机器翻译的质量离人们心目中的理想目标还有很长的路要走。
中国数学家、语言学家周海中曾在其论文《机器翻译五十年》中指出:“要提高机译的译文质量,首先要解决的是语言本身问题而不是程序设计问题;单靠若干程序来做机译系统,肯定是无法提高机译的译文质量的。同时,在人类尚未明了大脑是如何进行语言的模糊识别和逻辑判断的情况下,机译要想达到信、达、雅的程度是不可能的。”(机器翻译今如何.科学网.2012-02-04[引用日期2012-09-12])
美国发明家、未来学家雷·科兹威尔曾经大胆预言,到2029年机译的质量将达到人工翻译的水平。对于这一石破天惊的论断,学术界存在颇多争议。
虽然如此,大家普遍认为目前依然是机器翻译最有发展前途的时期,人们对机器翻译的发展前景关注是建立在客观认识和理性思考的基础上的。我们也有理由相信,如果语言学家、计算机专家、心理学家、逻辑学家和数学家能够勠力同心,机器翻译面临的所有难题将会逐一得以解决。
长期以来人们孜孜以求的是希望能运用自然语言与计算机进行交互通信,这是因为这样做有十分重要的实际意义和理论意义:人们可以用自己最熟悉的语言来使用计算机,而无需再花大量的时间和精力去学习不很自然又艰深的计算机语言;人们也可通过自然语言与计算机之间的交互通信进一步了解人类潜在的语言能力和智能机制的巨大发展空间。
智能手机的普及为机器翻译的推广起着非常重要的作用。随着机器翻译技术的不断进步,它会成为人们生活中一个不可或缺的重要组成部分。
跨文化交际除了满足旅游、留学、经商等场景下的基本生活,还应该有文化、美食、服饰、思想等等高层次的交流,机器翻译短期内并不能帮助人们实现这种高质量、高层次的交流,因为机器翻译归根结底只是手段和工具,如何避免机器翻译喧宾夺主或者依赖机器翻译而使得人们忽略了“跨文化”交际的文化层面?对异国文化的兴趣、对异国文化的欣赏和学习,都不是翻译插件或者翻译机能一揽子解决的。或者这方面我们应该思考应不应该引入机器。毕竟文化和思想是人类的特质,而不是由机器通过统计算出来的结果能够代替的。
参考文献:
[1] 毕继万.跨文化交际与第二语言教学[J].语言教学与研究,1998.
[2] 冯志伟.统计机器翻译述评[J].外语教学与研究:外国语文双月刊,2013.
[3] 何武.机器翻译对翻译教学的促进[J].重庆工学院学报,2004.
[4] 胡文仲.文化差异种种[J].教学研究,1998.
[5] 贾玉新.跨文化交际学[J].上海外语教育出版社,1997.
[6] 李生.自然语言处理的研究与发展[J].燕山大学学报,2013.
[7] 科学网.机器翻译今如何2012-02-04.
[8] 罗季美.机器翻译句法错误分析[J].同济大学学报:社会科学版,2014.
[9] 妮鲁帕尔·艾山江.自然语言处理技术综述[J].商情,2013.
[10] 吴畏.基于语义的自然语言理解研究[J].数字通信,2014.
[11] 新华网.计算机翻译技不如人 谷歌机译处于领先地位,2012-11-15.
[12] 张永中.纠正文学外译偏误 提升文化传播水平[N].中国社会科学报,2018-02-13(003).
[13] 张永中.变译和全译在文化对外传播中的不同效度[J].上海翻译,2018,(4):78-82,95.
[14] 胡颖.“一带一路”背景下大学生跨文化交际能力培养研究[J].教育现代化,2018,5(35):190-191.
[15] 徐敏.国际条约之缔结与跨国文化问题之初探[J].南荣学报,2016-05-30.