机器翻译技术困境的哲学反思
2020-12-04李晗佶,陈海庆
李 晗 佶, 陈 海 庆
(1.大连理工大学 人文与社会科学学部,辽宁 大连 116024;2.大连理工大学 外国语学院,辽宁 大连 116024)
一、引 言
翻译作为一项古老的人类职业和实践活动,在漫长的人类发展史中为经济交流和文化传播都做出了不可磨灭的贡献。在人工智能、大数据、机器学习等技术的驱使下,机器翻译得到了飞速发展并且在翻译速度、译文质量、覆盖语种、知识获取方式等方面取得了丰硕成果。但与此同时,机器翻译技术存在的问题也在不断展现。与技术研发者乐观的预期相反,包括译者在内的语言学家对机器翻译的未来持谨慎态度[1]。这就使我们不禁要对当前突飞猛进的机器翻译技术重新审视。少数国内外学者,如哈钦斯(W John Hutchins)[2]、威尔克斯(Yorick Wilks)[3]、麦德森(Mathias Winther Madsen)[4]、杨宪泽[5]、张政[6]等人从不同的学科视角出发,对机器翻译技术难点进行了探讨。但是我们也发现其中存在着明显的不足:首先,当前的研究仅将机器翻译视为工程学上的技术问题或语言学上的翻译问题,呈现出学科多元的趋势;其次,对于造成技术困境的内在成因缺乏深入分析。鉴于目前理论研究的不足以及现实应用中的迫切需求,本文旨在回答以下3个问题:(1)机器翻译技术的困境外在表征如何;(2)造成这种局面的内在成因是什么;(3)我们需要以何种路径走出这种技术困境。
二、机器翻译技术困境的外在表征
机器翻译就是指利用计算机实现自然语言文本间转换的技术。早在古希腊时期,一些哲学家就萌发了利用机械装置进行语言翻译的想法。但是直到20世纪50年代,美国科学家威弗(Warren Weaver)的构想与实践才真正拉开了机器翻译研发的序幕。在“全自动高质量机器翻译”(Fully Automated High-Quality Machine Translation,FAHQMT)宏伟目标的指引下,这一领域在数十年的发展历程中经历了几度沉浮。信息化时代的快节奏沟通对语言障碍的消解提出了日益紧迫的需求,无论是从商业价值、社会价值还是技术价值角度上来看,机器翻译无疑都具有重大的理论与实践意义。近些年来,机器翻译的研发在算法结构、设计思路、硬件支持等方面都发生了巨大的变化:谷歌神经翻译(Google Neural Machine Translation,GNMT)的质量已经可以和人工翻译相媲美;脸书(Facebook)基于卷积神经网络(Convolutional Neural Network,CNN)的翻译系统在速度上实现了超越;微软翻译(Microsoft Translate)在中英新闻翻译方面以1.3分BLEU测评分差超越人类;法国AI企业康特梅特里公司和德国初创公司DeepLy联合设计编制完成的机器翻译系统仅用12小时就将800页的《深度学习》(Deep Learing)一书内容由法文译为英文并付诸出版……似乎在当下,机器翻译已经实现了“高质量”的目标。那有关“全自动”的设想呢?就在神经翻译系统发布不久,谷歌再度发布重要成果,称其实现了不同语种间“零知识”(Zero-Shot)的互译,也就是可以在两种事先未学习过的语言间转换。脸书的研究人员也提出了一种“不需要任何翻译资源的无监督翻译模型”,并将词到词的翻译(Word-by-Word Initialization)、语言建模和反向翻译作为指导原则。
技术上一次又一次颠覆性的突破令人不禁思考,技术学家所提出的“奇点”(Singularity)论断是否将在翻译领域首先来临?语言学家普遍认为,机器翻译取代人工翻译的论断还为时过早。而工程师则将翻译视为一个数学和统计学方面的问题,并试图依靠算法和大数据来“胜过”语言学家[7]。虽然对这一领域的未来前景持乐观态度,但是技术研发者也并不否认当前研发路径中存在的不足:如何将先验知识融入系统,如何对神经机器翻译过程和错误进行解释,如何确保机器学习全局关联模型的系统鲁棒性[8]。上述技术问题在机器翻译输出的译文结果中具体表现在以句子为单位机器翻译系统在处理篇章信息时会忽略上下文信息,同时对于一词多义、歧义解构和存在瑕疵的原文处理时效果不佳。
三、机器翻译技术困境的内在动因
那么机器翻译所面临的技术困境是否真的就只是工程学意义上的技术问题或语言学层面的翻译问题呢?为此,我们需要对机器翻译的本质进行分析。机器翻译的任务就在于模拟人类的语言转换能力。而人工智能所要追求的目标就是让计算机完成人类心智能做的各种事情。语言作为人类思维和智能的外在表象,无疑成为二者之间连接的纽带。人工智能哲学研究者卡特(Matt Carter)指出:“人工智能发展中面临的最有意义、最困难的计算问题也许是自然语言的理解与产生问题。”[9]144智能、思维、意识等问题不仅受到人工智能领域的关注,同时也是哲学研究中力图厘清的关键所在。这就使得人工智能与哲学之前的联系比其他学科要更为紧密。一方面,哲学对人工智能具有假设论证、概念澄清和历史检验等积极作用[10];另一方面,人工智能发展也将校验哲学之中的预设和假说。因此,作为人工智能的具体应用,机器翻译技术的发展同样需要接受哲学的检验和拷问。
哲学自身的发展也经历了数次转向,早期哲学家们关注对世界本原问题进行追问的本体论哲学,随后又开始了对主体性问题研究的认识论哲学。但是由于在解释认识论的语句中存在着内容空泛、逻辑混乱、概念不清等局限,“语言”的重要性得以突显,分析哲学哲学家开始强调只有通过对语言进行分析,人们才有能力追求世界的本质并获得客观真理。语言哲学关注语言与世界以及语言与思维的关系问题。对上述问题的不同解答不仅影响着我们对人类智能的理解,同时也直接决定着人工智能发展的未来走向。为此,机器翻译能否最终实现突破,我们有必要从语言哲学中的“语义问题”与“语境问题”出发进行审视。
1.语义问题:数据是否等同于理解
人类认识围绕“意义”展开。弗雷格(Friedrich Ludwig GottlobFrege)、罗素(Bertrand Russell)等哲学家认为,语句的意义就等同于其所蕴涵的真值条件。为了弥补自然语言的缺陷,他们试图通过建构一种符合逻辑规则,且清晰、简洁“人工语言”以此消解其对思维的阻碍。如果这种预设能够实现,那么包括语言、心智以及世界等在内的一切都可以经由形式化的构造和符号化的过程得以表征和实现。早期的符号主义(Symbolism)人工智能由此得以催生,技术研发者也着手开发基于规则的机器翻译系统(Rule-based Machine Translation),即通过人为构建自然语言之间的转换规律进行翻译。这种研发路径遵循“句法”规则,以强大的形式描述和生成能力表现出极强的应用价值,但是开发周期长、鲁棒性差、人工成本高、翻译知识获取难、难以升级等局限也在后续的发展过程中逐步显现。此时,由于转向“句法”而暂时得以规避的“语义问题”再度成为焦点。面对自然语言的符号化表征、形式语言的语义意向性获取以及统一、系统的语义理论框架建构等方面的发出挑战[11],同时凭借计算机性能以及算法上的大幅度提升,人工智能研发者开辟了联结主义(Connectionism)的研发路径。对机器翻译来说,研发者将传统基于规则的机器翻译内在难以解答的“语义问题”交由数据和统计解决。统计机器翻译(Statistical Machine Translation)依靠大量语料,通过数学模型描述自然语言的转换过程并建立自动训练的语言统计模型。这种方式在很大程度上弥补了理性主义翻译方法的局限,其结果也达到了令人满意的效果。端到端编码器-解码器结构、seq2seq学习的方法的提出以及注意力(attention)机制的引入使得神经机器翻译(Neural Machine Translation,NMT)开始展现其巨大的魅力。使用深度学习(deep learning)神经网络获取自然语言之间的映射关系使得这一系统只需要少量代码就可以驱动整个系统完成运转。神经机器翻译系统不仅显著提升了翻译质量、训练所需数据量更少、同时对新语言间转换的拓展也更为便捷。那么,这是否就意味着人工智能以及机器翻译可以绕开“语义问题”得以发展呢?
针对这一问题,哲学家们的洞见无疑为我们提供了答案。20世纪50年代,被誉为“人工智能之父”的英国数学家图灵一直在思考一个问题,机器能思维吗?为了能够更加清晰地对“机器”和“思维”两个词进行定义,他构想了“图灵测试”这一模仿游戏来证明:计算机就是算法。图灵的创见为人工智能发展开辟了一条全新的道路,直接促进了符号主义研究范式的发展。工程师在这种理论基础上建造计算机,并处理各种逻辑推理,试图解决包括翻译在内的各种问题。但同时,他的设想也蕴含着一个根本性的问题:由于受到数学本质的限制,人类思维是否就是算法的集合,机器有可能发展出如人脑一般的智能吗?为了反驳图灵有关“智能”的观点,美国语言哲学家塞尔(J. R. Searle)构想了一个名为“中文屋论证”的思想实验:设想不懂中文的塞尔在封闭的房间中,借由用英文所写成的转换规则也可以产出令人满意的“转换”结果。塞尔借此想要证明,从来没有一种纯形式的模式足以凭借自身就能产生意向性(Intentionality)。他指出:“人的思维不仅是形式或语法的过程……计算机程序只是语法的,而心不仅仅是语法的。心是语义的,人心不仅是一个形式结构,它是有内容的。”“要理解一种语言需要完全具有心理状态,这比仅仅一套形式语法的要求更多,要具备一种释义,或者说那些符号都要有意义。”[12]塞尔所要强调的是机器并不能产生与人类相似的理解过程,同时程序所产出的近似结果也不能为人类的理解过程提供充分的解释,从而明确指出了人工智能研究范式中句法与语义、逻辑与现实以及符号和对象之间的断裂与对立。基于现象学观点,美国哲学家德雷福斯分别从生物学、心理学、认识论和本体论4个角度对人工智能的基本理论预设进行了一一的驳斥[13]。他认为永远不可能以理解客体的方式来对人类自身进行理解,人类行为无法用数学的方式进行计算。由此,德雷福斯得出结论,人类和机器的信息加工是以完全不同的形式进行的……人工智能目前的困难就暴露出了技术的限度。
从认知科学角度来看,神经认知、心理认知属于人与动物所共有的低阶认知,而语言认知、思维认知和文化认知则属于人类所特有的高阶认知。虽然人工智能在不断的进步,但并未在这5层认知中的任何一层得以实现。即便是令人欢欣鼓舞的机器学习也只不过是对人类智能粗浅的模仿[14]。那么当前的“风光无限”的神经机器翻译是否实现了语义理解呢?我们来看两个例子:①在公园新安装的座椅上放置着“油漆未干!”的警示牌,谷歌神经机器翻译将其翻译为“Paint is not dry!”;②对于“天哪!有炸弹!”这样的警示,谷歌给出了“God! There are bombs!”这样的翻译结果。而有经验的人类译员则会分别给出“Wet Paint!”的翻译和“Get Out!”并马上转身就跑的应激反应。通过对比原文,我们会发现人类译员做出的翻译与之并不对应;而机器翻译的结果无论从语义对应还是语序结构上来说都没有问题。这是否就意味着机器翻译的结果就要优于人类译员呢?很显然,答案是否定的。翻译是心理的、认知的过程,不仅表现为原语输入和译语产出这一外在的言语行为和言语事实,同样也反映了译者语际转换的内在心理机制和言语信息加工的认知过程。英国翻译理论家纽马克根据语言类型与功能,对翻译方法做出了“语义翻译”(Semantic Translation)和“交际翻译”(Communicative Translation)的区分:前者强调忠实于原文的信息内容;而后者则关心语言信息对读者所产生的效果[15]。由此可见,人类译员的翻译结果实际上呈现出的是对原文进行语义理解并重组和再现的过程,这也是当前基于数据的机器翻译难以实现的。有人可能会提出反驳,当前机器翻译出现的问题只是数据量大小的问题,从逻辑上来讲这一问题会在未来技术的驱使下得以解决。但是正如语言学家乔姆斯基所言,语言的可能性是无限的,跨语言的组合方式与对应条件更不可能使用数据和统计的方法所穷尽[16]。与机器翻译所依赖的大数据相比,人类译员学习范围十分的有限,但是人类可以从中总结并发掘潜藏的知识。这种抽象化的能力则是当今的人工智能难以实现的特质。
翻译需要遵循源语识别、语义理解与目的语产出的标准过程。而当前基于数据的神经机器翻译绕开了“语义问题”并使“语义理解”的过程成为“黑匣”,技术研发者将关注焦点聚焦于机器的输出结果上。神经网络技术受到了人脑工作方式的启发,但其依旧沿袭计算科学的路径而并非神经科学。从本质上来讲,神经机器翻译与统计机器翻译的基本思路都是概率最大化,只不过在具体的实现方式上存在差异而已。也就是说,当前人工智能以及机器翻译领域所取得进步并非是理论和技术上的突破,只能称之为算法和硬件性能上的提升。不理解语义的人工智能并不能体现人类智能的本质,同时也无法实现强人工智能的宏大愿景。由此可见,尽管在当前的研究范式下机器翻译从产出效果上来讲已经取得了长足的进步,但是“语义问题”依旧是不能也无法绕开的难题。
2.语用问题:现实世界知识缺失的局限能否解决
构建“人工语言”的设想虽然避免了歧义的产生,但是却并未认清逻辑语言的实质。以奥斯汀(J. L. Austin)、格莱斯(H.P.Grice)等为代表的哲学家们并不否认自然语言中的歧义和混乱的事实,更加关注对日常语言的分析,由此将焦点从“语义”转向了“语用”。不同于早期基于语言与世界相对应理念所提出的“图像论”,维特根斯坦(Wittgenstein)经过反思,在《哲学研究》中对自己建构的哲学体系进行了批判。他认为语言和行为相互交织形成了“语言游戏”[17]13,这种具有多样性、目的性、规则性和工具性的活动恰恰是生活形式中的一部分。这一观点的核心就在于语言只有在具体的使用情境中才能突显出意义与价值。他指出语言游戏不仅包括下命令、提出假设、讲故事、演戏、唱歌等,将一种语言译成另一种语言同样也是其表现形式之一[17]。由此可见,翻译就是游戏。那么当前基于经验主义路径所研发的机器翻译系统是否弥补了“翻译游戏”对现实世界知识缺失的局限呢?美国认知科学家侯世达针对这一问题进行了精辟的论述。他指出,尽管谷歌翻译技术的实用性毋庸置疑,但是在技术方法上还是缺乏“理解力”。由于没有记忆的参与,这些看似可行的译文在本质上来讲没有图像,缺乏理解,也就失去了意义。他总结道:“更多的数据并不会使机器获得理解能力,因为理解能力涉及到思想,这也是当今机器学习面临的最基本问题。”[18]
正如侯世达所言,目前已知的智能形式所使用的都是记忆,而非数据存储。作为一种深刻的人类艺术形式,翻译散发着神秘而振奋的光芒。在将语言A表达的思想转化成语言B表达的思想的过程之中,不仅仅要保持语义与形式的清晰性,还要呈现出原作者的品位、偏好和写作风格。这就是说,翻译不仅仅是语言层面的转换,还要涉及语言的背景信息并结合译者自身的经历加以理解,是一种“深度心智”的表现形式。当前基于数据统计的机器翻译只是在进行词语间的联想而非思想的对接。这种研发路径的缺陷就在于它所处理的符号与我们对这个世界的体验与知识并无关联,具体表现为以下两个方面。
首先,当前的机器翻译缺乏对常识的理解。所谓常识,就是指日常生活中的知识,尤其是那些不言自明、难以言说的知识[19]。如对一颗苹果树而言,我们具有超越其外在的物理形态的以下常识:苹果树的树冠可以供人们遮荫,树干可以作为木料制作工具,结出的果实可以食用;其生长需要阳光、水、土壤等基本条件;遭受害虫侵袭可能会导致其生病、枯萎等。上述对于苹果树的泛在概念是人类经由语言将日常的生活经验潜移默化进行存储的结果,但是由于无法以形式化的语言精准表述,如何让机器对其掌握就成为难题。我们来看一个例子,一位顾客在网站上发表了一条对餐厅的点评:“Guys!Stuff re so friendly and helpful. ”使用谷歌翻译,我们得到了这样的结果:“伙计们!东西是如此友好和乐于助人。”看到这条译文,我们无疑会感到十分迷惑:友好和乐于助人都是来对人进行修饰的形容词,而在此为何搭配的主语是“东西”?回到原文我们就不难发现,这位粗心的顾客错将“staff”(员工)拼成了“stuff”(东西)。这种对人工译员而言明显的错误却难倒了当前“智能”的机器翻译系统。此外,人类的常识储备也是一个不断丰富的过程。不同于一蹴而就的数学计算,翻译在不断的摸索和探讨中追求近似的完美。法律翻译译者需要查阅大量资料了解源语与目标语国家的法律规范与社会风俗才能准确地对相关概念进行阐释;为了完成工厂交给的翻译任务,译者还需要亲自来到车间了解生产流程与工具组件的相关信息。上述人类译者通过不断学习来丰富自身的知识储备的行为就是常识积累的过程。而当前机器所进行的“学习”依旧是以人类现有的知识成果,而非以与现实世界的交往为来源。
其次,当前的机器翻译依旧难以跨越语境障碍。正如“理想语言学派”哲学家所指出,自然语言具有的不确定性主要表现为歧义和模糊两个方面。前者产生的原因就在于意义与形式之间的非一一对称性;而后者可以归纳为描述对象类属界面的不确定性、语言符号体系的收敛性、描述对象自身的不可言说和不同社会角色对语言本身理解的差异性等多个方面[20]。这种不确定性无疑对依赖于逻辑语言分析并形式化描写人类思维的计算机程序提出了巨大的挑战。我们来看一个例子:
原文:人们以为他对她有“意思”,于是,建议他对她“意思意思”。他说,他没那种“意思”。她则反问,你们是什么“意思”。大伙中有的觉得很有“意思”,有的则认为真没“意思”[21]。
谷歌翻译:People thought that he had “meaning” to her,so he suggested that he “meaning” to her. He said that he did not have that “meaning.” She asked,what is your meaning? Some of them feel very “meaning”,while others think that there is no “meaning.”
“意思”这个词在80余字的原文中重复出现了6次。面对这种中文词汇层面的歧义,谷歌翻译将原文中分别表示“爱意”(feeling)、“示爱”(express)、“意图”(intention)、“有趣”(interesting)和“无趣”(boring)的指称一股脑地处理成了“meaning”。人类可以经由上下文语境以及自身对世界的理解拨开语言歧义的迷雾进行语义识别,而计算机则在此犯了难。自然语言的不确定性是当今包括机器翻译、自然语言处理乃至整个人工智能发展无法回避的问题。机器只能处理在基本单元、运算和关系以及优先级上都明确的语言。美国人工智能奠基人西蒙就表示:“在自动翻译过程中,当翻译取决于上下文和意义而非句法线索时,这一理论就遇到了困难。”[22]
目前人工智能领域针对“语用问题”所采取的解决方式无外乎两种。常识化需要对世界上大量的知识进行编码,并让程序使用者写编码识别语言意图;而统计则利用庞大的语料库和简单的识别规则,让机器自己进行学习。但二者都存在缺点,前者的工作量难以想象,后者又存在着过程难以解释、结果不确定的局限。卡特指出:“人工智能的发展中必要的一环就是以相应的方式与外部世界相关联。通过感知方式使人工智能和外部世界通过经验得以表征。”[9]206由此可见,“语用问题”所反映的实质在于不确定性思维是人类把握客观世界的一种重要方式,用不精确、非定量、模糊的思维进行思考和推理的能力正是人与机器在智力层次的根本差别之所在。
四、机器翻译技术困境的未来出路
通过上文论述,我们分析了困扰机器翻译技术发展的内在动因。那么机器翻译技术困境的未来出路究竟在哪里?本文认为需要从以下3个方面入手来对这一问题予以解答。
1.正视机器翻译的技术局限
我们首先要明确,机器翻译技术难以达到甚至超越人类的翻译能力。“图灵测试”为人工智能研究者测试机器是否智能提供了可行的工具,但是也同样包含了3个未曾言明的内在预设:机器智能是对人类智能的模拟;人类智能是世界上最高的智能形态;世界上只有一种智能形态,就是人类智能[23]。人工智能发展是在不断探求并模仿人类意识和本质的过程,而“心智”谜题目前仍然有待破解。通过对机器翻译面临的“语义问题”和“语境问题”的分析我们可以看到,即使对当前在研究思路、反映效率以及产出质量等方面都有了很大的提高的神经机器翻译来说,神经网络只是在亚符号层面的对象进行多层次加工,产出的结果依旧只是数学统计层面的呈现,并未实现翻译所需的语义知识、语用知识、普通常识和非语言知识层面上的突破[24],也就并不能如人类一样展现出语言意义方面的特征。而当前一些媒体与科技公司出于自身利益的考量,往往夸大机器翻译所取得的成果并鼓吹“人工译员即将失业”,从而造成了普通民众对于翻译本质和翻译行业的错误认知。一些技术研发内部人士的看法恰恰是对这种不切实际言论最强有力的回击。控制论提出者维纳为韦弗信心满满的机器翻译设想给出了负面的评价:“说实话,每一种语言在词汇范围上都十分模糊。而且语言的情感和言外之意若是以机器来进行翻译,似乎不甚乐观。”[25]欧洲机器翻译协会主席哈钦斯也明确指出:“机器翻译并没有也不可能对职业翻译产生威胁。”[26]机器翻译有其特定的使用范畴,如崔启亮的研究就指出,以出版和审美欣赏为目的的文学类文本和与信息检索和实际使用为目的天气预报等类型文本分别居于人工翻译与机器翻译的两端[27]。由此可见,我们不能因为在下棋、自动化等特定领域的出色表现就认为“通用人工智能”或“强人工智能”已经实现,甚至相信超越人类智能的“超人工智能”即将来临。同样不能只因为机器翻译所展现出的“类人工翻译”结果,就认为翻译的难题已经或即将被解决。
2.突显机器翻译的技术优势
人工智能诞生的目的就是为了服务并促进人类的进一步发展。由此,一些学者就指出,人工智能在概念上就存在歧义:我们当前所做的工作并非是在再造智能,而是在增强智能(Augmented Intelligence,AI)[28]。正如德国技术哲学家卡普(Ernst Kapp)所提出的“人体器官投影说”一样,人工智能技术凭借其在计算和存储方面的巨大优势弥补了人类在生理层面上的不足,实现了人类的增强。无论是对专业译者还是普通用户来说,机器翻译都无疑已经成为工作和沟通的强有力工具。面对当前职业化翻译工作中任务量大、交付时间紧的现状,采用机器翻译进行初译并辅以人工译后编辑(Post-editing)的做法不仅能够提升工作效率、保证翻译质量并实现语言资产的复用,同时还将译者从繁重的、重复性的劳动中得以解放。对普通用户来说,虽然目前的机器翻译译文存在着一些问题,但是在出国旅行、日常交流和应急使用等场景下,诸如语音翻译、图片翻译等机器翻译新模式无疑降低了翻译使用的门槛,实现了信息的实时获取。正如胡开宝和李翼所指出,机器翻译与人工翻译之前的关系并非对立,而是相辅相成、相互促进[29]。
3.采用跨学科联动的研发方式促进技术创新
人工智能在发展的过程之中不断吸收着来自计算机科学、控制论、心理学、语言学、认知科学等众多学科的最新成果。因此,机器翻译的发展不能仅仅依靠工程领域的努力,而应采取跨学科联动的方式促进技术创新。从哲学角度来讲,我们不难发现机器翻译技术难以跨越的“语义问题”和“语用问题”正是人工智能面的意向性、框架性、语境化与日常认识等哲学问题的缩影[30]。哲学与人工智能之间并非敌对关系,两个学科的联手能够相互指引,共同发展。来自分析哲学、现象学对于智能本质的诘难不仅能够为机器翻译以及人工智能发展澄清问题,同时还有助于技术研发者提炼新的研发视角并对已取得的成果进行分析与批评。从语言学角度来讲,语言学家与语言学理论不应该被拒之门外。以语用学为例,这一理论更加注重人类在具体的、真实的场景中如何使用语言以及如何传达和获取语言意义。将这一理论的引入机器翻译研究将会有助于弥补当前研发范式上的缺陷,通过模拟人类利用语言的方式来克服现有系统中语言信息在歧义、模糊、不确定性等方面存在问题,从而在有效地规避以往“规则路径”和“统计路径”中语言信息与语境脱离的缺憾,并有助于识别语言意向性,对自然语言处理以机器翻译的跨越式发展无疑都具有重要的推动作用。从认知科学角度来讲,我们需要借助最新的技术手段对人类思维、语言生成等“黑匣”进行探究。翻译就是信息加工过程,因此,对于译者翻译过程的研究应该聚焦于翻译活动的客观描述,也就是译者的脑内思维活动方面。除了以往机器翻译开发中所使用的技术之外,对翻译文本的认知、翻译策略的选择、文本的情感特质以及文本的背景知识等也应成为技术模型中的重要组成部分。只有通过哲学家们对技术发展框架上逻辑缺陷的分析,辅以语言学和认知科学对人类语言和人类认知活动探求的最新成果,再结合计算机科学家对程序算法以及数据统计上的不断改进,未来的机器翻译技术才能够取得实质性的进步。
五、结 语
机器翻译作为一种技术手段,其研发不仅对人工智能学科的理论具有极强的指导价值,同样在人类的现实生活中也发挥着重要的实践性作用。面对目前取得的阶段性进展,我们不能被冲昏头脑,而需要透过现象对其本质进行分析。从表象上来看,机器翻译存在的问题似乎是由于工程学或语言学领域的不足所导致的。但是究其实质,这恰恰反映出了机器智能与人类智能之间的差别。正如本文所指出的,机器翻译技术若想取得突破性进展,“语义”和“语用”是无法绕过且必须解决的两大挑战。由此可见,在尚未实现“强人工智能”的当下,距离“全自动高质量的机器翻译”这一宏伟目标的最终实现还有很长的路要走。但我们同样需要看到,虽然塞尔、德雷福斯和侯世达等哲学家对人工智能展开了激烈的批判,但是他们所针对的只是技术研发范式中的逻辑缺陷,并非是从根本上否定人工智能的可能性与合理性。与此相同,本文的研究目的也在于强调我们需要在认清造成机器翻译技术困境内在成因基础上,明确机器翻译的技术本质,并采取跨学科联动的方式进行未来研发,以期促进机器翻译技术取得长足的发展。