口译翻译软件的问题与对策研究
2020-11-26张凌霄陈亦菲
张凌霄,陈亦菲,郭 瑜
(南京师范大学外国语学院,江苏 南京 210046)
0 引言
随着科技不断发展,国际学术交流日益密切,人们的跨语种对话需求增长,实时语音翻译软件在市场上大量涌现。但是,目前的口译APP良莠不齐,不同专业领域的用户适合何种口译软件、各类口译软件的用户体验感如何还需要进一步调查分析。我们选择对目前研究较少的“口译APP”,选取市面上三款热门口译APP,深入对比某些重点学科领域(包括但不限于法律、财经、新能源、人工智能领域)的翻译结果,探究口译APP的应用现状并预测其发展前景[1]。
1 文献回顾
机器翻译(Machine Translation,即MT)是指通过计算机把一种语言转换为另一种或多种语言文本的过程。从上世纪70年代至今,机器翻译经历了从“直接翻译”到“深度学习的神经机器翻译”的发展。目前,深度学习技术的大规模应用使机器翻译的效果得到了巨大的提升。
1.1 专业口笔译方面
近年人工智能翻译的质量不断提升,然而由于依赖大数据及概率的推算,目前的机器翻译技术在复杂语法、篇章等方面仍有欠缺,在文学、法律等专业领域也尚有许多不足。因此,人机耦合成为了更好的选择。利用机器预先做好复杂繁琐或重复性的工作,再由人工进行后期编辑处理,并为机器提供新的语料和训练,实现机器翻译与人工翻译相互促进[2]。
专业笔译方面,计算机辅助翻译应用的普及有力地推动其变革,促进译员之间协作,保证项目分工的流畅、机器预翻译、统一规范术语等,极大提高了笔译效率。专业口译方面,由于口头语言更复杂多变,为语音识别及解析带来了更大挑战。目前,机器翻译在口译方面的表现远不如笔译,但在人机耦合的情况下,随着语音技术的发展,机器可以帮助译员整理笔记和专业词汇,提高翻译效率[3]。
1.2 AI+翻译应用
大数据、物联网、人工智能技术的发展对我国产业发展产生了巨大的影响,诸多产业纷纷开始将产品与人工智能相融合,其中包括语言服务业。众多商业巨头推出实时翻译产品,迎合市场的同时有力地推进了人工智能翻译应用的发展与研究[4]。
国内现有的翻译应用中以“技术派”与“应用派”为代表,前者拥有突出技术,依靠网络平台在语音识别、文字识别、语种方言、翻译技术等一个或多个方面尤为优异,如科大讯飞、搜狗旅行翻译宝,后者以智能应用为特点,不断升级转型,以更加用户友好的方式开拓翻译机器市场,如“咪咕灵犀”AI技术应用、网易有道翻译王2.0 Pro。然而,AI+翻译应用的市场也存在诸多问题,技术和应用方面都有待提高。
1.3 翻译APP在生活领域的应用
随着跨境旅游日益增多,国际经济文化交流日益密切,实时翻译的需求量不断加大。翻译APP以其便携、低成本等优势,逐渐成为多数人的首选。然而,作为手机软件,翻译APP既有机器翻译本身的不足外,又受制于手机硬件、系统、网络等等,其翻译效果并不能尽如人意。多数翻译APP在旅游生活方面能给用户带来一定帮助,但在专业领域语言翻译方面还鲜有应用[5]。
1.4 小结
在人工智能翻译飞速发展的今天,人工智能翻译在笔译、旅游生活实时翻译等方面表现较好,而在专业口译以及各专业领域翻译等方面还存在许多不足。因此,我们选择口译APP,借助测评、问卷、访谈等多种方式,着重研究分析其在专业领域的翻译效果。
2 实验设计
本次测试选择了市面上流行的三大口译APP为研究对象。三大口译APP均能做到实时进行语音识别并进行翻译,其口碑在同类口译APP中颇佳,在功能和性能方面也各有利弊,可以帮助实验人员对翻译结果进行对比分析[6]。实验中选取的音视频材料涵盖了法律、财经、新能源、人工智能这四个领域。
2.1 实验假设
通过文献研究,我们可以做一个简单假设。目前市面上较为流行的口译APP能基本胜任生活中的辅助交流工作,但是在专业领域上的能力还有所欠缺,暂时难以为专业性学术交流提供口译服务。此外,生活中的交流多偏向于简单句与口语化表达,而口译APP在长难句以及书面化语料的翻译方面则有所欠缺。因此,本文从译员的评价视角出发,选取专业领域术语及长难句书面化语料,对口译APP的语音识别能力以及翻译效果进行测试。
2.2 实验流程
本次实验分为五个步骤,具体步骤如下。
(1)步骤一:建立APP评定标准。本次实验着重测试口译 APP在专业领域的语音识别及翻译功能,因此以其主要参照因素制定评分细则。
(2)步骤二:筛选测试语料。收集法律、财经、新能源、人工智能四个专业领域的音、视频文件,筛选出长度及难度基本相当的词组、单句、语段进行测试。
(3)步骤三:筛选测试口译APP。经过初步测试,筛选出三款质量相对较优的口译APP进行全面、系统的测试。
(4)步骤四:测试机器口译。测试过程分为了三个阶段进行依次测试词组、单句、语段的测试。
(5)步骤五:评定与分析。记录每一款口译APP在每一领域的语音识别结果及翻译结果,生成对比分析报告,归纳总结口译APP存在的问题,并提出解决假设。
3 实验结果与论证
3.1 测试环节
通过测试,我们对口译APP的运转性能、翻译能力有了更深入的了解。针对同一句句子,不同的口译APP给出了不同的翻译结果,其翻译的多样性也能够给从事专业翻译工作的人以启发。如“燃料电池汽车使用可再生氢气,其排放物只有水蒸气”这句话的三种机器译文。
(1)Fuel cell vehicles use renewable hydrogen,and their only emissions are water vapor.
(2)Fuel cell vehicles use renewable hydrogen,which emits only water vapor.
(3)Fuel cell cars use renewable cleaners that emit nothing but water vapor.
三种 APP的翻译结果都合理准确,其中(1)句的结构相对简单,基本属于直译;(2)(3)句的定语从句结构使翻译结果更为简洁,使用者可以在保证结果正确的情况下,根据使用情境或自身理解运用水平选择合适口译APP。
然而,口译APP还有很多不足之处。在语音识别方面,口译APP对模糊音的辨别还有待加强,比如识别“What is left unmentioned in contract may be added there as an appendix.”一句中的“unmentioned”,翻译软件的识别结果出现“on mentioned”,导致翻译出的意思完全相反。
在翻译方面,会出现专业名词错译、句子结构判断错误、句子主要成分漏译等情况。如“发现了……,由此建立了人工智能的机制模拟方法”,在翻译其后半段时,各口译APP均使用了从句结构,然而个别软件漏译了句子的主要成分,如“…, from which the establishment of artificial intelligence mechanisms,simulation methods.”这句话中缺少了动词。
3.2 存在问题及对策
通过对口译APP在中译英与英译中两个方面的口译测试,我们发现口译APP可以胜任日常生活中的基础交流,但涉及到专业词汇、复杂句式等方面仍然存在问题。语音识别能力和翻译结果准确度作为最影响口译APP翻译效果的两大因素更应当着重加强。此外,用户界面、输入修改操作等也能改善用户对口译 APP的使用体验感。但是,口译 APP还应从语音识别能力和翻译准确度入手,优化口译APP词库。具体分析如下。
3.2.1 存在问题
(1)语音识别效果。
对中文的语音识别能力较强,但对英文的语音识别能力仍然较弱,个别模糊音难以辨认,比如在摩擦音和爆破音等轻音的识别上无法准确识别,发音相近的单词识别不准确,比如上文提到的“unmentioned”。
(2)翻译效果。
某些专业领域的词汇难以翻译准确,体现出口译APP的语料库在专业领域还有所欠缺,特别是在法律、人工智能、医学等常用的领域中,扩充专业名词的语料库,以提高专业词汇的翻译准确度。比如美国著名的达特茅斯学院“Dartmouth College”,口译APP并不能识别出这个专有名词,应而识别结果为“dot mouse”,“that mouse”等。
(3)用户体验感。
有时选择语音识别选项时无法进行语音识别,需要重新进入口译APP进行操作,运行性能欠缺,极大地影响了用户体验感。同时,有个别口译APP没有输入修改操作,只能重新识别,操作更为繁琐。3.2.2 解决对策
(1)不断丰富语料库。
基于语料库的机器翻译系统的发展与深度学习的神经机器翻译的大规模应用说明了在机器翻译过程中对语料库进行收集、整理、加工并总结自然语言规律的重要性。在新词、热词不断更新迭代的当今时代,语料库必需不断扩充以适应口译工作的需要[7]。尤其是专业领域的词汇术语及专有名词更需要与时俱进。
(2)人机耦合。
APP的语音识别能力难以在短时间内有大幅度的提高,所以需要人工进行辅助翻译。在口译之前做适当的准备工作,比如准备专业术语英汉对照表等,在翻译后可以对翻译结果进行适当的修改。此外,口译APP在进行语音识别时,应该对识别内容有初步的纠错和改正功能,以提高翻译的准确性。同时,输入修改操作也应该更加便捷,这样弥补了语音识别的不足,有助于增强翻译结果准确度[8]。
4 结语
经过漫长的发展历程,机器翻译行业在科技迅猛发展的今天愈发欣欣向荣,但良好的发展势头的背后,口译APP仍然在诸多方面亟待完善,如提升语音识别与语音解析水平、提高翻译速度与准确度、不断优化善语料库等。通过不断地发展与完善,我们期待口译APP以其更优质的性能,开拓广阔的市场,得到更好的运用,在人类的翻译事业中发挥更大的作用。