国内几种翻译软件AI同传及语音翻译质量评估分析

2019-09-10赵玉蓉杨鑫刘欢龙玟月杨茜安超阮先玉

校园英语·月末 2019年9期

赵玉蓉杨鑫刘欢龙玟月杨茜安超阮先玉

【摘要】AI同传的出现为翻译行业发展注入了新动力，同时也引起业内学者与专业译员们的极大关注：AI同传未来发展前景如何，翻译质量有无保证，能否取代人工翻译？此类讨论将研究者的视线聚焦在AI同传的核心技术——神经机器翻译上。在人工智能与大数据飞速发展的当今，越来越多的综合方法可应用于神经机器翻译技术的更新与完善。本文以3款融合AI技术的翻译软件为例，选取实用性原文素材为研究对象，参考权威口译质量评估标准，建立起一套评价标准，得出结论：AI同传及语音翻译译文仍未达到人工水平并存在较大差距，融合AI技术的神经机器翻译仍存在改进空间，如扩大语料库、增强学习功能与联想功能等。

【关键词】AI同传;神经机器翻译;口译质量评估

【作者简介】赵玉蓉，杨鑫，刘欢，龙玟月，杨茜，安超，阮先玉，西南石油大学。

【基金项目】本文由2019四川省级大学生创新创业训练计划项目“大数据背景下AI同传翻译质量研究”（201910 615049）、西南石油大学第18期（2018-2019年度）课外开放实验重点项目（KSZ18C01）资助。

一、引言

自2016年起谷歌率先推出神经网络机器翻译系统NMT（Neural Machine Translation），机器翻译（Machine Translation）技术领域开始发生重大变革，机器翻译质量实现了大幅度提升。借助飞速发展的人工智能技术，国内各大互联网公司加快研發推广步伐，竞相推出融合了AI技术的翻译产品和服务。融合了AI技术且易获取的口译软件在得到广泛使用的同时也收获了大量反馈信息，无论是应用于口译实战，还是应用于大众生活，其翻译质量参差不齐，得到了褒贬不一的评价。

二、国内几种支持AI技术的翻译软件翻译原理——神经机器翻译（Neural Machine Translation，简称NMT）简介

神经机器翻译在翻译建模上不借用其他手段，只采用神经网络完成源语言到目标语言的转换。随着信息技术的进步、语言学理论的发展和人工智能技术的飞跃，引入神经网络的机器翻译对提高机器翻译效率和质量做出了重大贡献。但是，经典的机器翻译模型是一种通用的模型，并不完全针对机器翻译任务本身而设计，导致神经机器翻译仍然存在一些问题亟待解决。

三、研究方法

1. 使用软件与素材。本文选用3种为大型会议提供过AI同传服务的翻译软件（腾讯翻译君、讯飞听见、搜狗翻译），人声录入原文，将软件译文与标准译文对照，进行初步分析。

本文选取的现场原文素材以及配套权威标准译文，内容涵盖国际会议演讲或致辞、历年政府工作报告、总理答记者问等。素材特点为：选词意义准确，表意清晰。多采用书面词汇、政治术语及复杂且长但逻辑性强的句式结构等，措辞严谨、精准，绝不会出现模棱两可、易生歧义等语句，文体正式化和语体口语化兼备的特点上。

2. 分析理论——杨承淑的口译质量评估标准。台湾辅仁大学杨承淑提出的“量化”和“质化”理论是认可度较广的一种口译质量评估标准，评估项目及评分占比为：忠实（准确、完整）占50%，表达（明确、流畅）占30%，语言（语法、选词、风格）占20%，时间控制（原文与译文的时间比）以总分为基础上下浮动2%。由于该理论的对象为口译专业考试，在考试过程中时间有限的情况下，将时间控制一项纳入质量评估有一定的必要性。但在本项目研究中，对于时间控制没有过高要求，因此不做为重要评估标准参考。

四、译文质量分析

1. 译文错误类型及译文质量量化表。为了确保译文对比质量，本团队前期先完成6期素材的录入、整理和分析，总结出几种频繁出现的错误类型。在完成译文错误类型归纳的基础上，参考杨承淑的口译质量评估标准，制定出一套适用于本研究的评分标准，采用扣分制，对10期译文打分。错误类型、扣分细则及评分表如表1所示。

2. 无错句的案例。无错句分为零翻译、完全相同翻译和基本标准翻译。零翻译指原文不需要做翻译处理，译文只需与原文保持一致，本素材译文中不存在此情况。完全相同翻译指的是机器译文与标准译文完全相同，可直接采用的情况。基本标准翻译指的是机器译文虽然与标准译文基本相同，有修改的余地，但不做改动也能表意清晰顺畅的情况，亦可直接采用或稍做修改。

（1）完全相同翻译。

原文：中华人民共和国成立70周年。

标准：the 70th anniversary of the founding of the People’s Republic of China

三个软件：the 70th anniversary of the founding of the People’s Republic of China

（2）基本标准翻译。

原文：我们已经走上一条符合中国国情、适合时代要求的正确道路。

标准： We have embarked on a right path that fits China’s conditions and is in keeping with the trend of the times.

三个软件：We have embarked on a correct path that conforms to China’s national conditions and meets the requirements of the times.

3. 典型的有错句案例。

（1）词汇错误——用词（组）不当，导致语义错误或者偏差，与原文意思不符。

例：将“位居前列”译为 “ranking first”（名列第一），与原文意思有出入。

原文：国内生产总值达到67.7万亿元，增长6.9%，在世界主要经济体中位居前列。

标准：GDP reached 67.7 trillion yuan， representing an increase of 6.9% over the previous year-a growth rate faster than that of most other major economies.

搜狗：The gross domestic product ...... ranking first among the world’s major economies.

腾讯：The gross domestic product （GDP） ...... ， ranking first among the world’s major economies.

讯飞：......， an increase of 6.9%， ranking first among the major economies in the world.

（2）句法错误——语法错误。

例：使用现在分词做状语将“回顾历史”译为 “looking back on history”，但主句的主语为the economic globalization，不能与该状语构成主谓关系，是明显的语法错误。

原文：回顾历史，20世纪兴起的经济全球化，起初只是西方发达国家、或者说是地中海文明的经济全球化。

搜狗：Looking back on history， the economic globalization that arose in the last century ......

——生硬直译，导致不能表意。

原文：坚决打好蓝天保卫战。

标准：We will make our skies blue again.

讯飞：Fight against the blue sky！

（3）段落错误——语义分析错误，导致表意有误。

例：将“背水一战”译为 “the spirit of the first World War”，对该词组语义理解有误。

原文：您在报告里讲改革要有壮士断腕的决心、背水一战的气概

腾讯：In your report， ...... the determination of a strong man to break his wrists， the spirit of the first World War......

（4）其他错误。原文：40年来，达沃斯小镇以其独特魅力，已经成为中国观察世界、交流思想、阐述主张和谋求共识的重要平台。

标准：Over the past four decades， Davos， this lovely small town ......

讯飞：the Davos small town apparatus apparatus has been so attractive ......（乱译）

4.定量分析。本文10期素材统计得出素材原文小句总句数为508句，各软件所译有错误译文小句总句数统计情况为：搜狗154句、腾讯187句、讯飞162句，基本标准译文小句总句数统计情况为：搜狗99句、腾讯95句、讯飞120句。

按评估标准对十期素材进行打分，并计算平均分，所得结果如下：搜狗88.35分，腾讯87.85分，讯飞85.1分。

5.原因分析。（1）词汇。词汇的问题在于英语词汇普遍一词多义，AI口译软件无法准确选取最恰当的词义，这是机器翻译历来为人诟病的弊端之一。从本项目研究过程来看，基于深度学习的神经机器翻译在这方面已有一定改观。（2）语料库。AI口译软件译文中许多类型的错误都是由于语料库的明显不足。由于语言具有动态性，而神经机器翻译为了加快训练速度，会将双语词典限制在一定范围之内，语料不足必然导致翻译质量的降低。（3）语法。AI口译软件翻译单句的语法结构与源语语法形式一致，而未顺应目标语言的语法内涵，造成一些明显的语法错误，无法将原文隐性逻辑理清理顺并体现在译文语法结构中。（4）语境。胡壮麟曾将语境归纳为三类：语言语境即语篇的上下文，情景语境即语言交流的环境、方式、条件和参与者等，文化语境即语言产生的人文背景等。语境本身就很复杂，对于神经机器翻译来说，无疑更是巨大的挑战。首先，在语言语境方面，AI口譯软件译文缺少衔接词，连贯性较差等问题，一方面可能与神经机器翻译的源语分析能力有关，神经机器翻译无法识别分析词汇或各句语境的统一关系或独立关系;另一方面与其可译句子长度的受限有关，由于句子长度限定在一定词数范围内，同一语境下超出限制部分的词句无法整合到同一逻辑关系或语法结构中，导致断句错误等问题。其次，在文化语境方面，即结合源语文化背景处理译文方面，由于文化是多种因素结合的产物，其蕴含在语言中的广度与深度表达，要求译员要具备丰富的文化常识和敏锐的学习观察能力。神经机器翻译具有一定的长时记忆，对于文化常识也有一定的内存储备，但根据分析过程中出现的诸多问题来看，这种记忆联想和学习能力还远远不够。

五、结论

1. 综合评价结果。参照翻译理论和口译质量评估标准，本文从词汇、句法、段落以及软件自身其他问题四个方面，将三个软件的AI同传及语音翻译译文与标准人工译文进行对比分析，得出定量和定性分析结果显示，三种软件的AI同传及语音翻译质量基本在同一水平。整体上，人工翻译译文质量优于三个软件的AI同传及语音翻译译文质量，后者翻译质量仍有待提高。2.研究启示。（1）提高神经机器翻译源语分析能力是解决神经机器翻译诸多问题的根本。目前针对该问题，改善注意力机制已成为研究热点。将大数据应用到神经机器翻译系统中，其语言学习能力或许能得到增强。（2）扩充神经机器翻译语料库规模。当前神经机器翻译为了加快训练速度，将语料库规模限制在一定范围内，也限制了系统的联想预测能力。（3）AI口译结合人工翻译及译员不断自我提升的必要性。本文认为，神经机器翻译与译后编辑结合，能大大节省译员的时间与精力，并有效检验、修正机器译文的错误。这不仅对翻译标准研究提出了要求，还对译员个人素质与技能水平做出了要求。AI口译的进步必然与人工翻译的进步紧密相连。 3.本项目的局限性由于时间、精力、能力和篇幅有限，另外出于便利统计和整理的目的，本文仅能通过案例研究的方式对三种软件的AI同传或语音翻译质量进行评估，样本类型不够丰富，量化数据只作为一项参考指标，意在探寻量化分析的可能性。因此，本文建议未来研究可由翻译界和其他相关学界专家合作进行，融合多学科研究方法，将翻译与科学技术尤其是AI技术紧密结合，建立实用可行的评估模型，积极探索AI同传及语音翻译质量评估与改善的新途径。

参考文献：

[1]姜敏浩.政府工作报告特点及英译策略研究[J].学周刊，2015（30）： 18.

[2]杨承淑.口译教学研究：理论与实践[M].北京：中国对外翻译出版公司，2005.

[3]李梅，朱锡明.英汉机译错误分类及数据统计分析[J].上海理工大学学报（社会科学版），2013，35（03）：201-207.

[4]孙逸群，周敏康.机器翻译质量综合评价方法研究[J].中国科技翻译，2017，30（02）：20-24.

校园英语·月末

2019年9期

国内几种翻译软件AI同传及语音翻译质量评估分析

杂志排行

校园英语·月末的其它文章