语音识别技术在口译实战中的应用

2021-01-29孔莹

科技视界 2020年33期

孔莹

（沈阳建筑大学外国语学院，辽宁沈阳 110168）

0 引言

自20世纪80年代起，技术就一直应用在口译实战中。纯人工翻译费时费力，早已消亡。随着人工智能发展的日益成熟，语音识别技术、文本转换、语义分析、情感识别、语音合成等自然语言处理技术也越来越多的应用在机器翻译中，谷歌和微软都推出了神经网络的机器翻译，国内的腾讯于2018年推出腾讯君，为博鳌论坛提供口译服务，但翻译效果仍不理想。但不得不说，技术在口译实战中的参与程度越来越高，并且之后无论是作为主体还是客体也会以显性或隐形的方式贯穿始终。机器翻译包括语音识别技术、机器翻译、语音合成三大步骤，但三大步骤发展不平衡，发展得并不理想。本文试图将这种技术作为辅助翻译工具，对它在口译员译前、译中和译后所起的作用进行详细阐述，从而进一步阐述译员与技术之间的关系。

1 语音识别技术的工作原理

Automatic Speech Recognition（ASR），是机器翻译中语音识别、机器翻译和语音合成的第一步，也是发展得最好的一步。这门交叉学科发展已有半个多世纪，国外的隐马尔科夫模型理论HMM不断完善，该模型是一个按照时间点划分的预测模型，在有时间点t的一些情况下，引入一些参数和数学模型的计算，以此来预测时间点t+1的概率，之所以可以应用在语音识别上，是因为语言具有强烈的前后关联性，比如英语中的定语从句、宾语从句等，包括they are和Iam这种固定搭配，这都可以被拿来当设定好的参数，从而用马尔可夫来进行这些关联和计算，从而提高语音识别的效率。到了20世纪80年代，基于HMM模型的人工神经网络（ANN）算法意义重大，机器开始用数学模型模拟神经，还能通过反复训练，从而自主学习和延伸。为之后APPLE、IBM重视语音识别技术、投入巨资进行研发奠定了基础。国内对语音识别技术的研究起步虽晚，但取得了非常多的成果。

语音识别技术目前在机器口译中发展的虽好，但后续步骤发展还在初级阶段。对译员来说，语音识别技术完全可以作为计算机辅助技术在译前准备、实时翻译、译后起非常大的作用。本文也将根据人机交互的作用，进一步探讨人与技术的关系。

2 语音识别技术的作用

2.1 译前

译前准备阶段，语音识别技术其中一个发展方向是便携性的加强，最突出的两家一个是苹果的Siri系统和国内专攻中文的科大讯飞。Siri更像是一个人工智能，不仅能听懂各种语言，还能基于问题作出反应。Siri首先通过手机的扬声器和听筒提取声学特征，然后借助在线强大的搜索引擎来满足用户的需求，完成了人机交互；科大讯飞则是专攻语音技术主要包括语音合成和语音识别两项关键技术。此外，语音技术还包括语音编码、音色转换、口语评测、语音消噪和增强等技术，有着广阔应用空间。口译员译前准备得好坏甚至可以决定整场翻译的质量。前期大量的调查研究工作对译员来说是非常烦琐的一件事，但在语音识别和人工智能的帮助下，译员可以快速锁定自己需要了解的相关知识，将平行材料中会议素材中的语音素材转换成文字，甚至也可以将文字材料转换成语音材料，译者可以边听边做别的，其本质是减少人的重复性劳动投入，是对人的一定程度的解放。

2.2 译中

译中，语音识别通过语音特征提取、声学模型计算、语言模型计算等途径生成文字表达，有助于解决噪音干扰、语速过快、语音变体等因素造成的听辨失效或低效问题，而且语音识别技术可以将说话者的话转换成文字表达后，口译的难度大大下降，从交传听译、同传变成了视译。Jason S.Littlefield等人描述了一种使用说话者相关语音识别的自动转录系统的概念演示器。该系统旨在更有效地生成讨论、访谈、会议等的文本和音频记录。它还允许人工更正已识别的文本并以更完整和可信赖的方式审阅笔录。尽管该原型基于未经验证的概念，但它打开了广泛的可能应用和进一步开发的领域。作者提出了一种使用词汇化信息进行翻译的方法。基于短语的翻译系统能够在句子中确定翻译开始时的点，延迟更短。经过充分的实验，发现该方法对于减少机器翻译的开始时间和处理时间很有用，可以在将来以各种方式加以利用。但也要注意尤其是在同传的时候，语音识别出来的文字可能会对译者精力分配造成影响。在进行口译时，译者原本是要兼顾听力分析和输出，语音识别技术对于习惯依赖笔记的译员来说可以极大地减少短期记忆的压力，但对于一个本身专注于听的译员来说，可能会打乱自己的精力分配，反而会影响自己的译文质量。与此同时，语音识别技术在汉译英和英译汉中表现也完全不同，在中文译员做汉译英所起的作用要远远大于英译汉时的作用，所以语音识别技术在母语翻译成另一种语言的时候表现得更好，作者认为，根本还是译者理解母语的速度要远远快于译者理解另一种语言。但仅仅作为笔记，也减少了译员的工作。所以，译员还是要多和机器磨合，从而提供更高质量的翻译服务。

2.3 译后

译后，语音识别技术可以将会上的录音直接转换成文字输入到语料库中，既可以为之后同样的主题的译前准备做后备资源，本质是将译员从重复性劳动中解放出来，从而提供更高效翻译服务。

3 结语

口译技术自20世纪起就一直以隐形或显性的形式或多或少地参与到口译中，人工智能发展潮的爆发，赋予了口译新的活力，而2020年疫情的暴发，对翻译的需求主要变成了远程视频口译，远程视频口译平台也层出不穷，让译员可以安全地在家提供口译服务，熟知各个远程口译平台的优缺点，给客户提供最适合的平台也成了译员的工作。可见技术与人依旧是以人为核心的同时，人也依赖于技术的发展。智能化的机器口译是对人工口译的集成性应用。然而，这并非预示口译活动中人的价值的丧失。相反，人将发挥包括高阶思维、情感认知、文化识别，以及机器监控等更为重要和必要的作用。因此，即使在以机器为主导的智能化口译模态下，人的智能仍无以比拟，人的价值仍无可替代。本文探讨了口译技术中语音识别技术在译前、译中、译后过程中具体是如何发挥作用的，希望能给译员提供一定的借鉴。