APP下载

对话行为理解与口语翻译方法分析

2019-02-22杨小玺

山东农业工程学院学报 2019年8期
关键词:语句语义语音

杨小玺

(晋中学院 山西 晋中 030600)

0.引言

对话行为具体指的是对话语句的言外力,又可以看成是浅层话语结构的内容。对话行为充分反映出对话语句还有对话人的目的,比如可以通过陈述、解释、许诺或者是疑问等形式。不同的对话行为必然为对话理解创设了语言中不同的信息内容,在处理自然语言的过程中也有着十分广泛地应用,比如常见的口语翻译系统、口语对话系统以及自动摘要等。

1.对话行为在口语翻译中的应用

如今,随着国内外诸多学者对于对话行为理论地不断深入研究和探讨,先后有众多学者尝试着将对话意图的相关描述应用到传统的机器翻译当中。比如,JANUS 系统、Verbmobil 系统以及 Sridhar 等。

现对JANUS 翻译系统进行研究,此研究系统主要用于完成德语到英语还有德语到日语的翻译。从这个系统的运作程序来看,源语言的语义最初被解析成了一个个单独的中间语言,接着从中间语言进行转换成了目标语言,实现不同语言之间的互译。此外,JANUS 系统采取的是C-STAR 所定义的中间转换格式,但是对话行为只是作为IF 格式中十分重要的一种。所以,对此类建立在中间语言转换基础之上的翻译系统而言,对话行为只是作为一种语义呈现参与到整个翻译阶段中。

Verbmobil 是上个世纪九十年代德国联邦教育部研发的语言技术项目之一,迄今也是十分重大的一项创新。在这个Verdmobil 语音翻译系统中,对于对话行为的应用具体体现在如下模块当中:其一,语音识别模块。这个模块的主要作用是对对话行为进行预测,也就是对语言模型实施动态过滤,目的是为了提升词语的语音识别准确率;其二,语义评价模块。在这个模块中主要是通过已知的获取的对话行为中囊括的信息内容聚焦算法,用于确定下一语句采取何种对话行为;其三,上下文信息抽取模块,主要是用作Verbmobil 中各个模块中的上下文信息提供,目的是为了取得较佳的翻译结果。事实上,采用Verbmobil 系统进行翻译,对话行为并没有直接应用到翻译模块。

Sridhar 翻译系统主要提供了一种对话行为和建立在短语统计翻译模型二者相结合的应用方法。此系统的主要应用思路是首先建立在源语言对话行为基础之上把训练语言进行划分成不同的类别,接着对不同的语言类别进行训练使之形成翻译模型。考虑到数据稀疏方面的问题,Sridhacr 等人选择把基线系统当中所训练出的短语翻译概率表,同时加入到不同的对话行为分类语言当中,接着加入参数使之形成对短语概率实施数据平滑操作的目的。

从这可以看出,在翻译系统当中,对话行为信息不仅仅可以应用到语音识别功能模块,目的是为了提升翻译系统的运作性能,同时还可以应用在建立在中间语言基础之上的统计翻译模型。

2.口语翻译方法

当前国际上比较常用的口语翻译实现系统使用的翻译机制是不同的,主要可以划分成以下三种:其一是传统翻译方法;其二是非传统翻译方法;其三是人机互助混合式翻译方法。下面将对这三种翻译方法进行详细论述。

2.1 传统翻译方法

传统翻译方法具体指的是下面四种比较常见的翻译方法:其一是基于原则的语音翻译方法;其二是基于事例以及模板的语音翻译方法;其三是基于中间语言的语音方法;其四是基于传统模型的翻译方法。以上所列举的四种翻译方法都可以在文本机器当中翻译出来,而且还可以应用到众多商业化翻译软件以及实验系统当中。所以,我们也可以把它们称作是最为主流的几种翻译方法。

2.2 非传统翻译方法

非传统翻译方法具体指的是除了以上列举的四种传统翻译方法之外,最近数年来常被提起以及经常被尝试的几种全新的翻译方法。虽然此类翻译方法相比较传统的翻译方法而言没有被得到广泛地采用,然而却是研究人员朝着如何更加高效、实用的方向不断努力的研究成果。早在1997年,Wakita 等众多研究人员曾经提出了可以实现局部抽取且正确翻译的一种语音翻译方法,主要思想是建立在事例基础之上的口语翻译,翻译模块需要对所输入的语句实施句法以及语义分析,接着在解析结果当中找到符合既定长度以及结构的句法,和事例库当中的某一个片段或者是例句的语义距离远远小于实现给定的语块或者是片段,最终还需要通过建立在事例基础之上的翻译方法对符合条件的语块以及片断进行翻译。此种方法方法也是比较常用的“回避困难”的一种做法。从这可以看出,翻译方法不是单单只从输入整句话来达到切分片断或者是语块的目的,往往是局部地对片断进行切割和计算,此种做法有可能获得的翻译片断和事先输入的语句之间存在含义不相吻合的现象。此外,很多情况下,输入整个语句之后抽取不出可用于翻译的片断,以至于在整个翻译系统中无法输入任何内容。不仅如此,采取此种口语翻译方法和语义计算之间有着十分密切的关系。所以,必须借助高质量的语义词典方可充分反映出不同片断之间存在的语义距离测度模型。例如,日本德岛大学任福继教授曾经提出过一种有效的超函数翻译方法,主要是解决当前大部分机器翻译无法实现“信、达、雅”标准的情况下使用的,当用户已经无法再对翻译机器提出更多关于正确率以及可读性的前提之下方可使用这种翻译方法。超函数翻译方法是建立在原语言输入以及目标语言输出二者之间充分地映射关系基础之上的实现思路。总体来说,此类方法和传统的建立在分析基础之上的机器翻译系统需要对原句子进行十分彻底的句法以及语义分析是完全不同的,这是一种需要借助构造 SF 达到创建原语句模板以及目标语句模板二者的对应关系的。所以在翻译的过程中必然需要做到获取原句SF。

2.3 人机互助混合翻译方法

此种翻译方法具体指的是同时使用多种翻译方法的多引擎式交互口语翻译方法。当前大部分从事口语翻译研究的工作人员偏向于采取推进式对话方法,也就是两个说着不同语言的人之间通过对话实现彼此之间的信息传递,也指的是当其中某一方说完之后,则翻译系统会将这个说话人所说的语句进行翻译并且将其发送到对方,此时另一方需要通过完全听完来自另外一方说话人所翻译之后的语音并发音。面对这种情况,对于翻译人员而言完全可以和说话人进行沟通,也就是说在进行翻译之前是可以和说话人进行对话的,可以事先弄清说话人具体使用了哪些词汇,明确对方的说话意图。此种对话翻译系统,对于中间翻译角色而言必须具备的是能够和对话人事先对话的能力,也就是说翻译者需要和说话人之间形成交互式对话关系,而不是简单的单向式对话传递。然而,当前除了比较常用的JANUS系统之外,难以看到人机交互式口语翻译系统,大部分人通常会选择在原语言识别以及分析技术基础之上,通过改进传统的识别技术以及翻译策略达到提升系统翻译的可读性以及经准确,然而这种做法显然是徒劳无获的。主要原因在于无法预料说话人具体谁说什么以及他的表达方式是什么等等,而且说话人在说话过程中无法将标点符号说出来,人们说话往往是想到什么说什么,不会像书面语必须经过长期的深思熟虑,因此在整个过程中必然会出现说话人需要对前面说过的话做出修正的情况,面对这种情况应该让系统不管是“听懂”或者是“听不懂”都必须做出翻译,不会给机器任何提问的机会,因此这种做法显然是不合情理的。

3.总结

总体而言,在过去的相当长一段历史中,人们国内外学者对于语音翻译的研究显然取得了较大的进步,然而,不管是在理论上,或者是在技术上,依然存在诸多问题需要做出进一步研究。此外,在进行口语翻译的过程中,传统的口语翻译方法显然占据较大的比重,而且具有较强的科学研究意义以及实用价值。即使现如今我国及国外学者对于口语翻译的研究还存在诸多没有得到解决的问题,然而必要的定位口语翻译系统也可以应用到实际应用场合当中,尤其是可以在使用方式以及应用领域方面进行创新。切实做到从现实需求出发,做到合理利用目前已有的较为成熟的技术,突出人机交互的障碍,在未来必将大有作为。

猜你喜欢

语句语义语音
重点:语句衔接
语言与语义
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
批评话语分析中态度意向的邻近化语义构建
“社会”一词的语义流动与新陈代谢
“吃+NP”的语义生成机制研究
我喜欢