APP下载

关联翻译理论在茶企简介翻译中的实用性

2016-03-29郭坤荣史梦娇河北农业大学河北金融学院河北保定07000

福建茶叶 2016年8期
关键词:歧义分词关联

郭坤荣,史梦娇(.河北农业大学;.河北金融学院,河北保定 07000)

关联翻译理论在茶企简介翻译中的实用性

郭坤荣1,史梦娇2
(1.河北农业大学;2.河北金融学院,河北保定 071000)

茶企简介是茶企对外展示的一扇窗口,本文基于茶企简介翻译提出了一种更有效的关联翻译方法。本方法的主要思想是:先找准一组褒贬中性词库,然后提取出待测词与词库中基准词词汇的极性义原、词性、其它义原,计算相应的相似度,并分别给出合适的权重值,由此计算出待测词与基准词的相似度,最后判断待测词的关联倾向,希望该方法的提出可以进一步加快中国茶企的国际化进程。

关联翻译理论;茶企;简介翻译

茶企简介发挥着日益重要的作用。随着互联网的飞速发展和普及,借助互联网技术走向国际领域的茶企越来越多,各大茶企越来越热衷于在互联网上标注自己公司简介,并表达茶企观点和评论,茶企简介成为了各大茶企向国际社会展示的名片,也是获取信息最为重要的一个社交平台。为此,我们在茶企简介翻译实践中必须对中西方茶企简介的不同特点加以重视,才能达到理想的交际效果。

1 关联翻译理论介绍

语言和文字作为人类特有的用来关联事物、进行思想交流的工具,这种社会现象是比较特殊的,而自然语言作为人类思想关联最基本、最直接、最方便的表达工具,无时无刻不充斥在社会的每一个角落。迄今为止,关联翻译理论已经有将近50年的发展史了,在漫长的发展过程中,关联翻译理论形成了自己特有的理论和方法,形成了一门独立的学科,有自己特定的科学内容。目前对“关联翻译理论”这一术语并没有严格的定义,我们能够看到的定义基本上是解释性的,但并不影响我们对它的理解。

语言学家刘涌泉对自然语言的处理概括为:“作为人工智能方向的一个主要内容,关联翻译理论主要是借助电子计算机等工具处理包括口语信息及文字信息在内的人类的独特的信息,并建立各种类型的人-机-人系统。作为它的核心内容,关联翻译理论主要是自动识别语音及语符和自动合成语音。”而美国计算机科学家对“关联翻译理论”的理解是:关联翻译理论是以人-人之间的交流和人-机之间的交流语言为主要目标的一门学科。关联翻译理论的目的是要构建出集语言能力及语言应用于一体的数学模型,通过搭建相应的计算框架来实现这样的语言模型,然后通过提出相对应的方法来逐步完善这一语言模型,最后根据相应的语言模型设计出各种实用系统,并利用相关的评测技术来对这些实用系统进行判断。

关联翻译理论的研究内容比较广泛,研究方向主要涉及机器翻译、自动文摘、信息检索、文档分类、问答系统、信息过滤、信息抽取、文本挖掘、舆情分析等,研究问题的层次一般主要包括语法学、形态学、语用学及语义学。相比于国外,国内的关联翻译理论起步相对较晚,目前的研究也面临了比较大的困难,一方面,自然语言中存在大量的歧义性,歧义词法、歧义句法、歧义语义和歧义语用,无论在什么语言单位,歧义性一直是困扰我们的根本问题。因此,针对不同语言单位,如何面向不同的应用目标,研究歧义消解的处理策略和方法,就成为了关联翻译理论面临的核心问题。另一方面,对于一个特定的系统,可能会遇到未知词汇、未知结构,而随着社会的发展每一种语言也都在发展变化,新的词义、新的词汇、新的词汇用法、新的句子结构,因此系统必须有良好的容错能力。

2 关联翻译理论在茶企简介翻译中的实用性

2.1文本预处理

茶企简介中的中文分词是关联翻译理论的前置过程,简单地说,中文分词的任务是要通过计算机系统在中文文本语料中的词汇及词汇之间自动添加空格或者是其它的边界标记。分词问题看起来比较简单,实则不然,对研究者来说仍然是个比较巨大的考验。中文分词的几个基本问题是:未登录词识别问题、汉语分词规范问题、歧义切分问题及语料库的建设问题。中文自动分词问题被提出后,茶企简介翻译译员提出了很多分词方法。

2.1.1基于词典的方法

茶企关联翻译中经常回用到正/逆向最大匹配和正/逆向最小匹配方法,顾名思义,前者的基本思想就是字串以ML为长度按照从左至右的顺序对字典进行扫描,如果扫描到该字串则对这个字串进行切分,然后将指针往后移动ML个长度继续扫描,否则以(ML-1)为长度继续与字典进行匹配。后者基本思想与前者差不多,主要区别在于匹配顺序从后面开始执行,通过对简介中文字的智能匹配能达到很好的翻译成效。

2.1.2基于语义分析的方法

茶企简介翻译中时常会遇到语义不明的情况,针对此类问题,Gao et al.(2005)提出了一种基于语义的中文分词方法,传统的分词方法只是简单地将机器学习或篇章语言学应用于中文分词当中,该方法是在分词的过程中通过句法分析器先对句子的语义及句法进行分析,然后提出一种语用数学框架,在这个框架中词的切分和生词类型的检验能同时进行,最后,该方法认为中文的分词标准不是唯一的,而是存在多重标准和不一样的词汇粒度。现在,该方法已经应用在微软的亚洲研究所开发的适应性汉语分词系统中。

2.1.3基于统计的方法

简介翻译同时也是行业内语言转换的结果,通过建立如Hidden Markov Model、互信息等统计学习模型来提取文本的特征词,由于在统计的过程中存在着共现率高但对关联倾向判定没有意义的词,所以基于数理统计的方法通常需结合词典法使用。

2.2词性标注

茶企简介翻译中的词性也将它定义为词类,是词汇基本的语法属性。当前,我国茶企简介翻译面临着三个方面的难题:一是汉语是一种较特殊的语言,词的形态变化不多,因此不能通过词的形态来对词的类别进行简单的判断;二是常用词兼类严重,虽然兼类现象在汉语词汇中占的比例很小,但由于它的使用频率较高,兼类现象比较繁多,覆盖面广,牵涉到汉语中大多数词类,因而造成在文本中词类歧义排除的任务量大,面广且复杂多样;三是由于研究人员自身的原因造成的,在词性划分的标准及目的等问题上,语言学界仍然存在着分歧。接下来用到的中文词性标注规范。词性标注所使用的方法主要包括三种:

基于统计模型的词性标注方法。I.Marshall(1983)建立的LOB语料库词性标注系统CLAWS是基于统计模型的词性标注方法的典型代表,该系统通过对 n元语法概率的优化统计,实现了133个词类标注的合理标注,为我国茶企简介翻译提供了很好的理论指导。

基于规则的词性标注方法。作为一种比较早的词性标注方法,基于规则的词性标注方法的主要思想是根据兼类词搭配关系及上下文的语境构建词类消岐规则。刘开英(2000)依据兼类词与兼类词之间的搭配关系构造了词类识别规则,对于其中存在的动名词兼类现象,总结出了九条词性鉴别规则。E.Brill提出了一种基于机器学习的自动获取规则,它的获取途径是大规模的语料库,该方法为实现茶企简介翻译中基于规则的词性标注系统提供了极大便利。

集统计及规则方法于一体的词性标注方法。周强(1995)提出了一种集规则方法与统计方法于一体的词性标注方法,其主要思想是对汉语句子的初始标注结果,先对它们进行规则排岐,将比较常见和明显的歧义现象排除掉,然后使用统计排岐的方法,对那些剩余的多类词进行处理及未登录词的词性推理,最后通过人工校对的方式,获得准确率较高的标注结果。

2.3停用词处理

传统的茶企简介关联翻译的主要任务包括词性标注、自动摘要、句法分析和指代消解等,基本方法主要有两种,一种是理性主义方法,另一种是经验主义方法。理性主义方法主张人的很大部分的语言知识是遗传下来的,是与生俱有的,在具体的自然语言问题研究中,该方法主张建立符号处理系统,由人工整理和编写初始的语言知识表示体系,构造相应的推理程序,系统根据规则和程序,将自然语言理解为符号结构,在关联翻译理论系统中,一般首先根据词法规则,利用词法分析器对输入的句子词汇进行词法处理分析,然后语法分析器依据语法规则分析输入的句子语法结构,最后再将语法结构映射到语义结构(如逻辑表达式、中间语言、语义网络等)。

实际翻译茶企简介中,文本经过分词处理后会出现一些对词汇关联倾向判断没有帮助的词,这些词就称为停用词。停用词通常有两类:

(1)虚词,它们不能独立地充当句法的成分,意义不是很明确,一般虚词包括副词、介词、连词、助词、叹词和拟声词六类。针对茶企简介中常见的虚词,可作、可用经验主义的方法来翻译,也是从假定人脑所具有的一些认知能力开始的,它主张通过建立特定的数学模型来学习复杂的语言结构,然后通过模型识别、统计学和机器学等方法来训练模型的参数,从而扩大语言使用的规模,它是以统计学为基础建立的,因此我们也将它称做统计关联翻译理论。

(2)虽然在训练样本中经常出现,但没有实际意义,对训练样本的关联倾向判定影响不大。例如某茶企简介中的“全而无缺,聚而不散,仁德至上”的精辟诠释,通过关联翻译理论,可以先构建一张停用词表,在分词处理过程中将得到的结果与停用词匹配,若匹配成功,就将这个词去掉,否则就保留下来。

3 结 语

关联性的大小取决于语境效果与处理努力,对茶企简介的翻译具有强大的解释力和实用性。然而,相比于国外的Twitter、Facebook等社交平台,茶企简介关联翻译研究的相对较少。用户发表的评论观点,一定程度上表达出了用户对某产品或者是信息资源的态度,同时也表现出强烈的关联倾向,因此关联倾向分析便逐渐成为关联翻译理论研究的热点。通过以上关联翻译理论对茶企简介翻译的分析可以看出,关联理论给了译者很大灵活度,同时也是茶企简介文本关联分析的基础和前提,对茶企简介翻译实践具有重要的实用价值。

[1]Ernst-August Gutt.Translation and Relevance:Cognition and Context CM.上海外语教育出版社,2004:106.

[2]程妍.中美茶企简介体裁对比分析[J].湖北经济学院学报(人文社会科学版).2012(5):69-71.

[3]何文静,王春燕.茶企简介的英译策略与方法[J].三峡大学学报(人文社会科学版).2012(6):117.

[4]冯克江.论茶企简介的翻译[J].语文学刊(外语教育与教学).2010 (8):34-37.

郭坤荣(1980-),女,硕士研究生,讲师,研究方向:英语语言文学。

猜你喜欢

歧义分词关联
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
分词在英语教学中的妙用
eUCP条款歧义剖析
“一带一路”递进,关联民生更紧
结巴分词在词云中的应用
结巴分词在词云中的应用
奇趣搭配
English Jokes: Homonyms
智趣
基于关联理论的歧义消除研究