APP下载

俄语地名翻译的音节切分研究

2015-02-08赵云鹏胡斯玥刘新贵宋华标赵政坤

地理空间信息 2015年6期
关键词:响度音素辅音

赵云鹏,胡斯玥,刘新贵,宋华标,赵政坤

(1.信息工程大学 地理空间信息学院,河南 郑州 450052;2.湖北省基础地理信息中心,湖北 武汉 430074;3.61206部队,北京 100042)

俄语地名翻译的音节切分研究

赵云鹏1,胡斯玥2,刘新贵1,宋华标1,赵政坤3

(1.信息工程大学 地理空间信息学院,河南 郑州 450052;2.湖北省基础地理信息中心,湖北 武汉 430074;3.61206部队,北京 100042)

在境外地名数据库建设过程中,地名翻译是境外地名数据整合的前期基础性工作,但目前缺乏有效的地名翻译解决办法。音译是地名翻译的主要方式,也是地名翻译研究的重点内容。以俄语地名为例,在分析俄语发音特点和音节构成的基础上,制定了较为合理的音节切分方案,并实现俄语地名音节切分,将翻译对象由地名长字母串化简为音节,能够有效降低地名翻译的复杂度,为地名规范化翻译工作提供参考。

地名翻译;音译;音节切分;俄语地名

为了构建全球地名数据库,丰富我国地名信息资源,进一步满足境外地图制图和对外交流的需求,地名翻译工作必不可少[1]。自从20世纪90年代初IBM的研究人员Peter Brown等提出IBM模型以来,机器翻译技术不断快速发展和应用,使人们重新树立起了对机器翻译的信心[2],但是对于地名翻译技术的专题研究还很少。由于地名翻译规则较为特殊,现有主流翻译软件难以满足需求,地名翻译多以人工翻译为主[3]。本文以俄语地名为例展开地名翻译的相关技术研究。

1 俄汉对照音译结构

音译即译音,是把一种语言的词语用另一种语言中跟它发音相同或近似的语音表示出来的翻译方法。在进行俄语地名音译时必须要严格遵守俄语和汉语的标准发音规则。为了避免“同音异字”等情况的发生,规范地名翻译结果,国家民政部和国家测绘地理信息局制定了俄语汉字音译表,用于指导俄语地名的汉字转写工作[4]。表中俄汉对照关系可以用T=(E,H)结构表示。其中,T代表对照关系;E代表俄语部分,可以是简单音节,也可以是元音或辅音音素;H代表俄语对应的汉字。例如:T1=(бaй,拜)、T2=(бa,巴)、T3=(a,阿)、T4=(б,布)等。

俄汉音译表为俄语地名音译提供了基础,但是直接利用俄汉对应关系翻译整个地名字母串时,音素间界限不够明显,翻译复杂度较高,准确率难以得到保证。对俄语字母串进行音节切分,将翻译对象化简为音节,将原有的二层翻译结构变为三层翻译结构,可达到降低翻译复杂性、提高翻译准确率的目的。音节切分后翻译效果如图1所示。

图1 音节切分后翻译效果示意

2 音节切分

2.1 俄语语音结构分析

俄语是俄罗斯国家的官方用语,属印欧语系斯拉夫语族的东斯拉夫语支。俄语语音系统中有33个字母(10个元音字母、21个辅音字母、2个无音字母),表示42个音(6个元音、36个辅音)[5]。从发音的角度,俄语词可划分成为音节片段。一个音节可以由一个元音音素构成,也可以由一个元音和一个或几个辅音构成[6,7]。俄语词的语音结构树枝图E=(W,J,S),如图2所示。其中,W代表俄语词;J代表音节;S代表音素或无音字母。

图2 俄语语音结构树枝图

为了便于音节切分,将俄语音素划分为元音、响辅音、噪辅音、无音字母4种类型,如表1所示。其中,ё 、ю 、я、 е在读音上与元音о、 у 、a 、э存在着对应关系[8],根据发音特点,将ё、 ю 、я 、е定为元音。对于辅音音素,不再进行软硬音区分,只分为响辅音、噪辅音2类。同时,考虑到无音字母对音节切分的影响,设置了无音字母类型,在进行音节切分时需先对无音字母进行处理,并且参照“响度说”,将元音、响辅音、噪辅音的响度等级分别设定为3、2、1[9]。

表1 音素分类表

2.2 音节切分基本原则

在俄语语音学研究史上,曾先后出现过多种音节理论,其中影响较大的有“元音中心说”、“呼气说”、“响度说”、“肌肉紧张说”和“合张运动说”,它们分别从不同视角阐述和说明了俄语音节的本质和切分原则[9]。通过分析这些经典理论,本文采用“元音中心说”和“响度说”对俄语音节切分的基本原则进行归纳与总结。

1)一个元音对应一个音节。“元音中心说”指出,元音是成节音,能作为中心组成音节,而辅音都是非成节音,不能单独组成音节。因此,俄语词中有多少个元音,就能有多少个音节,且一个音节包含一个元音。如双音节词“один”含有2个元音“о”、“и”,分别对应2个音节“о”、“дин”。

2)词首辅音属于后行元音,词尾辅音属于前行元音。根据元音中心说,辅音不能自成音节,辅音或辅音群需要与邻近元音构成音节。因此,词首的辅音或辅音群需要与其后的第一个元音结合形成音节,词尾的辅音或辅音群需要与其前的第一个元音结合形成音节。如俄语地名词语“Покровск(波克罗夫斯克)”中的词首辅音“п-”属于第一个元音“о”,词尾辅音群“-вск”属于第二个元音“о”。

3)元音间的辅音划分有两种情形:①元音间只有一个辅音。“响度说”认为,在非词首音节中,响度总是渐次递增,而音节界限位于响度递增时的最低点之前。所以当2个元音之间只有1个辅音时,这个辅音属于后面的元音。如俄语地名词语“Ленa(勒拿河)”中,元音“е”和“a”之间的辅音“н”属于后元音“a”。②元音间存在辅音群。根据“响度说”,音节界限位于响度递增时的最低点之前,而辅音音素可以有噪辅音、响辅音两个级别。所以需要对辅音群的辅音逐个进行判断,直到找到响度谷值作为音节的切分点。

4)词中存在无音字母ь和ъ时,需在无音字母处断开。硬音符号ъ和软音符号ь都是不发音的,在音节划分时,硬音符号ъ和软音符号ь处均需断开。

2.3 音节切分基本思想

俄语词具有“音素-音节-词”的3层语音结构,俄语词是顶层,音节是中间层,音素作为底层。对词的音节切分实际上是对词中的音素进行分割与组合。音节的核心是元音,一个音节只含有一个元音,音节界限存在于2个邻近元音之间的响度谷值处,例如俄语词“выщинский(维辛斯基)”的响度分布为“1 3 1 3 2 1 1 3 2”,可见响度谷值在щ、с处,则可划分为3个音节вы、щин、ский,如图3所示。因此,确定2个邻近元音的位置,分析二者间的辅音数量与类型,找到响度最低点,是实现音节切分的关键。

图3 音节界限示意图

2.4 音节切分基本步骤

2.4.1 地名词语预处理

俄语地名中经常会含有“_”、“-”、空格等特殊符号,如“Бaян-Бурд(巴彦-布尔德)”、“Сaxaрный Зaвод(萨哈尔内扎沃德)”。在进行音节切分之前,应首先对这些词语进行去特殊符号处理,在“_”、“-”、空格等处将词语分割成单词。另外,俄语存在着一些特定的发音规则,如音组тц、дц要读成较长的ц音;音组сш、зш要读成较长的ш音;音组сч、зч、жч要读成较长的щ音;音组тск、дск中的тс、дс读成ц音等。所以要先将单词中的这些音组进行替换,如“Иркутск(伊尔库茨克)”变化为“Иркуцк”,然后再进行音节切分。

2.4.2 音节切分

在完成地名词语预处理之后,按照音节切分基本规则开始音节切分工作。首先对单词中的无音字母进行处理,在无音字母处断开,舍去硬音字母ъ,保留软音字母ь到前面的字符串中,接着获取元音在字符串中的位置。以元音为核心确定字符串音节切分点的位置,假设俄语词中的元音为Y(n)=y1y2…yi…yn(n>0),且它们在字符串中的位置为T[i](i>0),然后对邻近元音间的辅音进行判断,获取音节界限,设置切分点,具体过程如图4所示。

1)T[i+1]-T[i]=2时,邻近元音yi、yi+1之间没有辅音,切分点位于T[i+1]处。

2)T[i+1]-T[i]>2时,邻近元音yi、yi+1之间有辅音,设邻近元音yi、yi+1间的辅音为F(m)=f1f2…fj…fm(m>0),且每个辅音在字符串对应的位置为L[j],则切分点的位置LQ为:

图4 音节切分点位置的获取过程

若2个邻近元音之间只有1个辅音(即m=1时)F (1)=f1,就在辅音f1对应位置L[1]处设置切分点。

若2个邻近元音之间存在辅音群(即m>1时),F (m)=f1f2…fj…fm,则需要对辅音群的辅音逐个进行判断,若辅音f1为噪辅音,则辅音群属于后面元音构成的音节,切分点在L[1]处;若辅音f1为响辅音,则需要对辅音f2进行判断,若辅音f2为噪辅音,则辅音f1属于前面元音构成的音节,辅音f2及其后面的辅音群属于后面元音构成的音节,切分点位于L[2]处;否则,需要对辅音f3进行响、噪辅音判断,直到找到辅音群中的第一个噪辅音f (j),将其位置L[j]作为切分点为止。

根据得到的音节切分点对音节进行切分,表示为“J1-J2-…-Jn”形式。

2.4.3 后处理与结果输出

对字符串的切分结果进行后续处理,将无音字母、空格、“-”、“_”引起的断开进行拼接,生成最终结果,以表格形式输出。

3 实 验

本文在VC++6.0平台上实现了俄语地名的音节切分系统,并从《新编俄罗斯地名译名手册》中随机选取了300个俄语地名作为实验材料进行音节切分,共切分出音节1 076条,明确了地名内部的基本语音界限,切分效果如图5所示。其中无需字母再划分,可直接进行翻译的简单音节有758条,约占音节总数70%,有效降低了地名翻译的复杂度。

图5 音节切分结果

4 结 语

地名是地图的重要组成部分之一,其翻译的正确、统一与否,直接影响到我国政治、经济、军事和外交工作的开展[10]。音译是境外地名翻译的主要方式,音节是听觉能感受到的最自然的语音单位,本文以俄语为例,展开音节切分研究,明确地名字母串的发音界限,减弱了译者主观意识对翻译过程的影响,有效降低了地名音译的复杂度,为境外地名规范化翻译提供参考。但是在俄语地名的音译过程中存在着部分意译现象,俄汉音译表中存在着一些不符合音节结构的对照关系,因此,在下一步工作中需要研究音节切分过程中这些特殊字母组合问题,以及音译与意译相结合的问题,来提高切分后俄语地名翻译的准确率。

[1] 杜祥明.中国大百科全书:地理学[M].北京:中国大百科全书出版社,2004

[2] 杜金华,张萌,宗成庆,等.中国机器翻译研究的机遇与挑战——第八届全国机器翻译研讨会总结与展望[J].中文信息学报,2013,27(4):1-8

[3] 刘新贵,孙群,马小青,等.境外地名翻译软件的研制[J].测绘通报,2011(4):74-76

[4] 民政部,国家测绘地理信息局.外语地名汉字译写导则(俄语)[M].北京:中国标准出版社,2008

[5] 陈君华.俄语语音学教程[M].北京:北京大学出版社,1997

[6] 陶莹.俄汉语音节差异浅谈[J].外语与外语教学,1994(增刊):19-22

[7] 王玲玲.汉俄语音对比分析及对俄汉语语音教学策略[D].长春:吉林大学,2014

[8] 哈尔滨工业大学外语第二教研室.俄语(第二外语用)[M].北京:人民教育出版社,1980

[9] 徐来娣.俄语音节理论研究与俄语音节切分优化方案[J].中国俄语教学,2009,28(4):69-72

[10] 朱萌.引进版地图中地名表示方法研究[J].测绘通报, 2014(12):56-59

P281

B

1672-4623(2015)06-0161-03

10.3969/j.issn.1672-4623.2015.06.054

赵云鹏,硕士,主要研究方向为地名数据一致性处理与地名翻译。

2015-09-09。

项目来源:郑州市科技计划资助项目(141PPTGG369);信息工程大学地理空间信息学院硕士学位论文创新与创优基金资助项目(ZS201503)。

猜你喜欢

响度音素辅音
失去爆破和不完全爆破
BR Sounds
英语的辅音连缀
依托绘本课程,培养学生英语音素意识
小学英语课堂中音素意识与自然拼读整合训练的探索
在拼读阅读课中培养学生英语阅读素养
零基础速记48个音标音素
响度在节目制作和播出中的应用
第二讲 元音和辅音(下)
数字时代中节目响度平衡浅析