APP下载

河南省旅游汉英双语平行语料库的创建和应用研究

2018-08-16姚晓鸣

校园英语·下旬 2018年4期
关键词:应用前景

姚晓鸣

【摘要】“一带一路”与自贸试验区建设为河南全域旅游带来了发展新机遇, 但目前在政府门户网站上相关旅游信息的英文介绍存在译法不规范等现象,因此,从河南省的全方位出发,很有必要构建一个汉英双语平行语料库,这个平行语料库要涉及到河南省的自然景观、人文景观、文化遗产等。本文首先介绍了旅游汉英平行语料库建设的必要性,明确了该语料库的建设步骤及发展应用前景,为河南省旅游文化走向国际助力。

【关键词】河南省旅游;平行语料库;应用前景

一、引言

在20世纪90年代,加拿大议会会议录英法平行语料库建成,这是世界上第一个双语平行语料库。一些大型平行语料库也在国内建成,其中有王克非教授等创建的通用汉英平行语料库,胡开宝教授等创建的英汉医学平行语料库以及由香港理工大学和北京外国语大学学者共同合作而创建的英汉旅游文本语料库等。和通用语料库相比,专门用途语料库在很多方面的优势还是很明显的,比如专业词典编撰、学科语言研究及教学方面。因此,河南省构建旅游汉英双语语料库的创建是很必要的,能够提供翻译工作者所需要的语料,对旅游汉英表达等起到了规范作用,也大大提高了翻译教学和语言教学质量等。

二、河南省构建旅游汉英双语平行语料库的必要性

旅游语料库建设在国内外均取得了突出成果,但很少创建与河南省旅游相关的汉英双语平行语料库。相对比大型语料库,在各地的旅游资源基础上,创建中小型的汉英双语旅游语料库非常重要。河南省有着悠久的历史文化,旅游资源也极其丰富,特别是嵩山、少林寺、龙门石窟、云台山、安阳殷墟等都闻名世界,吸引了越来越多的西方国外旅游者。西方游者喜欢中原文化,但是用汉英双语介绍河南的文化资源、旅游资源、风土人情等的资料并不多,与之相关的出版物也是很少。在政府门户网站上会有一些相关旅游信息的英文介绍,但都比较滞后,还存在译法不规范等现象。旅游业的发展日新月异,及时构建一个涵盖全省人文自然景观和文化遗产等更为全面的旅游汉英双语平行语料库就显得尤为必要。

三、河南省旅游汉英双语平行语料库的创建

双语平行语料库的建设不同于单语语料库,它主要包括语料库设计、语料的收集、语料的整理与加工、语料的存储与检索等步骤。

1.语料库的总体设计。在设计语料库时,要考虑语料库的类别、规模、性能、实现方法和后期发展等。语料库的规模并不是越大越好,针对性较强的小型语料库也能达到研究目的。Flowerdew指出普通的小型语料库规模达到25万字/词就已足够。Tribble认为大型语料库对师生的使用不能达到理想效果,这是由于大型语料库的范围过于广泛、数据庞杂造成其不能适应专门用途的英语学习。特定语料库的代表性主要体现在该语料库上获得的分析结果可以概括成为该语言整体或其指定部分的特性。这个语料库的内容将分为自然景观、人文景观、文化遗产等三个字库,每个字库将从自然、人文和文化遗产等方面选取具有代表性的内容。形成以汉语为原语,以英语为译语,原语文本与译语文本相互对照,通过加工形成句子层面对齐的河南省旅游汉英双语平行语料库。

2.语料收集。在语料的收集方面,要考虑到语料的代表性。语料的采集不能是随机的,既要围绕应用目标,又要考虑应用需要。因此,汉英语料不仅需要同时收集电子版本和纸质版本的汉语和英语的原文文本,同时包括汉语和英语译文文本。基于此,该语料库主要收集教育教学材料、期刊杂志、各类电子出版物、字典和网络资源等。汉语文本的可以通过互联网进行,可以选取地方的官方旅游网站,比如河南省旅游局官方网站、河南旅游文化网、各个地区的旅游局官方网站以及其他正规的旅游网站,如河南旅游集团有限公司网等。

选择书面语语料要参考以下几个基本的原则:基于学术影响力;人们阅读习惯的统计采样;随机采样;资料的流通程度和文本被阅读的次数;依据语言说明进行文本选择的经验等。可以参考的中文资料有《河南旅游地理》、《河南旅游历史文化》、《走遍中国——河南》、《发现者旅行指南——河南》等。汉英对译文本方面可以利用《洛阳旅游文化大观(汉英对照)》。但是汉英对译的资料很少,因此进行一些英译工作来充实汉英对译文本。

3.语料整理和加工。目前人们常用的文本处理软件主要有Microsoft Office软件、OCR图片文字识别软件、TXT文本文档等。除了格式外,还要检查是否出现错别字、乱码、语法错误等情况,同时要删除多余的信息。与此同时,还要对语料进行除噪,规范加工。通过txtmarker、headadder等软件对汉英语料进行除噪。将除噪后形成的TXT格式导入电脑。

收集的汉英双语语料还要进行对齐处理,在平行语料库中,常见的对齐方式就是句子对齐。而句子对齐方法一般是基于长度、基于词和混合法等方法。在这三个方法当中,基于长度的对其方法资源占用少,计算效果较高,因为它是根据句子的长度来预测对齐的可能性。而基于词的对齐方法会影响算法效率,因为它需要借助词典。这样看来,混合法的效果会更好。

4.语料存储和检索。一般都使用ASCII文本形式存储已处理好的语料,存储的文本中不能出现斜体、下划线、字体加黑、特殊符号等情况。通过这种方式存储能够为后期的检索提供方便,同时也能规范文本的内容,保持格式的一致,去除多余的回车和空格等文本噪音。语料库构建完成后,有必要对其进行改进,扩充内容,将其内容和功能更加完善。因此需要對语料库的检索系统进行维护,这样来满足不断发展的科技和信息需求。Paraconc是常用的双语语料库检索软件。

四、河南省旅游汉英双语平行语料库的应用

双语平行语料库的建设影响着语言的诸多方面。河南省旅游汉英双语平行语料库建成后,将会具备及其广泛的应用前景,主要体现在以下三方面:

目前已有的河南省旅游汉英文本形式存在一定的差异,部分专有名词的译文很不规范,没有形成统一的译文。河南省旅游汉英双语平行语料库能够为我省的人文自然景观和文化遗产提供汉语和英语文本,能够对旅游的汉英词汇进行统一,能够规范河南旅游方面的汉英表达,能更好地培养旅游方面的人才。

本语料库研究将积极促进语言学研究,并辅助翻译教学。因为语料库是通过观察和科学分析而得出的数据,更能体现出科学性和准确性,因此在语言教学中能起到至关重要的作用。在翻译教学方面,双语平行语料库的作用更像一个“译员培训研习班”,能够提高学习者的汉英互译能力。通过关键词的搜索,河南省旅游汉英双语平行语料库能够展示汉英双语的对译语料,所提供的双语词汇和句型表达比较准确。

本语料库将对旅游汉英词语词汇的选择、语用、语体等研究提供重要的参考。该语料库的构建将为河南省汉英旅游辞典的编纂提供重要依据。语料库能够为英语的教育教学提供丰富的资料,同时也为辞典的编写、各类教材和参考资料编写提供了主要语料来源。能够更好地服务于双语导游人才的培养。

五、结论

在语料库的广泛应用下,河南省旅游汉英双语平行语料库将展示出河南省丰富的旅游资源,构建英汉互译,通过深入加工实现句子层面的对齐。通过语料库的应用,实现河南省旅游汉英表达的进一步规范,并在此基础上进行语言教学和翻译教学,能够更好地培养河南旅游人才,同时也为河南省汉英旅游辞典的编纂和旅游教材的编写提供有力支撑。本语料库的开发和运用将也会对我省旅游业的持续健康发展有着重要意义。

参考文献:

[1]Anne OKeeffe and Michael McCarthy The Routledge Handbook of Corpus Linguistics[M].London:Routledge,2010.

[2]LEECH G.The State of the Art in Corpus Linguistics[M]//AIJMER K,ALTENBERC B.English Corpus Linguistics:Study in Honor of Jan Svartvik.Londres:Longman,1991:8-29.

[3]KENNEDY G.An Introduction to Corpus Linguistics[M].Beijing:Foreign Language Teaching & Research Press.2000:83.

[4]SUNNERS D.Lancaster English Language Corpus:Criteria and Design[M].Harlow:Longman,1991.

[5]ZANETTIN F.Bilingual comparable corpora and the training of translators[M].Meta,1998(4):616-630.

[6]潘璠,冯跃进.基于语料库的同义词差异性特征调查[J].山东外语教学,2000(4):8-12.

[7]柏晓静,常宝宝,詹卫东.构建大规模的汉英双语平行语料库[C]. 2002全国机器翻译论坛会议论文,2002.

[8]胡開宝.语料库翻译学概论[M].上海:上海交通大学出版社,2001.

[9]宋亚军.小型旅游英汉双语平行语料库的创建及教学研究[J].河南机电高等专科学校学报,2017(3).

[10]王克非.双语平行语料库在翻译教学上的用途[J].外语电化教学,2004(6):27-32.

猜你喜欢

应用前景
浅论“产出导向法”研究及其应用
量子点探针显影的应用研究进展
物联网技术现状及应用前景展望
利用新的广电媒体技术带动广电事业发展
遥感技术在公安业务中的应用浅析
无线通信技术电网通信探讨
信息技术在医院人力资源管理中的应用策略研究
单片机在企业生产中的应用前景
简析住宅建筑设计中BIM技术的应用