河南旅游英语外翻资料的语料库分析
2016-12-06宋亚军
宋亚军
河南旅游英语外翻资料的语料库分析
宋亚军
(河南机电高等专科学校 外语系,河南 新乡 453003)
当今河南省旅游产业蓬勃发展,旅游资源的外宣功能虽得到有些学者的重视,却仍存在很多问题。科技的进步和网络的发展使得语料库语言学能够用于旅游外宣资料的研究,并以一种不同的视角来发现河南旅游外翻资料的使用特点和挖掘其存在的更多问题。
河南旅游;语料库;对比分析
0 引言
河南省地处中原,历史文化悠久,旅游资源丰富,少林寺、龙门石窟、云台山、安阳殷墟等举世闻名,吸引了大量国外旅游者,所以对河南省涉外旅游英语宣传材料的研究,是十分必要的。
目前专门探讨国内旅游英译资料的文章并不多,且大多数都是围绕旅游资料的翻译技巧展开的,都是对某个具体的翻译现象进行探讨的,而未将旅游资料作为独特的使用文本来考虑[1]。笔者曾在中国知网以“河南旅游”为主题搜索到从2000年至2015年末360篇关于河南旅游的期刊文章,其中有关河南旅游英语、外翻或者公示语的研究只有10余篇,这反映出学者在关注河南旅游产业发展的同时,忽视了语言在对外交流层面所起的作用,而且在这10余篇文章中,鲜有用语料库的方法研究河南旅游英译资料的。
1 研究方法和目的
语料库语言学发展至今,取得了一系列重要的语言学发现和研究成果。尤其是在中国,自20世纪90年代中期至今,外语语料库的开发和研究可谓突飞猛进[2]。语料库之所以流行是因为它提供了更加宽广的研究视角,就像Sinclair曾说过的:“能够系统地对大数量的文本语料进行审视,使我们有可能发现一些以前从未有机会发现的语言事实。”[3]
因此本研究以河南省旅游英语外宣资料为研究对象,在河南省官方旅游网站上收集各地市的英语宣传资料组建河南旅游英语样本语料库来对比本族语通用语料库。然后运用语料库软件(wordsmith、BFSU Power Conc和Keywords_plus)对两个样本库在词汇特征(如词频、词汇密度、平均词长、平均句长等)和差异性高频词块方面进行对比分析,从而试图发现河南省英语旅游资料的词汇或语体使用特点和存在的不足之处,为进一步服务于地方旅游事业的发展做出贡献。
2 语料收集和整理
本研究所创建的河南省旅游英语资料语料库(简称HC)全部来自于省旅游局官方英语网站,其内容包括河南省文化习俗、地方特色介绍和全省18个地市共计102个景点介绍。语料来源真实可靠并具有显著的代表性。所选的参照语料库来自于本族语通用语料库(简称GC)。
语料收集好后对其进行整理,使之变成干净的纯文本形式,所使用的软件是一款名为“文本整理器”的免费软件,主要进行删除空行和格式整理工作。
3 数据统计与分析
3.1 基本数据统计与分析
表1 基本数据统计
通过wordsmith软件可以得到两个语料库的基本词汇数据见表一。类符/形符比是衡量文本中词汇密度的常见方法,然而两库大小不一,GC库文本容量较大,功能词重复的次数多,类符/形符比低,常用的补救办法是采用标准化类符/形符比来计算词汇密度[4]。从数据来看,两库词汇密度、平均词长都比较接近。在平均句长方面HC则明显高于GC,这说明HC的句长变化较大,句子结构较为复杂。
3.2 显著性词块对比分析
利用北外梁茂成教授开发的Keywords_plus软件可以把HC和GC进行对比分析,然后把正差异性最大(即p值接近于0,对数似然率正值位居前列)的一词、二词、三词和四词词块进行分类研究。之所以选择到四词是因为二词和三词中有些意义不完整,如river、of Henan、the yellow等,选择到四词词块时,意义相对完整。同时选择出差异性最大的前15位进行分析,原因是从15位以后会出现词汇意义重复的现象,如tang dynasty、the tang 等。具体内容见表2。
表2 显著性差异词块对比
为了便于研究和发现词块使用特点,对上述词块仔细对比后发现可以根据其用途和功能分为如表3所示的。
旅游主题类词汇如mountain, temple, yellow river反映出河南旅游的主题就是山川、庙宇和河流。河南省是个山水集聚、香火旺盛的圣地,而covering an area of, above the sea level, built in the, to the west则反映出在景点介绍时特别突出其地理位置和气势磅礴、地大丰饶的特点。
表3 词块分类
历史地位类词汇,如dynasty, spring and autumn, ancient的使用反映出河南旅游文化跨朝跨代、历史久远,而emperor的使用反映出在景点介绍时突出了帝王“效应”。
民俗文化类词汇,如famous, of henan, in China的使用反映出景点介绍时特别注重其在全省和全国的地位,同时对as one of和legend has it that进行检索发现其后跟的大部分是和历史渊源、民俗故事相关的词汇,这说明在景点介绍时特别强调景点的历史渊源和民俗文化。(图1和图2)
图1 as one of 部分检索截图
图2 legend has it that 检索截图
外宣途径类词汇较为单一,因为所选材料均来自于河南省旅游局,在每个景点介绍后会附上旅游局的官方联系方式,这也说明旅游局特别重视自己的外宣功能。
3.3 发现问题
第一,在分析数据时发现,安阳殷墟博物馆的英文为:The Yin Ruins Museum,后来又在GC中检索ruins,发现其使用环境均为比较糟糕或是破旧的状况,而安阳殷墟虽是历史遗迹,却是中国历史文化和文字的重要历史遗产,把这一重要历史遗产冠以ruins会令外国游客误解,因此把安阳殷墟翻译为The Yin Ruins Museum有待进一步商榷,笔者建议使用拼音翻译成The Yinxu Museum较好。
图3 ruins在通用语料库中检索截图
第二,由于dynasty是高频词汇且反映出各地市的景点介绍对历史文化的挖掘程度,因此笔者把该词在各地市景点介绍中出现的形符数和总形符数的比值做了个排序,见表4。
表4 dynasty比重分布
结果显示dynasty在郑州、开封和新乡市景点介绍时所占总形符数比重较大,也可以说较为注重景点的历史文化挖掘,而濮阳和平顶山市则较为欠缺。
4 结论
通过上述研究发现,河南省旅游局官方外宣资料涵盖全省18个地市的百余个景点和风俗文化介绍,旅游资料相对完整规范且特色突出,如:旅游英语主题词汇突出,景点历史人文、民俗文化特色显著,外宣功能得到重视等;但同时也存在着一些不足之处,如:部分地市景点介绍的历史文化有待深挖,景点名称有待优化等,希望有关部门做进一步研究讨论后进行调整和修正。在后续研究中,研究内容也可延伸至负差异性对比研究、词性用法研究及句法结构或文本分析研究等。
(责任编辑杨文忠)
[1] 郭英珍.河南旅游翻译的生态翻译学视角审视[J].河南师范大学(哲学社会科学版),2012,39(2).
[2] 梁茂成,李文中,许家金.语料库应用教程[M].北京:外语教学与研究出版社,2010.
[3] Sinclair, J. Corpus, Concordance, Collocation[M]. Oxford, UK: Oxford University Press,1991.
[4] 杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002.
The Corpus Analysis of Henan English Tourism Materials
SONG Ya-jun
((Department of Foreign Languages, Henan Mechanical and Electrical Engineering College,Xinxiang 453003, China)
Henan tourism has been developing so fast these years. Though external publicity of tourism materials has deserved its attention, it still has a lot of problems. With the development of technology and internet, it is possible for corpus linguistics to be used to study tourism materials, which can find more characteristics and dig more problems with a different angle.
Henan tourism; corpus; comparative analysis
2015-12-12
H319
A
1008–2093(2016)02–0062–03
宋亚军(1980—),男,山东德州人,讲师,硕士,主要从事语料库语言学研究。