国内外高校英语新闻语料库的构建
2020-03-04徐莉娟
徐莉娟
(合肥学院 外国语学院,安徽 合肥230601)
在全球化背景下,随着信息技术的快速发展,我国英语新闻的对外传播能力不断提升。国内很多高校都利用英文网站进行对外传播。为了进一步提高对外宣传的力度,并在翻译课程教学中加强外宣翻译和新闻英语翻译教学,为了保障新闻和外宣翻译的语篇和话语特征能够符合以英语为母语的受众的语言表达习惯,提高国内高校英语新闻报道的质量和外宣翻译教学的质量,建立国内外高校英语新闻语料库实有必要。然而,目前很多新闻语料库的建立是基于主流媒体及期刊进行的,对于国内外高校的英语新闻重视不够。鲜有针对源语高校新闻及国内高校英译新闻建立的语料库,这势必会极大地影响国内高校英译新闻的质量,会影响英译新闻的受众的接受度。国内高校英译新闻的受众主要是以英语为母语的群体。因此,建立国内外高校英语新闻语料库并对其进行语言特征的对标分析,对于国内高校的推介,促进高校间的国际交流与合作,提高翻译教学质量都有着重要的作用。
1 英语新闻语料库研究现状
语料库语言学兴起于上个世纪中后期,在过去的20年中得到了长足的发展,己演变成现代语言学的重要构成。其对外语教研领域中多可学科发展情况形成一定影响,可以用来进行语言的量化调查和质性分析,从而深化对语言结构和语言使用的描述并且开拓多个方面的研究与应用;还被广泛地应用于大规模语言调查,语言教育教学 ,翻译研究,机器翻译,人工智能语言研究等领域,并在上述领域开辟了广阔的发展前景。
作者以CNKI为数据源,以“新闻语料库”为关键词对2008年至2018年十年的期刊论文、学位论文等进行检索,经筛选仅有20余篇与英语新闻语料库相关的论文。经分析,发现在过去的二十多年,作报刊英语是新闻英语主干,逐渐高校外语新闻教育领域中的一个炙手可热的课程,国内外诸多机构与学者在早年间研究就指出报刊英语是一门可以淋漓尽致的呈现出时代发展特色的新闻语言类型,在后续几年中将会有更为广袤的发展空间,并且结合语料库语言学、统计学以及新闻学相关理论知识为基础,建设了功能强大的新闻类语言语料库。路透社语料库(Reuters Corpus)(第一版)于2000年开发完成,为英国通讯社语言的学术研究提供了参照。1995年开发完成的北美新闻文本语料库(North American News Text Corpus)应用于信息检索和语言建模。苏黎世英文报纸语料库(Zurich English Newspaper Corpus)不仅促进了对17、18世纪英文报纸的研究,并且使报刊语言特点的历时比较成为可能。国际关系学院的郑志恒博士基于《纽约时报》《华盛顿邮报》等8家主流媒体自行创建了美英报刊英语标注语料库(Newspaper English Corpus),河南师范大学的李文中博士基于《中国日报》《上海星报》《北京周末报》创建了中国英语新闻文章语料库〔1〕,高莉(2011)基于英语国家新闻报纸完成了英语硬新闻语料库的建设〔2〕,冯正斌(2016)基于《北京周报》《金融时报》《中国日报》等报刊完成了财经英语新闻语料库的建设〔3〕。除基于报刊创建新闻语料库外,还有基于VOA、BBC、ABC和NBS主流媒体的新闻材料创建的VOA新闻语料库(陈欣,2010)〔4〕,基于WEB的多媒体新闻语料库(杨林伟,2012)〔5〕。此外,有基于已有或自建新闻语料库对词汇及其搭配使用、对教学辅助作用等方面的研究:刘金盼(2010)基于自建新闻语料库对词语的相关度进行研究〔6〕;刘远博(2012)基于《人民日报·海外版》自建海外版时政新闻原始语料库对对外汉语词汇进行研究〔7〕;朱一凡、胡开宝(2014)基于汉译语料库及原创语料库对“被”字句的语义趋向与语义韵进行研究〔8〕;吴丽娟(2016)基于自建新闻语料库对“make使役结构”汉译方法进行了分析〔9〕。所有这些语料库的建立及基于语料库进行的研究对于相应语言的研究及语言教学都有着重要的作用,对于网络化教学环境建设提供了良好的平台。
2 国内外高校英语新闻语料库构建必要性
基于合肥学院外语系2017年市场调研的结果发现,安徽省内约30%应用型本科及以上层次院校已经引入或开始引入翻译技术并开设相关的课程。安徽大学、合肥工业大学、安徽工程大学、黄山学院等7所高校已经在这方面走在了其它高校的前列。语料库技术属于翻译技术类课程的核心内容。合肥工业大学邀请香港大学语料库方面的专家进行语料库建设,在短短几年内有效提升了翻译服务、研究和教学水平。合肥学院作为地方应用型高校,“地方性、应用型、国际化”的办学定位决定了该学校在翻译服务方面应当有所作为,因而需要在翻译技术方面有所准备。而且市场调研发现对翻译技术能力的要求已经成为翻译方向毕业生入职的基本条件之一。调研结果显示,100%的翻译公司要求应聘人员具有翻译技术背景。
目前外国语学院的“南滟语言工作室”翻译团队的教师前期进行了“学院英文网页”新闻的翻译工作。而且其专业方向课程也逐步往翻译倾斜,英语专业积极推进模块化教学,增加了翻译模块的课程,使其贯穿学生的大学英语专业学习之中;近几年英语专业学生参加不同级别的翻译大赛,也促进了翻译教学的不断改进,在此过程中使用语料库来辅助教学将会起到意想不到的效果,英语新闻语料库的建立也势必会推进我校翻译专业课堂教学质量及英文网页新闻翻译的质量。因此,建立相关的英语新闻语料库能更好地满足翻译教学及翻译服务的实际需要。建立的语料库将提供真实可信的语料,为翻译提供参照,亦能通过反思提高翻译水平。
3 国内外高校英语新闻语料库构建思路
本研究拟建设国内外高校网页英语新闻语料库,主要选取中国及美国多所知名高校校园新闻、高等教育交流与合作和学术研究等方面的新闻作为语料,以实现提高英语语言教学、翻译教学及新闻翻译质量,达到提高教学水平和加强对外宣传的目的。
3.1 语料库建设规则
规划与建设语料库宗旨在于呈现出某个现实语域内语言应用情况,或是为迎合相关研究活动要求。这就预示着语料库若能囊括经典内容,便能从根本上保证基于该语料库基础作出相关结论的可靠性程度,和专题新闻语料库比较,语料库内容的代表性主要在如下几个方面体现出来:(1)语料真实度的高低;(2)语料对应的规模性;(3)语料的层次性。
3.2 语料收集
根据有关学者的研究成果,十万级甚至千词级这种小型语料库尤其符合专门的需要,所以本研究所建立的新闻语料库规模大小为40-60万字。依据上述语料库的代表性原则进行收集和整理语料,收集的所有语料均以文本文档的形式进行储存,首先建成原始语料库,并对语料的准确性进行校对,为后续的分析提供保障。对所收集新闻语料库中的语料进行分类、编排,由于所收集的语料涵盖不同类别的新闻事件,为了方便以后的整理、查找以及校对,需要对语料库中的新闻语料进行编码,编码可以分为一级、二级及三级目录。
3.3 语料赋码
语料赋码首先进行篇头标注,在文本开头对所收集语料的相关背景内容进行标注,可包括语料收集者、所收集新闻日期、新闻标题等。标注完成后对语料库进行词类赋码,对语料进行分词和词性标注,对文中的每一个词赋予相应的词类码,词类码代表了一个词的语法特征,也为语料库的进一步应用做好准备。不同语域语料的赋码应该适应该语域语言的特点,其分词和词性标注都应该符合并尽量体现该语域语言的特色。本研究主要利用TreeTagger进行自动赋码,之后对已赋码语料辅助以人工校对。
3.4 语料检索及使用
建成的语料库只有能够通过检索才能发挥其应有的理论和实践价值。语料标注完成后,需要运用语料库检索工具对已处理语料进行检索。检索工具可使用语料库软件AntConc,对语料的语言特征如词汇、句法、语篇和语义搭配等多个层面进行分析。自建语料库的使用可以改变传统教学以教师讲授为中心的教学理念,让学生基于自建语料库进行自我探索语言的使用,促进学生自主学习能力的培养;可以有效提高英语语言教学质量,帮助学生理解语言学习过程中搭配的语篇意义,提高学生专业词汇的广度和深度;可以为外语学习者自主学习和个性化学习提供保障,适合高校翻译教学改革;可以为学校英文网页新闻翻译提供保障,促进学校的对外宣传,推动学校国际化的发展。
3.5 语料库的完善
在应用语料库的实践中,国内各大高校新闻量爆发式增长,英译新闻语料内容更具充实性特征,这就要求参与语料库建设的工作人员要梳理连续拓展初有语料库的意识,持续强化数据库内容的多样性,拓展语料库的规模,也要立足于共享师生及其他用户的主观感受及需求,有针对性的调整更新已有的存储模式,使用者提供最大的便利〔10〕。
4 结语
随着英语新闻对外传播能力的不断提升,为了提高新闻翻译质量,达到提高教学水平和加强对外宣传的目的,为了进一步推动语料库语言学的发展,建立英语新闻语料库有着很强的实践意义。为了更好地推广使用此语料库,语料库建设者需要认真如实地选取、保存和校对语料,确保语料真实可靠;需要对语料进行赋码,为后续分析提供便利;要运用检索工具对语料进行检索分析,方便学习者使用;并对语料库不断进行完善,提高语料使用的频率。