“世界海关组织新闻报道语料库”的建设及研究构想
2015-10-21李端阳
李端阳
一、引言
作为对国家间交往行为进行监督管理的机关,海关在边境交往中承担着维护国家利益的神圣使命。深刻认识和把握海关发展的动态和本质规律并始终遵循规律来谋划海关的发展,具有重要的战略意义。在国际社会发生深刻变化、国家正全力谋求经济社会发展方式转型的重要时刻,海关的职能、战略政策、行为方式随之也会发生深刻变化(姚永超、王晓刚,2014)。例如,“一帶一路”的战略构想是中国对外开放和区域发展战略的重大转变,这对中国海关与其他国家海关的合作机制提出了什么样的挑战?沿线各国海关有何动态?又如,信息化、网络化带来了社会价值观的多元化和社会组织的多样化,海关如何把握这些变化,如何对哪些活动需要监管、哪些不需要监管,监管的目的是什么、方式方法是什么做到未雨绸缪,紧跟时代的步伐?对此类问题的思考,离不开收集大量的文献资料,其中必不可少的是权威性、世界性的新闻报道,因为新闻报道最能描绘出反应国际关系格局变化、国际社会变迁的详细轨迹,相关语料库的建设及应用研究将为海关研究提供丰富的语言宝藏。通过建设世界海关组织新闻报道语料库并结合批评话语分析的方法进行高频词汇研究、主题词历时变化研究、语义韵研究、主题词语义网络的构建等,将对梳理世界海关组织及世界各国海关在职能和行为方式上已经发生和正在发生的重大调整提供来自文本的实证基础,进而为海关战略和政策的制定者和研究者提供更为客观、理性的借鉴。
二、语料库的建设及相关研究简介
语料库的建立及研究是20世纪中后期语言学及应用语言学研究领域的一大发展特点,迄今为止已有近50年的历史。语言使用千差万别,并非凭研究者的个人的语言本能所能判断。观察语言差异必须依赖大量的文本分析,而以语料库为基础的分析提供了一种手段,能同时处理大量语言数据和保持它的许多语境因素的联系(桂诗春,2009)。
在近半个世纪的岁月里,语料库的功能及其对语言学及应用语言学的价值在不断地被人们挖掘和发现,并已逐步成为应用语言学领域的一个独立分支,即语料库语言学。纵观语料库的发展历史,可以看出以下特征:第一,库容量大。语料库的建立与研究在不断完善、不断更新。新一代的语料库容量大,如BNC(英国国家语料库)已达到2亿词次。21世纪初已实现通过互联网检索的在线语料库(WEBCORP)更是达到了10亿-50亿词次(何安平,2004)。第二,种类多样化。例如,原始语料库按照一定规则(语域、语体、历时或共时等)收集现实中使用的口、笔语资料。赋码语料库对原始语料库进行词性、语法、语音、语义或语篇进行标记。平行语料库在两种或多种语言之间在句子或短语层面上实现同步对译。学习者语料库收集非母语学习者的口、笔语料。专门用途语料库收集关于特定主题的语料,常在术语提取、培训特定领域的译员以及社会语言学、教育学、社会学、历史学等领域中作为辅助工具(潘璠,2012)。第三,语料库的建立为探究语言在使用过程中呈现出来的规律提供了宝贵的数据。通过语料库研究可以探究:1)特定词汇在特定领域中的实际使用频数;2)反复出现的习语或搭配模式;3)特定词汇与特定语法结构的同现倾向;4)与某种语义场相关联的词汇或语法结构;4)与某类语篇相关联的语法结构和语篇结构的使用特征等(何安平,2004)。第四,语料库的应用领域越来越广,从语言教学和研究扩展到社会语言学、教育学、社会学、历史学等领域,为多领域的研究提供定量分析的依据和定性分析的基础(卫乃兴,2007)。
虽然语料库能够提供语言事实,却不能给出语言知识,主要是由于“语料库中展现的语言形式很可能是脱离语境的,研究者要清楚地说明所观察到的语言证据和据此作出的解释之间的步骤”(Huston,2002)。与此相反,批评话语分析一直以来由于在解释层面缺乏客观、充分和系统的语言实证而遭受诸多质疑。因此语料库研究中的定量方法和批评话语分析中的定性方法相结合有助于对语料进行深层次的挖掘分析和阐述解释,从而能够以一种技术的手段揭示话语中的“潜在意义”(张淑晶,2014)。
近几年来,国内有些学者已经注意到语料库语言学和批评话语分析相结合的研究趋势。一方面,语料库主题词、搭配以及检索分析有助于认识文本的话语信息,另一方面,批评话语分析则揭示意识形态对语言和社会的影响(辛斌、高小丽,2013)。
三、基于语料库的批评话语分析研究
20世纪的哲学研究出现了语言学转向,致使西方学者开始对传统的科学思维进行反思,批评话语分析(Critical Discourse Analysis,CDA)就是推动这一反思的重要前沿学科之一。批评话语分析最早由英国语言学家Roger Fowler和Gunther Kress在1979年提出,是批评语言学(critical linguistics)的一个分支,为“研究话语与不同领域的社会文化发展之间的关系提供了理论和方法”(Fairclough,1995: 30)。批评话语分析以发现和解决社会问题为研究的出发点,通过话语(文本)的语言学分析来探索语言与社会的辩证关系(钱毓芳,田海龙, 2011)。话语不仅在社会实践中产生,而且反作用于社会,这种反作用的明显标志就是话语参与社会实践,再现并构建社会事实。例如,新闻文本作为反映社会实践的重要话语,对构建社会事实起到重要作用。批评话语分析把语言学与其他社会科学直接联系起来,为社会科学各个领域的研究提供文本为实证基础的研究方法,同时也改变了传统的对于语言在社会生活中作用的认识。
但是传统的批评话语分析存在一些问题:数据的分析往往受到研究者先入之见的影响;定性语言分析手段存在着弊端;数据选取的任意性使得数据的代表性以及结论的可靠性遭到质疑。对此,批评话语分析呈现出的最新动态就是语料库语言学方法越来越受到重视。Hardt Mautner是第一位倡导将批评话语分析和语料库技术结合的学者,他认为语料库强大的技术能够支持对大量语篇进行定性研究(Mautner,1995)。批评话语分析与语料库语言学结合起来,在大量语言事实的基础上,归纳出关于典型的语言使用情况的一般性结论。例如,Stubbs(1996)、Baker(2008)和Salama(2011)等将语料库语言学和批评话语分析相结合,用于分析具体政治新闻语篇中蕴含的意识形态,强调语料库方法对于揭示语言和权力关系的重要意义。语料库方法强调真实语言数据的频数概率特征,基于语料库的批评话语分析能够克服传统批评话语分析自上而下定性分析的瓶颈,对语言规律性特征的描述可以为解读命题背后的立场、态度和暗藏意义提供可靠的证据(甄凤超,2010)。
近几年来,国内有些学者已经注意到语料库语言学和批评话语分析相结合的研究趋势,正如卫乃兴(2007)所言,“如果语料库的方法和数据大量进入话语分析以及近几年兴起的批评话语分析等领域,极有可能引起相关学科形态的改变,成果的规模、数量和影响都有可能提升”。语料库语言学与有关学科交叉,拓宽自身的研究领域,势在必然。又如,钱毓芳和田海龙(2011) 在《话语与中国社会变迁: 以政府工作报告为例》一文中对1999-2008年间两届政府工作報告进行分析,讨论工作报告话语与中国社会变迁之间的关系,表明政府工作报告能够影响接受者的行为及引发和促进社会变革。
从这些研究中,可以看出将语料库方法和批评话语分析相结合的优势,一方面语料库主题词、搭配、语义韵分析有助于分析文本的话语信息,另一方面,分析的对象不再是由分析者选择的个别语篇,而是从大量的语篇中提取出那些具有典型或代表性的“语言模式(linguistic pattern)”,有助于人们探究语言使用过程中所蕴含的文化传统和社会变迁。
四、建立“世界海关组织新闻报道语料库” 的独到学术价值和应用价值
1.国内外还没有专门收录海关领域英文报道的语料库
国内外已建立了不少法律、财经、农林、医学、旅游等专门用途型语料库。专门用途英语语料库在特殊用途的英语变体语料的规模和代表性方面都比通用语料库高,特定的话语类型在通用语料库中不宜收集或并无涉及。目前国内已建成或在建的一些专门用途英语语料库,如解放军外国语学院的“军事英语语料库”,河南师范大学的“中国英语(China Eng lish)语料库”等。这些语料库已呈现出良好的应用前景(甄凤超,2010)。
但是,迄今为止,国内外还没有专门收录海关领域新闻报道的语料库,世界海关组织新闻报道语料库的建设及应用研究将对海关领域专门用途英语研究和掌握海关动态及战略制定提供强有力的语料支持和宝贵的启示。
2.国内基于新闻语料库和批评话语分析对战略决策进行支持的研究鲜见
国内基于新闻语料库和批评话语分析对战略决策进行支持的研究鲜见。基于世界海关组织新闻报道语料库可以深入挖掘相关文本的语言特征及这些语言特征所反映的世界各国海关职能和行为方式的重大调整,将为海关主动把握自身发展规律、科学分析国家和社会发展规律、国家间交往活动发展趋势提供坚实的文本支撑,有助于对国际海关的动态发展给出令人信服的诠释,有助于中国海关主动应对新的困难和挑战。
例如,2001年的“911”事件以来,各国政府海关的工作重心呈现出从传统的经济职能转向国土安全保护等非传统职能的趋势,隶属于美国财政部的美国海关署就调整成为了隶属于美国国土安全部的海关与边境保护局。又如,2008年以来,国际金融危机爆发导致全球性经济危机,不仅引发了各国经济发展模式、发展内涵以及发展道路的大调整,更是导致了国际关系格局的大调整,这些调整对国家的存在状态产生深远的影响,欧元区各国海关发展呈现出很多新的动向。再如,当前习近平总书记在访问东盟期间首次提出的共建21 世纪“海上丝绸之路”的战略构想也已成为国内外广泛关注的热点问题,对中国海关的监管机制、同其他政府部门的合作机制及同丝绸之路沿线国家海关的合作机制都提出了新的课题。这些重大事件以何种语言模式反映在世界海关组织的新闻报道中?这些语言模式又反映出世界海关组织和世界各国海关的什么样的动态轨迹?这些动态和发展规律对中国海关的战略、政策的制定和研究有何种借鉴意义?对于这些问题,都可以通过语料库中有文本支撑的实证语料进行批评语言学分析。
3.促进海关领域的数据驱动型培训和翻译
“世界海关组织新闻报道语料库”拟收集的语料将包括《世界海关组织新闻》(WCO NEWS)杂志和通过互联网推送技术获得的相关新闻文本。世界海关组织是唯一世界范围的专门研究海关事务的国际政府间组织,以加强各成员海关工作效益和提高海关工作效率,促进各成员在海关执法领域的合作为使命。 《世界海关组织新闻》(WCO NEWS)是世界海关组织面向全球公开出版的关于世界海关组织、国际海关动态的新闻报道类杂志,是研究海关专门用途英语的极其宝贵的权威资料。该语料库所采集的语料和提取出的关键词汇对海关专门用途英语的数据驱动式教学及海关翻译、海关英语词典、教材的编撰也是很宝贵的资料。
五、“世界海关组织新闻报道语料库”的语料来源及主要目标
1.语料来源
主要语料来源是《世界海关组织新闻》杂志和通过互联网推送技术获得的相关新闻文本。《世界海关组织新闻》是世界海关组织面向全球公开出版的关于世界海关组织及世界各国海关最新动态的新闻报道类杂志。有英语和法语两个版本。拟采集英语版本。从2004年10月起`,每年2月、6月、10月出刊,迄今为止(2014年12月)已出30期,每期约1万5千字。每期设有“要闻简报”、“档案资料”、“聚焦报道”、“深度访谈”、“要情动态”等栏目,每期的字数约为1万5千字。此外,“世界海关组织新闻报道语料库”的研究人员已通过互联网推送技术已对世界各国海关的最新新闻动态进行历时约2年的追踪,积累了大量的语料。
2.主要目标
首先,提取出世界海关组织新闻中的高频词汇、主题词及它们的使用规律和语境特征。第二,透过世界海关组织新闻语料库中的的词汇特征等语言模式,探究世界海关组织新闻历年的重点内容及世界各国海关职能、行为方式及在国家政权中地位和作用的变化轨迹和发展规律。第三,通过把握世界海关组织和世界各国海关的发展动态,为更主动地把握我国海关的未来发展趋势提供借鉴。第四,基于世界海关组织新闻语料库的文本分析和提取出的关键词汇为海关英语词典及教材的编撰提供语言材料并支撑海关专门用途英语的数据驱动式教学和翻译。
六、“世界海关组织新闻报道语料库”的建设方法
通过采集《世界海关组织新闻》的文本,建立《世界海关组织新闻》语料库,利用语料库软件对语料进行定量分析,提取高频词汇和历年主题词汇,通过高频词汇和历年主题词汇的搭配、共现规律及语义韵分析,挖掘文本特征所暗含的意识形态意义,把握世界海关组织及世界各国海关的职能及行为方式、价值取向的发展趋势。具体为:
1.语料采集和整理
《世界海关组织新闻》从2004年起至今(2014年12月)每年3期,已出30期,2015年待出3期,拟全部采集。对于通过互联网推送技术获得的文本,整理已采集的文本,并继续追踪采集。采集到的语料全部采用UTF-8编码格式保存文本。采用软件和人工结合的方式获得清洁文本。拟采用的文本清洁软件为;“文本整理器”和“ABBYY FineReader”。
2.语料分析
1) 高频词统计
通过显著性和概率的运用,直观地观察语料的显著特征,有效弥补话语批判中的主体性泛滥和结论置信度缺失的不足。
2) 主题词提取
拟采用英国国家语料库作为参照语料库,用语料库软件Word Smith Tools生成主题词数据库,进而生成主题词、关键主题词和联想词。
3) 语义韵研究
通过索引分析,观察关键主题词的三字或四字词从,研究与单个关键主题词购成聚合关系的搭配词和联想词。
4) 构建语义网络
在统计分析和索引分析的基础上,探索各个主题词所属的语义范畴,以及主题词间的联想关系,构建语义网络,为研究抽象的社会变迁提供具体的语言事实依据。
3.批评话语分析
不同语义范畴的主题词将反映世界海关组织和各国海关历年关注的重点和发展变化轨迹,对这一发展规律的把握将为中国海关战略、政策的制定和研究提供客观、系统、翔实的依据。
七、结语
“世界海关组织新闻报道语料库”将弥补国内还没有海关专门用途领域语料库建设及研究这一空白。首先,通过系统、客观、高效地文本分析,有助于更好地把握世界海关组织的发展动态及世界各国海关职能、行为方式及在国家政权中地位和作用的变化和发展规律。第二,通过把握世界海关组织和世界各国海关的发展动态,能够为更主动地把握中国海关的未来发展趋势提供借鉴。第三,《世界海关组织新闻》语料库所采集的文本和提取出的关键词汇为海关英语词典及教材的编撰提供语言材料,为海关翻译和培训提供数据化驱动。
[参考文献]
[1]Salama, Amir H. Y. Ideological collocation and the recontexualization of Wahhabi-Saudi Islam post-9/11: A synergy of corpus linguistics and critical discourse analysis[J]. 2011, 22(3): 315-342.
[2]Baker P. Useful methodological synergy? Combing critical discourse analysis and corpus linguistics to examine discourse of refugees and asylum seekers in the UK press[J]. Discourse and Society. 2008(3): 273-306.
[3]Fairclough N. Critical Discourse Analysis: The Critical Study of Language[M]. London /New York: Longman, 1995.
[4]Hardt-Mautner G. “Only Connect.”Critical Discourse Analysis and Corpus Linguistics[Z]. 1995: 2014.
[5]Huston S. Corpora in Applied Linguistics[M]. Cambridge: Cambridge University Press, 2002.
[6]Stubbs M. Text and corpus analysis: computer-assisted studies of language and culture[M]. Oxford: Blackwell, 1996.
[7]桂詩春.基于语料库的英语语言学语体分析[M].北京:外语教学与研究出版社,2009.
[8]何安平.语料库在外语教育中的应用--理论与实践[M].广东:广东高等教育出版社,2004.
[9]潘璠.基于语料库的语言研究与教学应用[M].北京:中国社会科学出版社,2012.
[10]钱毓芳,田海龙.话语与中国社会变迁:以政府工作报告为例[J].外语与外语教学.2011(03):40-43.
[11]世界海关组织.《世界海关组织新闻》[Z].2014:2014.
[12]卫乃兴.JohnSinclair的语言学遗产——其思想与方法评述[J].外国语(上海外国语大学学报).2007(04):14-19.
[13]辛斌,高小丽.批评话语分析:目标、方法与动态[J].外语与外语教学.2013(04):1-5.
[14]姚永超,王晓刚.中国海关史十六讲[M].上海:复旦大学出版社,2014.
[15]张淑静.语料库在批评话语分析中的应用[J].郑州大学学报(哲学社会科学版).2014(03):130-133.
16]甄凤超.语料库语言学在中国的成长与发展[J].当代外语研究.2010(03):36-41.
(作者单位:上海海关学院)