APP下载

基于语料库的中美媒体关于北京冬奥会新闻报道文体特征对比分析

2024-02-29康馨月

文化学刊 2024年1期
关键词:连接词体育新闻被动语态

康馨月

引言

奥林匹克运动会是国际奥林匹克委员会主办的世界规模最大的综合性运动会。2022年冬奥会在中国北京举行,吸引了世界各地媒体争相报道。对北京冬奥会的新闻报道研究主要集中在国家形象建构上,如牛慧清、段嘉希(2022)从政治、社会、文化等方面探讨了《俄罗斯报》建构的中国形象,为新时代中俄关系的发展提供参考[1];刘思雨、季峰(2023)对CGTN关于北京冬奥会的报道进行研究,研究认为CGTN对北京冬奥会的报道进一步整合了国际体育传播与国家形象建构的内在关联,使国际体育传播与国家形象建构深度互嵌[2]。不同国家拥有不同的制度及价值观念,对同一事件的报道具有一定的差异性。因此,对同一事件的不同国家的新闻报道进行分析具有一定的必要性。

文体学是现代语言学理论的重要组成部分,是一门研究文本体裁特征、本质及规律的学科。目前对文体学的研究逐渐从文学作品转移到非文学语篇上,这可以帮助人们清晰地了解文章表达的内容以及指导语言的正确应用。本研究借助文体学理论,利用语料库工具和统计分析软件,对China Daily和CNN上有关北京冬奥会的新闻报道从词汇、句法和语篇三个方面进行比较,并对其在语言特点上的差异进行分析,试图找到中美媒体关于北京冬奥会新闻报道的文体特征差异,为国内体育新闻写作提供借鉴与参考,促进我国体育新闻事业的进步。

一、研究设计

综合考虑媒体的影响力和公信力,本研究从China Daily(《中国日报》)和CNN(美国有线电视新闻网)在北京冬奥会开幕至闭幕(2022年2月4日—2022年2月20日)期间发布的新闻中每日随机抽取两篇新闻各自建成小型语料库,两个语料库分别简称为“CDC”和“CNNC”。

针对同一新闻,不同国家的报道具有一定的共同点和差异性,本文将使用语料库工具和统计分析软件对China Daily和CNN上北京冬奥会相关报道进行词汇、句法、语篇层面的对比,具体研究的问题如下:(1)China Daily 和CNN关于北京冬奥会报道的文体特征共同点是什么?(2)China Daily和CNN关于北京冬奥会报道的文体特征差异是什么?(3)本研究可以为国内体育新闻写作提供哪些借鉴?

本研究所涉及的研究工具主要包括语料库软件TreeTager、Wordsmith 6.0、AntConc 3.5.9和统计分析软件SPSS 25。TreeTager可以对连续文本中的单词进行词性标注附码,本文利用TreeTager对两个自建语料库中新闻报道词性进行赋码,以研究词汇特征,包括形容词、动词和名词在每个语料库中的分布情况等。Wordsmith 6.0可以提供词表生成、关键词检索与提取、搭配词分析等功能,本文利用Wordsmith 6.0进行了词汇多样性及词汇长度、句子长度等分析。

二、结果分析

经过对语料进行处理分析,本文将从词汇、句法和语篇三个层面对CDC和CNNC语料库的文体特征进行比较。

(一)词汇层面

在词汇层面上,本研究考察了不同国家英语体育新闻词汇选择的异同,主要从词汇多样性、词汇长度、词汇密度和情态动词的使用四个方面进行对比分析。

1.词汇多样性

形符是指文本中出现的全部的词汇,类符是指不重复计算的形符数。类符/形符比(Type-token ratio,TTR)可以衡量文本的词汇密度,是词汇多样性的表征。但由于文本的长度不同,功能词的重复次数也不同,因此,不同文本的词汇密度应通过标准化类符/形符比(STTR)进行比较。在文本中,类符/形符比比值愈高,则说明词汇的使用愈丰富(Baker,2000)[3]。笔者通过Wordsmith 6.0计算出了两个语料库的类符、形符及STTR。研究发现,CDC的标准类符/形符比为44.48,高于CNNC的标准类符/形符比44.37,即China Daily关于冬奥会的新闻报道的词汇多样性要比CNN高,词汇使用更加丰富。

2.词汇长度

词汇长度会影响读者的阅读速度和阅读难度,是考察新闻语言特征的一个重要视角。本文考察了China Daily和CNN关于北京冬奥会报道的平均词长和词长标准差。平均词长是指语料词汇长度的平均值,词长标准差可以反映词汇长度与平均词长的差异情况。一般来说,体育新闻报道所选词汇长度较短,读者阅读较为容易。笔者运用Wordsmith 6.0计算出了两个语料库中的平均词汇长度,发现CDC和CNNC的平均词长为4.71和4.69,十分接近。这表明,中美记者在报道中都喜欢用简短的词语,这样增加了新闻的可读性。但美国报道的词长标准差为2.54,略高于中国报道的2.50,也就是说,CNN报道选用的词汇在平均词长上下浮动的程度略高于China Daily。

笔者进一步对不同长度单词的频率进行研究,以便看到每个语料库不同字母长度单词的分布情况。研究发现,在CDC和CNNC中,两个字母单词至五个字母单词出现频率相对较高,均在10%以上,其他字母个数单词在两个语料库中的分布频率都较为接近。值得注意的是,两个语料库在两个字母单词、三个字母单词和七个字母单词的使用频率上差距较大,在1%左右。总体来说,两个语料库在单词选择上都倾向于使用三个字母组成的词汇和四个字母组成的词汇,这类词汇更为简短精练,便于读者阅读。

3.词汇密度

词可以分为实词和虚词。实词是指具有实在意义的词,可以充当句子成分,一般包括名词、动词、形容词、数词、量词和代词。虚词则是不具有完整含义的词汇,不能独立成句和单独作语法成分,但具有语法意义,必须依附于实词或语句使用。Ure ( 1971) 提出词汇密度的计算公式为实词与总词数的百分比,百分比越大文本提供的信息量就越大。在实词中占据主要地位的是名词、动词、形容词和副词,笔者用AntConc3.5.9对赋码后的文本进行检索,测量两个语料库的相关实词频数。两个语料库在动词、形容词和副词的使用上比例较为接近。值得注意的是,CNNC中名词所占比例明显高于CDC,这表明美国体育新闻比中国体育新闻更加喜爱使用名词。

为更加准确地对比两个语料库的词汇密度,笔者对CDC和CNNC中的每个语篇的词汇密度进行了统计,在此基础上运用SPSS对其进行独立样本t检验,观察两个语料库内语篇是否具有显著差异,具体检验结果如表1所示:

表1 CDC和CNNC词汇密度独立样本t检验对比

由表1可知,CDC和CNNC在词汇密度上存在显著差异(t[63]=-6.21,p[2-tailed]=0.000,CI or MD=-5.34,-2.74),CDC(M=58.19,SD=2.93)显著低于CNNC(M=62.23,SD=2.23)。两组平均值在5点利克特量表上的差异为4.04,效应量d为-1.55,即两组相差1.55个标准差。根据Cohen(1988)的标准,1.55为较大的效应量,说明CDC和CNNC关于北京冬奥会报道的词汇密度具有显著差异。CNN上冬奥会相关报道的词汇密度大于China Daily上的相关报道,即CNN报道的信息量更大,文本难度更高。

4.情态动词的使用

情态动词是表示语气的单词,自身具有一定语义。在新闻报道中,记者通常采用情态动词表达事件的观点和态度。除此之外,情态动词也有缓解语气的作用,避免语气过于生硬,提高新闻的接受度。本研究借助语料库工具AntConc3.5.9对China Daily和CNN上有关冬奥会的新闻报道中情态动词的使用情况进行分析,探求其语义特点,具体统计结果如表2所示:

表2 CDC和CNNC情态动词使用情况对比

从表2分析结果可以发现,CDC和CNNC中情态动词所占比例非常小,分别为0.83%和0.80%。在两个语料库中,情态动词“will”所占比例都为最高,在CDC中占0.24%,CNNC中占0.26%,而带有强烈语义情感的“must”在两个语料库中所占比率都为最小。CNN报道在情态动词“will”“would”“could”的使用上均高于China Daily,其中“would”一词相差比率较大;在情态动词“can”“should”的使用上低于China Daily,其中“should”一词相差比率较大。“should”一词带有较强的主观色彩,且比较强硬,相比之下CNN的报道更加委婉。新闻的本质是为大众提供真实客观的信息,过多地使用情态动词会导致新闻中掺杂报道者个人的情绪,影响新闻的准确性。

(二) 句法层面

词汇的排列组合构成句子。在句法层面上,本研究主要考察不同国家英语体育新闻的句子特征,主要从句子长度和被动语态两个方面进行对比分析。

1.句子长度

与词汇长度相同,句子长度会影响新闻的可读性,也是考察新闻语言特征的一个重要视角。无论长句还是短句,都在文章中起着各自的作用,长句更加正式,短句可以降低阅读难度,体现新闻写作的简洁性。笔者通过Wordsmith 6.0检索计算得到了CDC和CNNC的平均句子长度。CDC的平均句子长度为22.53,CNNC 的平均句子长度为23.23,即CNN的记者在报道体育新闻时使用的句子长度要长于China Daily的记者。在报道体育新闻的过程中,中国记者更倾向于使用简短的句子,使文章更加简洁,便于读者迅速掌握文章的重点信息,而美国记者更倾向于使用长句子使文章叙述更加完整。下面是笔者在语料库中挑选出来的具有代表性的句子:

例1:Besides,athletes from different disciplines were sent to some European countries to receive advanced training.(China Daily,2022年2月7日)

例2:Having looked destined to crash as she hurtled towards the ground on that final jump,a miraculous landing following a stunning 1080 double cork was testament to the youngster’s fearlessness and strength of character.(CNN,2022年2月7日)

2.被动语态

在英语中,语态分为主动和被动。主动语态的主语是动作的执行者,在表达上更加直接。被动语态的主语是动作的承受者,通常用来描述事件的过程和结果,更加客观。在新闻写作中,为避免掺杂报道者过多的个人情感,让读者更客观地看待报道的内容,有时会使用被动语态。笔者在AntConc3.5.9中输入正则表达式S+_VBw*s(S+_[RX]w+s)*S+_VwNs对CDC和CNNC中的被动语态进行检索,并对检索数据进行卡方检验,具体检索结果如表3所示:

表3 CDC和CNNC 被动语态使用情况

为保证新闻的直观性,CDC和CNNC在报道冬奥会相关新闻时,多采用直接的方式向读者传递信息,主要使用主动句。从表3可以看出,CDC中被动语态所占比例为14.40%,大于CNNC的13.29%。由于两个语料库规模具有一定差异,为保证研究的严谨性,笔者运用SPSS对数据进行卡方检验,观察两个语料库内被动语态的使用情况是否具有显著差异。研究表明,CDC和CNNC的被动语态使用情况差异并不显著(X2=0.505,P=0.478>0.05)。

(三) 篇章层面

一系列连续的语段或句子所构成的语言整体是语篇,本研究主要从文本长度和衔接特征两个方面对China Daily和CNN上有关北京冬奥会的新闻报道进行对比分析。

1.文本长度

文本长度是体现篇章层面文体特征的一个重要方面。当新闻主题相同时,不同报道的长短可以体现文本信息量的大小和难易程度。笔者整理了两个语料库中各语篇的文本长度,设零假设为“CDC和CNNC的文本长度情况无显著差异”,对其进行了独立样本t检验,具体分析结果如表4所示:

表4 CDC和CNNC文本长度独立样本t检验对比

由表4可知,CDC和CNNC在文本长度上存在显著差异(t[63]=-5.24,p[2-tailed]=0.000,CI or MD=-468.15,-205.61),CDC(M=548.47,SD=207.46)显著低于CNNC(M=885.35,SD=305.68)。两组平均值在5点利克特量表上的差异为336.88,效应量d为-1.29,即两组相差1.29个标准差。根据Cohen(1988)的标准,1.29为较大的效应量,说明CDC和CNNC关于北京冬奥会报道的文本长度具有显著差异。CDC平均语篇长度仅为CNNC的64% 。CNN更倾向于使用长篇幅,信息量相对更大,CDC倾向于使用短小的篇幅,降低读者阅读难度。

2.衔接特征

衔接手段是连接文章各个部分的桥梁,可以使文章更连贯。1976年Halliday和Hasan发表了论述语篇衔接的专著《英语中的衔接》(CohesioninEnglish),他们将英语的衔接手段归纳为五种:照应(reference)、替代(substitutin)、省略(ellpsis)、连接词(conjunction)、词汇衔接(lexical cohesion)[4]。本研究主要研究连接词作为衔接手段在文章中的作用。连接词是指连接句子的各种连词、副词等,可以表明前后句子之间的联系。除连接词外,一些短语也可以起到连接词的作用。Brown 和 Yule(2000)认为,连接词及相关起连接词作用的短语主要分为五大类,即增补连接词、转折连接词、原因连接词、时间连接词和其他连接词[5]。

本研究从上述五类连接词中各选取五个具有代表性的词或短语对两个语料库进行检索分析,分别为and、 also、 moreover、in addition、besides,but、 yet、 though、 however、on the contrary,so、 thus、 therefore、because、 as a result,then、 after、 finally、next、meanwhile,of course、 well、for example、in fact、 after all。笔者依次将这些词或短语输入AntConc3.5.9进行检索,检索结果表明,在CDC和CNNC两个语料库中,各类连接词的使用情况较为相似。增补连接词总体使用频率最高,其中“and”的出现频次最多;在转折连接词中“but”出现频率最高,其次为“also”;原因连接词中“so”的使用频率较高,其次为“because”;时间连接词“after”的使用频率最高;其他类连接词整体使用频率在五类连词中最低,只有“of course”的使用频率相对较高,其他连词使用频率几乎为0%。值得注意的是CDC中增补类连接词和原因类连接词的使用频率都高于CNNC。

总体来看,在CDC和CNNC中连接词的使用不是很多,“and”和“but”的使用是所有连接词中最多的两个。笔者认为出现这种现象的原因可能是体育新闻通常较为简洁且段落多。体育新闻中经常会出现很多的直接引语,帮助读者身临其境地融入到比赛现场中,这些引语有时单独成段,不需要连接词进行连接。

三、结语

各个国家在其主流媒体上面发布的新闻可以帮助人们快速了解最新、最重要的事件,交流和传播文化。体育新闻报道可以推动体育事业的发展,激发全民运动的热潮,促进群众体育不断发展。本研究在文体学的理论指导下,运用语料库相关软件对China Daily和CNN上有关冬奥会的新闻报道从词汇、句法和篇章三个层面进行分析。研究结果发现China Daily和CNN在报道冬奥会相关新闻时存在一定的相似性,都喜欢使用较为简短的词汇,主要用主动句描述新闻信息,在衔接手段方面多使用and和but。与此同时,两家单位的新闻报道具有一定的差异性,China Daily使用的词汇比CNN密度更小,报道语气较为生硬,包含的信息量更少。在句法方面,China Daily更喜爱使用短句子,在一定程度上降低了句子的阅读难度,且其更多地运用被动语态使文章更加客观,但这一差异并不显著。在语篇方面,China Daily关于北京冬奥会报道的平均篇幅比CNN短,信息量更小。为了更好地让世界了解中国,中国英语报刊应该在词汇、句法和语篇等多方面向国外报刊学习和借鉴,增加词汇使用的丰富程度,较少使用高强度的情态动词,避免过多地带有个人情感,加强句子的正式程度,丰富衔接手段。

猜你喜欢

连接词体育新闻被动语态
连动结构“VP1来VP2”的复句化及新兴小句连接词“来”的形成
被动语态复习(The Paasive Voice) 九年级 Unit5—7
被动语态
体育新闻中的辞格运用
被动语态专项训练
被动语态考点大放送
论体育新闻报道内容和形式的改变
体育新闻娱乐化现象思考
英语连接词:传统与反思
英语连接词的显功能初探