语料库方法在新闻传播研究中的发展应用分析
2023-01-06蒋艳
摘要:语料库是一种对连续性文本内容进行科学取样并进行分析归类的电子文本库,也属于一种新型数据分析工具。在新媒体的冲击下,传统媒体已经逐渐失去了独家性的优势,如今大众对新闻消息的要求越来越高,他们需要更准确的消息和更符合个人偏好的新闻,新闻传播领域的学者们对语料库给予高度关注,并对其在新闻传播领域中的应用进行深入研究。大数据背景下,新闻传播学研究需要开辟新的方向,而语料库的研究和应用对于新闻传播领域的发展有着重要作用。文章对语料库方法在新闻传播研究中的发展应用展开分析,对大数据背景下新闻传播研究发展新方向进行研究,提出當前语料库研究方法的应用领域,并根据当前存在的问题对未来的发展应用进行展望,希望为今后语料库方法对新闻传播学领域的进一步应用提供参考。
关键词:语料库方法;语言学;新媒体;新闻传播;发展应用
中图分类号:G212.2;H08 文献标志码:A 文章编号:1674-8883(2022)24-0023-04
基金项目:本论文为2020年度重庆市社会科学规划外语专项研究项目“架构隐喻视角下的批评话语分析:以疫情下外媒对中美经济的报道为例”系列成果之一,项目编号:2020WYZX04
语料库是一种重要的语言学方法,其丰富了语言学的内涵,并为其研究开辟了新的视野。新闻传播学领域的研究面临一个共同问题,即文本分析方法的创新。语料库方法是一种探索性工具,它在新闻传播研究中的起步较晚。在21世纪,人们对网络时代的新闻语言有了全面的了解,根据语言学、统计学、新闻学等理论,对新闻语言进行了大量研究,并在此基础上构建了新闻语料库。因此,在新闻传播研究中,语料库的应用应逐渐受到重视。
(一)新闻实践领域方向
如今各类社交媒体已经被大众所熟知,随着智能手机的大范围普及和使用,每个人都可以成为新闻事件的发布者和播报员,大众传媒的传统定位和粗放式新闻传播方式需要及时创新和优化。在大数据时代背景下,消息的传播具有开放性,公共数据随处可见,并且基本上不会被垄断,因此,当前媒体不仅要生产独家数据,还要学会利用这些公共数据。这些公共数据中不仅包含着数字信息,其中的文本内容也是非常重要的,想要充分利用好这些公共数据,就要具备整合数据和分析数据的能力,同时还要从这些海量数据中提取出有价值的信息,最终呈现给观众[1]。
(二)舆情研究领域方向
以往的舆情研究基本上都是对话语和事件的表层进行研究,并未深入分析公众内在的思想和行为,因此研究内容具有一定局限性,缺乏情感内涵和信息规律。以往的调查方式和访谈方法都有一定的局限性,并未从受众的思想情感、心路历程、社会关系等多角度去分析事件内部的含义,也并未对其中复杂的语义进行深入研究。在研究时距方面,当前舆情研究的主要内容偏向于共性研究,在历史性研究方面有所欠缺,但是舆情热点会因为条件发生变化而消失,所以如果只对舆情进行横向的共时性分析,那么只能得到这一时间点的特性和内在联系,缺乏深度。舆情分析需要与纵向的历时性研究相结合,这样才能更公正和客观。
现有的舆情监测系统和分析软件所采集的信息具有较明显的同质化特点,因为这些信息基本上是从互联网社交媒体上采集而来的,因此最终的分析结果也是大致相同的。虽然现在的可视化图景给人眼前一亮的感觉,但是背后却缺乏与文本数据更深层次的联系。如果应用被结构化处理过的文本数据库,就能够很好地挖掘海量数据、整合数据以及分析数据。舆情话语的表达形式多样,内容丰富,并且真伪难断,而基础文本数据库的建立能够有效解决这一问题。除此以外,文本数据库的结果也能对舆情之后发生的纵线走向进行分析。
(三)传播学学术研究领域方向
传统的传播学文本分析通常采用的是框架分析法、符号分析法等具有定性特点的分析方法,但是这类文本分析法主要是对文本的修辞、意识形态等方面进行分析,缺乏客观性。文本信息,尤其是舆论研究方面的文本信息,通常都呈现出碎片化形态,因此很容易被人们忽略。虽然目前已经出现一些分析词频的软件,通过高频词和低频词进行统计和分析,但是仍然缺乏对语义方面的深入挖掘和研究。因此,要对学术文本进行结构化整合,还需要寻找其他工具,通过对文本数据的分类统筹,并从中提取出关键信息,最后分类保存,这样才能为学术研究提供更准确的数据支持。
(一)新闻实践领域
1.史料检索语料库
史料检索语料库是指对以往新闻报道中的内容进行数据化处理,并转化为语料库中的核心部分。随着时代发展,新闻传播渠道越来越向扁平化方向发展,因此,构建一个方便大众检索和使用的史料语料库,也有利于传统新闻传播行业的生存和发展。另外,语料库需要通过购买、交换、合作等方式来采集媒体平台上用户创造的新闻内容数据,并将这些外来的数据作为文本数据库补充资料。
2.政府公开信息语料库
彭博社亚洲区新闻资讯曾经表示,数据驱动型报道中的数据都可以并应该从公开的信息渠道中获取。信息资源和数据不一定只能从私下渠道中挖掘,人们也可以从公开渠道中获取,比如政府官方网站会发布一些政策信息,官方媒体及其官网也会发布一些专题报道内容,这些信息都是最直接、最准确的,并且这些信息数据更容易分类,这样一来就能节省更多的人力、物力和时间成本。
3.“数据博客”语料库
这类语料库是利用网络社交平台节点式传播方式获取信息数据的,这些文本数据大部分来自微博、抖音等平台,寻找新闻线索也可以多加关注这些平台。在搜集内容的时候,可以选择那些具有影响力的、传播范围广的内容,之后可以对这些内容进行结构化处理,再转换成可供搜索的大众信息语料库。
(二)舆情研究领域
建立动态监测舆情的语料库,需要具备关键词检索功能,这就需要利用语言学、修辞学方面的知识进行分析,这样才能对舆论中的语言内涵、心理情感、社会关系等深层次内容进行分析。建立动态舆情监测语料库,首先要根据规则对收集好的舆情文本内容按照专题进行分类,并做好标注,之后再将文本进行合并,从中提取出关键词。需要注意的是,小型的基础语料库需要大数据库作为母体支撑,但同时大数据库也需要多个小数据库作为信息检索源。另外,大数据库是不具备结构化功能的,因此大数据库中的信息在收集完毕后需要进行结构化梳理,在梳理过程中需要用到结构化算法。
1.舆情热词语料库
舆情研究少不了对热词的搜索,通过对热点的搜索,可以很快找到当下传播范围更广泛的热点新闻。舆情热词语料库就是为了更好地作用于舆情监测,提高与当下热点新闻的关联度。关注热点内容,收集热点新闻中的语料信息,并在此基础上建立舆情热词数据库,找到其中的热点词,之后再应用语言学的分析方法,设计热点词发现功能,以达到舆情监测的目标。
为了实现这个目标,首先要根据研究规模的大小采集相应数量的样本信息,然后运用构建语料库的相关工具对这些样本信息进行标注與结构化处理,之后对舆情新闻中的热词进行统计,并根据这些热词设置成数据库中的搜索关键词。需要注意的是,搜索关键词不一定是出现频率最高的词语,重点是找到舆情中最敏感、最核心的字眼,如同文学作品中的中心词。中心词是整条舆论信息中能够引爆热点的词语,是引导公众将舆论转化为实际的关键因素,也是产生最高关联度的重点因素,这样热词就能与其他词汇关联起来,从而构成信息网络。
分析舆情热词,最重要的是找到引导点和关联点。找出引爆点,就能根据关键词进行深入挖掘,进而挖掘到最核心的舆情内容,而根据关联点,能够找到相关联的词汇,使引爆点起到领导作用,让热词迅速传播开来,并对公众形成较大的影响力,进而促使公众将舆论推向实际。而关联词则负责搬运消息,它将各种相关词汇联系起来,形成一个范围较大的网络。通过引爆词和关联词,可以对舆情热词从两方面进行分析,一个是从舆情中间分析,另一个则是通过舆情向周围扩散。在此之后,就可以以中心度和关联度为参考,设置一个能够用公式计算出来的指标体系。由此,舆情监测系统就能随时发现热词的强度如何,并根据具体情况进行后续工作。
2.“意见领袖”修辞特征词语料库
当传统媒体没有及时进行报道或者是出现失语问题后,人们会习惯性地打开网络媒体平台,从网络“意见领袖”所发表的言论中寻找蛛丝马迹,意图从这些发言里寻找到一些相关的分析、解读或者观点。“意见领袖”发表的言论或观点一般都会受到大众的关注,并且很容易引起他人的共鸣,进而对舆论产生较大的影响。之所以会出现这种现象,主要是因为“意见领袖”的言论风格十分鲜明,在领域内具有一定权威性。因此,“意见领袖”所提出的观点、表现出来的态度中会出现一些关键词,通过提炼关键词、主题词,就能够总结出该“意见领袖”发表的文本数据的文学性特征,并以这些特征作为寻找具备号召力和动员性的关键词,为引导舆论提供参考。
3.传播学学术主题词语料库
传播学领域内的学术主题词语料库的建立,可以从微观层面入手。人们经常会忽略微小细致的事物,因为这些事物并不容易被发现,然而那些容易被忽略的微小事物通常能够引起很大的反响,因为微观的研究往往能够揭露深层的内涵。
因此,传播学主题词语料库可以从微观方面入手,将非结构化的文本数据转为结构化的文本数据,具体来说就是先确定方向,为结构化工作设立一个目标。以传播史方面的研究为例,可以将一个固定时间作为搜集史实资料的节点,然后将在此节点内搜集到的文本进行整合,并对不同分类进行标注,最后再提炼出与这个节点有关联的词语,构成语料库。
4.受众特征关键词语料库
微博中的广告能够针对不同用户进行准确投放,那么在语料库建设过程中,可以对受众群体的习惯、爱好等进行深度挖掘,这样就能够充分收集到用户的心理、行为习惯和社会关系,并对这些信息进行深入分析,从而准确把握受众的需求点。这种语料库分析主要是出于特征聚类的原理,在此基础上,就能够为有相似需求的受众推送满足其心理预期的相关消息,进而达到精准推送的效果。
第一,当前国内主要将语料库归于大数据技术之中,并作为一种文本分析工具,它主要用于提取文本内容中的关键词,并对词语出现的频率进行统计分析,但这些功能只停留在表层,对词语的词性、修辞、结构、内涵、情感、意象等方面都无法进行提取和分析。目前国内的新闻传播学研究中,还存在单方面对语料库进行研究的情况,所以还需要加深语料库的研究层次,如开发更多的语料库功能、创新应用方法等等。
第二,缺乏大规模且具有权威性的语料库。我国构建用于新闻传播研究的语料库比国外起步稍晚,并且收集样本的工作没有开展太久,在样本数量方面还比较匮乏。
研究当前的语料库方法之前,需要建立一个符合研究方向的语料库,并且还要以同类型的语料库作为参考对象,否则就会缺少可供对照的标准,那么最终的分析结果就会受到样本的影响。除此之外,在收集样本的过程中,可能会受到一些人为因素的影响,造成分析结果存在偏差,因此,自建语料库缺乏更客观、系统、完善的标准是目前语料库方法应用过程中一个急需解决的重要问题。
第三,应用于新闻传播研究中的语料库建设基础相对薄弱。新闻传播研究领域下的自建语料库,通常都会从一家或几家报纸报道中的内容进行抽样,虽然在取样数量上是符合自建语料库取样数量要求的,但是从取样内容来看,可能会受到新闻偏向性的影响,以及取样方立场、观念等方面的影响,缺乏客观性。如此一来,收集到的样本也会存在局限,无法从整体上客观分析文本数据,最终所产生的结果也是针对某一方面或某个阶段而言的,缺乏系统性。
(一)语料库方法下的文本分析研究
从目前来看,学者们对语料库方法下关于新闻标题的研究并不算多,从为数不多的文献中,本文选择《基于语料库的网络体育新闻标题研究》作为示例,并对其中的内容进行分析。
在这篇文献中,作者以网络上体育新闻作为研究对象,并从语言学角度对网络体育新闻的标题进行研究,为了让研究内容更加全面,作者还运用了文献归纳法和文献研究法对语料库进行了补充。通过语料库方法来研究传媒语言,相比于传统的分析方法,研究的范围更广泛,数量更充足,而且能够更快地检索到文本中的主题词,排序方式也更加准确,语料库方法与其他研究方法相互配合,得出的结果也就更加规范。因为利用语料库方法来研究传媒用语具有一定的挑战性,因此研究者需要具有更专业的能力和更丰富的专业知识,包括传播学、新闻学、语言学等等,才能为研究提供更准确的理论支持。
在《基于语料库的南京青奥会新闻报道框架研究》一文中,应用语料库方法将重点词汇整理起来,如高频词、关键词、中心词等,之后再运用新闻学知识,对文本内容进行梳理,使其更符合规范,最后建立起以中心词和出现频率最高的词汇为主的体系架构。这种以专业理论知识和数据为支撑的研究方法,相比于传统分析方法,更能够突出主题,并且对研究者的思维方式和学术眼光有着更高的要求[2]。
(二)语料库方法下的新闻传播中外对比研究
在有关中外对比下的语料库研究文献中,其中一篇关于中美丝绸之路对比的文献就运用了语料库方法。文献内容主要包括中美两方对丝绸之路提出后开展的报道,作者运用语料库方法对两国报道中出现的关键词以及发展趋势进行了归类研究,从报道中提取关键文本信息作为判断新闻态势的语料,进而找出具有针对性的传播方法。这项研究之所以更具创新性,主要在于通过语料库方法对数据进行量化,对具有传统倾向的媒体研究提供了新的方向和方法[3]。
在《太极拳在美国的传播:一项基于美国大众媒体语料库的研究》一文中,作者将国外媒体对中国相关事物的态度为研究参考范例,采用语料库方法进行具体研究。这篇文章主要依据传播学理论展开分析,之后对美国大众媒体对中国太极拳的相关报道内容展开深层剖析。使用语料库方法,能够从文本中快速、便捷地提取出相关信息,但是想要让被提取信息更具系统化,就要选取适合的语料库。在使用关键词分析方法时,需要注意的是要具备语料库语言学的专业知识和技能。
从不同语料库中检索出来的词语,它们的分类方法也有所差别,但是关键词分析法具有快速便捷的优点。这里所说的关键词,是指文本内容中重复出现次数较多的词语。关键词分析法的使用,对语料库语言学的研究起到了重要作用,因此这是许多学者和研究者常用的一种方法。
(三)语料库方法下的话语分析研究
《基于语料库的新闻报道的批评性话语分析——以性别问题为例》一文,属于语料库方法话语分析研究范围内的相关文献。在这篇文献中,作者将美国几个主流媒体对性别方面的探讨列为研究对象,并根据报道中有关性别内容的关键词建立起小型的语料库,通过批评分析法对报道内容展开研究。探讨更深层次的内容,并对媒体报道中关于性别问题的新闻传播方式进行了分析和总结。在众多文献中,不止一篇文章应用到了批评话语分析方法。批评性话语分析屬于定性分析的一种,主要研究对象是新闻报道中的内容,人们的态度、观念等主观因素是无法通过数据显示出来的,但是利用批评性话语分析方法能够将其中的关键词体现出来。定性分析方法具有一定的主观性,因此会对分析结果产生一定影响,尤其是带有感情色彩的文本内容。因此,要对文本内容进行更深入、客观的探讨,才能让分析结果更加准确。
(四)语料库方法下的新闻媒体语义语用研究
以语料库方法为根据的新闻媒体语义语用研究所包含的内容比较广泛,不仅包括主题词、中心词、关联词方面的研究,同时也对词语的词义和用法进行研究。关于此类研究,以《基于语料库的网络体育新闻缩略语研究》这篇文献为例。在这篇文献中,主要运用语料库方法对缩略语进行了探讨,并对网络体育新闻中出现的缩略语进行了分析,指出其特点、规律、表达形式等不同之处,新闻的写作用语可以此为模板。语料库的应用,为新闻的写作方法提供了全新的角度,今后新闻的写作方法也能够以一种新的形态出现在大众面前。除此以外,也有学者对此进行了研究和探讨,比如国内一篇关于利用语料库加强对城市文化传播与形象建构的相关报道。在这篇文章中,作者将定量与定性的结合作为研究对象,分别从报道的数量和话题两方面展开研究,对语料库分析出来的关键词进行解析。在对媒体报道内容进行深入研究后,与语料库的检索结果进行整合,总结出关于贵阳城市文化形象的相关内容。此外,语料库的应用从全新的角度为量化分析的研究方法提供了一个方向,如《大数据时代传播研究中语料库分析方法的价值》这篇文献,这篇文献用语料库方法对新闻传播研究中的价值进行了系统性描述,其中还细致描述了语料库方法在新闻实践领域与舆情研究领域中的应用,这对今后语料库方法在新闻传播研究中的发展应用起到了积极影响。
大数据时代,传统的分析方法已经无法跟上当下新闻传播研究的发展步伐,因此,语料库方法的应用和完善已经成为一种趋势。如今大数据背景下新闻传播研究发展已经有了新的发展方向,那就是语料库方法研究,而语料库也被新闻传播下的多个领域所应用,因此,这也是未来研究的趋势。然而从当前的情况来看,语料库方法的应用还存在一些问题亟待解决,因此还要继续深化语料库方法在新闻传播研究中的应用。
参考文献:
[1] 唐佳梅,卢重佑.语料库方法在中外新闻传播研究中的应用分析[J].新闻传播,2018(1):30-32.
[2] 熊文新.新闻报道主观性的语言学透视:一种结合语料库驱动和批评话语分析的方法[J].现代传播,2022,44(5):22-32.
[3] 唐佳梅,洪宇.语料库方法在新闻传播研究中的发展应用[J].新闻研究导刊,2017,8(23):9-10.
作者简介 蒋艳,硕士,副教授,研究方向:英语教学、英语语言学、翻译传播。