APP下载

学术期刊视角下国内外传媒领域研究现状分析与启示:数字驱动下的知识结构重塑

2022-03-30金茜茜陈虹枢黄晓兰

情报工程 2022年1期

金茜茜 陈虹枢 黄晓兰

1. 北京理工大学管理与经济学院 北京 100081;

2. 中国传媒大学经济与管理学院 北京 100024

引言

伴随信息通信技术的突破与革新,物联网、人工智能、虚拟现实等新兴技术不断带来应用场景变革。在技术冲击与国家政策引导的合力下,传统媒体在传播媒介、社会属性和实现方式上都持续向着新媒体转型,带来全新的智能媒体时代。“传媒”已经不再仅是简单的传播介质,更是一种知识储备与认知构建的平台,在潜移默化中改变着人们的思维模式与生活方式,影响着经济发展、政治治理和信息安全等关键议题[1]。传媒领域的理论研究同样面临着世界范围内各种思想文化交流、交融、交锋的新形势。正如习近平总书记提到的,“加快建设社会主义文化强国、增强文化软实力、提高我国在国际上的话语权,迫切需要哲学社会科学更好发挥作用”[2],更要尊重信息传播规律,拓展相关研究,创新方法手段。新冠疫情等突发性公关危机事件更加凸显传媒研究在风险传播、健康传播、科学传播等方面的效能,以及对于保障民众生活水平,维持社会平稳发展等方面的重要意义。

近年来,围绕“传媒”展开的分析与研究不断涌现,以探索该领域的发展脉络与前沿热点为核心,内容涵盖新媒体的发展趋势、社交媒体、传媒经济学、网络舆情等主题[3-7],传媒期刊的国际多样性[8]、传媒领域研究主题的演化趋势[9]等话题也受到学者们的广泛关注。研究方法上,已有研究多以文献计量为主要视角及方法基础[10],对各个时期的相关研究内容进行了较为系统的梳理,并揭示出传媒领域研究在不同时期所表现出的特点与所取得的进展。但随着学科体系结构日趋复杂,单纯从文献计量学视角难以深入挖掘文本内容中的语义信息,从宏观、浅层的统计研究过渡到具体、深入的知识发现是大数据背景下文献计量学揭示学科知识结构的研究趋势。面向基于文本内容的知识发现,以关键词为基础的方法对于技术概念的表达最为细致,但往往需要进行多层、大量、有监督的筛选,筛选原则及聚类的粒度直接影响技术主题的生成[11];以隐含狄利克雷分布(Latent Dirichlet Allocation, LDA)为代表算法的主题模型,由于能够深入挖掘大量文本中的隐含语义,近年来受到科技文本挖掘、技术预测、技术管理领域学者的广泛关注,但已有研究尚未对如何合理预设主题数目达成普遍共识[12],且其本质上是从词与文档的共现进行语义分析,对文本集的元数据,即文献计量信息,无法进行有效利用[13]。

面向以上研究问题,以新时期传媒领域研究现状作为研究对象,本文充分结合文献计量方法与主题模型,通过对文档内容和元数据进行联合建模,在定量总结领域内隐含知识结构的基础上深入剖析各个国家的研究热点,同时构建国家-主题分布矩阵,较为全面地揭示了近年来国际传媒研究的国际贡献格局与国家合作模式。本文最终回归国内传媒领域知识结构的研究,并在前文分析的基础上就以下问题展开讨论:我国学者在研究主题选择上有哪些偏好?与传媒研究的主要国家相比有何异同?现有学科体系是否存在调整与完善的空间?

本文的主要贡献可以归纳为三个方面:(1)基于文献计量学理论分析国际传媒研究的地理分布与合作特征,全面洞察传媒研究的国际贡献模式,以期为后续研究提供启示意义。(2)基于文本挖掘技术探索国际传媒研究的知识结构,充分讨论当前传媒领域的研究主题与热点,旨在以相关结论为科研人员及政策制定者提供参考借鉴。(3)结合文献计量与概率主题模型,提出一种基于文档与元数据的联合建模方法,在比较国内外研究热点的基础上明晰我国当前研究的优势与短板,为我国传媒领域的持续深入发展添砖加瓦。

1 数据来源与研究方法

1.1 数据来源

本文以Web of Science (WoS)中研究领域为“Communication”且Journal Citation Reports(JCR)排名在Q1区的22份期刊为数据来源[14],检索2015—2019年文献类型为“Article”且语言类型为“English”的所有文章,筛除信息缺失的记录后得到有效数据5307条。表1给出了22份期刊的全称及其影响影子,同时标明了每份期刊包含的数据量。整个数据集涵盖的字段包括但不限于论文标题、关键词、摘要、作者姓名、作者所属机构及地区、文章发表年份等信息。

1.2 研究方法

本文结合文献计量与概率主题模型,通过对文档内容和元数据联合建模,构建国家-主题分布矩阵,对目标文本集的地理分布特征与隐含知识结构进行定量表达与总结。具体的方法模块包括数据预处理、参数设置与主题抽取、国家-主题分布矩阵构建以及主题分析。

1.2.1 数据预处理

在数据预处理阶段,本文提取元数据中的文献隶属国家信息,统计各个国家在目标领域的发文数量并绘制合著网络图,以便直观地展现文献的地理分布特征。对于文献标题及摘要整合而成的文本集,本文按照表2所示步骤对其进行系统的数据清洗,以确保语料库中只留下有助于表征各个研究主题的单词或词组,为后续准确地在大量数据中提取主题信息奠定基础。

表2 数据清洗步骤

1.2.2 参数设置与主题抽取

为明晰领域知识结构并洞察研究热点,本文对语料库中的主题分布特征进行研究。本文基于隐含狄利克雷分布模型(Latent Dirichlet Allocation, LDA)从预先清洗的文本集中抽取主题分布,以此表示目标领域的知识结构,切实赋予“主题”语义属性[12]。作为一种生成概率模型,LDA首先从狄利克雷分布中取样生成文档d的主题分布,再从主题的多项式分布中取样生成文档d第n个词的主题zd,n;之后从狄利克雷分布中取样生成主题zd,n对应的词语分布再从词的多项式分布中取样生成最终词语wd,n。生成文档的过程如公式(1)所示,式中α和β为模型的超参数,分别决定文档基于潜在语义的差异及共现词的数量[15,16]。

基于LDA的主题发现方法在进行模型训练之前需要设定预期生成的主题数目,由于很难预先透彻理解文本集,如何合理设置主题数目一直是文本挖掘领域内基础研究的重点和难点。为了确保所获取主题的整体可靠性,本文采取计算困惑度值(perplexity)的方法来确定主题数目[16],具体计算如公式(2)所示,其中D表示语料库中的测试集,其文档数量记为M,Nd代表每篇文档d中的单词数量,p(wd)则为文档中某个特定词语wd产生的概率。困惑度值越低则模型效果越好,但通常会导致主题数目过大,不利于后续的人工解析,为此,最终的主题数目设定需要在模型效果以及主题解析的难易程度之间进行平衡。

LDA以词分布的形式来表达主题结构,以主题分布的形式来反映文本结构。其中前者展示了不同词语对主题生成的贡献程度,后者可以反映目标领域研究主题的分布情况。根据文献-主题分布矩阵,文献di由i个主题基于一定概率pij生成,其中pij的取值范围为0到1,具体可记为公式(3)。本文对各主题的文献分布概率进行累加,并进一步计算其在语料库中所占的比重,以此表征主题在领域内的研究热度。

1.2.3 国家-主题分布矩阵构建

为了进一步发掘世界范围内各国在思想文化交流、交融、交锋中的研究热点,本文对文档内容和元数据中的地理信息进行联合建模,挖掘目标领域研究主题在国家层面的特征。根据元数据的文献计量信息,每篇文献同时隶属于一个或多个国家,结合文献的主题分布数据,本文构建国家-主题分布矩阵,计算国家m在不同研究主题上的参与情况cm,具体计算方法如公式(4)所示。图1给出了计算国家-主题分布矩阵的示意图,通过融合文档内容与元数据中的地理信息,可以更加全面地利用文本的多维属性,明晰国家与研究主题的关联模式,为国际视角下目标领域的知识结构研究奠定基础[17]。

图1 各国研究主题分布计算过程

2 研究结果

2.1 国际传媒研究的地理分布与合作模式

发文数量可以在一定程度上衡量不同国家科研产出的效率,反映该国在传媒领域的活跃程度与国际影响力,国家间的合著论文数量则进一步表征了传媒研究的国际合作特征[18]。为了直观地展现全球范围内各个国家在传媒领域的产出情况与合作模式,本文抽取发文数量大于50篇的20个国家并利用VOSviewer[19]绘制国家合著网络图。如图2所示,图中节点大小体现国家的发文数量,边的权重代表国家间的合著频次,节点下方标注的数字分别代表该国的发文总量与合著论文数量。从全球范围内来看,各个国家在传媒领域发文数量分布不均衡的特点较为突出,美国是唯一发表论文超过2500篇的国家,同时是国际合作的引领者,与韩国、英国、德国、荷兰、新加坡、中国、加拿大等十多个国家合著论文共523篇。英国、荷兰、德国、澳大利亚等也是论文的高产国家,其中荷兰与比利时、德国与瑞士之间存在较强的合作关系。中国(特指中国大陆地区,不含中国台湾)近五年内发表论文146篇,在全球范围内排名第十,除了与美国有较为密切的合作外,中国与新加坡、澳大利亚、韩国、德国、英国等国家也存在少量合著论文。

图2 传媒领域国际合著网络图

为了进一步分析不同国家参与传媒研究的程度与相应贡献,本文继续对高产机构与作者的地理分布情况进行统计,从5307篇论文所涉及的1979个机构中筛选出发文数量大于60篇的16个机构,同时在表3中关联其所在国家。就机构发文数量而言,依旧是美国目前在世界范围内占据领先地位,包括俄亥俄州立大学、密歇根州立大学等在内的半数以上高产机构均来自美国。荷兰、新加坡等国家也培育了传媒领域的领先学术机构,其中荷兰的阿姆斯特丹大学、新加坡的南洋理工大学,加之美国的德克萨斯大学奥斯汀分校,其传播学及媒体研究专业在最新的QS (QS World University Rankings)专业排名中均位于全球前十,在全球传媒研究中发挥着巨大影响力。

表3 传媒领域高产机构及其所属国家

本文进一步统计了12688位作者中近5年内发表文献大于10篇的17位高产作者,如表4所示,发文数量位居伯仲的作者分别来自奥地利与新加坡,美国籍及荷兰籍作者占比最高,17位中美国占据7位,荷兰占据5位。通过分析高产机构与作者的地理分布可以得出一个共同的结论,即美国、英国、荷兰等国家的学术界更加关注传媒领域的相关研究,且具有较高的权威性。对比来看,我国传媒领域的研究人员在国际范围内的知识交流并不频繁,更倾向于在中文期刊上发表相关研究[20]。与计算机科学、生命科学等存在密切合作关系的学科领域有所不同[21],多数作者及机构的合著频率较低且合作范围较小,传媒领域的高产作者更倾向于相对独立的研究模式,多数合作行为均在同一科研机构内部产生,并未形成成熟的作者或机构学术共同体。

表4 传媒领域高产作者及其所属国家

2.2 国际传媒研究的整体知识结构

某一学科领域的知识结构在一定程度上集中反映了当前的社会需求与时代特征,通过对该领域的研究主题与热点进行剖析,科研人员能够洞察现存理论及应用层面的问题,从而寻找后续研究的发展方向[22]。与此同时,相关结论也有助于政策制定者提高决策效率,进而推动学科发展。本文利用基于LDA的主题发现方法对5307篇论文的研究主题进行挖掘,图3基于文档-主题分布矩阵绘制了每个主题在语料库中的贡献量占比,直观地展示了传媒领域高质量国际期刊的研究热点。为了更加客观、全面地对主题内容进行解析,表5给出了每个主题中出现概率最大的5个特征词。

图3 传媒领域研究主题分布

如传媒研究的主题分布(图3)以及主题的特征词分布(表5)所示,新闻(T28、T08、T22、T19)、政治传播(T27)、社交媒体(T11、T03)、广告(T01)、科学传播(T25)等主题为近年来国际范围内传媒领域的研究热点,同时,数字技术(T18)在塑造社会结构与学术研究的过程中发挥着越发重要的作用。

表5 传媒领域研究主题及特征词

新闻分析(T28)是传媒领域的核心研究问题之一[23],根据其特征词构成可以看出,该主题主要侧重于对新闻报道的内容与形式进行分析。另一方面,“数字化”这一概念使得数据新闻(T08)方兴未艾,在文本内容中占据相当大的比重。政治传播(T27)可以理解为从社会学、心理学、经济学等多种角度来阐明传播在塑造政治行为方面的作用[24],相关理论已被广泛用于民意调查(T10)、社会参与(T23)、电子政务等。作为传媒领域的一大研究热点,社交媒体(T11)为广告营销(T01)、公众行为及舆情传播方式转变带来了深远影响[25],目前已有大量研究围绕Twitter、Facebook两大社交平台展开,以期明晰媒介在社交中的作用、受众在使用社交网站时的行为等。此外,从图中可以观察到,科学传播(T25)相关研究也不断涌现,旨在挖掘媒介在教育、知识分享与科技创新方面发挥的巨大作用,以实现提升公民科学素养,增强科学家间知识传播效率的目标。

由此可见,在数字化时代背景下,移动通信与互联网技术交互发展,数字技术在潜移默化中推动了传媒领域的深刻变革,不断助力传统新闻业找寻颠覆式创新的突破口、改变政治传播与科学传播的方式与途径、影响用户在网络中的社交习惯与行为特征。

根据图3与表5还可以看出,部分主题的研究热度相对靠后,但可能隐含着巨大的研究空间与价值。例如,隐私披露(T29)、集体行动(T07)等主题过去五年在传媒研究中受到的关注较少,但随着数字化进程不断推进,社交平台中的用户行动具有低成本、低风险等新特征[26],用户生成内容呈指数级增长,上述主题均需受到进一步关注。

为了进一步验证本文得出的传媒领域研究现状与整体知识结构,本文利用VOSviewer构建该领域关键词共现网络图,如图4a及图4b所示。图4b揭示了2015-2019年国际期刊论文的关键词共现关系,可以看出,本文以LDA为基础的主题提取结果能够较为充分地反映出图中呈现的主要内容,且在保留语义信息的前提下对主题进行了更为细致的刻画,提升了主题解读的科学性与准确性。此外,对比2015年前后期刊论文关键词共现关系的变化特征(图4a、4b),可以发现学术界对气候变化、政治传播的关注度有所提升;Facebook、Twitter、社交媒体均成为高频关键词,与互联网、公众参与等词连接紧密。这与前文对科学传播(T25)、社交媒体(T11、T03)等主题的解读较为一致,进一步佐证了LDA的主题分析结论。

图4 传媒领域国际期刊论文关键词共现网络图

2.3 国际传媒研究的国家-主题分布

我国近五年来在WoS平台中所能检索到的传媒领域Q1区期刊论文共146篇,在全球范围内排名第10,且具有高影响力的学术机构和作者尚不突出,存在较大的进步空间。在此基础上,本文进一步对文档内容和元数据中的地理信息进行联合建模,旨在探究传媒领域研究主题在国家层面的特征,挖掘世界范围内各国在思想文化交流、交融、交锋中的研究热点,明晰并重点探讨我国传媒研究在国际视角下的优势与短板。

基于前文对传媒领域国际贡献格局的分析,此处选取中国、美国、英国、荷兰、澳大利亚、德国等发文数量位居世界前列的国家,计算国家-主题分布矩阵并对结果进行可视化。如图5所示,纵轴的30个主题按其在整个数据集中的研究热度降序排列,横轴依次为6个国家,图中矩形的深浅与长度均体现某一主题在对应国家的研究比重。

从图5中可以看到,各个国家普遍关注的研究主题包括“数字技术”、“社交媒体”、“政治传播”等。近年来,我国以及澳大利亚、英国、美国等诸多国家均高度重视数字技术的基础与应用研究,以期紧抓数字技术为国家经济、社会发展带来的机遇。习近平总书记就曾在党的十九大报告中首次纳入“数字经济”这一关键词[27],英国政府也曾提出数字战略(UK Digital Strategy),致力于提升国家在数字时代的整体竞争力。

图5 我国与海外各主要国家的传媒研究研究主题分布

数字化背景下社交媒体相关研究不断涌现。我国学者围绕社交媒体的传播特征、广告营销等话题展开了大量研究,国外研究人员则更多地关注社交媒体涉及的科学传播、隐私问题,以及社交媒体对少年、儿童的影响等,这在已有关于中外社交媒体研究热点分析的相关文章中也得到体现[25]。此外,数字技术变革下的新型传播模式对政治生态产生了巨大影响,如图5所示,我国和海外各主要国家均非常关注“政治传播”相关内容,究其原因,新媒体在国外政治大选中发挥着举足轻重的作用,我国中宣部也曾推出“学习强国”平台,将政治理论与红色文化转化为广大民众喜闻乐见的形式,缔造出政治传播实践的一大突破。

本文进一步挖掘并总结我国学者在研究主题选择上的特征。通过纵向比较国内不同主题的重要性程度,横向对比国内外研究主题的分布情况,本文归纳总结并讨论了从国际学术期刊视角来看,我国与传媒研究主要国家的研究偏好差异。

(1)我国在传媒领域的相关研究对“广告”、“风险传播”等主题的关注度与其他国家相比较高。我国广告研究目前已形成较为完整的研究体系,在广告形态、媒介、规制等方面取得了丰富的研究成果[28],图5充分反映出了我国在此研究主题上的研究积累和较为强烈的关注度。但国内广告研究在理论与应用层面均未能实现对欧美国家的超越,也尚未形成具有影响力的作者或机构学术共同体[29]。因此,未来研究应借鉴国际广告学研究中的经典理论,重视产学融合与跨学科研究,促使基础研究与应用研究共同发展。此外,相较其他国家而言,我国对风险传播这一主题的关注度较高,由于各个国家的风险传播效率会因国家体制、文化背景等不同而产生差异,特别是新冠疫情等突发性公共危机事件使学术界更加清晰地意识到,新时期应进一步提升我国在特地社会语境下的风险传播效能。

(2)我国科研人员对新闻分析、数字技术的关注度均较高,但数据新闻的研究成果却相对较少。图5反映出我国的数据新闻研究在国际范围内尚未处于强势地位,作为一门典型的新兴交叉学科,国外数据新闻研究的起步时间更早同时发展速度更快,我国在该领域的研究具有一定的滞后性与趋同性,尤其在理论研究层面仍有待提高[30]。习近平总书记曾指出,我国新兴学科与交叉学科的建设较为薄弱[31]。科研人员与政策制定者应共同努力,补齐短板,进一步完善我国传媒研究的学科体系。

(3)根据图5可以看出,科学传播是澳大利亚、英国、德国等国家共同关注的主题之一,我国的研究成果尚不及海外各主要国家。随着科学在经济、社会生活与文化事业中的渗透不断加深,科学传播搭建起科学专业化与公众需求之间的桥梁,日益彰显其在广泛国际科技竞争中的重要意义[32]。我国应积极打造具有中国特色的科学传播理论体系,促使科学传播坚守科普导向,满足我国的社会发展需求。

3 结论

本文结合文献计量方法与科技文本挖掘技术,对文档内容和元数据联合建模,较为全面地展示了过去五年国际传媒研究的地理分布特征与知识结构,以此为基础对我国的研究主题进行剖析。本文的主要研究结论如下:

(1)国际期刊视角下,传媒领域的文章发表呈现较为明显的不均衡分布。我国大陆地区的发文量排在第十位,这一方面可能是因为大多数传媒相关的领先期刊均源自发达国家,甚至在期刊编委会的成员选定上也存在一定倾向性;另一方面,国内研究人员更加倾向于在中文期刊上发表文章,国际性的知识交流并不频繁[20]。从国际视角来看,各个国家需共同促成一个平衡的全球贡献模式,使传媒成为一个国际性的研究领域。对我国而言,积极建立具有国际影响力的传媒期刊,在一定程度上有助于促进该领域的学术进步,提升我国在领域内的竞争力。

(2)传媒领域的高产作者与机构更倾向于相对独立的研究模式,并未形成稳定的作者或机构学术共同体。但传统的科研范式在数字化浪潮的冲击下不断改变与革新,传媒研究在一定程度上正经历着“科学化”的过程,定量分析与实验分析的思想正逐步得到强化[33]。未来研究是否需要拓展合作思路,这一问题有待研究人员的进一步思考与实践。

(3)数字技术对传媒领域产生了深远的影响,大数据、物联网、人工智能、虚拟现实等技术的普及加速推动了媒介形态的变迁,新媒体的蓬勃发展不断刺激传媒领域的产业升级与文化重塑。媒体转型与媒介融合使数据新闻、社交媒体等新兴跨学科主题成为焦点,为广告、政治传播、科学传播、风险传播等话题注入新鲜血液,同时引发学术界对隐私披露等问题的思考。科研人员应在重视技术研究的同时,回归传媒研究最根本的问题,由表及里探索数字化对传媒带来的机遇与挑战。

(4)我国在传媒领域的研究热点与我国的国家政策、社会形态、科研范式、学科发展源流等产生呼应。相比传媒研究的领先国家,我国在部分研究主题上具有理论基础不够扎实、产学交流不够密切、学科融合不够深入等短板。唯有充分了解目标领域内部的知识结构,汲取并丰实国际传媒研究的经典理论,学习并应用技术革新所带来的前沿方法,重视并促成学科交叉、产学交流与国际合作,才能开展符合我国社会语境的传媒研究,为促进我国传媒领域的学术发展与学科体系完善铺路架桥。

综上所述,本文较为客观地对国际传媒领域的地理分布与知识结构进行了分析,最终落脚于对我国传媒领域研究现状的探讨。但当前研究仍存在一定局限性,本文在进行数据选取时仅囊括了WoS的期刊文献,后续研究还需进一步纳入国内文献检索平台的数据,以期更好地对比国内与国际在传媒研究中的关注重点。此外,领域内主题并非孤立,而是相互联系的,本文后续研究将进一步考虑主题之间的语义关联,并从网络视角探究研究热点的迁移与变化。