计算传播研究的起源、演进与展望
——基于SSCI数据库的知识图谱分析(2006—2020)
2022-05-01佘世红杨锦玲
佘世红 杨锦玲
一、选题背景与研究问题
随着大数据、人工智能技术的蓬勃发展以及各式各样数字媒体的广泛普及,计算传播学作为一种新兴的、跨学科的研究取向得以快速崛起,并日益成为传播学研究领域的一个焦点话题。
目前,国内学界已经就计算传播和计算传播学的概念内涵做出了简要的界定和初步的探讨,其中为较多学者所参照的概念定义是“计算传播是指数据驱动的、借助于可计算方法所进行的传播过程,而分析计算传播现象的研究领域就是计算传播学”[1]。从广义上看,一些学者指出计算传播学实际是计算社会科学的重要分支,它通过传播网络分析、传播文本挖掘、数据科学等分析工具,采用一种非介入的方式对人类传播行为数据进行大规模收集和分析,并试图挖掘人类传播行为背后的模式和法则,探究其背后的生成机制与基本原理[2]。也有学者进一步指出计算传播学实则是计算社会科学在新闻传播研究中的应用,它并不是一门新的学科或新的理论,而是一种新的研究取向或新的研究方法,并将其定义为“通过收集和分析网上行为数据,描述、解释和预测人类传播行为及其背后驱动机制的一系列计算方法”[3]。
当前,在移动互联网和社会化媒体中所涌现的大量数字化痕迹将会为新闻传播研究带来丰富的数据,进而推动研究方法的创新和导致研究范式的转移,故将计算社会科学引入新闻传播学,立足于人类传播行为的可计算性来进行计算传播学的分析,能够更好地发挥数据的价值优势、对大数据的处理优势、自下而上的归纳优势以及非介入性的方法优势[4]。随着计算能力日益成为传播学研究所必备的核心能力,计算传播学所要弥补的是传统传播学研究在量化方法上的缺陷,并且力图在智能传播时代实现用户、场景和内容最优化的精准匹配[5]。对此,有学者提出了立足于学科发展的长远角度,计算传播学不仅促成了新闻传播学与计算和信息技术的创新融合,而且有助于实现传播学从“计量”到“计算”的范式转型。在此过程中,研究人员也应当重点关注计算传播学研究当中的理论意识、方法意识、数据意识、问题意识和伦理意识,并逐步建立起计算传播学研究的科学意识和价值规范,进而更好地推动传播学范式的转型革新与有序发展[6]。
综上所述,笔者认为尽管计算传播学在国内研究的价值意义日益凸显,但是目前还没有关于计算传播学国际研究现状的实证研究,对于计算传播学的发文数量与变化趋势、研究主力与分布情况、研究热点与前沿问题、经典文献与代表作者等方面的焦点内容,都还没有形成清晰的认识。近年来,在科学计量学、数据和信息可视化背景下快速发展的科学知识图谱,日益发展成为当前研究人员考察某个学科或领域的发展进程与结构关系的一种重要手段[7]。作为一种新兴的研究方法,科学知识图谱通过对海量的数据挖掘、信息处理、知识计量和图形绘制等方式,一方面能够对科学知识的结构、规律和分布情况进行可视化的图像呈现,另一方面也能够更为便捷高效地对特定学科领域的历史脉络、发展动态和前沿热点等进行科学绘制、全景勾勒和重点凸显。基于此,笔者试图采用科学知识图谱的方法,具体就计算传播学研究的已有文献展开一些相关的探索实践,并主要致力于回答下列的三个研究问题:
研究问题1:计算传播学研究总体的发文数量及其变化趋势如何,存在什么特点?
研究问题2:计算传播学研究的主要力量是如何分布的,即对计算传播学研究做出较为重要贡献的学科、期刊、机构、国家具体有哪些?华人传播学者在国际计算传播学研究领域的贡献如何?
研究问题3:计算传播学研究的经典文献及其代表作者是哪些,其主要探讨的研究方向或研究议题是什么?
二、数据来源与参数设置
(一)数据来源
本研究以学术文献索引数据库Web of Science下属的社会科学引文索引(SSCI)为数据源,它作为世界上最权威的引文索引数据库之一,不仅收录了社会科学领域中具有权威性和影响力的学术期刊,而且其文献所覆盖的时间范围和可追溯的内容跨度均很好地满足本研究的需要。
由于“计算传播学”是近些年兴起的具有强烈跨学科特点的研究领域,一方面我们希望获取“计算传播学”跨学科的相关学术资源;另一方面,我们也希望精准地获取西方传播学领域内关于“计算传播”的研究情况。因而,本次数据获取采用了两种方法。第一种方法是:我们在国际SSCI数据库中对“TS(主题)=computational communication(计算传播)OR TS=computational communication research(计算传播学)OR TS=computational communication science(计算传播科学)”,选择的时间跨度为2006—2020年(1)目前华南理工大学图书馆提供的SSCI数据库的时间是从2006年开始。,并通过限制语种为“English”和文献类型为“Article”进行精确检索。此次数据检索的时间为2021年1月1日,共得到文献题录数据876条。基于此,将上述目标文献题录数据导入CiteSpace软件进行数据预处理,在去除重复文献之后所最终确定了873篇有效研究文献,随后通过引文分析共获得47442篇有效引用文献,本研究借助CiteSpace 5.7.R3工具对SSCI数据库中有关计算传播学研究的文献进行科学知识图谱的可视化分析。为了获取更精准的文献,第二种搜索方法用“标题”取代“主题”,本次数据主要对SSCI数据库中“Communication”期刊领域内“标题=computational communication”,选择的时间跨度为2006—2020年,并通过限制语种为“English”和文献类型为“Article”进行精确检索。获得“计算传播”SSCI期刊的英文论文数量分别是41篇,并从主题、作者及作者单位、发表期刊对此41篇文章进行编码。
(二)参数设置
通过CiteSpace软件生成可视化图谱并展开系统性和科学性分析之前,根据研究需要先对各个功能区的参数值进行相应的设置:先是在Projects功能和参数区建立项目和导入文献;随后在Time Slicing功能和参数区设置起始年份和终止年份,并设置每1年为一个时间分区;接着在Term Source区域选取标题(Title)、摘要(Abstract)、作者关键词(Author Keyword)以及增补关键词(Keyword Plus),在Term Type区域选择Burst Terms(突现词)进行突发性探测;而后关于网络的类型(Node Types)、节点阈值的选择(Select Criteria)、网络的裁剪(Pruning)等功能,则按照不同图谱的实际情况进行选择和调整;其余未提及的参数阈值不做更改,保持默认值状态。
三、数据处理与分析
(一)发文数量与变化趋势
按照上述检索得到的873篇计算传播学研究的相关文献为对象,数据显示文献发表的时间跨度为2006—2020年,具体文献的年份发布情况如图1所示。总体来看,计算传播学研究总体的发文规模呈现出稳步上升的发展阶段,其中关键的转折点发生在2009年计算社会科学的提出和2013年大数据的兴起,为计算传播学的发展奠定了重要的基础和注入了全新的动力。而自2014年起,国际计算传播学发表的文献逐年增长,这表明计算传播学作为一种新兴的研究取向得到学界越来越多的关注和重视,有关计算传播和计算传播学的探讨和研究也顺势发展并渐趋丰富起来。
图1 SSCI数据库中计算传播学研究文献的年份分布情况
(二)研究主力与分布概况
1.跨学科性分析
科学领域共现分析能够有效地帮助研究者了解某一领域的研究文献在不同科学领域中的分布情况,即判断该领域的研究主要属于哪些具体的学科领域及其重要排序。将节点类型设置为“Category”,节点数据抽取标准设置为“Top50”,算法选择“Pathfinder”,运行CiteSpace软件进行学科领域共现分析,结果如图2所示。从图中可以看出,计算机科学(Computer Science)节点最大,即该学科类别的研究文献出现频次最多,具体涵盖了信息系统、人工智能、跨学科应用等方面的内容。此外,还涉及心理学(Psychology)和实验心理学(Experimental Psychology)、传播学(Communication)、商业与经济(Business & Economics)、工程学(Engineering)、管理学(Management)等,由此不难发现当前的计算传播学研究具有显著的跨学科融合特质和多学科交叉属性。
图2 计算传播学研究学科领域共现图谱
2.核心期刊分布
期刊共被引能够反映某一领域中重要的知识来源的具体分布情况,因而对核心期刊进行共被引分析能够帮助研究人员便捷高效地确定该领域的研究都引用了哪些期刊以及这些期刊所属的学科知识领域之间的关联。将节点类型设置为“Cited Journal”,节点数据抽取标准设置为“Top50”,算法选择“Pathfinder”,运行CiteSpace软件进行期刊共被引分析,结果如图3所示。
图3 计算传播学研究期刊共被引图谱
表1 国际计算传播学研究主题共被引的Top10的核心期刊
关于核心期刊的相关信息如表1所示,按共被引频次(Freq)从高到低进行排序,前十位的核心期刊分别是《科学》《美国科学学院学报》《公共科学图书馆综合》《自然》《计算机科学讲义》《认知科学趋势》《心理学评论》《认知》《认知科学》《人格与社会心理学杂志》《心理科学》。可以看出,当前发表计算传播学研究文献的核心期刊所涉及的学科领域较为广泛和相对多元,具体涵盖了计算机科学、认知科学、心理学、社会学、传播学等研究领域,这也与先前进行的跨学科性分析的结果相契合。
进一步精确到传播学(Communication)学科类别的核心期刊而言,本研究对共被引频次大于30的核心期刊进行了具体排序:首先是《传播学报》,共被引频次为61次;其次是《新媒体与社会》,共被引频次为44次;接着是《信息传播与社会》,共被引频次为36次;最后是《政治传播》,共被引频次为31次。
另外,对2006—2020年“标题=计算传播”加以检索SSCI传播学期刊发表情况如下:美国南加州大学主办的《国际传播学刊》发表了8篇:2016年发表了1篇,2019年专门发表了主题为“计算传播科学”(Computational Communication Science)专辑,通过数篇论文详细介绍了一些新近出现的计算方法及其研究成果,具体阐明了这些计算方法应用到传播学领域所可能面临的挑战与机遇、问题与对策,并简要勾画了今后计算传播学领域研究的趋势与方向。其次是《传播方法与策略》与《政治传播》各发表3篇,其他27篇SSCI论文分散于传播学27个期刊,包括《传播理论》《健康传播》《传播学报》《人类传播研究》等。不过,总体来说,传播学期刊对于计算传播学的研究尚处于起步期,发文数量和被引频次相较于其他学科期刊而言都不算多,当前研究的广度和深度皆有待后续的拓展和推进。
3.高产国家分布
对国家进行合作网络分析,能够帮助研究人员快速了解哪些国家发表该领域的论文数量较多或是贡献程度较大。将节点类型设置为“Country”,节点数据抽取标准设置为“Top50”,算法选择“Pathfinder”,运行CiteSpace软件进行国家/地区合作网络分析,结果如图4所示。
从图中可以看出,美国的节点最大,表明其发表论文的数量最多;其颜色变化从深到浅均有分布,表明其在2006—2020年期间均有文献发表;其处于网络图核心的位置,中介中心性为0.33,排在首位,且与英国、德国、意大利、荷兰、中国、加拿大、西班牙等多个国家都有紧密合作关系。自2015年起,中国也出现在该国家合作网络图谱当中,其节点的中介中心性为0.11,且与美国、英国、德国、法国等国也建立了良好的合作关系,由此表明中国在计算传播学研究领域也有一定程度的贡献和影响力。
总的来说,通过考察各国发文的研究情况可以发现:目前已有10个国家在计算传播学研究领域发表文献篇数超过30篇,其中包括美国392篇、英国87篇、德国70篇、意大利57篇、荷兰49篇、中国47篇、加拿大44篇、西班牙43篇、法国41篇和澳大利亚32篇。
图4 计算传播学研究高产国家分布图谱
4.重要机构分布
对机构进行合作网络分析,能够帮助研究人员快速了解哪些机构发表该领域的论文数量较多或是贡献程度较大。将节点类型设置为“Institution”,节点数据抽取标准设置为“Top50”,算法选择“Pathfinder”,运行CiteSpace软件进行机构合作网络分析,结果如图5所示。
按发文量从高到低进行排序,前十位的研究机构分别为伊利诺伊大学(University of Illinois)、宾夕法尼亚大学(University of Pennsylvania)、斯坦福大学(Stanford University)、亚利桑那州立大学(Arizona State University)、牛津大学(University of Oxford)、阿姆斯特丹自由大学(Vrije Universiteit Amsterdam)、威斯康星大学(University of Wisconsin)、麻省理工学院(Massachusetts Institute of Technology)、爱丁堡大学(Univ Edinburgh)和剑桥大学(University of Cambridge),具体的发文量情况如表2所示。
整体来看,排在前十位的研究机构皆为世界顶尖高校组织,彼此之间建立了良性的科研合作关系。此外,在上述提及的重要机构当中,有超过半数都分布在美国,由此看出美国对计算传播学领域的研究较为关注和重视。除了上述提及的美国、英国和荷兰等国的研究机构外,中国的香港城市大学、南京大学、中国科学院、清华大学、湖南大学、香港理工大学、香港浸会大学等机构组织也有学者从事计算传播学方面的研究。
图5 计算传播学研究重要机构分布图谱
表2 计算传播学研究发文量Top10的重要机构
(三)经典文献与作者分析
在CiteSpace中持续被高引用的文献通常可以被称作经典文献(Class Articles),其在科学知识图谱当中往往占据着重要的节点位置和扮演着关键的连接枢纽,并且在构建知识基础和推动学科发展等方面,发挥着相当重要的作用和产生着较为深远的影响。将节点类型设置为“Cited Reference”,节点数据抽取标准设置为“Top50”,算法选择“Pathfinder”,运行CiteSpace软件形成计算传播学研究文献共被引图谱,结果如图6和图7所示。另外,我们还对SSCI期刊中“标题=计算传播”的高被引的10个文献进行了文献、作者、内容等方面的分析。
图6 计算传播学研究文献共被引图谱
图7 计算传播学研究的代表学者与经典文献时区图(2006—2020)
第一篇是Palazzolo,Edward T与其合作者2006年发表在《传播理论》上的《传播与知识网络在“交互式记忆”系统中的协同进化:利用算法模型发展理论》,该论文的作者主要来自俄亥俄州立大学与伊利诺伊香槟分校。本文被引高达76次,其被引用的领域主要有:商业经济(Business Economics)、行为科学(Behavioral Science)、传播学(Communication)、心理学(Psychology)和计算机科学(Computer Science)。
第二篇是Woolley,Samuel C.,Howard,PN在2016年发表于《国际传播学期刊》上的《政治传播、计算宣传和自主的代理》,该文作者分别来自华盛顿大学与牛津大学。他们认为网络已经颠覆了我们对传播的认知,在数字传播时代,政治行动者会利用技术与算法来操控舆论,因此必须从更广泛的层面理解当下的政治传播与现代化的政治传播,必须调查算法与智能化中的政治操纵。该文被引55次,其被引用的领域主要有:传播学(Communication)、行为科学(Behavioral Science)、社会学(Sociology)和计算机科学(Computer Science)。
第三篇是Wouter Van Atteveldt和彭泰权(Tai-Quan Peng)在2018年发表于《传播方法与策略》上的文献,两位作者分别来自荷兰阿姆斯特丹自由大学与美国密歇根州立大学。该文主要探讨计算传播科学存在的机遇、挑战与局限。作者指出在数据、工具和处理能力三重合力的作用下,文本挖掘、网络分析、主题建模、大数据等计算方法在传播学研究当中的应用越来越普遍。与此同时,诸如议程设置、两级传播、选择性接触、人际说服等传播学理论也越来越广泛地被用作许多计算研究的重要理论基础。作为计算方法和传播学相结合的产物,计算传播学往往需要研究者主动学习新技能和持续开发新工具,积极应对并妥善处理好计算方法在技术、社会和道德等方面所可能面临的诸多挑战,由此才能保障计算传播学的良性运作和长远发展。被引用41次,其被引用的领域主要有:传播学(Communication)、行为科学(Behavioral Science)。
第四篇是宾夕法尼亚大学的Cappella,Joseph N在2019年发表于《人类传播研究》的《大众和人际传播研究的未来载体:大数据、社交媒体和计算社会科学》,文章指出网络分析、人际和社会影响建模、推荐系统等成为新的传播研究方向。更重要的是该文认为大数据、社交媒体与计算社会科学对大众传播和人际传播中的经典、实质性问题研究具有重要影响。该文被引34次,其被引用的领域主要有:传播学(Communication)、行为科学(Behavioral Science)、计算机科学(Computer Science)。
第五篇是Kerk F.Kee等人2013年发表在《传播学季刊》上的《社会团体、社交媒体和高维社会结构:用于计算传播研究的简单社会聚集模型》,文中提出以Facebook为案例,提出了一种计算方法,将紧密结合的群体和社会聚集建模为高维社会结构,以此来推进传播研究。此文被引用32次。
第六篇是康奈尔大学Margolin,Drew B在2019年发表于《传播方法与策略》上的,他指出尽管传播领域对计算研究方法的热情日益高涨,但使用计算方法的研究尚未融入主流传播研究。文章强调传播中计算研究的生态位——它在与使用该领域其他方法的研究人员的共生关系中可以发挥的特殊作用,促进整合。文章通过测试现有传播理论和产生新的传播理论思想方面的具体比较优势来阐述这一生态位。并且提出了四项建议,用于执行和评估计算传播研究,以促进实现这些目标。
第七、第八篇都是2019年发表在《国际传播学期刊》上的论文。第七篇论文指出计算工具成为传播学的新方法,不过观察法、实验法、理论法以及计算方法需要相互促进。本文有12个共同作者,分别来自加利福尼亚大学戴维斯分校、加利福尼亚大学伯克利分校,伊利诺伊州埃文斯顿西北大学、伊利诺伊大学乌尔巴纳分校、宾夕法尼亚大学、加利福尼亚大学洛杉矶分校、斯坦福大学、密歇根州立大学、得克萨斯州默塞德加利福尼亚大学默塞德分校、荷兰阿姆斯特丹弗里耶大学阿姆斯特丹分校、德国蒙斯特蒙斯特大学、香港城市大学。第八篇是Van Atteveldt,W发表的《走向开放的计算传播科学:可重用数据和代码的实用路线图》,该文明确指出计算传播科学(CCS)为加快传播研究的发现范围和速度提供了机会。作者认为,CCS将通过促进数据和代码的可重用性,从采用开放科学实践中获益。文章讨论与创建可重用数据和代码相关的目标和挑战。
第九篇是彭太权、祝建华等2019年发表在《亚洲传播学刊》上的《为亚太传播研究提供计算社会科学方面的介绍》。文章明确指出计算社会科学引起了研究范式的改变,尤其是在传播学领域。文章概述了传播研究中密切相关的主要计算方法,并展示了如何应用计算方法解决亚太社会的理论和实践问题。
第十篇是罗格斯大学传播学院Weber,Matthew S.2018年发表于《传播方法与策略》上的论文,主要探讨在计算传播研究中网络挖掘分析方法的运用问题。
(四)研究热点与主题分析
1.研究热点分析
对研究文献进行关键词共现分析,能够更好地帮助研究人员把握文章的主题思想和核心内容,同时也便于分析某一领域当前学者所共同关注的热点问题及其过往热点研究的演变。将节点类型设置为“Keyword”,主题词来源选择“Title”(标题)、“Abstract”(摘要)、“Descriptors”和“Identifiers”(关键词),节点数据抽取标准设置为“Top50”,算法选择“Pathfinder”,运行CiteSpace软件进行关键词共现分析,结果如图8和表3所示。
图8 计算传播学研究高频关键词共现图谱
表3 计算传播学研究Top10高频关键词
从上述图表可以看出,出现频次最高的关键词是communication(传播),这表明当前的计算传播学研究已然成为传播学领域的一个全新分支,被普遍应用于研究有关传播应用和行为实践,同时传播现象及其背后的问题也成为计算传播学所重点关注和核心探讨的研究对象。除此之外,高频关键词还包括了model(模型)、social media(社交媒体)、information(信息)、language(语言)、network(网络)、system(系统)、twitter(推特)、perception(感知)、big data(大数据),这表明计算传播学研究必然需要借助传播网络分析、传播文本挖掘、数据科学等可计算方法来加以推进,故优化系统感知和修正计算模型等自然成为计算传播学研究的热点问题。与此同时,伴随大数据时代的到来和社交媒体的普及,其所提供的海量用户数据和所追踪的使用行为痕迹皆能为计算传播学研究创造更为多元的可能和奠定更为坚实的基础,因而大数据和社交媒体也是当前计算传播学研究者关注的热点领域和重要课题。
2.研究主题分析
研究前沿指的是某一领域突然涌现或正在兴起的理论趋势和新主题,主要是基于突发性探测(Burst Detection)功能,从研究文献的标题、摘要、关键词和索引词位置进行突现词的提取。将节点类型设置为“Term”,主题词来源选择“Title”(标题)、“Abstract”(摘要)、“Descriptors”和“Identifiers”(关键词),词项选择“Noun Phrases”(名词性术语)和“Burst Terms”,节点数据抽取标准设置为“Top50”,算法选择“Pathfinder”,运行CiteSpace软件获取能够体现国际计算传播学研究前沿的突现词信息,结果如表4所示。由表可知,近年来国际计算传播学研究的突发节点逐渐增多,这表明该领域越来越活跃或是新兴的研究趋势相对较多。
表4 计算传播学研究的Top10突现词
对以上突现词进行简要梳理,大致可以归纳出有关计算传播学研究前沿的三条主要路径:其一是基于互联网(internet-based)、云计算(cloud-computing)的蓬勃发展和众多社交媒体的快速兴起,使得研究人员所能够获取到的媒体数据(media-data)更为海量、丰富和深入,尤其是促进了计算传播学对社交媒体数据(social-media-data)的主题研究;其二是得益于与计算机科学研究领域相关的计算语言学(computational-linguistic)、计算方法(computational-approaches)、计算模型(computational-model)、计算能力(computational-power)等方面的技术创新(technological-innovation)和迭代优化,为计算传播学领域研究的开展构建了更为强大的技术基础和提供了更为多元的选择自由,因而也是计算传播学需要持续探讨和深入研究的核心内容;其三是从计算社会科学发展而来的计算传播(computational-communication)作为传播学研究领域的一个重要分支,具体渗透到人们日常的经济、政治、社会、文化生活的方方面面。
四、研究结论与研究局限
(一)研究结论与讨论
本研究选择Web of Science下属的社会科学引文索引(SSCI)为数据源,借助CiteSpace软件对2006—2020年国际传播学研究进行了科学知识图谱可视化的绘制和分析,系统梳理了SSCI数据库中计算传播学研究的发文数量与变化趋势、学科分布、期刊分布、机构分布、国家分布、经典文献及其代表作者、研究热点与前沿趋势等多个方面的内容,归纳得出以下研究结论,并在此基础上展开讨论。
1.计算传播学研究总体呈现上升态势,不过学术研究滞后于产业发展与应用
(1)从发文数量与变化趋势的角度来看,计算传播学研究文献的发表量在总体上呈现出稳步上升的发展态势,图1的增长曲线图清晰的反映了计算传播学研究的上升趋势,从2006年13篇文献到2020年的157篇文献。
(2)从2006年到2020年,计算传播学主题研究文献数量并不是直线上升,从图1来看计算传播学主题文献研究发展存在重要的“节点”。第一个重要的“节点年份”是2006年,通过CiteSpace软件对文献题录数据分析,2006年有13篇计算传播主题相关文献,但经过进一步的精准检索,确定有4篇文章隶属于传播学领域,其中被引频次最多的是俄亥俄州立大学Palazzolo,ET等发表于《传播理论》上的论文,该文聚焦组织传播领域的交互记忆(Transactive Memory)理论,借助计算模型进行模拟实验并检验初始条件的影响作用,在一定程度上推动了传播理论的创新发展和知识进化[8]。从广义上来看,发表于2006年的这些研究文献可以被视作是计算传播学思想的早期萌芽。第二个重要“节点年份”是2009年,随着“计算社会科学”的正式诞生,促使计算传播学研究能够在计算社会科学概念框架下有序开展。于是,2010年计算传播学相关主题研究第一次出现一个小高峰。第三个重要“节点年份”是2013年。2013年是“大数据元年”,在大数据科学的驱动下,2015年之后,计算传播学相关主题研究文献数量达到之前近2倍。第四个重要“节点年份”是2019年,笔者认为2019年可以被认为是计算传播学研究的“分界线”,因为这一年SSCI传播学期刊才开始集中讨论计算传播科学的学科发展与方法论问题。
(3)2008年之前,大数据与计算机算法已经被广泛运用在广告产业与传媒产业;与此同时,计算机算法被应用在社会科学的多个领域。2008年,雅虎研究院资深研究员Andrei Broder首次提出了计算广告学的概念;接着2009年,“计算社会科学”被首次提出来。然而,直到2019年,国际传播学SSCI期刊才开始真正意义上讨论计算传播学的研究领域、研究方法、挑战与机遇等问题。毫无疑问,计算传播学是由大数据技术与计算机算法所推动,但理论研究严重滞后于产业发展。
2.计算传播学研究建立在“跨学科”基础上,其研究方向已经渗透到传播学主要领域
通过分析SSCI数据库中计算传播学研究文献的学科分布、期刊分布,发现计算传播学研究所涵盖的学科领域较为广泛和相当丰富,具有显著的跨学科性,而对其研究贡献较大的学科包括计算机科学、认知科学、心理学和社会学等。因而,笔者认为,“计算机科学”“人工智能”“计算社会科学”是计算传播学研究的重要理论基础(如图9)。在研究热点方面,此次通过对计算传播学研究文献的研究热点与主题分析,发现“传播”“社交媒体”“大数据”等已然成为计算传播学领域的高频词汇和研究热点。伴随互联网和现代技术日益向人们日常社会生活和国际重大政治事件渗透和影响,越来越多的学者开始使用网络大数据来探讨社会热点问题和分析政治传播现象,因而“计算政治传播”成为计算传播学的一个重要研究方向。[18]与此同时,数据新闻已经成为媒介产业的一个重要组成部分,传播学者对数据新闻的研究延伸出“计算新闻”的研究方向。另外,计算机科学与算法在广告产业应用最为成熟,程序化广告与实时竞价广告交易都是算法在广告产业中的应用,“计算广告”自2008年之后成为计算传播学的一个重要研究方向。此外,智能算法与大数据技术已经被广泛应用在健康传播领域,“计算健康传播”也成为计算传播学的一个重要研究领域。图9是笔者绘制的“计算传播学”的理论基础与研究方向。当然,计算传播学的研究问题远远超于图中所绘制的几个方向,我们认为数据驱动的计算传播学并不能仅仅囿于数据层面,应该通过数据挖掘来发现人类传播行为模式和透视其背后的关系网络和社会机制,从而使得计算传播学研究更具科学意识和价值意义,并逐步走向成熟。
图9 计算传播学的研究基础与研究方向
3.计算传播学研究处于起步阶段,华人传播学者在计算传播学研究中扮演重要角色
(1)通过解读SSCI数据库中计算传播学研究文献的机构分布、国家分布、经典文献及其代表学者,发现当前发表计算传播学研究文献的重要机构均为世界顶尖高校,且大多分布在美国。不过,SSCI数据库中计算传播的主题文献研究主要来自跨学科的学者。笔者对SSCI传播期刊中“标题=计算传播”的文献分析发现:传播学者对计算传播的研究还处于起步阶段,传播学界开始尝试将计算传播学作为传播学研究的一个重要方向。
(2)通过对SSCI传播期刊中“标题=计算传播”的文献分析发现,华人传播学者在计算传播学研究中扮演重要角色。在传播学SSCI期刊中“标题=计算传播”的Top10被引文献中有3篇论文有华人参与写作。其中彭泰权参与写作的2篇论文就在这10篇文章中,与彭泰权合作的祝建华教授是计算传播学研究的倡导者,祝建华不仅明确提出了计算传播学的概念和理论,而且近些年一直致力于计算传播学研究,并吸引更多中国的传播学者加入计算传播学的研究。华人传播学者对计算传播研究的兴趣与中国蓬勃发展的计算传播产业密切相关。中国是世界上人口最多的国家,不仅掌握着大量的人类传播行为数据,能够帮助研究人员获取丰富的数据材料,而且也是推进计算传播学研究的重要力量。
基于上述研究发现,笔者结合当前计算传播学领域所显露的研究问题和所面临的现实困境,针对性地就计算传播学研究在今后的发展提出了如下建议与展望:
首先,要时刻警惕商业化数字媒体所主导的“计算中心”及其引发的数据霸权,着力建设以计算传播学研究者为主导群体的“计算中心”。纵观计算传播学领域的相关文献,不难发现已有的研究大多使用的是人们在不同社交媒体过程中所留下的数字化痕迹,但这些用户数据信息并非掌握在计算传播学研究者的手中,而是分别被多家数字媒体公司所垄断,形成了服务于商业利益的“计算中心”。也就是说,由于当下的计算传播学研究者未能进入这些数字媒体公司所构建的“计算中心”,导致现今计算传播学研究数据的获取、分析、挖掘等工作皆受制于资本逻辑及其数据霸权。另外,若想在研究的过程中系统了解和深入剖析一个人的数字媒体使用行为,则需要全面追踪这个人在不同数字媒体的所有数字化痕迹,但实际上这些用户数据信息是彼此割裂的,并散布于不同数字媒体公司所把控的“计算中心”之中。数据的互不连通、难以整合,使得当前计算传播学研究者从数字媒体公司所采集到的不是一手的完整数据,其类别、格式、范围等都有所删减或是受到限制,因而不利于对研究结果做出进一步的科学解释或是提供切实有效的应对方案。基于此,计算传播学研究者一方面应当始终保持高校、机构与数字媒体公司之间的数据共享和项目合作,并在研究过程中努力打破数据孤岛,力求综合用户在不同数字媒体上的个体属性和行为数据展开多元化的研究。另一方面,计算传播学研究者更需集中力量来加快建设属于自己的“计算中心”,力求减少对商业化数字媒体公司的依赖程度,并积极争取计算传播学研究的主动权和话语权。
其次,计算传播学研究者需要不断丰富基础理论研究和持续拓展应用实践研究,并在跨学科土壤之上探寻计算传播学这一学科发展所需的“必要的张力”。除了沿用计算社会科学领域的研究理论,传播学领域的学术研究者更应该从传播学领域寻找有价值且高适配的基础理论,为计算传播学奠定坚实可靠的理论根基以及规范客观可行的研究方法,尽可能降低研究者的个人经验、理解水平、价值取向等主观因素所带来的影响。另外,计算传播学研究者也应当重点关注社会化媒体环境所产生的用户数字记录和行为痕迹等海量的数据信息,试图通过可计算的方法探究和分析人们在传播过程中的传播主体、传播内容、传播渠道、传播效果等方面的内容,并重点考察人们传播行为背后所隐含的社会关系结构、社会互动模式、社会心理倾向以及社会行为表征等方面的问题。基于此,在后续推进计算传播学领域的学科建设过程中,计算传播学研究者还应深入思考收敛式思维和发散式思维之间的关系,避免两极对立的思维,使其相互补充、相互促进和相互制衡[19]。具体来说,既要鼓励不同学科的研究者对计算传播学领域的常规性研究进行持续深耕,又要突破固有的传统思维方式,大力促进跨学科间的交叉融合和科研协作。在此过程中,不仅能够最大限度地激发发散性思维,而且也有扎实的理论知识和研究方法作为支撑性基础,将能够为计算传播学研究带来源源不断的生机与活力。
再者,研究者要重新审视当前计算传播学研究所面临的伦理困境以及“技术黑箱”问题,并重点推进计算传播学领域的方法论研究。随着计算传播学成为当前研究的热门领域,参与其中的学术研究者尤其需要端正自身的态度,避免陷入过分强调“万物皆可计算”的技术理性当中,无论何时都不能忽视必要的人性关怀和价值引导。对于新兴技术所带来的伦理风险问题,计算传播学研究者在组建研究团队的过程中也需要有意识地吸纳相关的技术专家和伦理学者,以期共同完善当前研究实验的伦理审查工作,并逐步解决用户数据安全、隐私侵犯等所引发的诸多争议。与此同时,也有越来越多的学者从方法论层面对计算社会科学展开探讨,指出大数据社会分析所采集到的数据样本可能并不具有很好的代表性,并且仅仅记录了个人或群体在某个社交媒体平台所留下的数据记录,难以真实反映他们在现实生活当中的行为模式[20]。当然,上述问题也同样存在于计算传播学研究领域当中,另外由于大数据的收集过程和分析方法是一个“黑箱”,这导致从事计算传播学领域的研究者往往很难觉察到机器或算法所造成的错误或是偏见。因此,计算传播学研究者更加应当坚持修正优化计算传播学领域的方法论研究,坚持不懈地攻克在因果解释以及预测方面的研究不足,这样才能切实地帮助人们解决更多日常生活和社会实践当中遇到的实质性问题,并让计算传播学研究逐步发挥出更大的社会价值与实际效用。
(二)研究局限
本研究通过知识图谱的方法对计算传播学的研究起源、演进与趋势进行了一个系统考察,殷切期望能够给国内计算传播学相关的研究提供一定的参考。但本研究也存在着一定的局限性,主要表现没有对计算传播学领内不同的主题,如计算政治传播、计算广告、计算健康传播进行分类详细分析,在后续研究中期望可以对此三个细分研究领域更深入地研究。