APP下载

复杂公共议题下社交媒体主题演化趋势与社会网络分析

2021-03-08杨奕张毅

现代情报 2021年3期
关键词:社会网络分析社交媒体网络舆情

杨奕 张毅

摘 要:[目的/意義]在信息技术快速发展的今天,社交媒体在复杂公共议题中承担了越来越重要的信息发布、用户参与和舆论引导功能。通过对社交媒体多平台的用户记录的大数据分析,可以考察跨国家和平台用户诉求的差异和传播途径。[方法/过程]基于中美贸易争端的现实案例,使用网络爬虫程序定时采集Twitter和Weibo的用户数据,应用概率主题分析、时间趋势分析、社会网络分析等大数据分析方法,剖析两大平台在议题分布、时间演化和关键影响者的表现形式与属性差异,尝试弥补现有研究体系视域的单一性问题。[结果/结论]结果表明:1)在网络环境中,现实事件对于用户行为和主题热度产生迅速的反映;2)引发平台主题框架差异的原因由特定的环境、制度或文化背景所塑造;3)关键影响者的类型和观点显著影响当地的议题讨论网络,并引导舆论走向。本研究实现了对社交媒体用户行为互动观察维度和理论维度的探索与推论,印证了跨平台差异的根本解释,在一定程度上回应理论与实践研究对社交媒体功能定位和发展优化的关注。

关键词:公共议题;中美贸易争端;社交媒体;网络舆情;主题演化;社会网络分析;比较研究

DOI:10.3969/j.issn.1008-0821.2021.03.010

〔中图分类号〕G206 〔文献标识码〕A 〔文章编号〕1008-0821(2021)03-0094-16

Social Media Topic Evolution Trend and Social Network

Analysis Based on the Complex Public Issues

——A Comparative Study of China-US Trade Disputes

Yang Yi Zhang Yi*

(College of Public Administration,Huazhong University of Science and Technology,Wuhan 430074,China)

Abstract:[Purpose/Significance]With the rapid development of information technology today,social media has assumed more and more important functions of information release,user participation and opinion guidance in complex public issues.Through the big data analysis of user records on social media platforms,the differences in user demands and communication channels in cyberspace can be investigated.[Method/Process]Based on the reality of China-US Trade disputes case,the study used the web crawler Twitter and Weibo of user data.Then,it applied probability topic modeling,time trend analysis,and social network analysis,to explore the differences between the two platforms in the issue distribution,time evolution,and key influencers for trying to make up for the problem of unitary vision existing in the current research.[Result/Conclusion]The results showed that:(1)in the online environment,real events had a rapid impact on user behavior and topic popularity;(2)The reason that caused the difference of platform topic framework was shaped by specific environment,system or cultural background;(3)The types and opinions of key influencers significantly influenced the discussion network of the platform and guide the direction of public opinion.The study realized the exploration and inference of the interactive observation dimension and theoretical dimension of social media user behavior,verified the fundamental explanation of cross-platform factor differences,and responded to the social practice and theoretical researchs attention to the function positioning and development optimization of social media to a certain extent.

Key words:China-US trade disputes;social media;online public opinion;topic evolution;social network analysis;comparative study

中美贸易争端起始于2017年8月美国对华启动“301调查”,随后对中国进口商品征收额外关税、设置其他贸易壁垒;中国商务部同时作出反制措施,对价值数百亿美元的美方输华商品征收额外关税。自此,世界两大经济体陷入旷日持久的经贸摩擦。虽然后期双方一度达成阶段性共识,但是这种超越地区限制的远距离行动,在一定程度形成社会学家Ulrich Beck所谓的“全球风险”,即双方的讨论解释依赖于当地社交媒体,在现实世界引发广泛讨论,通过本土或时间范围呈现全球的视角。

随着互联网的普及与网络传播的高效性和分散性,信息不仅能够在较短时间内实现更大范围的传播,也打破了传统以单一主体为中心的信息传播模式。尤其是微博客等社交媒体的出现,在事件的发展过程中,人们主动或随机形成且带有主观色彩的态度观点,实际蕴含丰富的信息内涵。这种半结构化、不规律的数据特征通过网络媒体的形式充分表达,揭示了人们的观点与思想,也引发了数据驱动的新兴舆论力量。在学术研究中,这些海量数据能够改进传统方法获取数据的局限,推动公众反馈参与形式的转变,完善参与者关系特征的测量评估,为数据挖掘复杂政治议题研究提供可能。

由于全球事件的交叉性较强,不同学科侧重点不同。相关研究主要以外交政策、政府机构改革、国家领导人沟通等主体为对象,集中在国家行政机构改革、政治领袖沟通、全球风险管理、政府管理监督等方面,鲜有研究聚焦公众视角,开展网络舆情与数据挖掘可视化的测度研究。此外,现有研究多集中于西方视域或案例,忽略了文化背景的多样性,无法通过现有研究辨析社交媒体的国别差异。为了克服这些局限性,本文重点关注的核心问题是,根据持续发酵的中美贸易争端,是否可以找到有效测量并比较跨平台社交媒体用户参与的反馈特征及舆论影响者关系结构的方法和路向。

具体来讲,本研究以两个当事国家具有语言和文化代表性的社交媒体平台Twitter和Weibo为研究对象。基于大数据挖掘与分析视角,使用网络爬虫程序采集用户社交媒体评论的海量数据;采用概率主题模型分析及时间趋势分析,分析用户偏好的相关主题框架,不同时期的热点演化趋势;然后使用社会网络分析方法,绘制中美贸易争端话题意见领袖网络的结构图谱,利用相关参数分析测度关键影响者在网络中的位置。探索比较用户形成网络拓扑特性的主题规律与网状结构,有针对性地改进传统研究方法和调查数据的局限性,回应理论与实践研究对中美贸易政治议题网络的关注。

1 文献回顾与理论基础

1.1 互联网社交媒体对信息传播模式的重构

随着20世纪80年代网络技术的兴起,信息革命对社会沟通交流方式带来众多机遇和挑战。作为互联网技术的典型代表,社交媒体概念最早由国外学者Jennifer B Unger提出,被定义为“网络用户用以交换信息和内容创建的平台”[1]。在此平台上,人们可以彼此分享观点、经验、见解,平台为用户提供了信息内容创造和交换的服务场所。由于参与对话和公开交互等特性,在公共议题的关注讨论中,所有用户既是潜在议题的发起者、传播者和渲染者,也是信息的消费者和生产者,甚至在不知觉的情况下参与其中[2]。这种由传统媒介制造话题的“一对多”传播范式转变为用户自发形成的“多对多”,在超越时空与快速传播的同时,实时更新至话题列表及关注者账户中,使得用户数据交换能力更加高效,为用户呈现接近事件真相的临场感知[3]。现如今,学界已将其视为网络协作模式和用户创造内容对集体智慧的贡献[4],成为获取社会意见的重要渠道之一。

在众多的社交媒体类型中,微博客(Microblog)是具有代表性的平台之一。该平台由丰富的账户聚合而成,包含多种形式的沟通模式。微博客的帖子均为公开发布,除特殊设置之外,所有用户均可以轻松浏览,这种低成本、便捷性与时效性并存的信息获取方式,实现了账户间点对点直接的信息互动[5]。更重要的是,这种去中心化的方式显著增强了人们在信息传播和沟通交流中的主体性和存在感。其智能化的展示模式深刻地影响公众观感,以一种更加强烈的方式推动公众参与,成为一个民主平等且持续响应的公共话语论坛[6]。

全球不同版本的微博客中,Twitter是世界最大的微博客服務供应商[7],其通用的官方语言(英语)、开放的平台与使用广泛的账户架构,成为微博客服务的主要场所,因此接近80%的Twitter用户持续跟踪其关注者的实时动态[8]。此外,该平台也是获取各类型公共事件信息的媒体平台[9],实时反映现实世界客观存在的公共议题,尤其在政治经济与社会讨论等方面,受到学界的广泛关注[10]。与此同时,本研究以中国代表性的微博客平台“新浪微博”(后简称“Weibo”)为另一研究对象,根据微博发布的2020年第一季度财报显示,截至第一季度末,Weibo月活跃用户达到5.5亿,与去年同期相比净增长约8 500万。

从本质内涵来看,社交媒体是公众参与的主要平台,社会互动日趋网络化特点,使得传统的单一制模式无法发挥最佳效用,多元互动和公众参与成为新时代公共管理的重要特征。从表现形式上看,微博客新型互动机制打开了数据开放之门,从根本上改变了信息传播过程中“创建与消费的结构模式”,也是学术研究的理想场所。从发展方向来看,相比传统的政治参与形式,用户网络民主化参与对于直接关系个体利益的特定议题保持更为积极的态度,而不是陷入宽泛的参与形式之中。在此意义上,社交媒体中用户参与的形式更加真实,在了解事件进展、拓宽参与渠道、激发沟通热情等方面发挥作用。

1.2 理论基础

1)框架理论。为了对微博客数据处理过程进行概念化和理论化,本研究借鉴了Goffman E提出的框架理论(Framing Theory)[11]。现实中多数传播过程产生于各类型的框架中,框架本身作为概念背景或主题原则恻隐于某项文本背后,通过将这些表征符号有序地排列组织,形成结构统一和逻辑一致的表达,帮助人们理解框架统摄范围内产生的信息传播、社会交往[12],由于相同的信息传播行为置于不同的社会结构中,其形成框架会产生不同含义。因此,框架理论研究基于这样一种观点,即人们对公共事件的反映是由特定社会制度或文化背景所塑造的[13]。当前,学界主要将框架理论应用于现实世界所反映的文本内容,使用信源线索、关键词、图片的标签化符号,进而潜在地影响政策观点、社会价值观等。随着信息技术的普及,媒体在框架建构方面的功能进一步提升。一方面,信息传播形式呈现复合和多元化,既有报纸、电视等传统媒体,也有微博客、微信客户端等社交媒体,舆论话语生成与报道框架多元化成为主要的趋势[14];另一方面,社交媒体的兴起,意味着人人都有机会在集体行动中参与框架的建构,众多非直接利益关联的网民均可直接参与话题讨论。框架理论为本研究提供了关键的概念基础。根据中美贸易争端的现实案例,从事件的产生、发酵到演化,各界声音此起彼伏,并在社交媒体场景体现。本文将该理论命题用于分析微博客用户交流,考察网民个体在评论行为中主要涉及哪些话题,以及这些评论在何时变得升温或冷却。基于此,框架理论不仅可以有效量化评论生成的主题框架模式,还能掌握特定主题的时间演化趋势。其网络符号构建了特殊的主题框架,进而推论基于微博客的中介化过程所生成的公众沟通实践。最后,探索比较不同舆论场的框架差异。

2)意见领袖(或关键影响者)。学术界经典的研究成果将影响群体的影响者称为“意见领袖”,指那些在信息传播中处于相对有利位置的意见引领者,其观点得到关注者的支持,具有相对更高的影响力和话语权。因此,意见领袖可以基于这些社会支持,影响其他群体的价值判断[15],利用可以控制的范围广泛传播信息,推动社会意见形成统一,甚至在社会网络的边缘也可间接形成独特影响力[16]。在社交媒体环境下,通常使用“关键影响者”解释意见领袖概念。在微博客平台下,用户间的关系结构通过“关注与被关注”调节,其实质上也形成一个线上的社会网络。关键影响者通过在某领域积累的知识资源或认知能力,处于资源流动网络的核心位置,进而成为互联网社会的“意见领袖”。如今,关键影响者受到社交媒体研究者的青睐,在于该角色对群体、交往和关系等概念的融合,强调从整体的合作网络出发,考察影响者的结构位置及影响力来源。当前,学界相关研究逐渐从传统的概念探析转至定量化的实证或数据挖掘研究。在本研究中拟回答的问题是:在中美贸易争端讨论中,哪些账号是Twitter和Weibo平台的关键影响者?研究具体包含两个方面:第一,社会网络参与者的整体结构,这是一个由边和顶点构成的宏观网络,顶点表示话题参与者,边表示他们在提及、转发、回复等方面的互动;第二,识别关键参与者,通过网络中心性指标,识别量化关键影响者构成。

1.3 社交媒体与舆情大数据挖掘

随着社会信息化程度的不断加强,互联网已成为大型的信息资源储存库,以此存放非结构化的文本信息。但面对海量的文本信息,传统的手动操作处理方式已显得力不从心,如何准确地从非结构化文本数据中提取满足研究者需要的知识信息,需要创新性地采用数据文本挖掘方法获取。文本挖掘(Text Mining)是以信息系统领域中的自然语言处理与数理统计分析为理论基础[17],结合机器学习与信息检索技术,从大规模的文本信息中发现并提取关键词和主题信息,尤其在处理多项文本的挖掘过程方面效果最佳[18]。

文本挖掘方法可以获取海量的信息构成。通过关键词特性提取、嵌入预定义主题、信息放大和缩小等多种方式,对文本内容展开搜索[19],最终转化为普通人可以理解的“知识”的过程。这种新型研究工具已成为研究者定位海量文本信息的有效工具,也是获取社会现象、用户内容、多主体结构关系的载体。现实议题在网络平台得以映射,最终也会反作用于社会舆论影响。当前,文本挖掘主要应用于信息抽取[20]、特征识别[21]、演化趋势[22],关注数据的主题特征、用户行为、隐私保护等方面的研究。如Javed N等提出一个概念框架,融合词性标记、Lexicon分类和聚类生成的语料库等语义处理技术,分析Twitter用户参与关于合作性和包容性治理的帖子[23]。Reddick C G等根据美国圣安东尼奥市在Facebook平臺上发布与固体废物管理相关的文本数据,使用概率主题分析确定了市民对于城市建设提出的有关主题[24]。在用户行为方面,Doran D等对社交媒体用户的传播行为进行可视化分析,预测社会舆论的倾向性[25];Lee M J等基于对互联网在线评论进行民意调查,研究人们对其他网民发布信息的容忍度以及网络用户在社交媒体发表意见的意愿程度[26]。在隐私保护方面,Metzger M J等研究认为近年来利用社交媒体开展的非法网络舆情传播,使得用户隐私及信息安全存在隐患[27]。Imran-Daud M等提出一种语义网技术的访问控制机制,通过自动检测敏感信息,实现用户对动态隐私的保护[28]。

综上,尽管现有研究取得了丰硕的成果,但一些局限性仍然存在。第一,无论是框架理论、意见领袖亦或是社交媒体研究,主要仍集中于西方发达国家的应用场景,针对我国等发展中国家为案例的实证研究较为缺乏。第二,对于用户大数据的挖掘实验而言,现有研究主要聚焦于技术算法层面的创新,很少有学者将传统的社会科学及传播学理论嵌入至该领域的研究。第三,当前针对社交媒体用户的研究仍然多属于理论研究的范畴,很少有研究采取跨国家、平台、语言的方式,探索比较用户数据的样本模式。

2 研究设计

2.1 情境案例

过去30年间,中美两国在贸易和经济关系方面取得了长足发展。中国现在是美国最大的商品贸易伙伴、第三大出口市场和最大的进口来源国[29]。然而,在新一届美国总统选举之后,这种局面发生了根本性变化。随着特朗普政府施行新的贸易战略,美国采取的方法超出常规贸易措施。其目标是通过贸易协定来解决中美双边关系中的结构性问题,然而政治层面谈判的激烈程度显示,双方在寻求达成协议的同时避免采取对等的严厉措施的意愿。

2018年3月,美国总统签署了一份备忘录,宣布以“中国窃取美国知识产权和商业秘密”为由,对从中国进口的商品征收关税,涉及金额达600亿美元;随后,中国商务部采取反制措施,对美国进口商品加征关税;2019年6月,中美两国领导人在大阪举行的G20峰会就重启经贸谈判举行会谈;同年8月,美国总统在Twitter上宣布,美国政府将对所有剩余的价值3 000亿美元的中国进口商品征收10%的关税,导致人民币兑美元汇率跌至7以下;作为回应,中国政府宣布将暂停购买美国农产品。两国贸易争端大有“山雨欲来风满楼”之势。当前关于中美贸易争端的文献较为有限,主要从定性研究切入,基于国际政治学、外交学和经济学视角,分析潜在的中美关系的经济影响[30]、国际政治影响[31],预测未来的市场前景,评估加剧冲突的可能性[32],并提出政策层面的解决措施[33-34],较少研究涉及定量分析维度,以及基于用户网络舆情的海量数据挖掘研究。

2.2 研究数据

研究拟选取Twitter和Weibo用户评论文本作为数据样本。首先,通过网络爬虫程序检索中文原文包含关键词“贸易战”和英文原文包含关键词“Trade War”的所有微博客帖子(字段为“账户名称、评论正文、@账户提及、发布时间”)。为便于结果的结构化比较,将用户限定为Weibo用户为中国大陆地区汉语用户,Twitter用户为美国本土地区英文用户。

为尽量减少两平台之间因时差而导致的结果偏差,实验设定在每天的同一时间(北京时间上午9点,美国东部时间晚上8点)开始收集数据,时间区间为2019年6月29日—9月30日。根据此事件的时间线显示,如图1所示,从首次出现至后期达成第一阶段协议,该时间段是事件的集中暴发与媒体平台集中讨论较关键的时间节点。因此在这个稍瞬即逝的时机,对东西方最重要的两个微博客平台开展海量的大数据探索,为学术研究提供了较为难得的机遇。在执行数据分析之前,需要进行必要的数据清洗工作,手动删除无效、广告营销以及含有极端言论的帖子,最终共采集36 035条Twitter和17 568条Weibo数据。

2.3 研究方法

通过网络爬虫获取的账户名称、评论正文、@提及、发布时间等数据,为探索文本主题、时间趋势、网络结构提供了不可多得的舆情文本资料。用户文本是获取用户现象、内容、主体结构关系的一种载体,融合大规模和自动化的数据分析,成为网络舆情和大数据政治学主要的研究方法。本文在现有理论支撑和数据实验的基础上提出一种分析框架。

第一,基于潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)的概率主题建模。概率主题模型作为功能显著的智能识别,也是文本挖掘法代表性技术。不同于传统的文档检索依据关键词展开,LDA基于Python语言环境,识别对应的相关主题获得线索和规律性认知。利用文本分类、聚类和信息抽取方法,找到文档主题的构成分布,然后检索与该主题对应的内容,进行相关性探索与推论[35]。因此,可以将LDA视为新形式的文本检索方法,该技术可处理多项文本,且具有智能分离多个含义的功能。同时,由于该方法基于计算机算法自动实现,可以使数据分析中的主观偏差最小化[36]。

第二,使用时间趋势分析(Time Trend Analysis)检验主题与时间的相关关系。对应于概率主题建模,时间趋势分析将建模后的主题采用时间序列划分,关注主题随时间变化的现象。两者的相关性能夠引导理解现实世界和数据之间、个体之间、不同群体之间的关系,多应用于统计学和经济学研究中。但在舆情传播领域,已有研究多针对突发事件以静态的方式展开研究,或分析用户评论在数量上的动态变化,融合主题建模的演化研究则探索不足,事实上,研究不能将两个维度割裂开来,应综合两维度考察用户舆情的信息内容。因此,本研究尝试应用时间序列分析,重点对Web数据以天为单位聚合,结合舆论场的时序变迁,生成以3天为周期的时间序列,以此揭示话题随时间演变的规律。

第三,社会网络分析(Social Network Analysis,SNA)是对关系结构及其属性加以分析的一种方法。SNA研究社会网络的关系构成在多个节点之间的连线集合。Twitter和Weibo账户彼此分别创建的关注、回复和@提及网络,可以获得有价值的关系发现,勾勒用户互动的图谱,从而形成理论归纳和总结。SNA包含网络整体结构和关键影响者识别,一是由边和顶点组成的整体社会网络,其中每个节点表示话题中的参与者,边缘表示他们通过提及、转发和回复方面建立的关系,汇聚了以整体合作数量、网络密度、网络规模、中心化趋势等指标为表征的整体认知图景。另一方面,网络内部的参与者网络,是一个由点度中心度和中间中心性为指标的关键影响者识别。社会网络分析为网络舆情提供了将空间概念引入研究框架的新机遇,呈现相关话题用户互动的空间分布及网络聚类。

3 研究过程

3.1 概率主题分析:基于LDA的议题关注

本节将介绍LDA模型主题的提取过程。通常来讲,社交媒体平台的文本信息由用户生成,并存储在后端数据库中。因此,在进行分类主题之前,需要对文本执行分词、去除停用词、清洗无意义字符等预处理操作。在英文预处理部分,使用了Python程序中领先的人类语言数据处理平台Natural Language Tool Kit,实现分词和停用词删除的操作;中文文本分词部分则选用Jieba中文词法分析系统。为完成中文停用词删除操作,使用了Apache Lucene的Smart Chinese Analyzer类中使用的中文停词列表,此后,每个公共评论文档都表示为单词向量。然后,使用信息检索领域的TF-IDF(Term Frequency-Inverse Document Frequency)关键词统计方法,进行筛选操作。过滤掉出现频率高但不影响文档主题的词语,尽可能多地保留影响程度较高的特征词,即可实现后续的建模分析。

在接下来的实验中,采用LDA模型定量提取指定数量的关键词和主题,以实现特征降维的作用。具体分析过程为:主题关键词提取→分类主题降维→概率统计及排序。①主题关键词词提取,根据研究人员设置的主题和关键词数量,系统自动提取相应的主题和关键词;②分类主题降维,将含义相近的主题和特征词分别标注至具有相同含义的主题中;③概率统计及排序,统计每个分类主题的隶属概率值并排序。分类主题建立在关键词聚类基础上,根据不同粒度划分,可计算出不同的主题数量,因此需要结合需求,对结果进行不断调试以达到最优求解。作者分别选取的潜在主题数量为20、25、30、35个,发现当Twitter和Weibo的主题总数分别为25和30个时,列表的语义提取效果最好。由于篇幅限制,分别列举分类主题对应的3个和4个代表性关键词,按照从最高到最低的平均适合度排序。表1和表2分别显示了Twitter和Weibo主题和关键词的分类结果。

在这一轮的分析中,从两个平台的主题集合降维提取4项突出的分类主题,确定了4项Twitter主题(按隶属概率值从高到低排序)“经济—金融—股票(0.398665361)、科技—投资—供应链(0.296178377)、媒体—社会—舆论(0.216263527)、政府—外交—领导者(0.088892736)”,以及4项Weibo主题“政府—外交—领导者(0.362724762)、经济—金融—股票(0.351972265)、科技—投资—供应链(0.192318333)、媒体—社会—舆论(0.09298464)”。表3和表4分别展示了Twitter/Weibo的分类主题、隶属主题及概率值的排序结果。

中美贸易争端也被称为经济争端或经济冲突,因此Twitter用户将“经济—金融—股票”(0.398665361)视为重点的关注议题之一,平台跟帖出现一些特定且较高隶属概率值的关键词,如“特朗普衰退、特朗普暴跌、价格、货币、下跌、特朗普关税”等;Weibo用户也聚焦于相同主题(0.351972265),他们集中关注股市(股指、恒生指数、上证综指)、外汇汇率(人民币、美元)、经济走势(峰值、衰退、下跌)等方面的内容。

Twitter主题“科技—投资—供应链”(0.296178377,关键词“谈判、贸易谈判、亚洲、出口、投资、进口”等)被用户视为另一个关键话题。例如,美国针对华为公司的贸易制裁在社交媒体引发讨论,一名网友表示“我从一开始就怀疑@Huawei是一个容易被视为贸易争端的目标之一,随着时间的推移,看看这一切将如何展开,将会很有趣”;也有另一位网友提出“尽管打了贸易战,但中国科技巨头@Huawei在2019年上半年赚的钱和2018年全年一样多”。与此相关,Weibo想对应的主题主要涉及“合作、增长、工厂、半导体、产品、芯片”等字眼,隶属概率值(0.192318333)排序第3位。

0.216263527,包含新闻媒体单位(福克斯新闻、Youtube、金融时报)和用户的情绪化表达(担忧、思考、选择)两方面的内容。相对而言,Weibo主题“媒体—社会—舆论”(0.09298464)关键词包含媒体单位(人民日报、中央电视台、胡锡进)、年轻人(青年、中学校长、朋友圈、教授)、情绪表达(关注、围观、紧张)3个方面,但是结果显示,该主题仅排序第4位,且低于前1位(“科技—投资—供应链”主题)接近10个百分点,并非Weibo平台的热门关注。

此外,概率主题建模实验也识别了两平台更为显著的差异。“政府—外交—领导者”主题在Weibo平台中排序第1,概率超过36%(0.362724762),这意味着超过1/3的相关帖子都在关注与“政治领袖”(国家元首、特朗普、刘鹤、总统、参议员)、“政府”(商务部、美国商务部、政权、华盛顿、政府采购)、“外交”(大阪、G7峰会、谈判)相关的话题,且实验中关键词在不同的分类主题下呈现不断重合的态势,从侧面支持了主题被频繁讨论的结果。有趣的是,Twitter的排序结果与之正好相反(0.088892736,排序第4),即政府话题在Weibo关注度最高,在Twitter关注度最低,呈现完全不同的特征,存在极为显著的差异。

3.2 时间趋势分析:社交媒体讨论主题热度

通过主题趋势分析,探索用户关注热点随着时间推移发生变化的趋势特征。检查两项指标基于一个基本原则,即将Twitter、Weibo上的帖子与同期现实事件对比,主题随时间趋势发生变化,并呈现上升或下降趋势,当单位时间段评论与关注主题相关时呈现上升趋势,反之则减少。通过这个操作,可以确定热门主题趋势与现实世界的共变关系。需要指出的是,如果某项主题类别在坐标内趋近于零,并不能明确为该类别在相应时间段没有出现任何隶属关键词,其实际仍然存在少量数据,虽然在图中未显示。图1(a)~(d)描绘了中美贸易争端时期Twitter和Weibo用户关注的主题随着时间发生变化的趋势图。其中,横轴(X轴)表示以3天为1个周期的时间跨度,时间区间与LDA概率主题实验相同(2019年6月28日—9月30日);纵轴(Y轴)为对应的隶属概率值,分别在0~0.8之间。

2019年6月28日—29日,中国国家主席习近平与美国总统唐纳德·特朗普在日本大阪举行G20会谈,这是在贸易争端事件后,两国领导人的首次会面。因此该事件发生之后(7.1—7.7),在两国社交媒体均引起强烈关注。其中,关于国际贸易与供应链相关话题(主题:科技—投资—供应链)讨论显著增加,占比接近50%。在两平台中也曾出现多个相同含义的关键词,如“出口(对应Export)、增长(对应Expand)、达成协议(对应Deal)、合作(对应Cooperate),关注持续近1个星期。同时,主题趋势分析映射出此事件的另一个重要的时刻:8月2日,作为“Twitter治国”的代表人物,美国总统特朗普连续发布4条长篇推特,宣布对中国进口商品加征关税,如图2所示。这一事件随即在两个平台上引发了大量讨论,尤其在“7.29—8.4、8.5—8.11”两个时间段,引起广泛的讨论和洗牌。Twitter用户关注“经济—金融—股票”(关税、衰退、市场、债券、道琼斯指数、价格、特朗普衰退、期货)和“媒体—社会—輿论”(声音、福克斯新闻、影响、担忧、措施、观察、报道、压力),主要围绕经济指数和情绪表达两方面,关注美国对中国新一轮经济贸易制裁的影响。

与Twitter映射的相似之处在于,Weibo用户同样密切关注美国总统这个决策对我国经济的潜在影响,体现为“经济—金融—股票”主题。但与Twitter截然不同之处在于,相较Twitter持续升高的用户“情绪表达”,Weibo用户更为关注事件对“中美关系和中美政治”的影响(“政府—外交—领导者”主题),显示出与Twitter的根本差异。对Weibo用户来讲,无论经济调控还是国际关系,政府在调控经济方面作用显著,因此人们的分析论证往往集中于政府,实验显示讨论多为积极评价。虽然不能简单地将网络舆情与现实世界进行直接比较,但在动态变化的数据集中,主题概率分布随着文本索引的增加/减少而增加/减少,可以作为实时追踪现实情况的有效指标。此外,基于这些差异,可以理解不同国家社会背景与网络舆情信息在用户表达、价值描绘、舆论引导、治理理念等方面的显著差异。

4 社会网络分析:网络结构与关键影响者识别

微博客平台涉及转发、关注、提及其他账户,为研究构建用户关系网络提供基础。本文选择在Twitter、Weibo平台中“@提及”两个或两个以上社交媒体账号为样本,共获得有效Twitter账号206个,Weibo账号183个,分别测算宏观和微观层面的网络指数。其中,宏观指数由整体结构和参与者类别组成,以确定账户整体特征;微观指数以参与者本身为关注对象,包含点度中心性和中间中心势两指标,将排名靠前的账号确定为社会网络的关键影响者。本次实验采用UCINET 6.0测量网络中心度,绘图工具为Gephi0.9.2版本。

4.1 网络整体结构与参与者类别

通过邻接矩阵可以考察关键影响者的合作现状,根据微博客的节点关系,构建可视化的矩阵结构图。如图5所示,网络节点面积和连接线条数量,与关键影响者的影响力成正比。账号的指数越高则面积越大、线条数量越多。根据图3(a)显示,Twitter关键影响者网络呈现显著的“一超多强”的联盟格局。作为核心中心点,美国总统特朗普个人Twitter账号(@realDonalTrump)控制并影响来自周围的圈层,其周边紧密围绕另外4种类型的关键参与者账号,分别为:第一,美国私营媒体官方账号,包括@CNN、@ABC、@ABC News、@CBS News、@FoxNews等,除了美国本土媒体,也包含少部分来自英国、中国的海外媒体,如@金融时报、@路透社、@BBC、@ChinaDaily、@cctvnews、@XHNews,媒体类别占总样本量的27.64%;第二,美国现任政府工作人员个人账号,例如美国国务卿@SecPempeo、众议院议长@SpeakerPelosi、参议员@SenTedcruz、副总统@Mike_Pengce等,少数美国前任政治家和外国领导人如美国前总统@BarackObama、印度总理@narendramodi包含其中;第三,部分企业官方账号,包含22家美国公司、9家中国公司和4家德国公司,占总样本的20.60%;最后,网络中还包含以记者、党政机构、研究人员等构成的其他群体,但总体仅占样本量的29.74%。

图4(a)显示中美贸易争端在Weibo平台的网络结构图。总体来看,该结构主要集中为三大板块:第一,以我国官方媒体为中心层,占微博的43.11%,其中官方媒体占51.39%(包括@人民日报、@人民网、@中央电视台新闻等),一般媒体占47.22%(包括@QQ新闻、@163新闻),以及一个香港媒体账号@香港商报;第二,研究人员在Weibo被称为“专家”(如@政委灿荣、@林毅夫、@戴旭、@邱振海、@宋忠平等),在Weibo平台显示出了较强的影响力,账号占比约为17%;第三,企业账户,Weibo平台包括20家中国公司(如@华为、@小米、@百度、@联想、@喜马拉雅)和4家美国公司(如@迪士尼中国、@Facebook工程团队、@Apple)账号,占样本的14.37%。这3种账号类型居于Weibo网络结构的中心区域,表明以这些账号为核心的结构彼此之间相互关联的数量最多。除此之外,网络整体结构还包含记者、党政机构、学术机构等其他类型,总占比约为25.75%。

4.2 网络中心度测量与关键影响者识别

网络位置中心性是一种量化网络中核心节点影响力的指标。在合作网络中,处于中心位置的关键影响者占据更重要的位置,具有更强的群体影响力,网络中心度指标由点度中心性和接近中心性两部分组成。其中,点度中心性根据每个节点所持有的链接数来分配重要性,指数越高其在网络中的传播力越大,影响其他节点的数量越多,客观反映节点在网络中的影响力和信息传播能力;接近中心性主要测量节点与网络中其他所有节点的最短路径长度的平均值,该值越高其核心程度越高,与其他节点的距离越近。

根据UCINET 6.0对网络中心性两项指标的计算统计和综合排名,如图5所示,在Twitter网络联盟中,特朗普(@realDonaldTrump)在中美贸易争端的舆论影响力高居第一且超过其后的各项节点两倍以上,与新闻媒体@CNN、华尔街日报@WSJ成为排名前3的关键影响者。同时,结果显示Twitter社交网络影响力与私有媒体的活跃程度存在显著的正相关。前12名中共10位来自美、英的媒体机构(占比83.33%),除了第2、3名之外,还包括美国消费者新闻与商业频道@CNBC、彭博新闻社@business、微软全国广播公司节目@MSNBC、福克斯新闻@FoxNews、@ABC,以及英国媒体路透社@Reuters、金融时报@FinacialTimes、英国广播公司@BBC等,唯一的非媒体机构为美国共和党账号@GOP,综合排在第6位。在Weibo平台中,我国两大官方媒体机构@央视新闻和@人民日报的中心性测量综合排名前两位;排名第3、4位的分别是报道国际资讯为主题的媒体@环球时报,以及该机构的总编辑、著名记者@胡锡进。根据对综合排名第5~12位的关键影响者统计,两位来自官方媒体(还包括@参考消息、@CCTV4),3位私營媒体(@新浪军事、@新浪财经、@军情直播间),3位来自研究人员的个人账号(@宋忠平、@洪琳、@邱振海)。

5 讨论和结论

本研究以中美贸易争端为案例,通过对两国微博客平台共计约54 000份数据挖掘,比较探索了用户在议题关注、时间趋势及关系结构等互动的特征差异。如今,以社交媒体为平台挖掘热门事件情报的作用愈发重要,微博客应用与爬虫程序、文本挖掘法的深度融合,为理解海内外网络民意、制定针对性举措奠定基础。本研究试图将传播学理论结合信息时代的分析技术,以传统理论为基础,以海量数据为支撑,解释和评价来自两个国家和平台的民意特征,阐述用户舆情可能存在的互动偏差,也为探索网络舆情研究的新视角提供一定的借鉴意义。

首先,本研究明确了两国社交媒体平台概率主题存在显著差异的根本原因在于不同的社会背景、语言表达及传播体制产生不同的用户表达框架,进而激发出截然不同甚至相互对立的价值观念。在以Twitter为代表的英文社交媒体环境下,用户关注贸易争端对经济和科技的影响;而在Weibo中文平台背景中,评论则以政府与经济发展为中心。受到政治宣传和舆论引导的影响,中文媒体风格呈现以政府机构为主导,以集体理性和措施解决为原则的网络传播特征;而在英文媒体背景下,受自由意志及个性化表达的媒体环境影响,体现为与用户现实关注结合,映射对宏观经济政策和经济衰退等问题的直言不讳。虽然框架理论与网络舆情的实证研究较为缺乏,但是此结论提供了一些有趣的研究证据。

其次,本研究证明了社交媒体的公众讨论,可以有效反映国际事件的发展,并来源于“现实世界”。通过对时间趋势的观察分析,话题关注者的主题往往通过集中式的讨论凸显,以一种动态的方式演变,这些结果让人们能够更好地理解用户在中美贸易争端前后的演变。同时,重要或有争议的事件在网络传播中发挥至关重要的作用,例如,G20峰会和特朗普总统的4条推文,很好地解释了网络轰动效应的根源,也表明重要人物在缓解或扩大潜在问题争端中扮演了特殊角色。此外,本研究也验证了所提出的“主题—时间趋势模型”,结合适当的可视化表达,能够以一种清晰简约的方式关注复杂的国际问題。

最后,本研究描绘了社交媒体平台关键影响者网络与属性类别的差异。一方面,网络结构展示两平台总体是具包容性的,一小部分账号处于网络的边缘被隔离在外;另一方面,话题讨论中占主导地位的群体则被少数个体所垄断,两平台意见领袖属性的差异也较为显著。其中,Twitter主要通过美国政治领袖以及若干私营媒体账号所发布的信息,带动西方世界的舆论影响;而在Weibo网络联盟中,官方媒体、私营媒体和研究人员主要承担政府“发声器”的角色,该平台没有直接出现政治领袖的个人账号,而是由研究人员以专家的身份代之,引导网络舆论并发挥关键影响者的作用。

与此同时,本研究仍然存在一些局限性,也为今后的研究提供可以改进的方向。一方面,本研究仅关注英文和中文的微博客内容,无法充分验证其他非英语或汉语的平台,因此,未来相关研究可以持续扩大语种的使用范围,评估社交媒体在更多国家和地区的研究价值;另一方面,未来研究可以考虑将文本情感分析扩展至分析框架,考察网络舆情的情感色彩,以及集体情绪随时间和事件产生变化的规律,上述问题有待进一步探讨和完善。

参考文献

[1]Jennifer B Unger.The Role of Social Networks and Media Receptivity in Predicting Age of Smoking Initiation:A Proportional Hazards Model of Risk and Protective Factors[J].Addictive Behaviors,1999,24(3):371-381.

[2]Herold,David K.Cultural Politics and Political Culture of Web 2.0 in Asia[J].Knowledge,Technology & Policy,2009,22(2):89-94.

[3]李晓静.社交媒体用户的信息加工与信任判断——基于眼动追踪的实验研究[J].新闻与传播研究,2017,24(10):49-67,127-128.

[4]Castells M.Communication,Power and Counter-power in the Network Society[J].International Journal of Communication,2007,1(1):29.

[5]Parmelee,John H,Shannon L Bichard.Politics and the Twitter Revolution:How Tweets Influence the Relationship Between Political Leaders and the Public[M].Lexington Books,2011.

[6]Kim S,Lee J.E-participation,Transparency,and Trust in Local Government[J].Public Administration Review,2012,72(6):819-828.

[7]Barnett,George A.Encyclopedia of Social Networks[M].Sage Publications,2011.

[8]Naaman M,Boase J,Lai C H.Is it Really About Me?Message Content in Social Awareness Streams[C]//Proceedings of the 2010 ACM Conference on Computer Supported Cooperative Work,2010:189-192.

[9]Hughes A L,Palen L.Twitter Adoption and Use in Mass Convergence and Emergency Events[J].International Journal of Emergency Management,2009,6(3-4):248-260.

[10]Kwak H,Lee C,Park H,et al.What is Twitter,a Social Network or a News Media?[C]//Proceedings of the 19th International Conference on World Wide Web,2010:591-600.

[11]Goffman E.Frame Analysis:An Essay on the Organization of Experience[M].Boston:Northeastern University Press,1986.

[12]朱天,張诚.框架理论视域下互联网圈子的传播结构认知[J].现代传播(中国传媒大学学报),2015,37(10):128-132.

[13]Binder M,Childers M,Johnson N.Campaigns and the Mitigation of Framing Effects on Voting Behavior:A Natural and Field Experiment[J].Political Behavior,2015,37(3):703-722.

[14]潘霁,刘晖.公共空间还是减压阀?“北大雕像戴口罩”微博讨论中的归因、冲突与情感表达[J].国际新闻界,2014,36(11):19-33.

[15]Katz E,Lazarsfeld P F.The Part Played By People in the Flow of Mass Communications[J].Personal Influence,1955:31-42.

[16]Dubois E,Gaffney D.The Multiple Facets of Influence:Identifying Political Influentials and Opinion Leaders on Twitter[J].American Behavioral Scientist,2014,58(10):1260-1277.

[17]Swanson D R,Smalheiser N R,Bookstein A.Information Discovery from Complementary Literatures:Categorizing Viruses as Potential Weapons[J].Journal of the American Society for Information Science and Technology,2001,52(10):797-812.

[18]Bruza,et al.Literature-based Discovery[M].Springer Science & Business Media,2008.

[19]Musto C,Semeraro G,Lops P,et al.CrowdPulse:A Framework for Real-time Semantic Analysis of Social Streams[J].Information Systems,2015,54:127-146.

[20]楊奕,张毅,李梅,等.基于LDA模型的公众反馈意见采纳研究——共享单车政策修订与数据挖掘的对比分析[J].情报科学,2019,37(1):86-93.

[21]郝媛媛,叶强,李一军.基于影评数据的在线评论有用性影响因素研究[J].管理科学学报,2010,13(8):78-88,96.

[22]于江,党延忠.用信息可视化方法分析科研领域发展状况[J].科学学与科学技术管理,2009,30(6):10-14.

[23]Javed N,Muralidhara B.Framework for Participative and Collaborative Governance Using Social Media Mining Techniques[J].International Journal of Computer Applications,2015,123(8).

[24]Reddick C G,Chatfield A T,Ojo A.A Social Media Text Analytics Framework for Double-loop Learning for Citizen-centric Public Services:A Case Study of a Local Government Facebook Use[J].Government Information Quarterly,2017,34(1):110-125.

[25]Doran D,Gokhale S S,Dagnino A.Discovering Perceptions in Online Social Media:A Probabilistic Approach[J].International Journal of Software Engineering and Knowledge Engineering,2014,24(9):1273-1299.

[26]Lee M J,Chun J W.Reading Others Comments and Public Opinion Poll Results on Social Media:Social Judgment and Spiral of Empowerment[J].Computers in Human Behavior,2016,65:479-487.

[27]Metzger M J,Docter S.Public Opinion and Policy Initiatives for Online Privacy Protection[J].Journal of Broadcasting & Electronic Media,2003,47(3):350-374.

[28]Imran-Daud M,Sanchez D,Viejo A.Privacy-driven Access Control in Social Networks By Means of Automatic Semantic Annotation[J].Computer Communications,2016,76:12-25.

[29]Murthy K V B.US-China Trade Disputes:Studying Long-Term Trade Patterns[J].Manag Econ Res J,2019,5(2019):10406.

[30]Hughes L,Meckling J.The Politics of Renewable Energy Trade:The US-China Solar Dispute[J].Energy Policy,2017,105:256-262.

[31]Gompert D C,Cevallos A S,Garafola C L.War with China:Thinking Through the Unthinkable[M].Rand Corporation,2016.

[32]Ikenson D J.Cybersecurity or Protectionism?Defusing the Most Volatile Issue in the US-China Relationship[J].Defusing the Most Volatile Issue in the US-China Relationship.Cato Institute Policy Analysis,2017,(815):1-16.

[33]Akhtar S I,Morrison W M.Digital Trade and US Trade Policy[M].Congressional Research Service,2017.

[34]Schell O,Shirk S L.US Policy Toward China:Recommendations for a New Administration:Task Force Report[M].Asia Society Center on US-China Relations,2017.

[35]Blei D M,Ng A Y,Jordan M I.Latent Dirichlet Allocation[J].Journal of Machine Learning Research,2003,3(1):993-1022.

[36]張毅,杨奕,邓雯.政策与部门视角下中国网络空间治理——基于LDA和SNA的大数据分析[J].北京理工大学学报:社会科学版,2019,21(2):127-136.

(责任编辑:孙国雷)

猜你喜欢

社会网络分析社交媒体网络舆情
“双微时代”的危机传播趋势和影响因素研究
浅析网络舆情治理
基于社会网络分析的我国微课研究探析
基于社会稳定视角的网络舆情预警机制构建的思考