热点事件情境下微博舆情反转预测

2022-07-02惠秋悦

信息资源管理学报 2022年3期

安璐惠秋悦

(1.武汉大学信息资源研究中心,武汉,430072; 2.武汉大学信息管理学院,武汉,430072)

1 引言

随着互联网和新媒体的飞速发展，信息的发布和传播门槛以及信息发布者和信息受众的沟通门槛大大降低，各大社交媒体平台成为舆论产生和发酵的主要场所。网民从传统媒体时代被动的信息接受者转变为拥有自身话语权的信息发布者和信息传播者，形成了“全民记者”局面[1]。此外，部分主流媒体为抢占新闻先机，将未经证实或未能还原事件全貌的消息报道传播。“全民记者”的非专业性和部分主流媒体的急功近利导致突发事件发生时，缺乏深度、片面且单一的具有明显舆论倾向性的信息在网络中迅速扩散，事件被错误或者片面解读，造成网民观点一边倒的局面。随着事件信息不断补充，事件真相被还原，又导致舆论倒向相反方向，形成舆情反转。网络舆情频繁发生反转降低了媒体公信力，也造成了对当事人的伤害，更危害了网络生态环境和谐发展。

2021 年3 月12 日，新浪微博发布《2020新浪微博用户发展报告》[2]，报告显示，截至2020 年9 月，微博月活跃用户达5.11亿，日活跃用户达2.24 亿，现已成为重要的舆论产生和发酵场所。本研究利用新浪微博上热点事件微博数据，采用定性和定量相结合的方式构建舆情反转预测特征体系，基于多种机器学习算法对热点事件是否会发生舆情反转进行预测，并通过特征重要性排序分析影响热点事件舆情反转的因素。对舆情是否发生反转进行预测，一方面可以揭示信息平衡性、事件类型、事件曝光者类型等因素与舆情反转之间的关联，丰富舆情反转预测的理论与方法，另一方面有助于突发事件管理部门、社交媒体平台以及公众根据舆情反转影响因素对热点事件舆情走向作出预判，并为舆情引导和危机治理提供方法与数据支持。

2 相关理论与研究现状

2.1 相关理论

议程设置理论、刻板印象理论和社会燃烧理论，是研究者分析公众舆论以及社会事件时常用的理论，多用于网络舆情的成因、传播、演化、应对等方面的研究。本文选择上述三个理论从网络舆情的事件、用户、信息、传播四个维度作为本文特征构建和结果分析的理论依据来研究热点事件情境下微博舆情反转预测。

（1）议程设置理论

议程设置理论是1972 年美国传播学家McCombs和Shaw[3]在《大众传媒的议程设置功能》一文中提出的，指媒体可以通过设置“议事日程”影响公众对事件的关注点。

佛罗里达大学新闻系Wayne Wanta教授认为，在某些问题上，社交媒体平台的帖子强化了新闻媒体的议程设置功能[4]；张敏等[5]从议程设置视角出发，剖析了议程设置与媒体行为失范之间的相关关系，并以“手术台自拍照片”这一反转事件为例，分析了媒体行为失范对于医疗突发事件网络舆情演化的影响；王国华等[6]的研究显示，网络媒体微博议程与网民议程之间的相关性达到显著水平，说明网络媒体通过议程设置对微博网民的态度产生了较大影响。

（2）刻板印象理论

1922年，美国著名政治家Walter[7]提出刻板印象理论，指出刻板印象是“以高度简单化和概括化的符号，对特殊群体所做的社会分类，它或隐或现地体现着一系列关乎其行为、个性及历史的价值、判断与假定”。王楠等[8]将网络舆情事件中“是否存在刻板印象”作为舆情反转预测的特征之一，其实验结果显示，刻板印象与舆情事件反转的相关性较大，存在刻板印象的事件更可能发生反转。根据刻板印象理论，本文将事件类型、事件主体阶层标签、事件结果等加入舆情反转预测特征体系。

（3）社会燃烧理论

社会燃烧理论[9]是牛文元教授根据自然界燃烧现象提出的社会物理学理论。该理论将人与人或人与环境之间的矛盾类比为燃烧所必需的燃烧物质，将媒体误导、群众的非理性等类比为助燃剂，将具有一定规模和影响的事件类比为点火温度。黄远等[10]从社会物理学角度，依据社会燃烧理论分析网络舆论反转的原因认为，外在信息（社会燃烧物质）刺激网民内在情绪（社会助燃剂）导致了突发事件（社会点火温度）发生之后网络舆论反转现象的出现。在本研究中，各类型的热点事件包含了不同方面的矛盾，如医患矛盾、贫富差距矛盾等，这些矛盾即为社会燃烧物质；媒体片面、偏离事实或虚构的报道、受众的非理性“站队”、舆论攻击等即为社会助燃剂；各大热点事件即为社会点火温度。

2.2 舆情反转

目前，学界对于舆情反转的概念还没有统一的界定，夏一雪等[11]认为舆情反转即网络舆情在传播过程中，网民通过互联网表达和传播意见、态度和情绪的反向转化的现象和趋势；Proietti[12]认为舆情反转是在舆情演变过程中，反转或冲突信息介入后，不同群体的观点倾向于在相反方向上发展的过程。本文认为，舆情反转是指由于信源报道片面化、偏离事实或虚构等原因，使带有明显舆论倾向性的消息在网络迅速扩散，网民在失真信息引导下对某事件持集中倾向的观点，而在事件真相曝光或得到冲突性补充信息之后网民观点倾向至与之前相反的方向。关于舆情反转的研究主要有以下几个方面。

首先，许多学者用案例分析的方法对舆情反转的成因、影响与应对[6,13]等方面进行了定性研究。舆情反转的成因主要有媒体和网民两方面。一方面是因为媒体的无意识议程设置，如媒体以往对某类事件的频繁报道导致网民形成刻板印象，媒体跟进报道实时纠偏，倒逼真相；另一方面是因为媒体的有意识议程设置，如媒体为争夺话语权而发布未核实信息、使用带有主观倾向性的报道框架引导舆论、大量类似信息连续重复传播等。媒体的议程设置会引导舆论风向偏离事实，最后形成舆情反转。网民的碎片化阅读方式、趋同心理、刻板印象等造成其对事件片面、错误地解读，也是引发舆情反转的关键因素。舆情反转会降低媒体公信力、削弱公众热情、激化社会矛盾。王国华等[6]认为，应加大媒体审核力度和网络环境监督力度，提高公众素养，正确引导舆论；邓春林等[14]从情绪和归因两个维度，对事件各生命周期的微博用户评论进行分类及演化分析，发现影响微博用户情绪变化的关键因素。

其次，有学者利用仿真实验模拟各影响因素对舆情反转演化过程的影响。陈一新等[15]对Hegselmann-Krause 模型进行改进，研究了意见领袖数量和观点变化强度对舆情反转中群体观点稳定的影响；夏一雪等[11]以信息量代表舆情演化程度，构建函数模型预测常态舆情演化趋势，通过监测实时数据与预测数据的差值进行舆情反转预警，并构建了反转后舆情演化预测函数模型；Zhu等[16]利用有界置信模型，研究了四种信息对抗模式对最终舆论方向的影响；Chen等[17]研究了外部信息干预强度、个体注意力和个体保守性对反转事件舆情逆转强度和方向的影响；Jiang 等[18]提出了一个新的二阶段SPNR 模型，证明反转事件中失真信息传播率、失真信息传播者转变为正面舆论传播者的概率和官方对事实真相的通报时间都不同程度地影响失真信息的传播；Wu等[19]研究了新冲突性消息的传播率、可信度和新消息源在网络中的节点中心度对舆情反转速率和幅度的影响。

此外，有学者对识别舆情反转事件所属类别进行了研究。袁野等[20]识别出事件性质、报道倾向、报道形式、首发平台和网民相关度五个维度的舆情反转风险要素，采用Q 型聚类和Fisher判别式将舆情事件自动分为各抒己见、严肃慎对、戾气扩散和督错维权四类。田俊静等[21]以事件持续时长、事件类型、反转时段、反转次数、事件规模、反转渠道、是否引起线下事件为分类属性，对属性进行人工赋值，构建了基于决策树的舆情反转事件类型识别模型，将舆情反转事件自动分类为情感与教育、社会公德与伦理、行政执法事件、影响重大事件等四类。

舆情反转预测的研究目标是对舆情是否发生反转进行预测，通常使用的方法是从不同研究角度构建舆情反转预测特征体系，使用不同模型进行舆情反转预测。田世海等[22]从平台控制性、信息准确性、主体批判性、传播突变性四方面识别舆情反转影响因素，将其作为舆情反转预测的特征并进行人工赋值，使用贝叶斯算法构建了舆情反转预测模型。王楠等[8]从事件本身、当事人、网民、第三方平台、政府以及其他因素等六个方面来识别舆情反转影响因素并作为舆情反转预测的特征进行人工赋值，选择Adam 优化的前馈神经网络模型进行舆情反转预测；江长斌等[23]以舆情事件性质、舆情热度、舆情首发主体权威性、舆情传播形式、网民情感倾向等七个特征构建舆情反转特征体系，采用人工赋值和定量计算相结合的方法获得特征值，构建了基于SVM 的舆情反转预测模型。

综上所述，现有舆情反转方面的研究主要是对舆情反转的成因、治理、影响等方面的定性研究、利用仿真模型分析各因素对舆情反转过程的影响、构建模型实现舆情反转事件类型自动分类和少量基于机器学习算法的舆情反转预测研究。而现有舆情反转预测研究中，在特征构建方面，虽有些研究对于舆情反转预测特征体系的构建较为全面，但特征粒度较粗且均需人工赋值的二分类特征，其他研究中所构建的特征大多局限于媒体报道的情感倾向、信息结构、首发媒体的权威性、事件性质、舆情热度等方面，特征体系较单薄，缺少针对信息的影响力、全面性、可信度以及传播过程中受众等方面的特征。在特征值计算方面，学者们大多采用人工赋值的方法对特征进行赋值，如“是/否存在刻板印象”“是/否进行了议程设置”，具有一定的主观性，且成本较高，较少利用社交媒体数据对特征进行定量化计算。

因此，本文从事件、用户、信息、传播四个方面，在现有研究的基础上对已有特征进行更细粒度的划分，提出新的舆情反转预测特征，定义特征的定量化计算方法，构建适用于社交媒体数据的舆情反转预测特征体系，计算特征重要性得分，对特征重要性进行排序，找出影响舆情反转预测的重要特征。采用机器学习的方法构建舆情反转预测模型，在事件发生之初对舆情是否会发生反转进行预测。

3 研究方法设计

微博舆情反转预测的方法共分为五步：①使用爬虫软件采集相关微博数据和用户数据；②微博数据预处理；③构建舆情反转预测特征体系，使用人工赋值、描述统计、情感分类、文本相似度测量等方法计算特征值；④基于多种机器学习算法构建舆情反转预测模型，采用五折交叉验证的方法评估模型预测效果；⑤使用XGBoost（eXtreme Gradient Boosting）算法计算各特征重要性并进行排序。本文研究方法流程图如图1所示。

3.1 数据获取与预处理

本文中的热点事件选取自人民网[24]、搜狐网[25]、观察者网[26]、蚁坊软件舆情监测系统平台[27]等以及舆情反转相关学术论文。将2.2 节中本文给出的舆情反转定义作为判定标准，结合各大网站每年末的“反转事件”盘点以及核心期刊中舆情反转相关论文所选取的事件，对本研究中的反转事件样本进行选取；根据定义以及舆情分析平台上的分析报告，选取未出现公众观点反转现象的热点事件，作为未反转事件研究样本。在事件选取过程中，某些热点事件因其事件规模过大或事件数据难以获取而未被选取，如新冠疫情爆发事件延续时间长、数据量大，可能导致其在整个数据集中占据主导地位；个别事件的相关话题词条被屏蔽，无法获取相关微博数据等。新浪微博话题下的微博被划分为“综合”“实时”“热门”“图片”“视频”五类，本文选定上述事件微博话题下的“热门”微博，使用爬虫软件爬取微博数据和用户数据。爬取的热门微博字段包括博文、发布时间、转发数、评论数、点赞数、评论内容及评论时间、转发内容及转发时间；爬取的用户资料字段包括博主昵称、博主id、博主主页链接、性别、认证、简介、认证类型、行业、关注数、粉丝数、微博数、所在地。删除原始数据中的无关、冗余数据以及反转事件中微博发布于事件反转之后的数据。

3.2 舆情反转预测模型的特征构建

本文依据议程设置、刻板印象、社会燃烧三个理论，从热点事件本身、信息发布者、信息发布者发布内容、信息传播四个方面构建舆情反转预测的特征体系，即①事件特征，②用户特征，③信息特征，④传播特征，并定义了特征的定量化计算方法。各特征赋值如表1所示。

表1 热点事件情境下微博舆情反转预测模型的特征赋值

3.2.1 事件特征

有关社会热点或具有争议性的事件往往更能吸引媒体争先报道，社会广泛关注的敏感群体更能引起人们热议，具有更高的讨论热度。本文认为，舆情是否可能发生反转与事件本身特征有关。根据刻板印象理论，若公众对某类人或者某类事形成了固定、笼统、概括的看法，如性别歧视等，多数情况下，事件发生之后，公众在未了解事实之前会将自己对群体的惯性认知施加于个体，造成对事件的错误判断。因此，本文将事件相关因素，如事件的类型、涉事群体、事件结果等因素纳入舆情反转预测模型的特征体系。根据社会燃烧理论，本研究认为各类型的热点事件代表了不同方面的矛盾，如医患矛盾、贫富差距矛盾等，这些矛盾构成社会燃烧物质，因此，本文将事件类型作为舆情反转预测模型的特征。综上，本文将事件特征划分为事件类型、事件曝光者类型、事件主体阶层标签、事件结果和事件信息平衡性五个特征。结合田俊静等[21]对舆情反转事件类型的划分，本研究将事件类型划分为自然灾害、事故灾害、公共卫生、社会道德、行政执法、医患关系和文化教育七类。浏览事件相关微博、舆情分析报告等查找事件最初的曝光者，并将曝光者划分为当事人、自媒体、主流媒体、政府部门和普通群众五类。根据廖夏梦[28]对舆情反转事件中的人群敏感性的划分，将事件主体划分为四类：①弱势群体，包括老人、儿童、女性等自然性弱势群体和下岗失业人员、农民工等社会性弱势群体；②职业群体，包括医生、大学生、教师等；③特殊人群，包括名人、患者、外国人、知名企业高层人员等；④不特别针对某类人群。事件结果特征包含财产损失、生命健康损失、名誉损失、权利损失、精神损失五类。事件信息平衡性是指已发布的事件相关信息中，包含了几方说法，传统媒体中仅包含一方说法的报道不被允许发布，而当事双方的说法往往尖锐对立，要采纳三方及以上的说法才能形成新闻的平衡面，将事件全面地呈现出来，本研究中该特征划分为仅包含一方说法，包含双方说法，包含三方及以上说法。

3.2.2 用户特征

热门微博是新浪微博上提供最新最热优质内容阅读服务的一项产品，热门微博的转发、评论、点赞数和阅读量均较大，相对于普通微博具有更大的影响力。本文用户特征中的用户是指采集到的各个事件微博话题下热门微博的博主。根据议程设置理论，具有一定影响力的媒体可以对公众进行议程设置，对公众的观点造成影响，因此本文把媒体影响力等因素纳入舆情反转预测模型的特征体系。根据社会燃烧理论，媒体片面、偏离事实或虚构的报道等构成了社会助燃剂的一部分，本文考虑了舆情反转中媒体可信度和权威性等因素，将其作为舆情反转预测模型的特征。综上，本文将用户特征划分为用户性别、关注数、粉丝数、微博总数、相对影响力、账号类型、认证类型、首发热门微博认证类型、与事发地距离、可信度。用户相对影响力是考虑到避免用户通过“互粉行为”来增加粉丝数，以粉丝数和关注数的比值作为用户相对影响力指标。新浪微博的账号认证类型分为个人认证和机构认证，机构认证包含企业、机构团体、政府、媒体、校园、公益认证。本文按照新浪微博的账号认证类型，通过识别用户基本资料中的“认证”信息和“行业”信息对用户的账号类型进行划分，划分的账号类型与其对应的关键词如表2所示，若用户“认证”信息或 “行业”信息中含有对应的关键词，则划分为相应的类。若用户无“认证”信息和“行业”信息，或“认证”信息和“行业”信息中均不含表2中的任一类别下的关键词，则将用户划分为“普通群众”。

表2 微博用户账号类型的关键词

用户认证类型即根据用户的认证划分为无认证、黄V和蓝V，其中，黄V为新浪微博中的个人认证，蓝V 为新浪微博中的机构认证。首发热门微博认证类型即每个事件的热门微博中最先发布微博的博主的认证类型。用户与事发地距离特征根据用户基本资料中的位置信息与各热点事件的发生地点信息进行标注，若用户与事发地点处于同一城市或同一省份或同一国家，则分别标注为“同城市”或“同省份”或“同国家”，若用户位置信息与事发地点分别位于不同国家，则标注为“海外”，若用户地理位置信息为“其他”或空白，则标注为“其他”。本文采取曾子明等[29]的用户可信度计算方法计算用户可信度，使用z-score 规范化后的粉丝数、关注数、微博总数和是否认证作为用户可信度评估指标，如等式（1）所示：

其中user_reliability(u)表示用户u的可信度，z_follower、z_following和z_weibo_sum 分别表示经z-score标准化后的粉丝数、关注数和微博总数，verify表示用户是否认证，若认证则取值为1，若未认证则取值为0。

3.2.3 信息特征

根据议程设置理论，具有一定影响力的媒体对各类信息的报道频率、篇幅等潜移默化地影响公众对事件重要性的判断，媒体报道的雷同性和统一侧重点可以使公众聚焦于经过选择的信息而忽略其他信息，关注媒体想要公众关注的，忽略媒体想要公众忽略的，能够影响公众“想什么”以及“怎么想”。因此，本文在构建特征体系时考虑了热门微博之间的文本相似性、报道篇幅、报道频率等方面的信息因素，并将信息特征划分为热门微博长度、信源数量、热门微博影响力、热门微博时效性、首发热门微博时效性、首发热门微博信息结构、热门微博议程设置度、热门微博情感倾向八个特征。热门微博长度即为热门微博文本的字数。信源数量是指以各个事件的首发热门微博的发布时间为起始时间，设置时间窗口为10分钟，将从起始时间开始10分钟内发布的热门微博定义为信源，则10分钟内发布的热门微博条目数量为信源数量，有研究表明，信源对于网络舆情扩散具有显著影响[30]。本文采用曾子明等[29]的微博影响力计算方法，将z-score规范化后的粉丝数、转发数、评论数和点赞数作为热门微博影响力的评估指标，如等式（2）所示：

其中，weibo_influence(w)表示热门微博w 的影响力，z_follower、z_repost、z_comment和z_like分别表示经z-score标准化后的粉丝数、转发数、评论数和点赞数。

首发热门微博时效性即各个事件中首发热门微博发布时间与事件发生时间相差的小时数。不少网络舆情反转事件的报道都“空口无凭”，仅有文字描述，或利用了公众“眼见为实”的心理，通过片面、篡改或虚构的图文误导公众舆论走向[15]，因此，本文将首发热门微博的信息结构特征纳入信息特征当中，将信息结构分为仅文本、文本和图片、文本和视频、仅图片和仅视频五类。舆情反转事件中，众多媒体口径一致，大量发布片面、有误导性的信息，对公众形成议程设置，导致舆论一边倒。本文用各事件下的热门微博博文的相似度来表示议程设置度，使用Python中的自然语言处理包——genism 进行文本相似度计算。首先对原始微博数据进行分词、去停用词、获得词袋模型等操作，调用gensim 提供的API 建立语料特征的索引词典，使用doc2bow 将文本转化成稀疏向量，并将稀疏向量转换成TF-IDF向量，文本向量化完成后，将各事件下的所有热门微博两两配对进行余弦相似度计算，将计算得到的所有相似度值相加并取均值，作为各事件下热门微博的议程设置度，如等式（3）所示。对于同一事件下的热门微博，其议程设置度特征值相同。

其中，E_sim(e)表示事件e的议程设置度，T i和T j分别表示事件下第i条和第j条微博，sim(T i,T j)表示T i和T j之间的文本相似度，m表示事件下包含的热门微博数。

对于热门微博情感倾向特征，本文使用Python中的snownlp进行计算，snownlp 中的sentiment模块可以对微博文本进行情感分析，其将情感分析当作二分类任务，即将微博文本分类为正向情感和负向情感，输出值为微博文本为正向情感的概率，本文将此概率作为微博文本的情感值。但原始的sentiment模块是由电商评论数据进行训练的，对微博文本数据的适用性较差，因此，本文使用weibo_senti_100k数据集[31]对sentiment模块进行重新训练，weibo_senti_100k 数据集实际包含近12万条带情感标注的微博数据，其中分别包含正向情感和负向情感微博各近6万条。在实验过程中发现，snownlp在评论内容和转发内容这种短文本数据集上的情感分析表现较好，但在微博文本这种相对较长的文本数据集上表现很差，因此，本文根据微博文本中的“。”“；”“？”“！”“～”和空格符号，将每条微博文本划分成若干短句，使用sentiment模块计算每个短句的情感值，将每条微博文本中的若干短句的情感值求和后取均值，作为微博文本的情感值，如等式（4）所示：

其中，w i表示微博i的情感倾向，senti(t ij)表示微博i中的第j个分句的情感值，m表示微博i中的分句个数。

3.2.4 传播特征

根据社会燃烧理论，社会助燃剂包括受众的非理性“站队”、舆论攻击等，因此，本文将受众表达是否理性的因素纳入舆情反转预测模型的特征体系。将传播特征划分为热门微博转发数、评论数、点赞数、评论和转发时效性、评论和转发内容情感倾向。本文将热门微博评论和转发时效性定义为每条微博自发布起1小时内获得的评论数和转发数。使用weibo_senti_100k 数据集重新训练过的snownlp中的sentiment模块，对微博评论和转发内容进行情感分析，将每条微博的所有评论情感值和转发情感值分别求和并取均值，作为微博的评论情感倾向和转发情感倾向特征值，如等式（5）和等式（6）所示：

其中，com_senti(i)和repo_senti(i)分别表示热门微博i的评论情感倾向和转发情感倾向，senti(comij)和senti(repoik)分别表示热门微博i中第j条评论和第k条转发的情感值，p和q分别表示热门微博的评论数和转发数。

3.3 舆情反转预测模型的构建

舆情反转预测本质上属于分类问题，即把样本分为反转和未反转两类。逻辑回归（Logistic Regression，LR）[32]、决策树（Decision Tree,DT）[33]、随机森林（Random Forest,RF）[25]、XGBoost[34]、高斯朴素贝叶斯（Gaussian Naive Bayes,GNB）[35]是目前常用的且性能较好的分类预测方法。因此，本文分别基于以上五种机器学习方法构建舆情反转预测模型。模型的输入为X i（x1,x2,x3,x4,…,x n），其中X i表示样本微博i，x1,x2,x3,x4,…,x n表示样本微博i的特征值。因为模型的输入必须为数值型变量，所以需要对特征值中的文本型变量进行编码。其中，使用pandas的.get_dummies函数对分类变量进行独热编码，编码之后返回一个稀疏矩阵，每一列是一个特征中的一个类别，含有该类别的样本表示为1，不含有的表示为0；对于有序变量，本文采用人工编码的方式，将每个特征中的类别依次转换为[0，1，2，3…]。模型的输出Y∈（0,1），其中0表示舆情不发生反转，1表示舆情发生反转。采用五折交叉验证的方法对舆情反转预测模型进行训练和评估，五折交叉验证是指将原始数据集随机划分为5份，每次选择其中4份作为训练集，剩余1份作为测试集，交叉验证重复5次，可以有效避免过拟合和欠拟合发生。用准确率（accuracy）、精确率（precision）、召回率（recall）、F1值、AUC 值作为评估指标。其中，准确率是指所有预测正确的样本占总样本的比例，如等式（7）所示；精确率是指所有正确预测为正的样本占全部预测为正的样本的比例，如等式（8）所示；召回率是指正确预测为正的样本占实际为正的样本的比例，如等式（9）所示；F1是用来衡量精确率和召回率的值，是两个值的调和均值，如等式（10）所示；AUC是ROC 曲线下的面积，ROC 曲线是以假正率为横轴和真正率为纵轴的曲线。

3.4 特征重要性排序

特征重要性是指每个特征对于最终的预测性能提高的贡献大小，特征的贡献越大则越重要。 XGBoost是常用的特征重要性分析方法[36]，是在GBDT（Gradient Boosting D ecision Tree）算法基础上进行改进的算法，其核心思想是不断地添加树，每添加一棵树就是学习一个新函数，去拟合上次预测的残差。当训练完成得到k棵树，预测一个样本的分数时，就是根据样本的特征，将每棵树中特征所落到的叶子节点的分数相加即为该样本的预测值。本文选择XGBoost计算特征重要性，根据树分裂前后目标函数的减少情况，即增益（gain）来衡量每个特征的优劣。增益计算公式如等式（11）所示：

4 实验研究

4.1 数据采集

本文对反转事件和非反转事件的选取遵循以下标准：第一，根据人民网、央视网新闻、观察者网等各大权威网站的“反转事件盘点”中认证的反转事件，以及专业领域核心期刊中舆情反转相关学术论文所选取的反转事件和非反转事件，对本研究中的事件样本进行初步选取。第二，根据本文2.2节中给出的舆情反转定义并借助舆情分析平台上的分析报告，对事件属于反转或非反转事件进行进一步判定。最终，本文选取了2017—2020年间的38 个热点事件，其中19 个为反转事件，19个为未反转事件。本研究以新浪微博热点事件话题下的热门微博为研究对象，以各事件阅读量最大的微博话题词条进行搜索，若话题词条被删除但关键词搜索结果较准确，则以被删除的话题词条为关键词进行搜索。 38个事件及其话题词条或关键词如表3所示。选择微博话题内的“热门”微博，使用集搜客爬虫软件（https://www.gooseeker.com/）爬取热门微博数据和用户数据，经删除无关、冗余微博后，共获得346745条数据。其中反转事件微博、用户、评论和转发数据共174701条，未反转事件微博、用户、评论和转发数据共172044条。

表3 2017—2020年38个热点事件

4.2 特征重要性排序

为判断各个特征对舆情反转预测的影响，本研究采用XGBoost算法计算特征重要性得分，并对特征进行重要性排序，去除重要性为0的特征后，特征重要性排序的结果如图2所示。实验结果显示，信息平衡性、事件曝光者类型和事件类型对舆情反转预测的影响最为显著。

事件特征方面，本研究发现，事件类型（重要性0.1089）特征对舆情反转预测较为重要，这与江长斌等[23]的研究有相似之处。而本研究提出的信息平衡性（重要性0.5902）、事件曝光者类型（重要性0.1107）特征对舆情反转预测的影响最为显著，以往研究都忽略了这两点。信息平衡性方面，实验结果显示，19个反转事件中，仅包含1方说法的有7个，包含2方说法的有12个，无包含3方及以上说法的反转事件；19 个未反转事件中，仅包含1方说法的有1个，包含2方说法的有6个，包含3方及以上说法的有12个。结果表明，报道所包含的发声方越少，舆情越容易发生反转，媒体在发布事件报道时应采纳事件相关的多方说法，构成新闻事实的基本面，达到信息平衡，客观全面地传达事件概况。事件曝光者类型特征中，事件当事人（重要性0.1058）重要性最高，其次为主流媒体（重要性0.0034）和普通群众（重要性0.0015），由事件当事人主动曝光或者由普通群众曝光的热点事件需严格审查所曝光信息的真实性，而主流媒体曝光的事件发生反转的概率相对较低。王楠等[8]研究发现，刻板印象特征与舆情反转相关性较大，本研究从事件类型、事件主体阶层标签和事件结果三个方面进一步揭示了刻板印象对舆情反转的影响。在所有热点事件类型中，社会道德（重要性0.0614）和事故灾害（重要性0.0005）重要性相对较高。社会道德类事件发生反转的概率最高，而事故灾害类事件不易发生反转。事件主体阶层标签（重要性0.0043）和事件结果（重要性0.0029）特征均低于上述三个事件特征，其中事件主体阶层标签中职业群体（重要性0.0029）、不特别针对某类人群（重要性0.0011）和自然弱势群体（重要性0.0003）较重要，女性、儿童等自然弱势群体和医生、教师等职业群体是公众较关注的敏感群体，当涉及到此类敏感群体的时间发生时，公众易凭借自己的刻板印象在未全面了解事件之前先行作判断，随着后续补充信息的加入极有可能发生舆情反转。事件结果特征中，生命健康损失（重要性0.0029）较重要，涉及到生命健康损失的舆情事件发生反转的概率低。

用户特征方面，研究发现，用户关注数（重要性0.0028）特征相对重要，现有研究中未提及这一点。本研究反转事件中的用户平均关注数为1397，而未反转事件中的用户平均关注数相对略高，为1490。

信息特征方面，本研究提出的信源数量（重要性0.0908）特征对舆情反转预测最为重要，此外，使用本文提出的定量化计算方法得出的首发热门微博时效性（重要性0.0714）、热门微博时效性（重要性0.0415）、议程设置度（重要性0.0211）均为重要特征，表明热点事件发生后，媒体为争夺话语权，盲目追求时效性，可能在未全面了解事件之前就向公众发布大量的、雷同的、不准确甚至有误导性的信息，导致事件发生之初舆论一边倒，事件真相还原之后发生舆论反转。首发热门微博信息结构特征中，文本+视频（重要性0.0007）特征较重要，这与江长斌等[23]的研究结果有相似之处。热点事件微博中，纯图片和纯视频这两种信息结构较少，而纯文本易伪造且没有其他模态的信息佐证，可信度较低，图片信息相比于视频信息较片面，容易导致公众断章取义，视频信息能相对全面地向公众展示事件的过程，还原事件真相。热门微博情感倾向（重要性0.0009）、热门微博影响力（重要性0.0002）、热门微博长度（重要性0.0001）特征也具有一定重要性，但重要程度较低。

传播特征方面，以往研究大多忽略了转发评论区的相关特征，本研究发现，热门微博转发数（重要性0.0002）、评论数（重要性0.0002）以及本文提出的热门微博转发内容情感倾向（重要性0.0002）和评论时效性（重要性0.0001）特征对舆情反转预测较为重要。舆情反转事件与未反转事件相比，其传播规模往往更大，公众在面对突发事件时，不应急于发表自己的言论，而应尽量全面地了解事件，客观地评价事件，维护良好的网络生态环境。

4.3 舆情反转预测模型构建与评估

根据3.2 节提出的舆情反转特征体系和3.3节的舆情反转预测模型构建方法，基于逻辑回归、决策树、随机森林、高斯朴素贝叶斯和XGBoost构建热点事件情境下微博舆情反转预测模型。根据3.2节中的特征值计算方法计算每条微博的特征值，通过舆情反转预测模型对每条微博中所报道的热点事件是否会发生舆情反转进行预测，采用五折交叉验证的方法对模型性能进行评估。各预测模型的评估结果如表4 所示，加粗的数值表示该列的最大值。实验结果显示，基于XGBoost和随机森林的舆情反转预测模型表现较好，XGBoost在精确率上表现最好，即擅长准确地发现舆情反转事件；随机森林在召回率上表现最好，即擅长找出大部分舆情反转事件。因此，可将XGBoost和随机森林作为本文构建舆情反转预测模型的主要算法。基于决策树的预测模型的准确率和精确率仅次于基于XGBoost的预测模型，分别达到0.9103 和0.8889，其召回率、F1值和AUC 值次于基于随机森林的预测模型和基于XGBoost的预测模型，分别达到0.9095、0.8979和0.9103。此外，基于逻辑回归的预测模型效果次于上述三个模型，基于高斯朴素贝叶斯的预测模型表现最差。

表4 舆情反转预测模型评估结果

5 结论

本文针对热点事件情境下微博舆情反转预测问题，从事件特征、用户特征、信息特征、传播特征四个方面构建了包含30个特征的特征体系，分别基于逻辑回归、决策树、随机森林、XGBoost和高斯朴素贝叶斯五种机器学习方法构建了舆情反转预测模型，采用五折交叉验证方法对模型效果进行评估。实验结果显示，基于XGBoost和随机森林的预测模型综合表现最好，分别在精确率和召回率上取得最高值。使用XGBoost计算特征预测模型的重要性并进行排序，结果显示，信息平衡性、事件曝光者类型、事件类型、信源数量、首发热门微博时效性、热门微博时效性、热门微博议程设置度、事件主体阶层标签、事件结果等特征均对舆情反转预测有较重要的作用。本文在已有舆情反转特征的基础上，提出了议程设置度、信息平衡性、热门微博时效性、评论时效性、事件曝光者类型等特征，并证明了这些特征对于舆情反转预测的有效性，补充了现有的舆情反转预测特征体系；同时也为应急管理部门及时发现可能会反转的热点事件提前进行舆论引导，为维护健康的网络生态环境提供方法支持。

通过分析对舆情反转预测有重要影响的特征，本文根据研究结果从媒体、公众和平台三个方面提出以下建议：

（1）媒体方面。第一，媒体应保证报道内容的信息平衡，从事件相关的多方收集信息，构成事实的基本面，避免信息偏倚，客观、全面地向公众传达事实概况。第二，在事件发生之初，固定时间窗口内，信源数量多，首发热门微博时效性和热门微博时效性强，均表明媒体在事件发生之后的短时间内便对事件进行快速报道，争夺话语权和阅读量，忽视报道内容的质量。媒体报道应先尽量了解事件全貌，将现有的信息准确、全面地传达给受众，以内容质量为导向而非话语权和阅读量，将质量置于流量之上，提高自身公信力。第三，媒体应合理减弱有意识的议程设置，媒体报道的内容应该符合了解到的实际情况，而非相互复制粘贴，导致舆论场被高频率更新的海量雷同信息淹没。第四，媒体报道应该客观公正，尤其在事实模糊时应向公众传达客观的信息，引导公众理性思考，避免带有明显舆论倾向的观点煽动公众情绪。

（2）公众方面。第一，面对突发事件，公众应理性、客观地思考，尽量从主流媒体处获取事件信息，对非官方来源的消息需谨慎对待。造成生命健康损失的事件舆情反转倾向较低，但由事件当事人或普通群众曝光的涉及到教师、医生等职业或弱势群体的社会道德类事件的舆情反转倾向较高，公众应提高识别能力，避免因刻板印象而在事实未明之前草率作出判断。第二，有图不一定有真相，主观且易造假的文字描述和片面的图片均具有很强的误导性，公众应提高辨别能力，对于没有证据的文字以及模糊不清、无前因后果或有明显编辑痕迹的图片乃至视频均需提高警惕。第三，理性分析事件缘由，耐心观察事件进展，了解事件全貌，不急于“站队”发表评论甚至实施网络暴力，不轻易转发扩散真假不明的信息，在舆情传播阶段减少包括对事件主体的污名化和对社会秩序的破坏等在内的负面影响。

（3）平台方面。各类社交媒体平台成为当今主要的舆论发酵场所，平台应该主动承担维护网络舆论环境和谐文明健康发展的责任。第一，谨慎推广非官方来源的具有较强争议性的信息，提高热点事件中官方信息的曝光度和覆盖量。第二，对于平台账号管理适当引入奖惩机制，引导平台上各类型媒体和普通用户加强对自身发表内容的质量把控，一定程度上弥补新媒体中“新闻把关人”的缺失，提升平台上发布内容的规范性。第三，社交媒体平台可实行用户实名制措施，责任明确到个人，减少网络匿名化给予用户的保护伞和侥幸心理。

本研究的不足之处在于，将舆情反转事件默认为全部由信源失真所导致，并从这一角度构建舆情反转预测特征体系，但实际中仍存在部分如“格斗孤儿”这类不存在信源失真，而是因为议题事件本身存在极大争议，舆论倾向在争议过程当中发生移动最后趋于稳定的舆情反转事件。未来工作中将考虑到舆情的动态演化性，纳入时间因素，提高舆情反转预测的准确性。

致谢: 感谢图书情报国家级实验教学示范中心为本研究提供的实验支持!