公共卫生事件中社会情绪的时空分析方法
——以新冠疫情事件为例
2021-12-08曹天阳,张雪英,怀安
曹 天 阳,张 雪 英,怀 安
(南京师范大学虚拟地理环境教育部重点实验室/江苏省地理信息资源开发与利用协同创新中心,江苏 南京210023)
0 引言
情绪是个体对外界刺激表现的主观意识的体验和感受,具有心理和生理反应特征[1]。情绪的结构研究多从分类取向[2-4]和维度取向[5-7]展开,认为情绪具有几种彼此独立的类型,各类情绪在几个基本维度上高度相关。社会情绪是一种宏观层次的情绪,可视为社会成员之间相互作用形成的、在较大范围(甚至全社会)内较一致的情绪体验[8]。公共卫生事件传播过程中易产生带有群体性和传染性的恐慌、忧虑、无助等负面情绪[9],不仅会削弱人们的身体抵抗力和心理免疫力,而且会威胁社会的稳定[10]。面对突发公共卫生事件强变异、易感染、难控制等特点,积极有效的社交媒体信息有利于降低风险感知,减少恐慌和非理性行为[11,12]。
由于社交媒体的公开性、交流性和参与性,微博[13]、Twitter[14]、新闻事件库[15]等社交媒体数据成为社会情绪研究重要的信息源。在文本情绪计算方面,情感词典[16]、机器学习[17]和情感分析工具[18]是提取情绪的主要方法;在文本分析方面,主要从关注热点挖掘、空间分析、情感分析等维度分析事件的演化特点,如通过关键词提取[19]、主题挖掘[20]等方法提取热点信息,通过空间自相关分析[21]、冷热点分析[22]探讨空间分布特性,通过时间序列[16]、空间特征[23]分析社会情绪的演化特征;在舆情影响因素分析方面,研究者发现用户行为选择[24]、意见领袖发言[16]等是影响舆情传播的主要因素。已有研究从多方面进行了积极探索,但仍存在如下不足:情绪粒度较粗且类型内部没有区分度;常用单一情绪类型表达文本,而情绪具有不可叠加性和复杂性,单标签的分类结果无法全面反映真实情绪;多侧重于单一时序层面的时空分析,缺少从事件演化的视角探讨情绪变化态势。因此,本文将社会情绪分为7种类型,并将情绪强度分为3个等级,实现“七类三级”的细粒度划分;通过综合分析语义规则的影响构建情绪计算模型,为尽可能还原文本全部情绪,提出基于单篇文本提取7种情绪类型的方法;以新冠疫情事件为例,将事件演化分为6个阶段,深度挖掘社会情绪的时空变化特征。
1 基于文本的社会情绪计算
本文提出“七类三级”的社会情绪分类体系;综合考虑句法规则对情绪表达的影响,构建涵盖情绪类型、情绪强度的基础情绪词典、程度副词词表和否定词词表的多维情绪词典;在经过分词、去停用词、分句等预处理后,利用规则与情绪词典相结合的方法提取单篇文本中7种情绪类型及其情绪强度等级,具体示例如图1所示。
图1 基于文本的社会情绪类型及其情绪强度等级计算示意Fig.1 Schematic diagram of text-based social emotion type and emotion intensity level calculation
(1)社会情绪分类。参考“愉悦度—唤醒度”二维情绪模型[5],选择情绪类型和情绪强度作为描述维度:将社会情绪的“愉悦度”分为乐、好、怒、哀、惧、恶、惊7种类型,同时参考Plutchik的情绪三维模型[6],按照“唤醒度”数值将情绪强度分为高、中、低3级,即“七类三级”。
(2)情绪词典构建。本文以大连理工大学的《中文情感词汇本体库》作为基础情感词典[25],该词典将情绪划为7大类,情感强度分为5级,每个情感词均有对应的情感类型和强度;综合考虑句法规则对情绪表达的影响,选择知网HowNet词库的《中文程度级别词语》构建程度副词词典,并将程度副词分为4个级别[26],强度取值范围为[0,2];从《现代汉语词典》和《现代汉语副词研究》中选取53个否定词构建否定词词典[27],强度取值为-1;选取数据集中出现频率最高的60 个表情符号构建表情符号词典,使用点间互信息算法[21]确定情绪类型和强度,以扩充基础情绪词典。
(1)
Sk=∑Senk
(2)
式中:k∈{1,2,3,…,7},代表乐、好、怒、哀、惧、恶、惊7种情绪;αik、βik分别为k类型情感词的强度和修饰该情感词的程度副词强度;n为否定词数量;N为情感词数量。
2 实验数据与研究时段
微博的开放性、实时性使其成为人们生活中交流信息、表达观点的重要平台。本文选择“疫情”“新冠”为关键词,采集2020年1月17日-5月31日和2021年1月1日-2月28日期间我国34个省级行政区微博数据,每条数据包含用户名称、发文内容、发文时间、文本链接。通过jieba分词、去除停用词等预处理对采集的文本数据进行清洗,并以文本形式存储,最终获得271 855条文本。
在危机传播理论中,事态发展一般可分为征兆、高峰、持续、恢复4个阶段[28]。根据新冠疫情事件期间每日新增确诊人数变化情况以及2021年出现反弹的特殊情况,将该事件划分为征兆、高峰、持续、恢复、复发、平稳6个阶段(图2)。各阶段具体划分如下:1)2020年1月17日-1月26日为征兆阶段,此时疫情讨论度和确诊人数逐渐增多,每日新增确诊人数低于1 000人;2)2020年1月27日-2月18日为高峰阶段,1月27日全国单日新增新冠肺炎确诊病例首超1 000例;3)2020年2月19日-3月9日为持续阶段,2月19日全国新增确诊人数明显下降;4)2020年3月10日-5月31日为恢复阶段,3月10日之后各省域逐步复工复产,5月31日新增确诊人数下降至个位数且变化平稳;5)2021年1月1日-1月26日为复发阶段,确诊人数不断增加;6)2021年1月27日-2月28日为平稳阶段,新增确诊人数出现明显下降,2月28日新增确诊人数降为个位数且变化平稳。
图2 演化阶段划分Fig.2 Division of evolutionary stages
3 社会情绪变化的时空特征分析
3.1 时间变化特征
以6个阶段为固定时间间隔,统计各阶段各类情绪的文本数量,研究社会情绪的阶段特征;计算各阶段“七类三级”情绪的占比(图3,彩图见附录3),将两相邻阶段中同类型同强度等级情绪占比相减,分析社会情绪的变化情况(图4)。
图3 各阶段社会情绪占比Fig.3 Proportion of social emotions in each stage
如图3和图4所示,不同情绪类型的变化情况存在差异性和相似性。高峰阶段中“好”情绪占比大幅增加,“乐”情绪占比大幅减少,而复发阶段“好”情绪呈下降态势,“乐”情绪有所增加。新冠疫情引发群体性恐慌使“乐”情绪下降,而政府机构大力推进疫情科普、持续鼓舞全国人民,“好”情绪增加,虽然两种情绪均可归为正倾向,但并非同步变化。“恶—哀”“恶—怒”“怒—哀”等负倾向情绪组合在各阶段的变化较一致。结合疫情防控期间相关事件,对社会情绪的变化进行分析:
图4 两相邻阶段各类社会情绪的百分比差异Fig.4 Percentage difference of various social emotion in two adjacent stages
(1)及时发布权威信息能降低公众的负面情绪。面对突发的疫情,民众第一心理反应是恐慌、焦虑,征兆阶段中“惧”情绪占比较高。政府机构迅速通过社交媒体积极引导舆论,“中国有信心打赢新冠肺炎疫情攻坚战”“武汉加油”等话题登上热搜,民众战胜疫情信心大幅增强。疫情最严峻的高峰阶段,“好”情绪占比大幅提升,“惧”情绪占比显著降低,负面情绪逐渐转变为对防疫行动的赞美和支持。
(2)事件是影响社会情绪变化的重要因素。疫情得到基本控制后,社会情绪由激昂变平缓,正向情绪占比下降。积极报道疫情防控工作虽能有效缓解恐惧,但民众对部分防控疫情措施漏洞存在不满情绪、对违反疫情条例擅自行动人员存在谴责情绪,“恶”情绪持续发酵,在持续和恢复阶段不断增加。因此,政府机构除及时发布权威疫情信息减轻民众恐惧外,建立完善、透明的应急机制并及时处理违反条例的事件也十分重要。
(3)周期性事件中社会情绪波动程度具有相似性和差异性,社会情绪的波动受民众认知的影响。2021年初疫情出现复发态势,复发阶段各类型情绪占比情况与征兆阶段相似。但由于第二轮疫情袭来时民众对新冠疫情已有基本了解,此时应急机制和抗疫行动更迅速、高效,民众的负面情绪得到迅速释放。
3.2 空间分布特征
本文以省级行政区划为基本统计单元,6个演化阶段为固定时间间隔,对新冠疫情事件中“好”情绪占比采用自然断点法划分(图5)。从图5可以看出,相邻省域社会情绪相似,如新疆、西藏、青海等西北地区以及湖南、江西、广东3个相邻省域社会情绪时空相似性较高。“好”情绪占比高低与当地疫情严重程度有关,确诊人数较低的省域(新疆、内蒙古、甘肃等)“好”情绪占比相对较高。从征兆阶段到恢复阶段湖北确诊人数大幅减少,“好”情绪占比逐渐上升;在恢复阶段,多数省域疫情得到控制,但广东、内蒙古等受境外输入病例影响,“好”情绪占比下降;复发阶段河北、北京等北方省域疫情形势严峻,“好”情绪占比偏低。
注:审图号为GS(2020)4619号,下同。图5 全国各省域“好”情绪类型时空分布Fig.5 Spatiotemporal visualization of "good" emotion in different provinces of China
为揭示新冠疫情事件中社会情绪的空间演化规律,按事态发展顺序将各省域相邻阶段中同类型情绪相减,得到7种情绪的时空变化特征(图6,彩图见封3)。从图6可以看出,各省域正向情绪变化存在共性,变化趋势较一致。在高峰阶段和平稳阶段,多数省域“好”情绪占比呈增加趋势,在复发阶段占比下降;“乐”情绪占比在高峰阶段减少,在疫情得到控制后的恢复阶段和平稳阶段,各省域“乐”情绪占比逐步上升;新冠疫情从蔓延到得到控制期间,“好”情绪逐渐减弱,“乐”情绪逐渐增多。负向情绪易受当地事件影响,同一阶段不同省域情绪表现不同。在高峰阶段,河南因“硬核防疫”被民众称赞,负向情绪占比较低,同阶段其他确诊人数较高的省域“哀”“恶”情绪呈正增长;在持续阶段,山东因“山东任城监狱发生新冠疫情”“山东对从日韩等国入境人员的隔离措施”等负面事件引起民众强烈谴责,“恶”情绪占比升高;在恢复阶段,民众因“郭某鹏返乡”案件对河南防控疫情措施存在质疑和不满,相比其他省域,河南“恶”情绪占比明显提高。
注:数值为前后两阶段各情绪类别的百分比差异,数值正/负表示情绪占比增加/减少。图6 各种社会情绪的时空变化特征Fig.6 Temporal and spatial change characteristics of various social emotions
3.3 周期性对比分析
2021年初国内新冠疫情有所反复,确诊人数逐渐攀升。为研究两轮疫情的异同,分别将复发阶段和平稳阶段与前4个阶段同情绪类型占比相减(图7)。对比分析可知,第二轮疫情来临时负面情绪受新冠疫情冲击减弱,经过持续、广泛、大力科普,民众对新冠已有一定了解,复发阶段中恐惧情绪明显改善,相比征兆阶段“惧”情绪占比明显降低。2021年防疫管理机制和基础建设更完善,“恶”“怒”情绪占比降低。与2020年相比,同样在春节期间,征兆阶段和高峰阶段民众在担惊受怕中度过,平稳阶段和复发阶段民众心态更加积极、乐观,“乐”情绪占比明显提高。社会情绪依赖个人经验对风险做出评估,而风险感知的强弱往往会影响其行为表现。当再次面临疫情,民众已有积极的风险感知和应对行为,负面情绪的消除速度更快。
图7 复发和平稳阶段与前4个阶段社会情绪对比Fig.7 Comparison of social emotion between relapse or stable stage and the first four stages
4 社会情绪变化的事件因素驱动分析
事件是影响社会情绪变化的重要因素,疫情防控期间发生了一系列关键节点事件,如“华南海鲜市场查封”“武汉封城”。从89个重要的疫情相关事件和微博热门话题中选择影响力值较大的12个节点事件(表1)进行分析。为避免7种情绪相互抵消,分别计算每日7种情绪的占比,再分别统计整个节点事件中各情绪占比之和作为该节点事件对社会情绪的总影响力值,总影响力值越大,说明当前节点事件对当前社会情绪的影响力越大。针对影响力排序为1-12的节点事件,按其发生的时间顺序,选择占比较高的乐、好、哀、惧、恶5类情绪制图(图8),探讨节点事件在突发公共事件中对社会情绪的影响。
图8 12个节点事件对各类社会情绪影响力对比Fig.8 Comparison of the influence of 12 node events on various social emotions
疫情防控期间,政府各部门及时更新抗疫动态、高度赞美抗疫战士,各节点事件中“好”为主导情绪,其他4类主要情绪变化存在差异,随着时间推移,“恶”情绪逐渐成为事件的次主导情绪。节点事件对社会情绪的影响力强度呈波动态势,征兆阶段较弱,恢复阶段最强,复发阶段影响力强度下降。统计各节点事件5类情绪中占比最大的两类情绪,并在此基础上计算低、中、高3级情绪强度占比最大的情绪。节点事件描述及其主导情绪统计结果如表1所示。
表1 节点事件描述及其主导情绪Table 1 Node event description and its dominant emotions
由表1可知,当事件能降低危害风险或起到维护社会法律、法规的作用时,民众的负面情绪能得到抑制,如“武汉雷神山医院开始筹建,国家卫健委组建的6支援鄂医疗队驰援武汉”事件中,“好”情绪类型表现为高唤醒度;当事件管控不符合民众的社会认知时,负向情绪得到强化,如“广州通报外籍新冠肺炎患者打伤护士”“澳籍华人女子返京拒隔离外出跑步”等,此类事件与社会道德良俗大相径庭,招致民众强烈谴责;积极回应公众诉求,实现政民良性互动的行为会降低民众的负面情绪,如“武汉市公安局撤销李文亮训诫书并郑重道歉,相关责任人被处理”获得民众好评,“恶”情绪强度表现为低唤醒度。
5 结论
本文以国内新冠疫情事件为例,将社会情绪分为7种类型、3个强度等级,利用句法规则与情绪词典相结合的方法,基于单篇文本提取7种情绪类型及其强度,并按照事件的发展阶段进行社会情绪的时空特征和事件驱动因素分析。研究结果表明:1)公共卫生事件中不同情绪类型的变化在时间和空间上均存在差异性和相似性。2)社会情绪依赖个人经验对风险做出评估,而风险感知的强弱往往会影响其行为表现。3)节点事件是影响社会情绪变化的重要原因。政府机构除及时发布权威信息减轻民众恐惧外,建立完善透明的应急机制并及时处理违反条例的事件也十分重要;积极回应公众诉求,实现政民良性互动的行为会降低民众的负面情绪。
本文主要采集社交媒体数据进行分析,由于社交媒体平台吸引受众群体存在差异,通过社交媒体平台获取的数据并不能准确反映社会的总体状况,研究结论普适性存在不足,未来将选取更广泛的数据源进行实证研究。