新冠疫情下的公共卫生危机信息演化特征及管理对策*
2022-11-11沈玖玖许守英
沈玖玖,许守英
(南昌大学,江西 南昌 330031)
1 引言
在信息多元化背景下,公共危机信息的治理在应对并消解突发性公共危机中发挥着重要作用,习近平总书记指出,要以信息化推进国家治理能力、治理体系现代化,用信息化手段感知社会态势[1]。新冠肺炎疫情传播速度快、范围广、防控难度大,造成了极大的社会危害,应对并消解这一公共卫生危机是对政府治理能力和治理体系的考验。在互联网时代背景下,社交媒体成为人们获取、传播信息的主要途径,且政府机构在危机期间历来注重使用社交媒体发布信息,观察公众行为和意见等[2]。官方、公众在微博等社交媒体上所关注、发布的与危机相关的信息充分反映了公共危机的演变态势。面对公共卫生危机,政府等相关信息管理部门应及时掌握危机发生的征兆,预测发展态势,提高危机信息管理能力,以便及时消解危机。
2 文献梳理
对于危机信息的概念,国外学者未有明确的界定。国内一些学者对该概念进行了讨论,如:吴建华认为公共危机信息是指公共危机管理的预防、监测、应急、恢复阶段与公共危机潜伏期、爆发期、缓解、消除过程中形成的所有信息[3];张继兰指出凡是与危机事件发生、进展、激化、结束有关的各类信息集合都可以看成是危机信息[4];吕斌认为危机信息是危机潜伏、暴发、持续、解决等一系列过程中与危机管理有关的各种信息[5]。笔者认为,吕斌对危机信息的定义概括相对更全面。因此,以下研究将采用吕斌的定义。
关于危机信息管理,国外有较多对于危机管理中的信息技术以及危机信息对于危机管理的作用的研究。如:《用于应急管理的信息技术》着重研究了应急通信系统、与自然灾害有关的信息存储与检索系统及其他信息技术应用问题[6];Nick Collin指出了危机信息管理中信息和技术管理重构的重要性[7];Graham强调了危机决策中信息的作用[8];Mitroff指出信息搜集、分析、传播是危机管理的直接任务[9];Matthew W.Seeger构建了危机信息传播的普适理论问题[10]。危机信息管理系统也是许多国家进行危机管理的重要工具,如ESI公司基于Web开发的应急信息管理系统得到了广泛利用[11]。
我国学者更多涉及对危机信息管理内容、措施、影响因素、模型的研究,如:辛立艳指出危机信息管理是对危机信息活动的各种相关因素如人、机构、信息、技术等进行科学的计划、组织、协调、控制,以实现危机信息资源的有效利用与合理开发[12];吕飞科分析我国政府公共危机信息的管理现状及存在的问题,提出了加强政府公共危机信息管理的内容和措施[13];宋君认为政府科学决策的前提是加强危机信息管理,政府危机信息的时效性、信息量的大小、正确与否将直接影响到政府决策的质量[14];王传清构建了政府危机信息管理联动系统模型架构[15];丁荣嵘研究了政府应急过程中有关于信息处理的现状并提出相关完善建议,思考了信息传播与我国政府应急信息机制改善之间的关系[16]等。
综上,目前国内外的相关研究主要涉及危机信息的内涵、危机信息管理内容、措施、影响因素、模型架构以及危机管理中的信息系统技术等方面。这些研究为危机信息管理研究的深化奠定了基础,但公共危机信息常常处于动态变化当中,因此相关的信息管理措施应当建立在充分把握危机信息演化特征的基础上,才能发挥信息对危机的干预作用。目前,相关研究缺乏对新冠肺炎疫情的危机信息演化特征的研究。因此,本文针对新冠肺炎疫情公共卫生危机的信息,分析其演化特征,并提出相应的管理对策,以帮助政府及时掌握公共卫生危机信息的发展态势,有效消解危机。
3 研究方法与技术路线
使用LDA主题模型进行主题识别、演化研究。首先,爬取数据并将其拆分为官方和公众数据,划分时间窗口并进行语料预处理。其次,确定最优主题数目并进行LDA主题建模。再次,计算主题相似度以确定主题内容演化路径并可视化,采用事后检验分析法确定主题强度演化并可视化。最后,分析主题内容、强度演化。技术路线如图1所示。
图1 技术路线
3.1 LDA主题模型
LDA是三层贝叶斯概率模型,三层分别为文档、主题、词,采用词袋模型,把每篇文档看作一个词频向量,将文本信息转化为便于建模的数字信息,可用于从大量的文档集和语料库中挖掘出潜在的主题,扩展性良好[17],且处理微博短文本的效果良好[18]。LDA认为一篇文档的构造首先以一定的概率选择某个主题,然后以一定的概率选出某个词,生成此篇文档的第一个词,不断重复,直到生成整篇文档。
3.2 主题强度、主题相似度计算方法
主题演化反映了主题变化的过程,是主题随时间逐渐改变的过程[19],包括强度、内容演化。主题强度演化是主题在时间轴上强度的变化,是活跃度的变化;主题内容演化是主题在内容上的变化,是内容的迁移。分析主题演化需要计算主题强度和主题相似度。
选用事后检验分析法计算主题强度。通过计算某一话题发生在某一时间窗口中的后验概率,用后验概率表示话题强度,进而描述话题趋势[20]。Griffiths等人[21]提出了估算后验概率的方法,首先在整个文档集上进行LDA主题建模获取所有的主题,主题t的强度由所有属于这个时间窗口的文档的平均值决定,表示为公式(1),公式中Dt表示时间窗口t中文档的数量。
基于点积余弦相似度算法计算相邻时间片主题相关词项的相似度,根据相似度确定主题演化关系与演化路径。余弦相似度的值介于0和1之间,值越大主题之间越相似。计算方法如公式(2)所示,公式中xi表示词i在主题x中的概率,yi表示词i在主题y中的概率。
4 研究设计
4.1 数据获取与时间窗口划分
在新冠肺炎疫情防控期间,政府一般通过新冠肺炎新增确诊人数的变化来观察疫情的变化情况。由图2可知,2020年我国新冠肺炎疫情相对较为严重,其前期危机起伏跌宕非常典型。因此,本文选取2020年1-8月疫情作为研究对象,并将这一阶段的疫情划分为三个阶段,即:1-2月疫情严重阶段;3-5月疫情得到了良好控制的阶段;6-8月新增确诊人数增加,疫情出现一些反复的阶段。
图2 全国新增确诊趋势图
新浪微博是我国著名社交媒体平台,日活跃用户达2.16亿[22],是公众获取和发布包含危机信息在内的各种信息的重要渠道。本文以新冠肺炎引发的公共卫生危机为研究对象,使用网络爬虫工具爬取了2020年1月1日至8月31日与新冠肺炎相关的169 034 0条微博数据,将广告等无关微博及低关注度(转发+评论+点赞<1)微博删除后,得到650 397条数据,包含361 235条官方数据、289 162条公众数据。为研究危机信息主题及其演化特征,采用先离散分析的方法,以月为时间单位将官方、公众数据分别离散到时间序列上相应的时间窗口中,共分为1-8月8个时间窗口,包含16份数据。
4.2 语料预处理
依次对各时间窗口中的数据进行简繁体转换、噪声过滤、分词及停用词过滤等语料预处理。噪声过滤主要包括对URL标识符、特殊符号的过滤。运用python程序语言调用jieba中文分词包进行分词及停用词过滤,去除数据中单个字节、数字及英文,调用pandas数据分析包将数据整理成规范格式,以便主题抽取和语义挖掘。
4.3 确定最优主题数目
主题建模前需确定最优主题数目,Perplexity指标以信息理论为基础,对模型的信息熵或概率分布进行计算,适用于度量主题模型的性能,Perplexity指标越小则训练结果越好。设置主题参数k的取值范围为1-20,调用python程序语言依次计算16份数据并得出各自的Perplexity指标曲线。以1月公众发布的危机信息的Perplexity指标曲线为例(见图3),图3中横轴代表主题参数k,纵轴代表Perplexity指标,k为8时Perplexity指标最小。因此,选取8作为最优主题参数。
图3 1月公众微博发布的危机信息的Perplexity指标曲线
4.4 LDA主题识别
运用python程序语言对语料预处理后各时间窗口的数据进行LDA主题建模,得到各时间窗口的最优主题及相关词项,各主题按主题强度由大到小依次输出,相关词项按概率由大到小依次输出,分析相关词项并做出主题标识。表1、表2为官方、公众微博发布的危机信息的主题标识。
表1 1-4月官方、公众微博发布的危机信息主题标识
表2 5-8月官方、公众微博发布的危机信息主题标识
5 公共卫生危机信息演化分析
5.1 公共卫生危机信息种类复杂
此次新冠肺炎疫情危机影响面广,所引发的危机情形复杂,包含原发性危机和次生危机,类似于一些自然灾害发生后往往引发次生灾害的现象。次生灾害是由原生灾害间接引发的灾害,如地震这一原生灾害引发的爆炸、火灾、水灾、泥石流等[23]。新冠肺炎疫情这一原发性危机同样波及交通、经济、教育等领域,引发后续交通管制、停工停产、停学等次生危机。通过对相关微博主题演化的分析,发现此次危机引发了社会各界对原发性危机和次生危机相关信息的高度关注,具体关注热点如下。
5.1.1 原发性危机信息
此次原发性危机是由新冠肺炎疫情引发的公共卫生危机,相关危机信息涉及公共卫生领域。
(1)疫情动态类信息。主要包括新冠肺炎疫情的宏观、综合、发展动向的情报,如确诊、疑似、治愈、死亡、境外输入等信息。
(2)疫情防控类信息。如封城、社区防疫等信息,有助于公众更好地配合疫情防控工作,便于疫情防控工作的实施。
(3)一线抗疫信息。如医院、医护人员、医疗、物资配备及捐赠等信息,为解决全局性、根本性和方向性问题所需,也便于制订疫情防控规划及决策。
(4)医疗卫生类信息。有关新冠肺炎疫情的微观、专题性医学情报、卫生防护类信息。如新冠肺炎症状、病毒来源、传播方式、防护手段、疫苗研发、治疗方法、核酸检测、医保等信息。这些信息大多来源于专业的医疗卫生机构,帮助公众清晰地了解肺炎相关信息、做好个人防护。
5.1.2 次生危机信息
公共卫生危机的暴发波及了交通、教育、经济等其他相关领域,产生了相关次生危机信息,包含以下信息。
(1)交通类信息。如各地交通管制情况、高速、公交、地铁等停运及重新运营等信息。疫情防控期间实行交通管制极大地影响了公众的出行,及时发布信息能有效避免交通及人群拥堵,便于疫情防控。
(2)经济类信息。包括国内外经济状况、企业生存机遇与挑战、复工复产、就业、失业等信息。疫情严重影响经济的发展,国家发改委等财政经济管理部门对经济类信息的掌握程度,关系到国家经济方针政策的制定、经济发展方向及企业的生死存亡。
(3)教育类信息。包括复学、网课、返校、高考等信息。教育乃国之大计,学生受疫情影响无法按时返校上课,尤其是高三、初三年级面临升学的压力,及时发布此类信息有助于减轻学生、家长的焦虑,使学生更好地投入学习。
(4)社会生活类信息。如春节、假期、气候、旅行、食品、谣言、治安等信息。新冠肺炎因极易传染导致各地区实行不同程度的封闭式管理,餐饮、影视等娱乐场所关闭,给社会治安、公众出行、休闲娱乐、学习、工作造成不同程度的影响。此类信息的发布有助于公众及时知晓社会生活受疫情的影响,同时及时辟谣有助于公众掌握对错,避免造成社会恐慌。
原发性危机的发生往往会引发次生危机,所产生的危机信息也是复杂多样的,涉及经济、交通、教育等多个领域,提示相关情报部门关注原发性危机信息的同时也要关注次生危机信息。
5.2 危机信息迭代产生
借助河流图对官方、公众危机信息主题强度演化进行可视化,图4中横轴代表月份、纵轴代表主题强度,不同颜色代表不同主题,颜色所占面积越大,主题强度越强。由图2、图4可知,1月公共卫生危机爆发后,次生危机也浮出水面,公众对交通次生危机信息的关注度达到最高、对社会生活类次生危机信息有所关注。2月原发性危机达到最大,交通、复学、复工主题出现,公众对交通的关注度有所下降,开始关注教育和经济次生危机信息。3月原发性危机得到有效控制,公众仍关注教育、经济次生危机信息,且社会生活类主题再次出现。4月经济、教育、社会生活类主题依然存在。5、6月存在经济、教育主题。7月教育主题消失,交通主题重新出现,此时经济主题依然存在。8月交通主题消失,经济主题依然存在,社会生活类主题再次出现。由此可知,危机信息呈现出此消彼长的迭代性特征;交通和社会生活是公众最先关注的次生危机信息;公众对交通次生危机信息在1、2、7月有所关注,且1月关注度最高,7月最低;对教育次生危机信息在2-6月有所关注,在原定开学时间2月关注度最高;对经济次生危机信息的关注时间最久,自2月持续至8月,在5月关注度最高;对社会生活类次生危机信息在1、3、4、8月均有所关注,在4月关注度最高。
图4 危机信息主题强度演化河流图
此次原发性危机的暴发引发了一系列次生危机,危机信息在时间上呈现迭代性特征;公众关注原发性危机信息的同时也会关注次生危机信息,首先关注了交通和社会生活类信息,后又关注了教育和经济类信息;公众对交通、教育、社会生活、经济次生危机信息分别在1、2、4、5月关注度最高,对经济次生危机信息的关注时间最久。
5.3 危机信息主题内容演化
基于点积余弦相似度算法计算相邻时间片主题相关词项的相似度,得到主题相似度矩阵,用以确定主题演化关系与演化路径。将0.3设置为相似度阈值。当相邻时间窗口主题间相似度大于0.3时,主题之间是相似的,存在演化关系,根据演化关系确定主题演化路径并借助桑基图对其可视化,如图5、图6所示。图中1-8行代表时间窗口1-8月,数字对应月份,各节点对应时间窗口中的主题,相邻时间窗口之间的灰色连线表示主题间的演化关系。不同时间窗口主题之间连线越粗,相似度越高,主题演化路径可以显示出公众关注点的迁移。
图5 官方微博发布的危机信息主题内容演化桑基图
图6 公众微博发布的危机信息主题内容演化桑基图
5.3.1 主题内容演化
因数据预处理时已删除低关注度微博,所以官方发布的信息也是公众关注的信息,本文在此基础上分析疫情各阶段的主题内容演化。
在疫情严重阶段,公众对疫苗研发、疫情动态与防控、病毒来源与检测、疫情防护、知识科普、抗疫一线、防疫物资等疫情基本信息的关注度较高,对武汉封城、交通、春节假期、复工、复产、复学、寻找感染者同车厢乘客等有所关注。此外,疫情暴发后公众找寻对抗新冠病毒的方法,对双黄连能否抑制新冠病毒有较高的关注度。
在疫情有效控制阶段,疫情基本信息的被关注度降低,其他信息的被关注度上升。如3月心理健康主题出现,说明疫情对公众造成了心理上的伤害;经济主题自3月持续到8月,可见公众对经济的持久关注;此时期复工主题依然存在并持续到了4月,复学主题持续到了6月。4月新生主题有清明节、输入性病例、联防联控机制。5月公众对核酸检测能否通过医保报销有所关注,同时出现的新生主题还有连花清瘟用于新冠肺炎治疗、新冠疫苗研发结果。
在疫情反复阶段,经济、复学等主题依然被关注,新生主题显示疫情基本信息再次被广泛关注,关注强度呈回升态势,表明疫情有所反复。如6月国家医保局发布了将核酸检测纳入医保报销范畴后,核酸检测与医保主题出现;北京海鲜市场三文鱼事件使得疫情严峻,北京应急级别调整主题出现。此外,新生主题还有疫情新发地、抗体研究取得重大突破。7月出现了核酸检测耗材需求增长、全球抗疫两个新生主题。8月进口冷冻海鲜检测出新冠病毒,冷冻海鲜事件主题出现。此外,新生主题还有新冠疫苗专利、大连确诊患者出院、“三下乡”等。
总体来说,1-8月公共卫生危机引发了社会生活、经济、教育、交通、心理、药物和疫苗研发等一系列问题。公共卫生危机信息主题内容随危机的变化而变化:疫情严重阶段公众对疫情基本信息的关注度较高;疫情有效控制阶段公众对疫情基本信息关注度降低,对次生危机信息关注度上升;疫情反复阶段公众对疫情基本信息关注度回升,且此时期的新生主题也体现了疫情的反复。
5.3.2 危机信息主题内容契合度
基于点积余弦相似度算法计算公众和官方在同一时间窗口中主题相关词项的相似度,得出官方、公众危机信息主题相似度,分析可知公众、官方发布的危机信息主题相似度较低,主题内容演化存在如下差异:①公众1-8月始终关注全球疫情动态,但官方发布的危机信息中未形成相关主题;公众对双黄连能否抑制新冠病毒存在较大的争议,但官方未形成有关双黄连的主题;公众对连花清瘟能否用于治疗新冠肺炎存在较大的疑惑,但官方未形成相关主题,发布信息过少;公众对疫情期间“三下乡”也有所关注,但官方未形成相关主题;此外病毒来源、疫情知识科普、武汉封城、清明节、输入性病例、全球抗疫、核酸检测耗材需求增长等主题也仅存在于公众发布的危机信息中。②公众发布的危机信息中经济主题存在于3-8月,但官方的经济主题仅存在于8月,对经济类信息发布较少。公众与官方发布的危机信息在主题内容方面存在较大差异,契合度较低,可能存在未满足公众信息需求的现象。
5.4 危机信息主题强度演化
基于事后检验分析法计算各时间窗口中主题的强度并借助河流图对主题强度演化可视化,如图7、图8所示。
图7 官方发布的危机信息的主题强度演化河流图
图8 公众发布的危机信息的主题强度演化河流图
主题强度演化河流图显示,1-8月官方发布的危机信息各主题的强度变化均较大,各时间窗口不同主题间强度差异较大;公众发布的危机信息各主题在1-4月强度变化较大,各时间窗口不同主题间强度差异较大,而5-8月各主题的强度差异缩小,趋向于稳定。图7、图8显示疫情动态、疫情防控一度成为各时间窗口中主题强度最大的主题,疫情动态的主题强度展现出逐渐升高、下降、再逐渐升高的趋势;疫情防控的主题强度与各主题相比始终较大,表明了公众对疫情防控工作的高度配合。此外,毒株分离、双黄连抑制新冠病毒、北京应急级别调整、大连确诊患者出院分别成为其他时间窗口中主题强度最大的主题。
由图7、图8对比可发现,官方和公众在主题强度方面差异较大,官方、公众主题强度最大的主题除4月皆为疫情防控外,其他各月均存在差异,1月公众主题强度最大的为毒株分离,官方为疫情防控;2月公众为双黄连抑制新冠病毒,官方为疫情防控;3月公众为疫情防控,官方为疫情动态;5-8月公众发布的危机信息强度最大的主题皆为疫情动态,官方分别为疫情防控、北京应急级别调整、疫情防控、大连确诊患者出院。可见,官方、公众在主题强度方面存在差距、契合度较低。
总体来说,公共卫生危机的暴发引发了一系列次生危机,进而引发公众对原发性危机信息的关注延展至对次生危机信息的关注,所产生的公共卫生危机信息种类复杂且在时间上呈现迭代性的特征。官方、公众发布的危机信息在主题内容、强度方面存在着步调不够一致的现象,契合度较低。
6 新冠疫情下的公共卫生危机信息管理建议
从研究结果看,伴随此次新冠肺炎疫情危机产生的危机信息,涉及医疗卫生领域乃至交通、经济、教育、社会生活等多个领域,呈现此消彼长的态势。公共卫生危机信息管理涉及多层级、多区域、多领域、多人群、多需求,面对复杂的公共卫生危机信息和次生危机信息,不仅需要政府组织内部多个部门的配合处理,也需要社会各方面力量的支持、参与和公众的信息反馈,应坚持多主体协同的思想,从内在联系、动态发展、系统和全局的角度进行危机信息管理。协同理论是政府部门与其他非政府利益相关主体合作,运用相对正式的机制,针对特定类型的社会问题进行协商、互动、共享、决策和共同行动,最终实现治理效果优化,对于危机信息管理系统的构建具有较强的实用性。基于此,本文构建了由政府(应急管理部门、卫生健康管理部门、公安部门、交通运输部门、教育部门、财政部门……)的信息管理部门、专业机构(医疗卫生机构、经济研究机构、教育研究机构、交通研究机构、心理机构、专家知识库……)的信息管理部门、社区、媒体构成的多元主体协同合作的公共卫生危机信息管理系统(图9),通过主体的协同合作收集、处理、存储、传播和利用危机信息,以实现对原发性危机信息和次生危机信息的良好管理。
图9 新冠肺炎疫情下的公共卫生危机信息管理系统
在此系统中,政府部门中应急管理部门和卫健委的信息管理部门、医疗卫生机构的信息管理部门和社区信息管理部门通过信息收集、处理监测公共卫生危机信息,当未发现公共卫生危机信息时,继续进行常态化监测;当发现时,需将其及时上报应急管理部门,以便政府及时掌握危机的发展趋势,并由应急管理部门决定是否发布危机预警和信息公开。在确认危机存在后,应急管理部门和卫生健康管理部门的信息管理机构、医疗卫生机构的信息管理部门需做好危机信息的收集、处理、存储、传播、利用。在此过程中,如果发现次生危机相关信息则需及时通过信息共享通道,将其共享给次生危机相关部门及专业机构,如交通运输部门、教育部门、公安部门等的信息管理机构和交通研究部门、经济研究部门、教育研究部门等的信息管理机构,由其根据危机信息的迭代性特征,适时观察和预判次生危机的发展态势,做好次生危机信息管理。公共卫生危机状态下,社区应将政府发布的相关信息及时传递到每家每户,防止谣言扩散、稳定公众情绪,落实危机信息管理工作,促进危机的尽快解决;在危机缓解和被解决阶段,社区应及时反馈危机管理、危机信息管理工作,提供管理效果评估的重要依据。媒体应充分利用官方提供的信息资源对危机信息进行有效管理和权威发布,号召意见领袖传达主流价值观、疏导公众情绪,稳定社会风气;官方和媒体也应及时挖掘、分析公众在社交媒体中发布的信息,及时掌握舆情动态,了解公众的信息需求,以便及时满足公众信息需求,解决官方和公众发布的危机信息在主题内容、强度方面步调不一致、契合度较低的问题。
7 结语
本文从宏观角度分析新冠肺炎疫情下的公共卫生危机及其衍生危机的信息演化特征,发现新冠肺炎疫情公共卫生危机的暴发引发一系列次生危机;公共卫生危机信息种类复杂且呈现迭代性特征;官方和公众发布的危机信息呈现在主题内容、强度方面步调不一致、契合度较低等一系列特征和问题。据此,笔者提出根据公共卫生危机的波动演化特点,采取相关领域共同协作的危机信息管理策略,尽可能降低危机的负面影响。不同于前人大多从微观视角研究某一具体舆情信息特征,本研究创新性地从宏观视角,呈现公共卫生危机及其引发的后续危机的相关信息的演化特征,关注到危机信息之间的关联性,为相关部门制定系统性的危机信息管理对策提供借鉴和参考。本文的不足之处在于,研究资料仅采集了新浪微博中大半年时间段的相关数据,相对于持续近三年的新冠肺炎疫情而言,数据的覆盖面和代表性方面存在局限性。后续的研究将从纵横两方面扩大数据的采集面,提高研究结论的准确性。