基于LDA-DLNB网络舆情识别的应急管理智库决策研究
2024-05-24熊励陆梦园王锟
熊励 陆梦园 王锟
摘要:[目的/意义]网络舆情信息在突发事件应对中有着不容忽视的传播影响力。完善舆论引导是中国特色新型智库的重要功能之一。做好网络舆情识别是应急管理智库提高综合研判能力的关键。[方法/过程]本文从应急管理智库建设角度出发,聚焦突发事件网络舆情信息中潜在的关键热点与情感结构识别问题,通过机器学习方法构建LDA-LDNB网络舆情信息挖掘模型,并基于突发事件网络舆情文本信息进行模型验证和实证分析。[结果/结論]本文构建的模型能很好地识别突发事件中网络舆情信息的主题、情感与演化特征,为应急管理智库提高应急管理决策服务能力提供方法支持,为构建数据驱动的应急管理智库提供新的思路。
关键词:应急管理智库 突发事件 网络舆情 文本分析
分类号:G206
DOI: 10.19318/j.cnki.issn.2096-1634.2024.02.01
1 引言
自《关于加强中国特色新型智库建设的意见》印发以来,中国特色新型智库建设得到高度重视,中国特色新型智库体系不断完善,在咨政建言、理论创新、舆论引导、社会服务等领域发挥着重要作用[1]。在过往的研究中,于志荣[2]将应急管理智库定义为“政府应急管理中的主体角色之一”,认为其在应急管理的应急预防、应急准备、应急处置以及应急恢复等4个阶段发挥重要作用。熊励等[3]将应急管理智库定义为“具备一定的应急响应机制、高度协调能力与控制能力,提供及时、准确、权威的决策支持和舆论引导的智库”。结合过往的研究基础,本文将应急管理智库定义为:聚焦政府应急管理能力与应急管理体系,针对突发事件复杂性、危害性和非程序性决策等基本特征而具备一定的应急响应、应急协调与应急情报服务能力,为政府部门的应急管理实践提供多层次、全方位的决策支持的智库。面向突发事件,应急管理智库致力于创新应急理念,完善应急规划,为应急决策提供咨询论证。
智库是推进国家治理体系和治理能力现代化建设的重要力量。党和政府不断健全舆论引导机制,鼓励智库面向国家现代化治理需求、运用大众媒体等多种手段,在舆情研判、舆情应对到舆情治理的全流程中充分发挥决策服务作用,切实提升决策支撑能力。综观全球舆情研究趋势,围绕突发事件的公众舆论引起了极高的关注度和讨论度[4-5],网络平台逐渐成为人们发布突发事件相关信息、了解突发事件进展动态,以及发表个人舆论见解的重要阵地。这些舆论通过网络平台不断传播,并带来潜在社会威胁[6]。其中,舆情治理面临风险关联性、建模复杂性、学科交叉性、社会影响性与情景不确定性等“五大挑战”,在理论层面是数据驱动下的典型智库研究[7],在实践层面也已经成为政府应急管理的重要工作。
鉴于此,为应对新形势下对标国家治理体系和治理能力的基本要求,发展以数据平台和数据服务支撑决策的智库服务形式,本文面向应急管理智库建设,基于机器学习方法,构建网络舆情信息挖掘模型,并基于突发事件网络舆情文本信息进行模型验证和实证分析,通过新一代信息技术辅助应急管理智库把握舆情发展规律,从而进一步完善数据驱动的应急管理舆情智库参与应急决策咨询,提高服务决策能力。
2 相关研究现状
围绕突发事件应急管理智库建设的相关研究主要包括两个方面。一方面,从应急管理智库的定义与功能展开研究。熊励等[3]研究了各领域智库在可操作性、适用性方面与应急管理需求不匹配的现状,明确了应急管理专业智库应具备较强的专业性和动态的应急性两大显著特点;应峻等[8]基于应急管理智库的服务现状,提出了面向突发事件专业领域智库发展的服务模式。另一方面,围绕政府应急管理中的智库服务开展研究。面对新型冠状病毒的大流行,国内学者积极建设新型应急管理智库,聚焦科技智库决策咨询研究[9]、高校智库应急服务[10]、政府大数据能力模型[11]、疫情预警指标体系构建[1]、智库情报服务能力[12],以及智能情报决策体系[13]等方面展开研究,为新冠疫情防控做出了重要贡献。同时,国内外学者都已经关注到如何将网络舆情信息作为重要工具应用于应急管理的情报服务,在突发事件的监测预警[14]、应急响应[15]和应急行动[16]中同样起到了重要作用。
在数据驱动的舆情研究方面,学者关注突发事件网络舆情意识形态、社会热点与情感机制等因素,通过多源数据分析与实证模型方法的有机结合,分别从情感分析[17]、文本主题挖掘[18]及传播演化[19]等维度对网络舆情及其特征展开研究。在主题识别方面,基于潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)的主题识别模型有助于挖掘网络舆情中潜在的主题,例如,通过模糊视角对短文本进行模糊主题建模的优化方法[20],构建用户主题聚类知识图谱及主题传播路径分析等[21]。在情感识别方面,基于有监督的机器学习方法和无监督的情感模型实现文本情感分类和预测的研究是较为主流的分析方法。无论是基于突发事件案例的微博舆情演化模型[22],还是基于点互信息和情感词典的协同分析[23],都能为网络舆情演化机制的识别与治理提供有效方法。
综上所述,尽管各类智库研究已经在应急管理体系发展中提供了丰富的理论与实践支撑,但是面向应急管理智库服务能力建设的研究仍然不足,需要结合数据驱动的内涵与建设路径展开研究[24]。因此,本文结合新一代信息技术,基于机器学习方法构建舆情分析模型,通过文本数据挖掘突发事件舆情的主题与情感特征,为应急管理智库提供信息挖掘的研究方法,助力应急管理智库提高舆情引导与服务决策效能。
3 基于机器学习的突发事件网络舆情信息挖掘模型构建
本文构建基于机器学习的网络舆情信息挖掘模型,其主要流程如下:首先,应急管理智库需要基于政府决策需求,明确突发事件网络舆情生命周期及其发展的不同阶段;其次,采集多源网络舆情数据,并为后续的分析做好数据处理与存储工作;然后,通过构建的舆情分析模型以可视化形式完成主题聚类与情感分类,监测生命周期内各个阶段的热点话题与公众情绪的分布结构与演化规律,辅助应急管理智库在突发事件发挥决策咨询与舆情引导作用。
3.1 LDA文本识别模型
网络舆情信息具有短文本、非结构化的特征,要对这类文本进行主题聚类研究,最具代表性的机器学习模型为潜在狄利克雷分布[25]。作为无监督机器学习模型,LDA模型基于词袋假设,构建每一文档为一系列主题的多项分布,并构建每一主题为一系列词的多项式分布[26],不依靠传统的词频统计文档的潜在主题数。
采用LDA主题模型对分词和预处理后的数据进行主题识别与分析。选用Sklearn模块实现文本特征提取,生成词频向量并返回稀疏矩阵,并基于pyLDAvis工具展示主题聚类的可视化结果。其中,在确定主题聚类个数时,需要通过计算困惑度来确定最优的分类个数。困惑度计算如公式(1)所示:
其中,w指文档中的词语,p(w)指测试集中每个词出现的概率,N测试集的文档总数。困惑度表明了训练的模型对某一条网络舆情内容属于哪个隐含主题的不确定程度。困惑度越低,表明聚类主题的效果越好,模型越优。在该模型中,由于词袋算法忽略了文本连结的有序语法,因此获得通过分词等方法实现分割后的无序词语,并将无序的文本词语转换为词频向量,进一步将文档的主题以概率分布的方式提取。在舆情分析中,网络信息主题识别能将公众高度讨论的话题抽取为词频向量再聚类,从而有效、精准地识别与事件紧密相关的网络舆情热点主题。
3.2 DLNB分类模型
文本情感分析的主要研究包括情感的主客观分析、情感倾向分析、情感喜好分析和多情感分类等内容。常用的情感分析方法包括无监督的情感词典方法[27]和有监督的朴素贝叶斯等机器学习方法[28]。由于情感词典依赖细粒度更精确、情感词覆盖率更完善的词典的构建,难以和微博短文本、非规范性的特性相契合,因此本文选择朴素贝叶斯方法构建情感分析模型。
朴素贝叶斯模型是基于概率论的一种机器学习分类方法,假定样本的n个属性之间相互条件独立,定义文档d=(x1, x2, …, xn)的类别C={C1, C2, …, Cm},朴素贝叶斯分类模型如公式(2)所示:
其中,c为类别集合中的某一类别,P(c)指每个类别的先验概率,P(xj|c)表示分类器预测样本xj在类c中发生的概率。作为情感分类领域应用较广泛的分类器,该模型要求在先验概率的基础上,将数据集归为n个标签中后验概率最大的标签。由于传统的朴素贝叶斯分类算法多用于二分类模型,因此本文构建的模型为双层朴素贝叶斯(Double Layer Naive Bayesian,DLNB)模型,通过对数据集进行两次分类模型的训练,最终得到准确率、精确率等均有一定提高的模型结果,过程如图1所示。DLNB模型的实现基于两层朴素贝叶斯模型的分类器完成两次分類过程,标签为“0”“+1”和“–1”,分别表示中性情感、积极情感与消极情感。首先,输入的数据集通过第1层分类器,经过训练的模型将数据集归为两个标签中后验概率最大的标签,即分类为有情感倾向和中性情感“0”两类;其次,第1层分类后的无情感倾向数据作为第2层分类器的输入,通过模型后将剩余文本数据归为“+1”与“–1”两个标签中后验概率最大的类别;最后,完成网络舆情数据集的情感倾向的3个分类,从而进一步分析突发事件网络舆情所反映的公众情感。
4 实证分析
4.1 数据采集及处理
在网络舆情事件选择上,本文基于重大突发事件特征,结合新冠病毒奥密克戎变异株在国内传播时期潜伏期短、传染性强、传播速度快的3个特点,同时选择了发布大量的网络舆情内容的新浪微博作为数据来源。本文获取的网络舆情数据均通过Python实现微博数据的自动爬取,数据采集的时间范围为2022年3月1日至2022年5月31日,采集的微博发布内容包括中国新闻网、新华网、中国日报等官方媒体和大量自媒体、独立用户等发布的内容,研究获取的数据包括用户ID(账号)、发布时间、转发数、评论数、点赞数、定位和正文内容等。同时,本研究为了尽可能地反映真实经历此次S市疫情的主体所发布的网络信息,仅选择了定位信息为S市范围内的微博内容作为数据来源,最终获得有效数据共计19,337条。
据百度指数的统计数据[29]和信息生命周期理论[30],本轮舆情演化生命周期为2022年3月1日—2022年5月31日,在4月6日达到搜索指数的峰值。基于生命周期理论与突发事件发展的具体情况,本文划分的4个阶段如图2所示。
本文数据的困惑度如图3所示,随着主题数量的增加,困惑度总体呈现波动下降趋势,所对应的最优主题个数等于7。因此,综合考虑一致性指标和困惑度,确认主题间无交集,本文选取潜在的网络舆情热点主题类别个数为7。
4.2 实验结果分析
4.2.1 网络舆情信息主题发现 本文将分别对信息生命周期内潜在主题热点及其对应的关键词进行主题识别及分析,并探究随着突发事件态势的发展,公众关注主题演变的趋势和内容。
对收集到的文本数据经过预处理、信息生命周期划分等准备工作后,调用Sklearn库来构建LDA主题模型进行主题识别,设定隐含的主题数为7,设定输出高频关键词TOP30,通过max_df参数过滤词频大于0.8的词汇,通过min_df参数过滤出现次数小于10的词汇,使得到的结果更客观且具有代表性,最后使用pyLDAvis工具实现可视化展示。LDA模型会选择高频的关键词来描述每一个隐含主题,并给出全部主题下的高频关键词。经过50轮迭代后,形成的结果如图4所示。
根据LDA模型迭代的结果,分别利用7个主题的关键词推断主题对应的信息,总结后如表1所示。根据表1中挖掘的7类主题,可以得出公众主要关注的7个方面,分别概括为社会生活、防疫措施、物资保障、生活记录、城市变化、疫情信息及新闻动态。
按照生命周期理论划分的4个阶段的文本数量、持续时间等,本文对信息生命周期内各阶段分别进行LDA主题建模,得出各个阶段不同主题占比,如图5所示。主题2在整个周期内都有非常高的讨论度,只在衰退平息期占比第2,仅次于主题4。主题1与主题2随着突发事件的进展,占比逐渐降低,讨论度总体呈现下降趋势;主题4反而随着突发事件进展不断发酵,成为后期主导的主题之一。主题3在前期占比不高,在波动下降期达到顶峰,在衰退平息期再次下降;主题7则与此相反,前期的关注度相对较高,随后不断下降,在波动下降期达到最低后,在衰退平息期又有小幅度升高。主题5和主题6在各阶段的占比变化不大,均仅在波动下降期有一定程度的下降。
结合各阶段词频和主题,最后按照各个阶段的最优主题数,总结代表性主题,结果如表2所示。由于网络舆情的形成扩散期较短,在短时间内呈现出爆发态势,因此前期的主要话题内容围绕事件早期的突发性展开。网络舆情信息的传播和讨论达到顶峰后,信息生命周期进入了下半阶段。在波动下降期,生活物资保障是这一阶段的代表性主题。最后,在衰退终结期,随着突发事件的趋于平稳,此时主基调转变了对事件结束的期待,生活记录(主题4)这一类别的主题达到了最高峰。
4.2.2 网络舆情信息情感分析 对新浪微博平台上以突发事件舆情话题中采集的文本数据进行模型训练,基于Sklearn库来构建双层贝叶斯分类模型,并对训练集和测试集做十折交叉验证,经过模型分类后得到预测的情感值,最后对信息生命周期内情感结果进行分析。
朴素贝叶斯模型属于有监督的机器学习方法,需要在预先对样本数据进行标记的基础上训练模型。鉴于人工标注的过程有一定的主观判断,为了尽量得到客观公正的标注数据,本文选择数据集约1/2的文本数据,由两人进行人工标注,完成后存在分歧的文本数据占总体的25.46%,选择保留其中的一致性数据,再由百度AI数据平台[31]完成剩余数据标注,最终该数据集的1/2完成标注的文本作为模型的训练集。同时,为保证分类器的准确性,需要控制每一层模型数据集中不同标注类别的情感文本数量基本相等,最终获得人工标注后的数据共6,316条,情感极性分布统计如图6所示。
图6 情感极性分布统计
Figure 6 Emotional polarity distribution statistics
以上述规则得到的数据集为最终的训练数据,对DLNB模型进行训练,并使用训练后的模型对全部的文本进行情感分类,得到全部数据的情感值和情感分类结果,如表3所示。无情感类别即中性情感类别,在全部文本中占比为29.99%,相对于消极和积极情感倾向的类别数量较少;而后者的子类别中,消极情感类别即消极情感倾向文本内容类别占比为33.59%,积极情感类别即积极情感倾向文本内容类别占比为36.42%。该结果反映了两种情感倾向的文本数量相对较为平衡,积极情感文本数量略多于消极情感,中性情感文本数量则约占总体的1/3。
经过训练的双层朴素贝叶斯分类模型,需要验证其模型预测能力,即通过性能指标进行评估。基于混淆矩阵可以得到常用的文本分类指标,包括准确率(accuracy)、精确率(precision)、召回率(recall)和F1值(F-measure)等。
为了验证本文构建的DLNB情感分析模型的有效性,选取近年国内外情感分类研究中常用方法进行模型评价指标的对比,以验证与说明DLNB模型应用在应急管理智库舆情分析中的适用性。通过与非双层结构的朴素贝叶斯(Naive Bayesian Model,NBM)模型,以及情感分析常用的SnowNLP方法的评价指标对比,本文构建的模型在各个验证指标均有一定效果的提升,并且全部达到80%以上(见表4),可以证明DLNB模型在赋能应急管理智库的舆情情感分类方面具有一定的优越性。
得到了上述情感分类结果后,为进一步分析相关网络舆情在各个阶段的情感特点,得到本文信息生命周期内3种情感倾向占比及分布结果,如图7所示。总体而言,积极情感和消极情感的占比略大于中性情感,后者在全部数据结果中约占30%,并且随着突发事件的发展,积极情感占比总体呈增长趋势,消极情感占比总体呈下降趋势。在形成扩散期,积极情感占比较低,不足该阶段总体的30%,同时中性情感和消极情感占比相仿,有较大的舆情基数。在集中爆发期,积极情感占比有较大波动,在2022年3月20日左右明显增长,随后减少到形成扩散期的平均占比水平;消极情感占比较高,最高达到了当日的54.79%;中性情感占比变化幅度较大,消极情感占比波动则与积极情感占比波动总体一致,此消彼长。到了波动下降期,积极情感占比稳步提高,消极情感占比逐渐减少,和中性情感占比基本一致,积极情感占比已经达到40.91%。由于衰退平息期较长,消极情感内容更多被积极情感内容取代,积极情感成为主导,在该阶段末尾的5月31日,積极情感占比最终达到61.79%,消极情感占比19.34%,中性情感占比18.87%。
为了进一步分析突发事件全周期内的情感分数的变化,对数据降维后得到了基于时间序列的平均情感值波动,如图8所示。其中,网络舆情信息内容的情感倾向分布以“0”为基准线,情感值越接近“0”则情感越接近中性,情感值大于“0”即为积极情感,情感值小于“0”即为消极情感。基于时间序列的情感波动,可以直观地呈现信息情感随着突发事件发展的变化情况,以增强数据结果的可读性。总体而言,情感极性较为显著,前期的情感值以负值为主,伴随阶段性出现的正面情感,接近生命周期中期时逐渐偏向基线;而后期的情感值则基本大于0,并且正面的情感值分数波动升高。
结合上述情感分析的实验结果,消极情感主要分布在形成扩散期和波动下降期,积极情感集中在网络舆情的衰退平息期,而集中爆发期的积极情感与消极情感均有较大波动,中性情感则在网络舆情的开始和结尾两部分占比较高,总体波动较小。
4.2.3 主题–情感关联分析与智库能力建设 基于突发事件的特殊性,以及事件发展的实际情况,本文按照主题识别部分划分的7个主题类别对结果做进一步的分类,从而更有针对性地提出智库对网络舆情的引导措施。按照主题分类方法,得到网络舆情信息情感与主题关联分类结果如表5所示。
突发事件网络舆情的情感走向总体为积极情感,但仍然有大量消极情感的走向和主题内容,应急管理智库需要基于主题与情感演化的特性进行合理的舆情研判,推动正能量的传播,以防止负面内容的发酵。基于主题和情感分析的结果,突发事件的网络舆情演化随着信息周期的发展具备3个特征。
第一,网络舆情主题随着突发事件发展具有一定的反复性。这主要体现在部分主题随着突发事件本身发展,反复多次引发舆论。例如,大学生封校这一主题分别在事件的形成扩散期和衰退平息期作为热点出现。在事件前期,网络舆情内容围绕大学生对突发事件的消极判断和对校园生活的影响展开;而在事件后期,舆情主题则围绕大学生希望得到返乡和隔离问题上的帮助展开,并且均具有强烈的负面情感倾向。
第二,网络舆情情感在突发事件的同一主题上出现了明显的两极性。这主要体现在相同主题内容会产生两种不同的情感倾向。例如,形成扩散期和波动下降期都形成了相似的物资保障主题,并同时存在积极和消极两种情感极性。例如,P2-1和P3-1主题主要表达了居民收到保供物资的感谢,而同一时期的N2-1和N3-1主题则反映了突发事件前期和中期的部分区域存在物资供应不平衡的现象。同样地,网络舆情情感也在某些特定主题类别上呈现出同一性。其中,围绕“生活记录”的主题展开的话题及评论以积极情感为主导,围绕“疫情信息”与“新闻动态”主题展开的话题及评论基本以中性情感为主导,体现了权威媒体与官方新闻在突发事件信息传达中的客观性与科学性。
第三,网络舆情内容相较突发事件的发展具有一定的滞后性。这主要体现在网络舆情形成具有热度的代表性主题并引发大量讨论时,相较于讨论的事件本身的发展已经存在一定的滞后性。体现滞后性的主题代表是波动下降期的NE3-1主题,在这一时期后期求助信息和负面事件的传播引发了悲观情绪的散播。事实上,老人及特困群体的生活需求与健康保障最早在上海2022年4月15日的第154场新冠疫情防控工作新闻发布会中被提及,后续的相关措施中也强调了这类人群的托底保障机制。当网络舆情引起大量关注的时间节点明显晚于这一事件的解决时间时,更体现突发事件下的高密度信息在大范围传播时具有滞后性。
基于上述的实验结果与分析,面向应急管理智库建设,针对突发事件网络舆情主题与情感特征与突发事件演化的关联性规律,分别从以下3个方面总结网络舆情分析对应急管理智库提高决策咨询服务能力的作用。
第一,及时识别突发事件网络舆情信息,有助于应急管理智库发挥应急决策咨询的综合研判能力。网络平台发表并传播的海量舆情数据能反映突发事件态势发展、社会热点和公众情绪等应急信息要素,也是监测舆情爆发并开展应急管理的重要情报来源。应急管理智库通过文本挖掘等数智技术及时识别网络舆情信息,能形成更加健全的综合研判体系,发挥社会舆情研判的积极作用。
第二,识别网络舆情热点主题与情感倾向,有助于应急管理智库参与决策咨询,发挥舆情引导能力。网络舆情中包含着公众观点和情绪表达的潜在信息,在网络的放大效应下具有引发次生舆论事件的复杂性和广泛性。应急管理智库通过揭示网络舆情信息,能在应急决策咨询中发挥解读公共政策并集聚社会正能量的重要功能,提高引导社会热点、疏导公众情绪的舆论引导能力。
第三,把握网络舆情演化规律,有助于应急管理智库提高决策咨询服务的风险监测预警能力。网络舆情传播与演化有其自身的规律,舆情风险伴随着突发事件生命周期发展的过程发生异化。应急管理智库以网络舆情信息为切入点,通过信息挖掘方法可以精准把握舆情演化规律、掌握突发事件全生命周期的舆情风险,从而在应急决策咨询服务中进一步提高对突发事件的风险监测预警能力。
5 结语
突发事件的舆情传播为网络安全、信息安全的治理目标带来了新的挑战,也对应急管理智库发挥咨政建言功能、加强舆论治理能力提出了新的要求。网络舆情在突发事件中的传播和扩散,体现了公众对现实事件的实时诉求,是关系民众切身利益的现实问题,因此具有敏感性和煽动性,容易随着传播范围和热度的扩大出现极端情况。突发公共事件网络舆情的生成和发展需要依托一定的话题载体,也会呈现出对应的情感倾向,对应急管理中的舆情研判至关重要。
本文基于应急管理智库舆情引导,提出了一种融合LDA主题类别发现与DLNB情感特征分析的模型。研究表明,积极情感主要聚集在生活记录和城市变化两类主题,消极情感主要聚集于防疫措施和物资保障两类主题。同时,突发事件网络舆情信息的演化随着信息周期的发展具备3个特征:一是网络信息主题随着舆情周期发展具有一定的反复性,二是网络信息情感在同一主题上出现了明显的两极性,三是网络舆情内容相较突发事件發展具有一定的滞后性。基于此,本文针对应急管理智库建设,总结网络舆情治理对应急管理智库提高决策咨询服务能力的重要性。
总体而言,突发公共事件的舆情的态势发展会随着事件自身的发展和推进产生相应的演化路径,舆情生命周期内的关键典型主题与情感倾向是智库进行研判与干预的重要特征。而应急管理智库需要把握其演化发展规律,充分发挥自身专家资源与数据情报资源优势。本文的局限性为:①面向应急管理智库提出信息挖掘的模型与方法,未能深入揭示网络舆情数据在应急管理决策服务中的耦合机制;②实证研究的数据构成不够广泛。在未来的研究中,将进一步探讨数据驱动的应急管理智库的实现机制,并通过更丰富的多源异构数据完善数据支撑。
参考文献:
[1] 中共中央办公厅、国务院办公厅印发《关于加强中国特色新型智库建设的意见[EB/OL]. [2023-01-20]. https://www.gov.cn/xinwen/2015-01/20/content_2807126.htm.
Xinhua News Agency. The General Office of the Central Committee of the Communist Party of China and the General Office of the State Council issued the “Opinions on strengthening the construction of new think tanks with Chinese characteristics”[EB/OL]. [2023-01-20]. https://www.gov.cn/xinwen/2015-01/20/content_2807126.htm.
[2] 于志荣. 政府应急管理中的智库作用研究[D]. 长沙: 国防科技大学, 2017: 9-11.
YU Z R. Research on the role of think tanks in the government emergency management[D]. Changsha: National University of Defense Technology, 2017: 9-11.
[3] 熊励, 郭佳璐. 面向应急管理专业智库建设的疫情预警指标体系构建研究[J]. 智库理论与实践, 2021, 6(4): 34-42.
XIONG L, GUO J L. Research on the establishment of an epidemic warning index system for the emergency management professional think tanks construction[J]. Think Tank: Theory & Practice, 2021, 6(4): 34-42.
[4] 刘怡君, 蒋文静. 社会转型期我国新兴舆情风险及对策研究[J]. 智库理论与实践, 2017, 2(6): 82-88.
LIU Y J, JIANG W J. Study of emerging risks of the network public opinion and countermeasures of the supervision under the context of the social transformation[J]. Think Tank: Theory & Practice, 2017, 2(6): 82-88.
[5] 张筱荣, 郭圳凝. 突发公共卫生事件网络舆情危机及其治理[J]. 北京交通大学学报(社会科学版), 2023, 22(2): 133-140.
ZHANG X R, GUO Z N. Network public opinion crisis and its governance in public health emergencies[J]. Journal of Beijing Jiaotong University(Social Sciences Edition), 2023, 22(2): 133-140.
[6] 黄仕靖, 吴川徽, 袁勤俭, 等. 基于情感分析的突发事件舆情时空演化差异研究[J]. 情报科学, 2022, 40(6): 149-159.
HUANG S J, WU C H, YUAN Q J, et al. Spatiotemporal evolution of public opinion in public health emergencies based on sentiment analysis[J]. Information Science, 2022, 40(6): 149-159.
[7] 李倩倩, 劉怡君, 马宁, 等. 基于智库双螺旋法的舆情治理与智库研究[J]. 中国科学院院刊, 2022, 37(6): 773-782.
LI Q Q, LIU Y J, MA N, et al. Public Opinion Governance and Think Tank Research Based on Think Tank Double Helix Methodology[J]. Think Tank: Theory & Practice, 2022, 37(6): 773-782.
[8] 应峻, 王钰琛, 王森, 等. 面向重大公共卫生事件的智库服务现状及发展建议[J]. 图书情报工作, 2022, 66(4): 3-13.
YING J, WANG Y C, WANG S, et al. Current status and development suggestions of think tank services for major public health emergencies[J]. Library and Information Service, 2022, 66(4): 3-13.
[9] 王柏村, 陈磊, 延建林, 等. 科技智库助力抗击新冠疫情的进展、启示与建议[J]. 科技管理研究, 2020, 40(16): 260-266.
WANG B C, CHEN L, YAN J L, et al. Progress, enlightenment and suggestions of science & technology think tank fighting against COVID-19 epidemic[J]. Science and Technology Management Research, 2020, 40(16): 260-266.
[10] 胡菲菲, 解志韬, 凌宏发. 公共危机管理视角下的高校智库应急服务研究[J].智库理论与实践, 2021, 6(1): 65-70.
HU F F, XIE Z T, LING H F. Research on Emergency Services of University Think Tanks from the Perspective of Public Crisis Management[J]. Think Tank: Theory & Practice, 2021, 6(1): 65-70.
[11] 蔣勋, 朱晓峰. 基于政府大数据能力建构的智库应急情报服务: 以新冠疫情防控为例[J]. 图书与情报, 2020(1): 64-74.
JIANG X, ZHU X F. Emergency intelligence service of think tanks based on the construction of government big data capability: Taking prevention of COVID-19 for example[J]. Library & Information, 2020(1): 64-74.
[12] 韩玮, 许静斯, 刘国佳, 等. 情报流程视角下智库应急情报能力及服务模式研究[J].情报理论与实践, 2021, 44(8): 14-21.
HAN W, XU J S, LIU G J, et al. Research on the construction of think tank emergency intelligence capability and service mode from the perspective of intelligence process[J]. Information Studies: Theory&Application, 2021, 44(8): 14-21.
[13] 张海涛, 栾宇, 周红磊, 等. 总体国家安全观下重大突发事件的智能决策情报体系研究[J]. 情报学报, 2022, 41(11): 1174-1187.
ZHANG H T, LUAN Y, ZHOU H L, et al. Intelligent decision-making information system for major emergencies: A holistic approach to national security[J]. Journal of the China Society for Scientific and Technical Information, 2022, 41(11): 1174-1187
[14] 连芷萱, 连增水, 张秋波, 等. 面向突发事件的网络衍生舆情预警模型与实证研究[J]. 情报杂志, 2019, 38(3): 133-140.
LIAN Z X, LIAN Z S, ZHANG Q B, et al. Derived network early warning model of public opinion and its empirical research[J]. Journal of Intelligence, 2019, 38(3): 133-140.
[15] REXILINE R J, RUBESH A P M, BHASKAR V. Mining crisis information: A strategic approach for detection of people at risk through social media analysis[J]. International Journal of Disaster Risk Reduction, 2018(27): 556-566.
[16] 吴雪华, 毛进, 陈思菁, 等. 突发事件应急行动支撑信息的自动识别与分类研究[J]. 情报学报, 2021, 40(8): 817-830.
WU X H, MAO J, CHEN S J, et al. Research on automatic identification and classification of actionable information in emergencies[J]. Journal of the China Society for Scientific and Technical Information, 2021, 40(8): 817-830.
[17] 吴鹏, 李婷, 仝冲, 等. 基于OCC模型和LSTM模型的财经微博文本情感分类研究[J]. 情报学报, 2020, 39(1): 81-89.
WU P, LI T, TONG C, et al. Sentiment classification of financial microblog text based on the model of OCC and LSTM[J]. Journal of the China Society for Scientific and Technical Information, 2020, 39(1): 81-89.
[18] 廖海涵, 王曰芬, 关鹏. 微博舆情传播周期中不同传播者的主题挖掘与观点识别[J]. 图书情报工作, 2018, 62(19): 77-85.
LIAO H H, WANG Y F, GUAN P. Topic mining and viewpoint recognition of different communicators in the transmission cycle of micro-blog public opinion[J]. Library and Information Service, 2018, 62(19): 77-85.
[19] 安璐, 吴林. 融合主题与情感特征的突发事件微博舆情演化分析[J]. 图书情报工作, 2017, 61(15): 120-129.
AN L, WU L. An integrated analysis of topical and emotional evolution of microblog public opinions on public emergencies[J]. Library and Information Service, 2017, 61(15): 120-129.
[20] RASHID J, SHAH S M A, IRTAZA A. Fuzzy topic modeling approach for text mining over short text[J]. Information Processing & Management, 2019, 56(6): 296-300.
[21] 張柳, 王晰巍, 黄博, 等. 基于LDA模型的新冠肺炎疫情微博用户主题聚类图谱及主题传播路径研究[J]. 情报学报, 2021, 40(3): 234-244.
ZHANG L, WANG X W, HUANG B, et al. Research on the topic clustering graph and the transmission path of micro-blogging users amid COVID-19: Based on the LDA model[J]. Journal of the China Society for Scientific and Technical Information, 2021, 40(3): 234-244.
[22] 任中杰, 张鹏, 李思成, 等. 基于微博数据挖掘的突发事件情感态势演化分析: 以天津8·12事故为例[J]. 情报杂志, 2019, 38(2): 140-148.
REN Z J, ZHANG P, LI S C, et al. Analysis of emotion evolution of emergencies based on Weibo data mining: Taking “8·12 accident in Tianjin” as an example[J]. Journal of Intelligence, 2019, 38(2): 140-148.
[23] 朱晓霞, 宋嘉欣, 孟建芳. 基于动态主题—情感演化模型的网络舆情信息分析[J]. 情报科学, 2019, 37(7): 72-78.
ZHU X X, SONG J X, MENG J F. Analysis of online public opinion information based on the dynamic themeemotion evolution model[J]. Information Science, 2019, 37(7): 72-78.
[24] 欧阳剑, 周裕浩. 数据驱动型智库研究理念及建设路径[J]. 智库理论与实践, 2021, 6(3): 20-27.
OUYANG J, ZHOU Y H. Research on path of the construction of data-driven characteristic think tank in China[J]. Think Tank: Theory & Practice, 2021, 6(3): 20-27.
[25] BLEI D M, NG A Y, JORDAN M I. Latent dirichlet allocation[J]. Journal of machine Learning research, 2003(3): 993-1022.
[26] PAVLINEK M, PODGORELEC V. Text classification method based on self-training and LDA topic models[J]. Expert Systems with Applications, 2017, 80(C): 83-93.
[27] 赵妍妍, 秦兵, 石秋慧, 等. 大规模情感词典的构建及其在情感分类中的应用[J]. 中文信息学报, 2017, 31(2): 187-193.
ZHAO Y Y, QIN B, SHI Q H, et al. Large-scale sentiment lexicon collection and its application in sentiment classification[J]. Journal of Chinese Information Processing, 2017, 31(2): 187-193.
[28] PANG B, LEE L, VAITHYANATHAN S. Thumbs up?: sentiment classification using machine learning techniques[C]. Proceedings of the ACL-02 Conference on Empirical Methods in Natural Language Processing - Volume 10. 2002: 79-86.
[29] 百度指数[EB/OL]. [2022-12-15]. https://index.baidu.com/ v2/index.html#/.
Baidu Index[EB/OL]. [2022-12-15]. https://index.baidu.com/v2/index.html#/.
[30] 賈亚敏, 安璐, 李纲. 城市突发事件网络信息传播时序变化规律研究[J]. 情报杂志, 2015, 34(4): 91-96.
JIA Y M, AN L, LI G. On the online information dissemination pattern of city emergencies[J]. Journal of Intelligence, 2015, 34(4): 91-96.
[31] EasyData智能数据服务平台[EB/OL]. [2022-12-15]. https://ai.baidu.com/easydata/.
EasyData Intelligent Data Service Platform[EB/OL]. [2022-12-15]. https://ai.baidu.com/easydata/.
作者贡献说明:
熊 励:确定研究思路,指导实验,提出论文框架,指导论文修改;
陆梦园:完成实验,撰写与修改论文;
王 锟:修改论文。
Research on Emergency Management Think Tank Decision-making Based on LDA-DLNB Online Public Opinion Recognition
Xiong Li Lu Mengyuan Wang Kun
School of Management, Shanghai University, Shanghai 200444
Abstract: [Purpose/Significance] Network public opinion information has a significant communication influence in emergency response. Improving public opinion guidance is one of the important functions of new think tanks with Chinese characteristics, and effectively identifying network public opinion is the key for emergency management think tanks to enhance their comprehensive research and judgment abilities. [Method/Process] From the perspective of constructing emergency management think tanks, this paper focuses on identifying potential key hotspots and emotional structures in network public opinion information related to emergencies. It constructs the LDA-LDNB network public opinion information mining model using the machine learning method, and conducts model validation and empirical analysis based on the textual information from network public opinion regarding emergencies. [Result/Conclusion] The results demonstrate that the model constructed in this paper can effectively identify the themes, emotions and evolutionary features of network public opinion information during emergencies, provide methods and decision-making support for emergency management think tanks to improve their ability to participate in network public opinion research and judgment for emergency management decision-making services, and offer a new way of thinking for constructing a data-driven emergency management think tank.
Keywords: emergency management think tank critical incident online public opinion text analysis
收稿日期:2023-08-28 修回日期:2023-11-02