APP下载

基于系统安全降维理论的网络舆情危机预警方法研究*

2021-10-08李启月杨晓枭王宏伟魏新傲吕雯婷

情报杂志 2021年9期
关键词:系统安全降维舆情

李启月 杨晓枭 黄 兴 王宏伟 魏新傲 吕雯婷

(中南大学资源与安全工程学院 长沙 410083)

0 引 言

据中国互联网络信息中心《第46次中国互联网络发展状况统计报告》显示,截至2020年6月,中国网民规模达9.40亿,互联网普及率达67.0%[1]。由此可见,网络已经渗透到人们的日常生活,展现出巨大的发展活力和韧性。但由于我国网民体量大,政府对网络舆论监管体制尚不完善,人们现实生活中的利益纠纷、社情民意都会集中在网络上曝光。舆情的非常态化发展,对社会而言,可能引发社会公共安全问题。对政府机关而言,缺乏有效的预警措施,会严重影响政府机关的公信力和权威性。对于企业和个人而言,舆情肆意扩散,轻则有损企业和个人的声誉,重则引起企业和当事人巨大的经济损失,甚至危及涉事人员的身心健康[2]。

舆情预警是国内外学者研究的热点,国外对舆情的预警研究可以追溯到1973 年,欧盟监测其成员国的舆论情况,为其制定决策提供依据[3]。目前,国外对于网络舆情预警已经趋于成熟,很多研究成果已纳入政府决策[4-5]。国内对网络舆情预警的研究起步较晚,但近年也涌现出不少研究。贾娴[6]运用Web挖掘技术进行了突发事件网络舆情预警策略的探讨,构建了从舆情数据采集、挖掘、分析到预警等级研判的网络舆情预警系统模型。王高飞[7]等在分析移动社交网络舆情自身特点与影响因素的基础上,将层次分析法与模糊综合分析法相结合,提出了一种移动社交网络舆情预警模型。此外,国内还有基于直觉模糊推理[8]、模糊综合评价[9]、灰色关联分析[10]、云模型[2,11]、数字孪生技术[12]、BP神经网络[13-14]、OCS-EGM模型[15]等方法对网络舆情预警的研究。总体来看,国内学者对网络舆情预警研究进行的丰富探索可归为基于运筹学理论的方法研究[6-10]与基于智能机器学习算法的方法研究[2,11-15]。这两大类预警方法,其论证过程或多或少都有对舆情危机简化处理的体现,但很少有人从系统安全理论角度,将舆情危机的多维性特征和预警方法相结合,对其实施降维,以达到简化预警难度的目的。

基于以上讨论,本文以网络舆情危机警级难以界定为着眼点,针对其多维性特征,把高维网络舆情危机及其影响因素,转化为较为简单、具体的低维预警指标;使之较容易的对转化后的各预警指标进行科学理解和量化解释,降低预警难度;拟在网络舆论系统管理中最大限度的实现危机预防,保障该系统的有序运转,为我国网络舆情监管部门防控舆情危机提供新的解决思路。

1 降维必要性和可行性分析

1.1舆情事件的多维结构本文以系统安全视角,从舆情的主体、内容和传播3个维度提炼出影响网络舆情危机系统的多维结构,如图1所示。

图1 网络舆情危机事件影响因素的多维结构

由图1可知,网络舆情事件可提炼为舆情主体维、内容维、传播维三个一级维度影响因素及其延伸的若干次维影响因素。一般而言,某一具体网络舆情事件会受到图1中的几个或所有维度影响因素的同时作用。此外,需特别指出的是次维度影响因素一般也具有多维性。例如:就主体维下受众的态度倾向而言,不同个体具有不同的态度与动机(即具有随意性);就内容维下涉及主题而言,主题的种类与性质也千差万别,等等。所以网络舆情事件是多维的,具备降维处理的条件。

1.2降维的必要性网络舆情危机事件一般特指在一定社会背景下组成的某一网民群体,针对某一特定事件或不良言论,利用网络公共领域大规模散布和传播负面信息,以发泄不满、制造舆论,最终造成不良的社会(包括网络社会和现实社会) 影响,乃至可能危及社会稳定的集群事件[19]。从系统安全角度来看,突发性网络舆情事件归根结底是社会公共安全中的一个子系统;从舆情多维结构来看(见图1),突发性网络舆情事件可视为一类复杂的高维安全问题,其作用机制复杂,后果严重且难以预测。鉴于此,为防控网络舆情危机产生可感知的公共危害,并探寻极具针对性的预警保障对策,就必须对网络舆情危机事件及其影响因素进行系统降维,降低预警难度。从而帮助国家和舆情监管部门高效预警并遏制可能给国家公共安全带来危机的负面舆情信息,促进网络舆论向着和谐、稳定的方向发展。

1.3降维的可行性

1.3.1 理论依据 学界早前提出的降维理论主要用于解决数据冗余、数据噪声等问题[20]。而吴超[16-18]等人则从理论层面正式提出了系统安全降维理论,并深入阐述了其本质和内涵,即“以保障系统安全为着眼点,针对其多维性特征,把多维系统安全问题或系统安全影响因素转化为较为简单具体的系统安全问题或系统安全影响因素,而且较容易对转化后的具体系统安全问题或系统安全影响因素进行科学理解和解释,以及有效解决和控制,进而提出较具针对性和最优或近似最优的系统安全保障对策的一种安全系统学思维和方法”,该理论为高维度网络舆情危机预警提供了新的解决思路。

1.3.2 降维优势分析 舆情高维度特征可以让网民们更系统、更全面的了解事件的来龙去脉,但维数的膨胀也加剧了政府和舆情监管部门对其防控的难度。适当降低影响舆情走向的各因素维度,保留其多维性优势,可消除高维度弊病。简言之,将网络舆情系统适当降维,有利于快速、精准的提取关键信息,在预警中有效消除无关和次要信息,简化预警难度。结合华佳敏[17]对安全系统降维的优势分析,可类比网络舆情危机事件降维优势如图2所示。

图2 网络舆情事件系统降维优势分析图

1.3.3 降维可行性 舆情降维可行的基本出发点和关键是有效对舆情危机进行降维。对于有数据支持的网络舆情事件,目前可依托于互联网时代的媒体平台与大数据处理技术,采集、记录和存储网络舆情的相关数据(如历史评论量、历史阅览量、舆情持续时间等),得到高维舆情数据集合K,记为K={k1,k2,…,ks},其中k为舆情相关数据或数据集。再通过映射、聚类、评估和判断等过程,对舆情数据集K进行预处理、清洗、降噪,最大程度地压缩数据空间,充分挖掘舆情数据集中隐藏的舆情危机,从而得到冗余度低、独立性强的低维目标特征集K',K'={k'1,k'2,…,k'f},其中,k'为某一维度舆情数据或数据集,且f<

2 基于系统安全降维理论的网络舆情危机预警方法构建

2.1确立预警指标与权重要确保舆情危机预警及时准确,建立科学、合理的预警指标体系是关键。本文从舆情事件影响因素的多维结构(见图1)出发,本着不改变舆情原本特征和性质,有效消除舆情次要信息得到冗余度低、独立性强的低维末级指标的降维理念,构建了基于系统安全降维理论的网络舆情危机预警指标体系,如图3所示。

图3 舆情各维度预警指标体系

预警指标体系的构建实为确定预警因素集,本文预警指标体系包含3个一级维度指标和7个次级维度指标,其中U={u1,u2,u3},u1={u11,u12},u2={u21,u22,u23},u3={u31,u32},各指标内涵如下:

负面回帖量维指标(u11):指话题历史负面评论数,反映网民对该话题的活跃度。

历史阅览量维指标(u12):指话题历史阅览量,反映网民对该话题的关注度。

舆情持续时间维指标(u21):指从话题发生到波动消退所持续的时间(衡量指标是百度指数搜索量超过1000的总天数与新浪微博热议搜索量超过10000的总天数,取最大值)[21]。

发帖数量维指标(u22):指话题历史原创贴与转发贴数量总和。

媒体平台数量维指标(u23):指舆情涉及主流媒体的数量。

主题敏感度维指标(u31):指舆情话题的敏感性,按内容主题可分为公共安全类、生存危机类、分配差距类、贪污腐败类、公共生活类和时政法治类6个方面[22];

视听化程度维指标(u32):表征舆情话题声像资料的详略程度。

为了更清晰的了解各指标的价值目标以及可靠性,需对次维末级指标进行权重。本文通过设计调查问卷确定各指标权重,具体过程如下:

首先,针对上述指标体系中3个一级维度指标、7个二级维度指标设计问卷并进行解释说明。每个指标按照很重要、比较重要、一般重要、比较不重要、很不重要进行选择。对每个指标, 选择很重要的得4分, 选择比较重要的得3分, 选择一般重要的得2分, 选择比较不重要的得1分, 选择很不重要的得0分, 然后回收问卷。按照同维指标得分的加权值计算每个指标的权重。本文共发出问卷46份,回收有效问卷40份,有效回收率为87%,虽然样本数量较小,但参与者均来自高校专家,结果可靠。

配合综合评价要求,最终对权重结果归一化处理得:一级维度评价集U={u1,u2,u3},权重A=(0.32,0.33,0.35);次维评价集u1={u11,u12},u2={u21,u22,u23},u3={u31,u32},权重A1=(0.57,0.43),A2=(0.31,0.34,0.35),A3=(0.54,0.46)。

2.2预警等级划分预警等级划分实为确定预警评判集,其反映了网络舆情的严重程度、发生频率以及各预警指标之间的关系。本文综合考虑国际惯例、我国相关机构管理规定和网络舆情的发展趋势,将网络舆情预警等级划分为:轻度级(Ⅰ级)、警示级(Ⅱ级)、风险级(Ⅲ级)和极度风险级(Ⅳ级)共4个等级。

2.2.1 单指标警级评判 为了提高舆情主体维、内容维和传播维下各次维指标警级评判的科学性,本文借鉴了黄星等[22]对突发事件网络舆情风险指标预警等级的划分方法。从“中国公共事件数据库”近3万起突发事件中挑选出热度较高的40个案例作为研究样本,通过对样本各指标的频率分析,最终得到舆情次维指标预警等级判定标准如表1所示。

表1 网络舆情次维指标警级判定标准[22]

表1中所涉及的定量指标警级判定主要通过搜集统计数据(为简化舆情数据收集难度,本文主要选择新浪微博、腾讯微博为相关数据收集平台)。定性指标警级判定则通过专家赋值,其中,舆情主题敏感度指标依据舆情事件敏感程度赋值如下:生存危机类赋值6、公共安全类赋值5、分配差距类赋值4、贪污腐败类赋值3、时政法治类赋值2、公共生活类赋值1;舆情视听化程度指标则依据声像资料详略程度(全面、基本、缺失、无)可依次赋值4、3、2、1。

2.2.2 综合预警等级评判 舆情单指标警级判定,实现了将高维舆情危机问题及其影响因素,转化为简单、具体的各个低维指标预警集。但舆情的风险等级一般是复杂的综合性测度,还需要依据低维指标预警集确定综合警级。本文对舆情综合预警等级的评判仍采取专家赋值法,通过计算舆情综合指标预警加权值确定舆情预警等级,具体过程如下:

第一步:设置预警区间,即舆情综合指标预警加权值所在区间,用以判断舆情综合预警等级。各次维指标警级值按轻度级(Ⅰ)、警示级(Ⅱ)、风险级(Ⅲ)、极度风险级(Ⅳ)依次赋值3、5、7、10;预警区间按舆情综合指标预警等级轻度级(Ⅰ)、警示级(Ⅱ)、风险级(Ⅲ)、极度风险级(Ⅳ)划分为四个区间,依次为(3,4]、(4,6]、(6,9]、(9,10]。

第二步:计算舆情综合指标预警加权值,计算公式为:′A=ΣU`i·u`ij·£ij,其中:′A表征各指标的综合预警加权值;U`i表示一维指标Ui的权重,u`ij表示一维指标Ui包含次维指标uij的权重;£ij表示一维指标Ui中次维指标uij的警级值(按轻度级(Ⅰ)、警示级(Ⅱ)、风险级(Ⅲ)、极度风险级(Ⅳ)依次取3、5、7、10);i取1、2、3,j取1、2、3。

第三步:通过上述公式计算′A值,判断′A值落入的预警区间即可确定舆情预警等级。

2.3预警方法阐述以上述网络舆情预警指标体系及其警级评判方法为前提,本文将结合图4对基于系统安全降维理论的网络舆情预警方法作如下阐述:

图4 网络舆情危机事件映射及预警方法

由图4可知,该预警方法分为数据采集、数据处理、数据分析及应用三个阶段,实现了粗粒度舆情信息转化为中细粒度舆情信息,进而转化为细粒度舆情信息的降维过程。

a.粗粒度舆情信息采集:对于有数据支持的特定网络舆情话题,该阶段主要依托于互联网平台(包括官方媒体、论坛以及自媒体等)与大数据处理技术,进行数据(如历史评论量、历史阅览量、舆情持续时间等)的采集、记录和存储,得到此话题高维舆情数据集合K,记为K={k1,k2,…,ks},其中k为舆情相关数据或数据集。

b.中细粒度舆情信息处理:首先对高维舆情数据集合K按舆情一级维度(主体维、内容维、传播维)进行预处理、分炼、降噪,最大程度地压缩数据空间,充分挖掘舆情数据集中隐藏的舆情危机。即对高维舆情数据集K进行一次降维,生成有赘余的低维舆情数据集;再对其进行细处理,按舆情预警指标体系(见图3)中一维指标所对应的各次维指标对其进行二次降维,将舆情事件从主体维、内容维、传播维三个维度,往次维指标分炼、识别、归类,从而得到冗余度低、独立性强的低维舆情数据集K',K'={k'1,k'2,…,k'f},其中,k'为舆情次级维度数据或数据集,且f<

c.细粒度舆情信息分析及应用:首先对中细粒度舆情信息处理后冗余度低、独立性强的低维舆情数据集K'(即各次维指标集),进行单指标警级评判(评判标准见表1);其次结合各次维指标警级与权重进行该话题的综合指标评判,最终实现舆情预警。

3 实例验证

综合考虑国际惯例以及我国网络舆情相关机构管理规定,不同舆情预警级别特征可概述为:Ⅰ级预警:出现舆情,网民对该舆情关注度低,传播速度慢,舆情影响局限在较小范围内,没有转化为行为舆论的可能;Ⅱ级预警:出现舆情,网民对该舆情关注度较高,传播速度中等,舆情影响局限在一定范围内,没有转化为行为舆论的可能;Ⅲ级预警:出现舆情,网民对该舆情关注度高,传播速度快,影响扩散到了很大范围,舆情有转化为行为舆论的可能;Ⅳ级预警:出现舆情,网民对该舆情关注度极高,传播速度非常快,影响扩大到了整个社会,舆情即将化为行为舆论[23]。本文仍以上海交通大学舆情研究实验室“中国公共事件数据库”为依托,从近30 000起公共安全事件中挑选出舆情热度较高的6个案例作为研究样本, 并利用本文提出的基于系统安全降维理论的网络舆情危机预警方法对其预警级别的进行了实证分析。

步骤1:舆情信息采集

本文为简化舆情数据收集难度,选择新浪微博与腾讯微博为相关案例数据收集平台;新闻媒体选择中央电台、当地电台、新浪新闻3个媒介。定量指标数据主要依据案例、抽样和官方统计获取,定性指标数据来源于调查问卷。整理后数据如表2所示:

表2 舆情案例数据统计

步骤2:确定预警等级

a.次维指标预警等级评判:以“温州动车事件”为例,可依据网络舆情单指标警级判定标准(见表1 ),可对其进行次维指标预警等级评判,结合各维度权重如表3所示。

表3 预警指标体系权重分配与等级

b. 计算舆情综合加权值′A:依据公式:′A=ΣU`i·u`ij·£ij,计算“温州动车事件”舆情综合加权值′A。其中:′A表征各个预警指标的综合加权值;U`i表示一维指标Ui的权重,u`ij表示一维指标Ui包含次维指标uij的权重;£ij表示一维指标Ui中次维指标uij的警级值(按轻度(Ⅰ)、警示(Ⅱ)、风险(Ⅲ)、极度风险(Ⅳ)依次取3、5、7、10);i取1、2、3,j取1、2、3。

′A=ΣU`i·u`ij·£ij={0.32×0.57×10+0.32×0.43×10+0.33×0.31×5+0.33×0.34×10+0.33×0.35×7+0.35×0.54×7+0.35×0.46×7=8.6035

c.综合预警等级评判:通过计算“温州动车事件”舆情综合加权值′A为8.6035,落入预警第三区间(7,9],即该事件预警等级为风险级(Ⅲ级预警)。

同理,“汶川地震”舆情综合加权值′A为10,落入预警第四区间(9,10],即该事件预警等级为极度风险级(Ⅳ级预警);“双汇事件”舆情综合加权值′A为6.1344,落入预警第二区间(4,7],即该事件预警等级为警示级(Ⅱ级预警);“北京特大暴雨”舆情综合加权值′A为8.6431,落入预警第三区间(7,9],即该事件预警等级为风险级(Ⅲ级预警);“宜黄拆迁自焚”舆情综合加权值′A为6.5858,落入预警第二区间(4,7],即该事件预警等级为警示级(Ⅱ级预警);“山西疫苗事件”舆情综合加权值′A为9.0262,落入预警第四区间(9,10],即该事件预警等级为极度风险级(Ⅳ级预警)。

经过分析,6个案例预警结果均与我国网络舆情监管机构管理规定的舆情预警级别特征描述相吻合,从而验证了本文提出的基于系统安全降维理论的网络舆情危机预警方法的实用性与可行性。

4 结 论

突发性网络舆情危机问题归根结底是社会公共安全中的子问题。本文以网络舆情危机警级难以界定为着眼点,针对其多维性特征,从舆情主体、舆情内容和舆情传播3个维度出发,将系统安全降维理论运用到网络舆情危机预警中,构建了基于系统安全降维理论的网络舆情危机预警指标体系及预警方法,最后通过6个实例验证了该预警方法的实用性与可行性。结果表明,运用安全系统降维理论对具体网络舆情危机事件进行维度分解,适当降低维数,可以有效消除舆情次要信息,降低预警难度;进而为国家和舆情监管部门应对复杂且警级难以界定的网络舆情危机预警提供了新的解决方法。当然,本研究方法也存在一定的局限:其一,本文初步建立了基于安全系统降维理论的网络舆情预警指标体系,并给出了次维指标的一个量化计算方法,但舆情事件的降维分析量化过程实际更为复杂,今后还需要深入研究。其二,相关指标权重以及预警区间由设计问卷得到,存在一定的主观性。今后对各指标的权重以及预警区间的有效估量,还需要结合现代化技术深入研究。

猜你喜欢

系统安全降维舆情
混动成为降维打击的实力 东风风神皓极
新型电力系统安全稳定运行分析
基于数据降维与聚类的车联网数据分析应用
地铁车辆车门系统安全互锁回路异常处置思路解析
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
降维打击
提升电力系统安全稳定性的有效措施探究
基于层次分析法的隧道机电系统安全评价
数字舆情
数字舆情