APP下载

网络群体事件预警技术的研究

2019-12-07印晓天王九硕

网络安全技术与应用 2019年12期
关键词:群体性舆情指标体系

◆印晓天 王九硕

网络群体事件预警技术的研究

◆印晓天1王九硕2

(1.公安部第一研究所 北京 100039;2.北京北大方正电子有限公司 北京 100871)

随着信息化时代的到来,群体性事件发生的频率日益增多,它产生的社会负面信息的影响也在日益变大,已经成为影响和制约社会稳定和经济发展的重要因素。因而尽早地检测出群体性事件,并对有一定危害性的话题进行预警,可以为网络监管人员提供有效的决策依据。本文根据线上和线下两个大的分析空间,提出包括信息发布点击与转发总量、涉及的地域个数、情绪负面者比例、是否涉及政治,民族,宗教,境外势力、重大社会事件敏感程度、事件组织者和信息来源在内的七个群体性事件预警体系指标。并根据提出的预警体系,对相应的案例实践进行预警等级分析。

群体性事件;预警指标;预警体系

1 相关工作

结合社会网络分析技术、隐空间理论,北京理工大学相关研究人员提出了网络群体性事件探测和预警分析模型。该模型可以挖掘出网络中隐含的可能导致群体性事件的有害群组,检测他们随时间推移发生变化的规律,并采用可视化方法对其进行图形化展现。此外,一些学者在模型的设计上提出了自己的建议:覃永震等针对群体性突发事件的特征,利用层次分析法,结合舆情生命周期,建立了适合群体性突发事件舆情监测预警评估的指标体系[1]。张鹏等实现了基于BP神经网络的突发事件网络谣言危机预警[2]。余光辉等通过案例调研探讨了每个指标的设置原因、作用与影响范围,最后建立了环境群体性事件背景值与环境事故指标相互结合的双层预警模型[3]。程国杨采用层次分析法与模糊综合评价法相结合的方式来构建群体性事件预警评价模型[4]。张小伟建立群体性事件的网络舆情监管模型并构建了群体性事件的网络舆情预警机制[5]。Hu R等以论坛、微博、博客等具有讨论功能的新闻网站为研究对象,构建网络舆情预警机制,来防范和判断群体性事件的发生[6]。Yao F S从公众情绪的主题演化的角度,研究高校学生群体事件的预防主要关注预警机制[7]。

2 群体性事件预警指标体系

2.1 指标体系

构建指标体系是监测和预警网络舆情风险的基础,指标体系是否科学直接影响和制约着群体性突发事件网络舆情危机判定的结果正确与否。本文根据群体性突发事件及其舆情演变的特点和规律,结合现有的研究成果,构建了初始维度为两个的指标体系:即线上和线下两个大的分析空间,而不是脱离线下空间片面地强调线上空间。其中线上空间又分为信息发布、点击与转发总量、涉及的地域个数、情绪负面者比例、是否涉及政治、民族、宗教、境外势力等问题四个方面,线下空间则分为重大社会事件敏感程度、事件组织者和信息来源的权威性三个方面。各指标以及对应的权重如表1所示。

表1 指标体系表

本文指标体系主要分为五个等级,0—2、2—4、4—6、6—8、8—10,发生的概率越高,得分就会越高,其值与群体性事件发生的概率呈正比关系。预警指标值的评判标准见表2。

表2 群体性事件预警指标值的评判标准

2.1 指标意义说明及数据来源

(1)信息发布、点击与转发量

信息的发布量是与该事件相关的信息总条数,可通过百度新闻搜索引擎或新浪微博的微搜索获得相关的网页或博文总数来获得;信息的点击量是该事件相关信息被点击浏览的总数量,可以统一从新浪微博中抓取相关数据,甚至可以使用点赞数替代这一数值,只要都在一个数据源和一个维度上差异不大;信息的转发量是该事件相关信息被转发的总次数,可以统一从新浪微博中抓取该转发数据。

(2)地理扩散程度

该相关事件涉及的省个数。

(3)情绪负面者比例

对该事件认知中的负面情绪的比例。

(4)是否涉及政治、民族、宗教、境外势力、等问题

根据是否涉及政治、民族、宗教、境外势力、等问题对该事件进行打分。

(5)重大社会事件敏感程度

构建群体性事件敏感词库,按照信息中敏感词库中出现敏感词的多少来确定该事件的敏感程度。

(6)事件组织者

将群体性事件组织者分为社会知名活动人士、知识分子、企业家、受害者本人、受害者家属、一般人士。

(7)信息来源的权威性

按照发布者为上级政府、上级政府对应部门、本级政府、涉事部门、涉事部门个人及一般个体来确定信息来源的权威性。

得到各级指标的权重值后,在分析群体性事件预警等级时,预警等级主要通过评价值的大小来反应。其中,预警等级的计算公式如下:

上式中,表示群体性事件预警的总评价值,代表指标无量纲值,代表指标的权重。通过上述公式可以测量出预警指标体系总评价值,再根据预警评估表3判断警级,并用相应的预警信号灯予以标识。

表3 预警分数与等级

3 群体性事件检测技术

群体性事件检测工作中的第一步是找出敏感人群,然后围绕敏感人群参与的事件进一步检测出群体性事件。本文首先通过人物分类算法找出属于同一类型的人群,对分好类的人群,再利用敏感人群的自主发现算法来找出敏感人群。首先介绍人物分类算法。

3.1 人物分类算法

对于提取出来的敏感人物,利用他们的基本信息作为对其分类的依据,即人物属性,如基本信息(昵称、简介、认证原因、注册地、标签、职业信息、行业类别、一句话介绍等)、社交关系、发布内容、语种、社交媒体的人物推荐等。

图1为人物分类算法流程图。

图1 人物分类算法流程图

3.1.1特征选择方法

之所以说TF*IDF是基于统计的文本特征提取算法,如果单纯只考虑TF时会存在以下两方面的问题:一方面,对于文本中出现的大量的对于文本没有很大贡献的虚词,由于他们出现的频率过高,在特征提取的时候很可能会提取到这些词作为文本的特征,这样做极大地影响了特征提取的有效性;另一方面,特征项的好坏取决于其是否能区分不同类别之间的文本,一个特征项的TF值很高,如果它在所有文本中出现的频率都很高,那么这个特征词并不具有区分力,很难说明这样一个特征词他所代表的具体类别。因此,引入了IDF的概念。

算法可具体表示如下,词频表示特征项在文本中出现的频率,这个数字是对词数的归一化,以防止它偏向篇幅较长的文本:

3.1.2贝叶斯分类算法

人物的分类可通过对用于识别用户的属性进行分类,从而达到对人物类别的识别,在这一过程中我们主要使用朴素贝叶斯分类原理:

1)找到一个已知分类的训练样本集,该训练样本集可根据用于识别用户的属性来获得;

3)如果不同特征属性是条件独立的,则根据贝叶斯定理有如下推导:

3.2 敏感人群的自主发现算法

通过分类算法对人物进行分类后,利用敏感人群的自主发现算法,来发现敏感人群。这里主要考虑微博数据。

该问题需要从两个维度进行分析,首先需要提取具有敏感信息的微博文本,对这一类的微博文本进行分析;其次,根据筛选出来的具有敏感信息的微博博文,从中提取该博文的发布者账号、账号ID、地域、转发评论情况等属性,从而进行下一步的数据分析。首先根据舆情关键词库,对微博数据进行实时分类,判断其是否是涉恐涉暴、重大舆情事件、群体性事件等舆情系统所关注的几个类别;对于筛选出的微博文本,根据每个微博命中的关键词以及关键词多对应的权重,给每条微博一个重要程度的打分,分数越高表示微博涉及的内容越敏感。得到每个微博所对应的敏感分数之后,为其对应的微博ID加上对应的分数,作为该微博发布者的一个累加分数。本系统中考虑以小时为单位对敏感人群重新排序。给出基于内容的微博用户敏感程度计算公式如下:

4 预警结果实例分析

根据本文提出的群体性事件预警系统,针对广西北海民众聚众阻挠码头建设事件,计算预警分数,确定预警等级:信息的发布、点击和转发量为7.36万得8分;情绪负面者比例为35.8% 得6分;统计涉及敏感词个数为12得6分;事件的组织者是受害者本人得4分;涉及省域个数为1得0分;不涉及政治、民族、宗教、境外势力、等问题,得0分;信息来源为上级政府得10分。根据以上数据计算值:

因此根据值可以确定该事件的预警等级为中级,意味着群体性事件发生的可能性比较高,相关部门积极寻找群体性事件的隐患,做好应为危机的准备。

5 结论

随着近年来群体性事件的频发,群体性事件预警机制对于维护社会稳定有着一定的意义。本文的群体性事件预警体系,根据7个预警指标,合理地确定出每个群体性事件的预警等级,进而及时地对有一定危害性的、不安全的事件进行预警,有效地预防和控制不良群体性事件的发生。为网络监管人员提供了有效的决策依据,消除不良的群体性事件给社会带来的威胁和危害。

[1]覃永震,妙全兴.群体性突发事件网络舆情监测预警指标体系研究[J].电子世界,2016(13):109-110.

[2]张鹏,李昊青,兰月新,周颖.基于BP神经网络的突发事件网络谣言危机预警[J]. 电子政务,2016(11):40-47.

[3]余光辉,陈天然,周佩纯. 我国环境群体性事件预警指标体系及预警模型研究[J].情报杂志,2013,32(07):13-18.

[4]程国杨.群体性事件预警机制研究[D].西南交通大学,2015.

[5]张小伟.群体性事件的网络舆情预警机制构建研究[D].电子科技大学,2013.

[6]Hu R. Research on early warning mechanism of group event network public opinion[J]. Computer Era, 2017.

[7]Yao F S. Research on the Early Warning of Student Progressive Group Events in Colleges from the Perspective of the Public Sentiment[J]. Journal of Nanchang University, 2014.

[8]吴军.数学之美[M].人民邮电出版社,2012.

猜你喜欢

群体性舆情指标体系
2022城市商业魅力指标体系
群体性突发事件背景下个体参与行为的认识与反思
在新媒体环境下处置群体性事件探究
网络空间攻防对联合作战体系支援度评估指标体系构建
建筑工程造价指标体系构建与应用探究
数字舆情
供给侧改革指标体系初探
数字舆情
消费舆情
关于群体性事件防控的思考