一种网络舆情的动态预警方法
2012-09-04石鲁生
石鲁生,陈 林,李 凯
一种网络舆情的动态预警方法
石鲁生,陈 林,李 凯
(宿迁学院计算机系,江苏宿迁223800)
针对影响网络舆情预警等级各因素的特点以及目前各预警方法对预警等级动态变化性考虑不足的问题,提出了一种网络舆情的动态预警方法.引入动态模糊集,利用模糊综合评价法对网络舆情进行综合评判和动态预警.选取舆情和舆情受众2个方面共7个对网络舆情预警等级影响较大的因素构成预警指标体系,给出3个舆情实例的预警计算过程及其最终预警等级和动态变化趋势.验证结果表明:动态预警方法可以准确计算出预警等级并对以后的动态变化趋势做出正确判断.
网络舆情;预警;动态模糊性
网络舆情是由于各种事件的刺激而产生的通过互联网传播的人们对于该事件的所有认知、态度、情感和行为倾向的集合[1].由于网络舆情反映了民情民意,影响着社会发展,存在引发社会问题的风险,因此,研究一种可以针对不同情况有效采取合理预控措施的网络舆情预警方法具有重要意义.近年来,国内外不少学者就网络舆情分析和预警进行研究,丁菊玲等通过对网民观点极性、观点强度和观点属性的挖掘,给出了利用三粒度观点树的网络舆情预警方法[2];李耘涛等从基于三角模糊数的网络舆情预警指标体系的灰色特性出发,给出了灰色预警的评价方法[3];许鑫等从信号纵向挖掘和信号横向防控2个维度介绍了突发事件的网络舆情预警方法[4];李弼程等人运用战场态势分析思想,选取7个适合计算机实现的网络舆情态势分析模式,提出了一种基于直觉模糊推理的网络舆情预警方法[5];Eirinaki等通过对Web使用记录的挖掘监控网络舆情并预警[6];Martens等利用单一粒度的观点挖掘算法从技术角度进行网络舆情监控和预警[7];Gao等利用云计算平台对海量的Web信息进行舆情识别和监控[8],此外,文献[9]至[15]从网络舆情的热点发现、预警机制和分析模式等方面提出了一些方法和手段.可以看出,现有研究多侧重于如何及时发现和获取舆情热点以进行网络预警,在预警方法上主要考虑了影响网络舆情的因素众多且复杂,但对其动态性考虑不足,不能全面准确地判断网络舆情的威胁.本研究通过引入动态模糊集(Dynamic Fuzzy Sets,DFS),利用模糊综合评判的方法,对网络舆情进行动态预警.
1 网络舆情预警指标体系
1.1 预警等级
网络舆情预警是发现对网络舆情出现、发展和消亡具有重要影响的因素,并连续不间断地动态监测、度量和采集与它们相关的信息,根据预警体系内容,运用综合分析技术,对当前网络舆情做出评价分析、预测其发展趋势、及时做出等级预报的活动[12].综合考虑国际惯例、我国相关机构管理规定和网络舆情的发展趋势,网络舆情的预警等级被划分为:轻警情(Ⅳ级,非常态)、中度警情(Ⅲ级,警示级)、重警情(Ⅱ级,危险级)和特重警情(Ⅰ级,极度危险级)共4个等级,并依次采用蓝色、黄色、橙色和红色来加以表示[2],4个预警等级的具体定义如下:
蓝色级(Ⅳ级):出现舆情,网民对该舆情关注度低,传播速度慢,舆情影响局限在较小范围内,没有转化为行为舆论的可能;
黄色级(Ⅲ级):出现舆情,网民对该舆情关注度较高,传播速度中等,舆情影响局限在一定范围内,没有转化为行为舆论的可能;
橙色级(Ⅱ级):出现舆情,网民对该舆情关注度高,传播速度快,影响扩散到了很大范围,舆情有转化为行为舆论的可能;
红色级(Ⅰ级):出现舆情,网民对该舆情关注度极高,传播速度非常快,影响扩大到了整个社会,舆情即将化为行为舆论.
1.2 预警指标
网络舆情是随着互联网的发展而产生的,互联网信息的及时性、海量性、广泛性、互动性和虚拟性导致影响网络舆情产生、发展、变化和消亡的因素不仅数量众多而且实时变化,更重要的是这些因素大多较为特殊、复杂且难于分析,因此,将每一个影响因素都反映在预警指标体系中较为困难,而选取对网络舆情影响较大的因素作为预警指标是较为现实的.本研究从舆情和舆情受众2个方面选取了7个指标构成舆情预警体系,如图1所示.
图1 网络舆情预警等级指标体系Fig.1 System of pre-warning indicators of internet public opinion
1.2.1 舆情
(1)热度:某一时间段内舆情被相对集中关注或更加关注的程度.
(2)焦度:某一时间段内舆情热度持续的情况.
(3)敏度:某一时间段内舆情在热点排行榜中上升或下降的情况.
1.2.2 舆情受众
(1)受众数量:某一时间段内关注舆情的网民人数,即受众数量,受众数量越多,舆情的影响力就越大,它是影响评估舆情预警等级的重要指标.
(2)受众广度:某一时间段内舆情受众地理区域的分布特性,即受众广度,受众广度越大,舆情的影响力就越大.
(3)受众倾向性:某一时间段内受众对于舆情所表现的情感信息,即受众倾向性,它可以反映出受众对舆情的某种态度倾向性.
(4)受众关注度:某一时间段内舆情被所有受众关注的程度即受众关注度.
2 网络舆情动态预警过程
网络舆情预警是一个多层次、多指标和多属性的复杂问题,预警过程中要处理的信息具备模糊性和动态性.模糊综合评价法可以在模糊环境中对受多种因素影响的问题做出有效且全面的评价,进而实现复杂的非结构性综合决策,但对于动态特征明显的网络舆情预警略显不足,因此,引入动态模糊集进行综合评判和动态预警是非常必要的.
2.1 动态模糊集
定义 设在论域Z上定义一个映射:
记为(珜B,珝B)=珜B或珝B,则称(珜B,珝B)为(珜Z,珝Z)上的动态模糊集,称(珜B(珖z),珝B(珗z))为隶属函数对(珜B,珝B)的隶属度.
在论域Z上可以有多个DF集,记U上DF集的全体为DF(Z),即
2个DF子集间的运算可以理解为是对其隶属函数作相应运算[16].
2.2 预警数学模型
2.3 预警过程
2.3.1 构造因素集
因素集是预警体系中的预警指标,将不同层次的预警指标构成不同的因素集,并将众多因素分为m类,即将因素集U分成m个因素子集U={U1,U2,…,Ui,…Um},(i=1,2,…,m)每个因素子集Ui有n个元素,即Ui={ui1,ui2,…,uij,…uin},其中元素uij(j=1,2,…,n)表示第i类因素子集的第j个因素.
2.3.2 构造权重集
为区别各因素子集对预警等级所产生影响的重要程度,赋予每个因素子集相应的权数.对因素子集Ui(i=1,2,…,m)赋予相应权数Ai(i=1,2,…,m),则因素权重向量为
同理,在每个因素子集中,根据各因素对该因素子集影响的重要程度,赋予每个因素以相应的权数,构造因素子集的权重向量.设uij的权数为aij,则该因素子集的权重向量为
2.3.3 构造预警集
对网络舆情预警等级的判定依据国际惯例和我国相关机构的管理规定,所有等级(如k个)构成一个判定预警等级的预警集,无论因素分为多少个因素子集,预警集只有一个,即
其中,Vx(x=k,k-1,…,1)表示第x个预警等级.
2.3.4 构造单因素动态模糊预警矩阵
单因素模糊预警单独从一个因素出发进行动态预警,以确定预警对象对预警集中预警等级动态模糊化的隶属度.设uij对预警集中第x个预警等级Vx的隶属度为为行即可得到单因素动态模糊预警矩阵
由于Ri是对第i个因素子集中的各因素进行单因素模糊预警,故为一级动态模糊预警矩阵.则第i个因素子集的动态模糊预警等级
为得到全面的预警结果必须考虑各因素子集对预警等级的影响,故需进行二级动态模糊预警.二级动态模糊预警矩阵应为一级动态模糊预警结果的综合,即
2.3.5 判定网络舆情预警等级及动态变化趋势
在综合考虑各因素子集及因素对预警等级的影响后,进行矩阵运算D=AR,再由S=DVT得到按最大隶属度原则,即确定最终预警等级,并根据)给出动态变化趋势.
3 实例分析
以日本3.11核泄漏危机、中国在利比亚的撤侨行动和315消费者维权为例,通过采集3月12日至3月14日百度贴吧中发帖和跟帖的数据,获取影响网络舆情预警等级的有效信息,采用动态预警方法确定它们网络舆情的预警等级及动态变化趋势.
3.1 预警步骤
3.1.1 因素集
U={舆情(U1),舆情受众(U2)},其中:U1={热度(u11),焦度(u12),敏度(u13)};U2={受众数量(u21),受众广度(u22),受众倾向性(u23),受众关注度(u24)}
3.1.2 权重集
根据专家的意见,采用Delphi法综合得到各因素子集和因素的权重系数,得到因素权重向量A={A1,A2}={0.35,0.65},其中因素子集权重向量A1={a11,a12,a13}={0.29,0.57,0.14},A2={a21,a22,a23,a24}={0.23,0.08,0.38,0.31}
3.1.3 预警集
综合考虑国际惯例、我国相关机构管理规定和网络舆情发展的趋势,得到预警集V={蓝色级(V4),黄色级(V3),橙色级(V2),红色级(V1)},建立预警向量V={4,3,2,1}.
3.1.4 单因素动态模糊预警矩阵
针对不同舆情,通过多位专家评分,给出每个因素对于不同预警等级的动态模糊化的隶属度,得到各舆情的一级动态模糊预警矩阵,再经过与权重集合成运算得到二级动态模糊预警矩阵.
(1)日本3.11核泄漏危机
该舆情的2个一级动态模糊预警矩阵为
第1个因素子集“舆情”的动态模糊预警等级
同理,可得第2个因素子集“舆情受众”的动态模糊预警等级
因此,该舆情的二级动态模糊预警矩阵
(2)中国在利比亚的撤侨行动
该舆情2个一级动态模糊预警矩阵为
同理计算可得该舆情的二级动态模糊预警矩阵
(3)315消费者维权
由该舆情的一级动态模糊预警矩阵为
计算得到二级动态模糊预警矩阵
3.1.5 预警等级和动态变化趋势
(1)日本3.11核泄漏危机
最终预警等级的计算结果为:
(2)中国在利比亚的撤侨行动
(3)315消费者维权
3.2 结果分析
表1为3个实例预警结果的比较.
表1 3个舆情的预警结果比较Tab.1 Comparation of three public opinions pre-warningresults
从表1的预警结果可知,3月12日至3月14日3天内,我国公众对日本3.11核泄漏危机高度关注,预警等级已达橙色级,并且该等级随着时间推移有可能继续上升达极度危险的红色级;而中国在利比亚的撤侨行动自2月末开始持续至3月4日已全部结束,作为1949年以来最大规模的撤离海外中国公民行动,该事件虽然曾经引起公众在网络上的高度关注,但随着时间推移,特别是日本3.11大地震的发生,其受关注程度大为降低,预警等级只达黄色级,且呈现继续下降的趋势;315消费者维权由于是年度活动,受关注程度自然不如3.11地震和撤侨这样的突发事件,故预警等级仅为蓝色级,但是随着3月15日期的临近,其动态变化趋势明显处于上升状态.在随后的几天里,因为网络上谣言四起以及公众对核泄漏的恐慌,全国出现了一次不小的“抢盐风波”,而锦湖轮胎、手机流亡软件和毒餐巾纸等随着中央电视电3.15晚会的曝光也受到了广泛关注和热议,利比亚撤侨行动则随着时间推移逐渐淡出了公众视野,这些都证明前面对各舆情预警等级及其动态变化趋势的判断是正确的.
4 结语
网络是各种不同意见自我表达的重要平台,通过网络舆情预警预先对可能对社会安全与稳定造成影响的事件采取措施,将其危害降低到最小是政府相关部门亟待解决的问题之一.本研究针对影响网络舆情的各因素具有模糊性和动态性的特点,通过引入动态模糊集,并利用模糊综合评价法,构建了一种网络舆情的动态预警方法,实验结果表明该方法对来自网络舆情的威胁能够进行动态、及时且全面的预警.
[1] 曾润喜.网络舆情信息资源共享研究[J].情报杂志,2009,28(8):187-191.
[2] 丁菊玲,勒中坚.基于观点树的网络舆情危机预警方法[J].计算机应用研究,2011,28(9):3501-3504.
[3] 李耘涛,刘妍,刘毅.网络舆情灰色预警评价研究[J].情报杂志,2011,30(4):24-27.
[4] 许鑫,张岚岚.基于信号分析的突发事件网络舆情预警研究[J].情报理论与实践,2010,33(12):97-100.
[5] 李弼程,王瑾,林琛.基于直觉模糊推理的网络舆情预警方法[J].计算机应用研究,2010,27(9):3312-3315.
[6] EIRINAKI M,VAZIRGIANNIS M.Web mining for web personalization[J].ACM Transactions on Internet Technology,2003,3(1):12-13.
[7] MARTENS D,BRUYNSEELS L,BAESENS B,et al.Predicting going concern opinion with data mining[J].Decision Support Systems,2008,45(4):765-777.
[8] GAO H,JIANG J,SHE L,et al.A new agglomerative hierarchical clustering algorithm implementation based on the map reduce framework[J].International Journal of Digital Content Technology and Its Applications,2010,4(3):95-100.
[9] 黄敏,胡学钢.基于复杂网络方法的舆情热点挖掘[J].计算机仿真,2011,28(9):114-117.
[10] 殷风景,肖卫东,葛斌,等.一种面向网络话题发现的增量文本聚类算法[J].计算机应用研究,2011,28(1):54-57.
[11] 郑魁,疏学明,袁宏永.网络舆情热点信息自动发现方法[J].计算机工程,2010,36(3):4-6.
[12] 吴绍忠,李淑华.互联网络舆情预警机制研究[J].中国人民公安大学学报:自然科学版,2008(3):38-42.
[13] 李弼程,林琛,周杰,等.网络舆情态势分析模式研究[J].情报科学,2010,28(7):1083-1088.
[14] 钱爱兵.基于主题的网络舆情分析模型及其实现[J].情报分析与研究,2008(4):49-55.
[15] 谢海光,陈中润.互联网内容及舆情深度分析模式[J].中国青年政治学院学报,2006(3):95-100.
[16] 李凡长,刘贵全,佘玉梅.动态模糊逻辑引论[M].昆明:云南科技出版社,2005:8-9.
(责任编校 亢原彬)
Method of dynamic pre-warning of internet public opinion
SHI Lu-sheng,CHEN Lin,LI Kai
(Department of Computer,Suqian College,Suqian 223800,Jiangsu Province,China)
In view of each factor’s characteristics that affect internet public opinions pre-warning level,and insufficient consideration for dynamic changing trends of the present pre-warning methods,a dynamic pre-warning method of internet public opinion is proposed.Comprehensive evaluation and dynamic pre-warning of internet public opinion are carried out by introducing dynamic fuzzy sets and using fuzzy comprehensive evaluation.Two levels total seven factors that greatly impact on pre-warning network constitute a system of pre-warning indicators,and pre-warning computing processes of three public opinions are given as well as the levels and dynamic changing trends.The results show that this method can accurately calculate the pre-warning level and make the right judgment on the dynamic changing trends of the future.
internet public opinions;pre-warning;dynamic fuzzyness
book=2012,ebook=47
TP391
A
1671-1114(2012)02-0059-07
2011-10-02
江苏省宿迁学院重点科研基金资助项目(2010KY09);江苏省宿迁学院重点科研基金资助项目(2011KY16)
石鲁生(1978-),男,讲师,主要从事新型数据库和动态模糊理论等方面的研究.