微信息舆情的主动介入导引模式*
2016-10-19孙彬,王东
孙 彬, 王 东
(1. 新疆财经大学 计算机科学与工程学院, 乌鲁木齐 830011; 2. 新疆教育学院 职业教育分院, 乌鲁木齐 830033)
微信息舆情的主动介入导引模式*
孙彬1, 王东2
(1. 新疆财经大学 计算机科学与工程学院, 乌鲁木齐 830011; 2. 新疆教育学院 职业教育分院, 乌鲁木齐 830033)
针对微信息舆情所面临的扭曲心态多发、公信力受损、技术死角多等严峻问题,在大数据条件下,利用分布式网络的MapReduce架构设计出虚拟式蜜罐防御模型和相关检测算法,实现监管角色成功介入,能够主动导引用户兴趣方向并预测新舆情倾向,并提出建设舆情监测适用机制的有效措施.结果表明:蜜罐式主动防御系统具有显著的导引功效,检验效率较高,针对性较强,能获得较好的监测效果,加强微信息舆情的主动性防范能力,提高舆情管理部门的公信力和舆情调节控制能力,为微信息监管提供重要的支持.
微信息; 舆情; 大数据; 主动防御; 蜜罐; 检测; 角色介入; 兴趣导引
随着移动网络的迅速普及,微信息传播涉及面迅速扩大,且更新速度愈加频繁.网民通过媒体能够十分便捷地制作和转发新闻,时间上呈现出碎片化、稀疏性和活跃性等特点,但共同情绪倾向的用户往往迅速汇聚,具有潜在的破坏作用,令微信息监控成为社会舆情监管中的难点.
目前我国社会心态情绪的总体基调是积极的、正向的,但在微信息圈中,负能量现象频出,各种利益矛盾逐渐暴露,扭曲心态多爆发,成为社会发展的障碍性问题.许多人境遇不如意,心态扭曲,恶俗、低毁和调侃的声音盖过了理性和客观公正的声音[1];少数不法分子借助互联网的隐蔽性,吹风点火借以宣泄对现行制度的不满情绪[2];少数极端情绪者刻意歪曲和放大炒作一些突发事件,借助微信息圈形成扭曲的共知假象,成为社会重大隐患[3-5].对于网络舆情事件,个别人的“态度缺席”和“政策失语”等现象时常发生[6],他们不惜打政策擦边球,屡屡冲撞法律红线,而监管部门难以获得证据支持,严重地消弱了执政部门的公信力[7].为了加强监管部门与网民信息交互机制,实现监管角色的成功介入,本文基于图型化模型和信息交互行为的心智信念体系[8-10],利用MapReduce设计出虚拟式蜜罐防御模型和相关检测算法,实现主动导引用户兴趣方向并预测新舆情倾向的功能,加强了微信息舆情的主动性防范能力,提高监管部门的公信力.
1 主动防御模式
1.1舆情监测技术
舆情数据具有稀疏性大、类型多样、难辨识等特点[11].虽然汉语词法分析系统ICTCLAS拥有良好的中文分词、词性标注和识别功能[12],但受困于在线捕捉效能低下的瓶颈,检测深度和广度不足;许多微信息系统提供高级API接口,以方便信息咨询机构调用底层数据,包括微文内容、转播次数、评论次数及认证机构等属性[13],但受到隐私和加密等原因制约,API不能保障查全率,且适用范围受限;基于OpenFlow的安全应用能以模块化组成方式进行透明预测和管控数据流,但其主要集中在流量监测领域(粗粒度监测),不涉及进程级的检测[14],定位功效差.
根据以上技术成果的梳理可知,单一技术舆情监测手段并不能满足实际工作需求.本文将分布式处理与蜜罐技术相结合,把虚拟技术与SDN进行整合,实现“流量级”和“进程级”兼顾的主动安全防范.
1.2虚拟式蜜罐机防御架构
在大数据环境下,应用网络分布式运算构建一个MapReduce架构的舆情监测机制.将复杂舆情数据采集活动切分为若干独立单元,由“Map任务”以并行的方式展开监测策略,调用依靠蜜罐机采集到的多种微信息网络空间中的敏感信息,然后各蜜罐节点把结果以“Reduce任务”汇集,最终通过微信息集聚类完成调查用户的异常倾向和调节情绪的任务.根据微信息网络特点,虚拟蜜罐型检测系统如图1所示,该系统主要包括:中心分析器(CDA)、进程检测器(PDI)、仿真虚拟机(VM)和诱饵板(TP)模块.
图1 虚拟检测系统Fig.1 Virtual detection system
借助OVS技术可以扫描前端虚拟机的端口、通量和NAT等状态,也能捕获前端虚拟机的进程数据.各个VM、TP机构成了分布式副本节点;中心分析器CDA担当了MAP的职能;进程监测器PDI实现Reduce的职责.
CDA主要是利用大数据技术,调度管理各个VM和TP,布置“协同策略”、“过滤规则”、“诱饵”、“交互频度”和“进程监督守护策略”等前端机的工作状态.
PDI从蜜罐服务器接受舆情消息,结合“流量级”和“进程级”两个层次,实现对异常信息的协同监测,绘制用户心智趋向逻辑图.
蜜罐诱饵机是实现主动介入和实时检测重要基础.VM从CDA接受布局防御的策略,实施介入调节和局部测算功能;TP借用诱饵话题的方式,吸引用户将VM纳入到自己的信息圈中.
2 主题倾向监测
2.1监测数据集
微信息监测经常面对着“一象多义(一种表象、多种主题解释)”和“一义多象(一种主题解释、多种表象)”等难题,需要合理建立用户现象和主题情绪概念之间的关联.用户信息所暴露的倾向主题与先验的敏感类型有内在的关联性,但不是一一对应的匹配关系,不能直接对等映射.假定一种兴趣倾向zi有m种典型的不良行为,则可构成其交互行为监测指标集C(zi)={cz1,cz2,…,czm}.用户情绪处于不断变化中,倾向主题与先验的敏感类型数据集的关联是多对多的,危害流量、不良记录、网络违规、煽动团伙、欺骗团伙等时常暴露出危害的嫌疑,判断规则很难固定下来.
为避免数据集过于庞大,对于一类交互行为{f1,f2,…,fn},如果它们是n种同义或近似行为,则合并为一个czi指标.假定fk指标的异常阈值εi∈(0,1],那么当用户嫌疑量值Φ(fk)≥εi时,则认定该行为特征的采集成立.如果有fk=czi,且czi⊂C(zi),则将czi指标面对zj的嫌疑度Φ(czi)增加1个权重数量.设权重系数为d(czi),则嫌疑度Φ(czi)的累积过程表示为
Φ(czi)=Φ0(czi)+d(czi)
(1)
该类用户的交互行为嫌疑程度为
(2)
用户兴趣行为影响力随时间延续而衰减,因此,测定时间不同,用户行为涉嫌舆情主题的危险程度也不相同.在[0,t]时间片段内,衰减表达式为
(3)
式中,f0(j,t)为时间衰减函数.多数文献采用指数函数或者线性函数作为时间衰减函数,为照顾适用性,衰减函数定义为
f0(j,t)=1+k0e-λj(t-t0)
(4)
式中:t0为czi发生的初始时间点;λj为衰减因子,用以控制衰减幅度;k0为惯性因子,用以加快衰减的幅度.
2.2关联性评价
基于信息熵或互信息的度量算法能有效地适应特征间的非线性关联性和特征的不确定程度,能够衡量出候选推荐信息与已有舆情信息集之间的关联程度,测算候选特征与类别已有信息集之间的差异性.
一个随机变量x的可能取值为x={x1,x2,…,xk},其概率分布为p(x),则x的熵表示为
(5)
在x发生的前提下,y发生所新带来的熵定义为
(6)
定义互信息为随机变量(x,y)的联合分布和独立分布乘积的相对熵表示为
(7)
各个蜜罐机按照预定调节策略进行舆情调节工作,需要依赖信息候选集的支持.定义调节性介入信息候选集为F,舆情信息集为标签类s,互信息被用来表示两者之间的距离,可以用候选特征项f与标签类s的距离之和表示,即
(8)
定义f和s的相关系数CU(f,s)的取值范围为[0,1],能体现出f在s已知情况下的不确定性减少程度.如果s完全依赖f,那么CU(f,s)=1;如果s完全独立于f,那么CU(f,s)=0.关联系数CU(f,s)可以用来表示候选类f与标签特征s之间的距离,距离可利用候选项f与标签类s中所有特征子集x的类距离求和得到,即
(9)
若候选项f与标签类s的类距离越远,即相关性程度越高,则f就具有较高的优先选择性.如果相关性最大的f并入s中,即可使新标签类s获得较高的内聚性.标签类s的类内距离为D(s,s),并且随着信息项x不断地加入,D(s,s)迭代累加形式为
Di+1(s,s)=Di(s,s)+D(s,x)
(10)
综合以上,对于标签类s相对于候选项f,其评价函数可表示为
(11)
2.3评价聚类过程
根据微信息样本数据的特点,要求不同组样本之间的实体差异尽可能大.如果同类舆情元素合并为一个代表元素,那么就能极大程度地约简数据集,有助于提炼出特征判断规则.基于用户心智的舆情聚类是通过计算各个元素与标签集合的空间距离,以距离疏远程度决定分类,再通过相似性元素的归并最终形成特征判定规则.评价聚类的具体环节如下:
1) 对主题内容设置标志性样本sk为空集;
2) 在舆情特征样本中取出与监测指标集熵距离最大的倾向特征,并将其添加到sk中;
3) 各个前端VM机以sk为聚类中心基,遍历本地舆情样本集或挑选最优的交互行为特征,调整预设主题的重心;
4)Reduce汇聚聚类结果sk;
5) 由sk属性结构提炼检测规则.
2.4介入信息的优选流程
鉴于微信息蜜罐系统调节介入功能的要求,在捕捉舆情苗头、抑制舆情风暴、控制舆情发展和防范群体事件等诸多环节中,都要适时地疏通和消息介入才能实现主动导引的效能.由于VM所采集的信息问题各异,CDA的监测、调和目标也各不相同,所以介入信息优选流程所关注重点是:适应信息圈调节情绪氛围的需要,选择优质举荐信息项.从候选集中挑选最优推荐方案sf的流程如下:
1) 对预设主题设置举荐集sf为空集;
2) 在舆情样本中取出与监测指标集熵距离最大的倾向特征,并将其添加到sf中;
3) 各个前端蜜罐机基于样本集,以sf为中心基,根据评价函数J(f)测算其它各项的关联性,挑选合格的fx(J(fx)>J0),并将fx添加到sf中;
4) 基于sf属性结构合并同类评价,合成举荐、调和信息项.
3 实验结果与分析
实验中设置了35个前端机形成蜜罐靶机,通过TP诱饵,全部VM机均被目标(信息圈)接纳.全部VM机共介入1 363个信息群,采集实验数据集如表1所示.
表1 数据集描述
在进程级检测度量实验中,PDI接受VM靶机的聚类结果,然后进行关联性测量和候选集选择.对最典型有威胁性主题(z1:文艺明星涉黄,z2:虚假广告,z3:狂热迷信,z4:文化低俗,z5:诋毁历史人物,z6:散布攻击国家政策的消息,z7:盲目推崇国外崇拜)进行图表分析,如图2所示.
图2 兴趣倾向威胁性对比Fig.2 Threat comparison in interest tendency
利用进程检测器启动进程级信息监管,收取民众的主流对话意向,聚类后过滤优选形成候选数据集,并将大量的有代表性的敏感热词增补到监测标准数据集中.本文算法与Elman神经网络算法、贝叶斯算法及粒子群优化算法的完成时间及准确度对比如图3、4所示.
图3 完成时间比较Fig.3 Comparison in completion time
图4 准确度比较Fig.4 Comparison in accuracy
由图3、4的比较结果可以看出,本文算法任务完成时间较少,曲线平稳,能应对大量数据并发的情况,稳定性最好;其它三种算法的准确度变化幅度大、稳定性较弱.随着检测指标由50个逐步扩大到600个,本文算法在计算速度上的优势越来越明显,且随着检测指标的增加,精确度逐步提高,并且始终保持领先.本文算法能保障微信息的分类工作,可实现大数据舆情环境下的消息选择、气氛调节和心智描述工作.
按照CDA调节策略,介入预定信息后情绪调节情况如表2所示.在候选集中挑选适当信息,参与信息交互活动,每小时向目标圈介入4条信息,导向性能明显,通过信息介入过程使得信息圈向正能量方向偏转(正偏).测试结果表明,只要能保持正能量氛围,就能吸引网民自动自觉接受该VM,并接纳进入信息圈.管理组织以强硬态度发布信息,不利于信息介入活动,容易产生对抗情绪.蜜罐系统设置的仿真角色调和成功率及情绪引导走向如表3、4所示.
表2 情绪调节概况
表3 角色调和成功率
表4 角色调和情绪走向
实验数据表明:网民比较相信权威,权威专家能够为网络舆情的正向导引提供强有力的支持;导控权威一旦形成,便会具有相对持久的、越来越强的信任关系.随着介入机制的推行,调节公信力和威望能逐步加强,持怀疑态度者逐步减少.有效信息的介入能在微信息圈中形成健康向善、积极乐观的社会心态,避免消极悲观的社会心态,同时有目标地、有步骤地、适当地自动介入一些正能量信息条目,能不断提升网络媒介的报道品味和品质.
利用本算法实时捕捉危险性情绪倾向,对负能量信息倾向者进行重点关注,捕捉情况如表5所示.提炼疑似危害的舆情问题进行规则过滤,形成特色话题调解预案,细分出嫌疑行为者多人.
4 结 论
主动引导防御通过介入引导蜜罐服务,一方面能有效地进行信息介入服务,维持正能量的权威和建立舆情调和机制,另一方面能揭开网络世界的大部分不确定性和隐藏性.实验结果表明:基于分布式网络条件下的主动引导型蜜罐方法能不断提升正面信息的介入量,负能量信息将逐步减少,舆论趋向能逐步向正能量话题收敛,并争取到广大中间立场者的广泛支持,达到张扬正能量的目标.小众群体观点能在正能量的导引下逐步收敛至统一,使极端情绪的个体者数量逐步缩小.
表5 负能量捕捉情况
[1]袁国平,许晓兵.基于系统动力学的关于突发事件后网络舆情热度研究 [J].情报科学,2015,33(10):52-56.
(YUANGuo-ping,XUXiao-bing.Researchontheinternetpublicopinionafteremergencyoccurrencebasedonsystemdynamics[J].InformationScience,2015,33(10):52-56.)
[2]唐子茜,曹勇.网络社会心态的特征及调适对策 [J].北京交通大学学报,2015,14(1):132-136.
(TANGZi-xi,CAOYong.Astudyonthecharacteristicsandadjustmentmeasuresofinternetsocialmentality[J].JournalofBeijingJiaotongUniversity,2015,14(1):132-136.)
[3]刘翠娟,刘茂.基于微博文本数据分析的社会群体情感可视计算方法研究 [J].北京大学学报(自然科学版),2016,21(1):1-6.
(LIUCui-juan,LIUMao.Researchonthevisualizationmethodofsocialcrowdemotionbasedonmicro-blogtextdataanalysis[J].ActaScientiarumNaturaliumUniversitatisPekinensis,2016,21(1):1-6.)
[4]刘德海,苏烨.群体性突发事件调解、预警和防御的情景优化模型 [J].系统工程理论与实践,2014,34(10):2609-2617.
(LIUDe-hai,SUYe.Scenariooptimalmodelofsocialmediation,informationwarningandpolicedeployinmassincident[J].SystemsEngineeringTheory&Practice,2014,34(10):2609-2617.)
[5]李小林,张力娜.基于直觉模糊理论的混合多属性Web服务选择 [J].沈阳工业大学学报,2014,36(6):676-680.
(LIXiao-lin,ZHANGLi-na.Hybridmulti-attributeWebserviceselectionbasedonintuitionisticfuzzytheory[J].JournalofShenyangUniversityofTechnology,2014,36(6):676-680.)
[6]张玉亮.突发事件网络舆情信息流风险模糊综合评价研究 [J].情报科学,2015,33(11):100-106.
(ZHANGYu-liang.Researchonfuzzycomprehensiveevaluationmodelconstructionofinformationflowonnetworkpublicopinionofsuddenevents[J].InformationScience,2015,33(11):100-106.)
[7]陈婧.弱势群体公共信息需求与障碍的实证研究 [J].图书情报知识,2015(3):80-87.
(CHENJing.Anempiricalstudyonthepublicinformationneedandbarrierofvulnerablegroups[J].Document,Information&Knowledge,2015(3):80-87.)
[8]夏琳琳,潘旭影,王丹,等.基于类高斯隶属函数的模糊万能逼近器性能分析 [J].沈阳工业大学学报,2014,36(3):316-321.
(XIALin-lin,PANXu-ying,WANGDan,etal.PerformanceanalysisoffuzzyuniversalapproximatorbasedonGauss-typemembershipfunction[J].JournalofShenyangUniversityofTechnology,2014,36(3):316-321.)
[9]王东,孙彬.互联网正能量教育与主动介入型教育模式研究 [J].新疆大学学报,2015,43(6):28-34.
(WANGDong,SUNBin.Positiveinterneteducationandactiveinterventioneducationtechnology[J].JournalofXinjiangUniversity,2015,43(6):28-34.)
[10]林一,陈靖,刘越.基于心智模型的虚拟现实与增强现实混合式移动导览系统的用户体验设计 [J].计算机学报,2015,38(2):408-422.
(LINYi,CHENJing,LIUYue.UserexperiencedesignofVR-ARhybridmobilebrowsingsystembasedonmentalmodel[J].ChineseJournalofComputers,2015,38(2):408-422.)
[11]吴信东,李毅,李磊.在线社交网络影响力分析 [J].计算机学报,2014,37(4):735-752.
(WUXin-dong,LIYi,LILei.Influenceanalysisofonlinesocialnetworks[J].ChineseJournalofComputers,2014,37(4):735-752.)
[12]张福勇,赵铁柱.采用路径IRP的Windows恶意进程检测方法 [J].沈阳工业大学学报,2015,37(4):434-439.
(ZHANGFu-yong,ZHAOTie-zhu.WindowsmaliciousprocessdetectionmethodwithpathIRP[J].JournalofShenyangUniversityofTechnology,2015,37(4):434-439.)
[13]徐恪,张赛,陈昊.在线社会网络的测量与分析 [J].计算机学报,2015,38(1):165-183.
(XUKe,ZHANGSai,CHENHao.Measurementandanalysisofonlinesocialnetworks[J].ChineseJournalofComputers,2015,38(1):165-183.)
[14]崔竞松,郭迟.创建软件定义网络中的进程级纵深防御体系结构 [J].软件学报,2014,25(10):2251-2265.
(CUIJing-song,GUOChi.Establishingprocess-leveldefense-in-depthframeworkforsoftwaredefinednetworks[J].JournalofSoftware,2014,25(10):2251-2265.)
(责任编辑:景勇英文审校:尹淑英)
Active intervention guidance mode of micro-message public opinion
SUNBin1,WANGDong2
(1.SchoolofComputerScienceandEngineering,XinjiangUniversityofFinance&Economy,Urumchi830011,China; 2.SchoolofVocationalTraining,XinjiangEducationInstitute,Urumchi830033,China)
Aimingatthefactthatthemicro-messagepublicopinionisfacingsuchseriousproblemsasmultipledistortedmentality,damagedcredibilityandmanytechnicalblindangles,undertheconditionofbigdata,thevirtualhoney-potdefensemodelandcorrelationdetectionalgorithmweredesignedwiththeMapReduceframeworkbasedonthedistributednetwork,andtheinterventionofregulatoryrolewassuccessfullyachieved,whichcouldactivelyguidetheinterestdirectionofusersandpredictnewpublicopiniontendency.Inaddition,theeffectivemeasuresfortheconstructionofpublicopinionmonitoringandapplicationmechanismwereproposed.Theresultsshowthatthehoney-potactivedefensesystemhassignificantguidancefunction,highdetectionefficiencyandstrongpertinence.Theactivedefensesystemcanobtaingoodmonitoringeffect,strengthentheinitiativepreventioncapacityforthemicro-messagepublicopinion,improvethecredibilityofpublicopinionmanagementdepartmentandtheregulationcontrolcapacityofpublicopinion,andprovideimportantsupportforthemicro-messageregulation.
micro-message;publicopinion;bigdata;activedefense;honey-pot;detection;roleintervention;interestguidance
2016-03-07.
国家自然科学基金资助项目(61562080); 教育部人文社会科学研究资助项目(14YJA860017); 新疆高校科学研究自然科学重点项目(XJEDU2016I064).
孙彬(1970-),女,新疆乌鲁木齐人,副教授,硕士,主要从事网络安全与计算机信息处理等方面的研究.
控制工程
10.7688/j.issn.1000-1646.2016.05.19
TP292.1
A
1000-1646(2016)05-0584-06
*本文已于2016-09-07 16∶10在中国知网优先数字出版. 网络出版地址:http:∥www.cnki.net/kcms/detail/21.1189.T.20160907.1610.052.html