APP下载

教育考试网络舆情监控与突发事件应急处理体系建设研究

2019-08-08王妞康辉英

电脑知识与技术 2019年18期

王妞 康辉英

摘要:网络舆情的复杂多变对教育网络舆情监测及应对提出了挑战.本文提出了一种依赖网络舆情监测评估指标的教育考试网络舆情监控与突发事件应急处理体系构建方法。针对不同类型处理时不同指标,建立了教育考试质量(Quality of Education Examination,QEE)教育考试模式(Educational Examination Model,EEM)和突发事件应急处理效率(Emergency Response Efficiency,ERE)的网络舆情监测评估指标。本文结合网络舆情特点构建了教育网络舆情监测评估指标体系,克服了以往评价指标体系的模糊性和不可比较的缺点,增强教育网络舆情事件热度评估和监测的准确性和客观性,为构建和完善我国突发事件应急管理体系提供基础和依据。

关键词: 教育考试网络舆情监控;指标体;突发事件应急处理体系

中图分类号:TP393        文献标识码:A

文章编号:1009-3044(2019)18-0030-05

x评估指标体系的权重量化在数值分析、模式识别以及搜索等领域得到了大规模的应用[1-2]。教育网络舆情研究多集中于网络舆情理论、工作机制,关于舆情评估指标体系的研究相对匮乏。所以,构建教育考试网络舆情监控与突发事件应急处理体系已变成目前的研究重点[3-4]。如今,大多研究学者主要的研究重点是使用不相同的特殊算法对教育考试网络舆情监控进行处理[5]。

本文选取了3个网络舆情监测评估指标,在保证初始网络舆情监控准确度一致的前提下,构建了针对不同类型的教育考试网络舆情监控与突发事件应急处理体系.实验结果表明:不同类型的教育考试将会导致对教育考试网络舆情监控处理产生不一样的影响,同时对于处理侧重角度的不同,指标使其发生改变。本文构建的教育考试网络舆情监控与突发事件应急处理体系克服了以往评价指标体系的模糊性和不可比较的缺点,增强教育网络舆情事件热度评估和监测的准确性和客观性。

1 基于凝聚链算法的网络舆情监控

在对突发事件的舆论信息进行分析的过程中,每种舆论都拥有一个中心焦点,围绕相关的中心展开相关的讨论、发表对应的评论信息,因此,基于某个中心话题的舆论信息可以用图1的点分布进行描述。

图1中,小圆圈代表某一个具体的舆论信息(如新闻、评论等),黑点代表舆论中心,虚线的大圆圈代表给定以某一舆论信息为参考对象,文档相似度小于等于给定的相似度闭值为半径所覆盖的区域,该区域所覆盖的点表示与该参考信息非常相似的舆论信息。基于热点突发事件的舆论信息都是舆论的中心话题,因此,具有热点的舆论信息其形成过程一般为首先发表热点信息(如图1中的点Pn),围绕该热点信息进行相关的大量转载与评论报道(如图1中的点B2),这些舆论与该热点信息非常相似。但在对Pn的评论中可能存在某种观点不被人接受,因此针对B2的信息进行再次评论(如图1中的点B1)而点B1的内容与原始焦点Pn的内容相差较大,因此相似程度降低,在图1中表示为B1不在Pn的二一邻域内。在有关的舆论分布中,由于Pn为舆论中心,因此围绕该中心的舆论信息量最大,对应的二一邻域所覆盖的点密度也最大,而针对点B2的舆论信息的评价,信息的关注度明显下降,因此,我们可以根据热点舆论信息的扩散过程的逆过程进行反向搜索,针对任意一个舆论信息(如图1中的Pl点),获取与之相似的舆论信息,并计算其s一邻域所覆盖的点的舆论密度情况,得到点P2最大,说明P2极有可能是Pl的信息来源处,因此针对PZ再次进行分析。在P2的s一邻域中,P3的点对应密度最大,说明P3极有可能是P2的信息来源处。再次对P3进行分析,获取P3的s一邻域,得到P4为最大密度,再以P4为中心进行计算,得到Pn的密度最大。通过对Pn的分析过程中,发现其一邻域没有超过该点的分布密度,因此我们可以说明该点为该区域的舆论中心,搜索过程完成。

凝聚链算法描述如下:

(1)当前信息集合I(ti)清空;当前特征词集合T(ti)清空;特征词频变化数TC(ti)清空;

(2)获取给定站点中的网页信息P;

(3)获取该网页P的更新日期,若该网页P的更新时间小于上次统计时间,则转(5)进行;否则执行(4);

(4)对网页P提取信息内容,将相应信息加入I(ti)中,并对内容进行分词处理,获取网页P的分词向量,添加入当前特征词集合T(ti)中,更新相应分词的频度;

(5)获取下一网页信息,若存在转(1)执行,若不存在,则转(C6)执行;

(6)计算特征词词频变化数TC(ti)= T(ti)一T(ti-1),过滤点磁盘变化数小于等于0的特征词;

(7)对每一个文档计算其[ε]一邻域;获取相应的点密度;

(8)对信息集合I(ti)中的每一个信息文档设置为未处理状态;

(9)获取信息集合中下一个未处理状态的文档d,若不存在则转(11);否则转(10)执行;

(10)将当前文档d的狀态改为已分析,同时获取文档d的[ε]一邻域,对[ε]一邻域内的点分别计算各自的点密度,获得最大的点密度所对应的文档e,若p(e)}p(d)则标记文档d的状态为链尾,转(9)执行;否则,获取文档e作为当前分析文档d,转(10);

(11)获取所有链尾状态的文档集合,过滤点密度小于给定闭值M-point的文档,得到热点文档信息。

2 教育考试网络舆情监控的指标体设计

突发事件应急处理体系凭借自身对教育考试网络舆情监控误差的容错特点,本文在上述分析的基础上,对不同体系进行指标体分析,同时测试这种体系与其他体系之间的差异性,对教育考试网络舆情监控指标所带来的影响。

本文定义的“指标体”代表的是相似运算下节约的资源[Esavings]和输出误差值[Qloss]之间的比值。

式中,求解[Qloss]的度量值应结合实际的问题而定,比如在进行发事件应急处理的过程中,[Qloss]一般按照相似先后顺序将事件紧急的信噪比(PSNR)作为度量标准。本文研究的内容主要是网络舆情监控阶段消耗的时间。按照运算系统层次和耗时因素,把网络舆情监控阶段的时间划分为:

式中,[ESMS]代表教育考试网络舆情监控处理使用时间,在本文主要指的是将教育考试网络舆情监控处理方法应用到四六级英语考试中所用的时间;[ESMA]代表教育考试网络舆情监控处理的时间。

将教育考试网络舆情监控处理的样本[ESMS]通常是指运用到整个突发事件应急处理体系的部分内容。表1表示将不同部分的质量处理置标题占据的比例。其中,使用教育考试网络舆情监控指标占据整个处理过程的比例为25%。需要注意的是每个部分处理所占用的比例根据参数变化而改变。主要的参数包括数据存储时间、样本规模等。本文使用的突发事件应急处理体系主要是根据对教育考试网络舆情监控处理的结果得到的。

将教育考试网络舆情监控数据进行有效存储是使用多元决策体系处理分析的关键,但是,如果增大四六级英语考试的密度,那么在相同的时间段内将刷新四六级英语考试处理数据也将变得更多,使得刷新占据的资源也相应增加。因此,网络舆情监控已变成提高处理突发事件应急处理体系的有效手段。

四六级英语考试刷新次数的减少将会导致一些教育考试网络舆情监控指标数据在存储的过程中发生丢失的现象。而对于分配教育考试任务的四六级英语考试,使用这种体系将会使得部分教育考试网络舆情监控指标体的数据存在较大的误差,如同这些指标体在受到其他外界因素的干扰下引起数值发生改变。四六级英语考试次数越多,那么受到外界因素干扰的概率就会越高。

教育考试网络舆情监控处理结果如图2所示。其中,横坐标表示指标数据占据总体处理质量的百分比;纵坐标表示使用多元网络舆情监控体系下教育考试网络舆情监控的准确度。根据图可知,使用不一样的体系,质量指标就显得更加突出。其中,QEE体系是网络舆情监控指标体中最为重要的指标;ERE指标是最差;EEM指标处于以上两个体系之间.比如针对HAR数据。比如EEM指标准确度为10%;QEE的网络舆情监控准确度仍能达到90%以上,而ERE体系的网络舆情监控精度为53%左右。

值得注意的是,存在的差异程度也会影响教育考试网络舆情监控与突发事件应急处理体系的使用,而对于网络舆情监控结果不敏感的教育考试网络舆情监控指标,使用的体系之间的指标体也比较小。例如在图1中的Adult数据库中,EEM、QEE以及EREH这3中體系的效果曲线变化十分相近。同样还存在另一种特点就是在图1(c)中的MNIST数据库中,ERE指标明显优于EEM,但是其他类型的数据库中,相似计算结果的ERE指标远远比EEM指标的要低很多。主要是因为教育考试网络舆情监控在对处理突发事件应急处理体系的信息采集过程中,删除部分处理突发事件应急处理体系的能力。

通过数值化的方式来说明本文教育考试网络舆情监控指标差异,将上文得到的曲线变化进行拟合,运算出的斜率相应的教育考试网络舆情监控处理敏感度使用[SMS]进行表示。[SMS]代表了单位比例指标体数据导致的教育考试网络舆情监控指标网络舆情监控精度不断降低。如果[SMS]变小,则表明本文体系对存储相似,那么得到的存储处理消耗的时间也将改变。表2给出了三个不同指标在进行教育考试网络舆情监控处理相互之间的灵敏程度,由突发事件应急处理体系可以计算出,教育考试网络舆情监控指标所占的比列每次增加1%,处理准确率将降低1.78%,QEE平均下降0.7%,教育考试网络舆情监控与突发事件应急处理体系平均下降1.95%。

3 教育考试网络舆情监控与突发事件应急处理体系构建

教育考试方式与体系类型有关,即在应用突发事件应急处理体系前,不同体系的[EMMA]和[EMCP]区别很大,使用不同体系进行对此部分进行多元决策时,应该优先考虑体系在近似之前进行的初始评论效果。

需要注意的是四六级英语考试方法[EMMA]的处理不可忽视。对于部分体系来讲,体系中的参数个数比较多,并且在处理样本数据较少的情况下,在对考试热点分析进行评估所占据的比例也不多。本文重点研究了在构建教育考试网络舆情监控与突发事件应急处理体系时,将指标体引入其中,然后对体系进行分级指令,以实现对教育考试网络舆情监控。

就像前文介绍的一样,教育考试网络舆情监控的处理([EMODEL])主要由2部分构成:突发事件应急处理体系下的处理[EMMA]和考试热点分析处理[EMCP]。本文使用体系的访问负载使用[FMMA]代表;质量指标的负载使用[EMCP]进行表示。那么教育考试网络舆情监控与突发事件应急处理体系可用以下公式表示:

4 实验与结果分析

本实验以2018年5月1日-2018年10月1日的新闻为例,对四六级网络舆情评估指标进行分析。为了对数据库中的网页新闻集合特点进行分析,统计在某时间区间内出现的四六级新闻主题报道数量,可以更清晰地看到公众或媒体对于该主题的关注度变化情况。例如,以“四六级考试考试时间”“四六级考试考试报名”“四六级考试作弊” “四六级考试考试成绩查询”为主题的新闻呈现的分别为单峰型、梯形形式,说明在此期间该事件可能激化了新的矛盾;之后新闻数量逐渐减少,意味着人们对该事件关注度下降。

在对热点整体发展情况进行预判之后,采用先整体后局部的分析方法进行分处理。为了提高分析效率,在中文分词之前将每条记录中的content内容导出数据库,用Jieba技术进行分词并将结果写入txt文本中。如表4所示,获得每篇新闻分词结果后,需要对出现的词语进行权值计算(见表5),并建立向量矩阵。根据上述分析可知,使用上文中的3种体系进行的教育考试网络舆情监控处理以及评估计算公式,分别在4个不一样的数据库中进行多元决策分析,分析结果如表6所示。因为参数的设定以及教育考试网络舆情监控与突发事件应急处理体系的构建,能够获得对此3种指标进行网络舆情监控处理,如图4所示,图4(a)为多元决策分析结果;图4(b)(C)依次表示四六级英语考试方式处理和考试热点分析评估结果,图4(d)表示四六级英语考试模式处理与考试热点分析之间存在的差异度。

针对教育考试方式目处理[EMMA]和考试热点分析处理[EMCP],体系指标体的差别一般对处理结果影响很小,处理体系的确定主要是依据处理体系最初的处理差异。由图4(a)可知,不同处理突发事件应急处理体系最初处理的差异比较大,EEM指标因为教育考试网络舆情监控处理以及处理运算都是与支持向量总数呈正比关系,但是在一些计算量比较大的应用中,数据通常很多。所以,对多元决策分析要求标胶高。QEE指标因为存在许多节点,导致体系参数数据增加,访存处理的要求也变得很高。差不多和EEM指标下的质量指标处理一样,。但是ERE置标题下因为体系参数数据和突发事件应急处理体系都很少,多元決策分析在此3种指标下处理准确度相对比较低,与平均分裂处理相比,EEM指标体下的质量指标准确率是ERE指标体处理的29倍,QEE的平均网络舆情监控处理是ERE的11倍。所以,通过此种初始处理差异性很大,表明突发事件应急处理体系对质量处理突发事件应急处理体系影响很大。

不同教育考试方式处理和考试热点分析处理的比例有明显的差异.通过图4(b)和图4(c)可以发现,EEM的教育考试方式处理和考试热点分析处理是属于相同级别,主要是由于在EEM指标下的教育考试网络舆情监控处理以及处理运算都是与支持向量的总数呈正比,所以这两类的差异不大;QEE指标下将突发事件应急处理体系引入到教育考试质量处理中效率很快,但是对于考试热点分析的处理比较低,主要是由于QEE指标下样本节点数太多,所以使得教育考试网络舆情监控的处理与节点之间呈正比关系。所以,对于考试热点分析的处理要小于教育考试质量的处理。

5 总结

突发事件应急处理体系的指标差异对教育考试网络舆情监控与突发事件应急处理体系问题有着重要的影响,本文通过利用3种教育考试网络舆情监控与突发事件应急处理体系,构建的教育考试网络舆情监控与突发事件应急处理体系,以实现对教育考试中紧急事件的准确处理。通过实验结果可知:将评估指标体应用到教育考试网络舆情监控与突发事件应急处理体系的构建中,对提高四六级英语教育考试质量具有积极作用,同时,可以针对不同的考试进行不同类型的处理,在处理突发事件应急处理体系的结构上也具有很大优势。

参考文献:

[1] Noori R, Karbassi A R, Ashrafi K, et al . Development and application of reduced‐order neural network model based on proper orthogonal decomposition for bod5 monitoring: active and online prediction. Environmental Progress & Sustainable Energy, 2013, 32(1):120-127.

[2] Tolonen H, Koponen P, Mindell J, et al. European health examination survey--towards a sustainable monitoring system. The European Journal of Public Health, 2014,24(2):338-344.

[3] Mahawar K K, Parmar C, Graham Y , et al. Monitoring of liver function tests after roux-en-y gastric bypass: an examination of evidence base. Obesity Surgery, 2016, 26(10):2516-2522.

[4] Thoe W, Lee O H K, Leung K F, , et al. Twenty five years of beach monitoring in hong kong: a re-examination of the beach water quality classification scheme from a comparative and global perspective. Marine Pollution Bulletin, 2018(131):793-803.

【通联编辑:唐一东】