网络公共舆情研判预警系统研究
2014-04-29楼艺婵
楼艺婵
[摘 要] 网络公共舆情可能引爆社会危机,实时监测是舆情发现、预警的前提。公共舆情研判依赖研判指标指导,利用信息技术构建舆情研判预警系统有助于提高舆情监测、研判、预警、处置过程的自动化程度,对提高政府舆情管理效率具有积极作用。
[关键词] 公共舆情; 研判预警; 信息技术; 舆情管理
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 02. 068
[中图分类号] C912.63 [文献标识码] A [文章编号] 1673 - 0194(2014)02- 0132- 02
1 网络舆情研判的必要性
据《第33次中国互联网络发展状况统计报告》[1],截至2013年6月底,中国网民数量达5.91亿,其中,手机上网比例达到78.5%,互联网在农村的普及速度加快,半年期新增网民中农村网民占到54.4%。近年来,互联网已成为网民情感宣泄、利益表达乃至思想碰撞的渠道,随着用户规模及群体的扩大,互联网作为国民表达渠道的作用将持续加强。
网络舆情从论坛帖子、博客、微博等发起,进而通过跟帖、浏览关注、转发等方式传播扩散,传播带有极强的互动性,传播快、扩散范围广,其“裂变式”传播特性[2]使得网民中具有代表性的情绪和意见被迅速放大。由于网络上的身份隐蔽性、个人社会边界模糊且信息庞杂,刺激、特异或冲突激励的内容往往吸引众多网民的关注,成为网上舆情信息的主要类型。舆情不仅表达网民的情绪、态度等,而且具有一定的鼓动性,并表现出某种行为倾向影响。当网络舆情产生聚集时形成网络舆论,对现实社会产生正面或负面的作用。失实舆情多形成消极舆论,误导民众、激化矛盾,扩大舆情事件危害。涉及公共事务的舆情如产生消极舆论甚至会导致社会危机,故舆情处置好坏对社会影响甚大。因此,及时发现、分析、预测、引导网络舆情变得非常重要。舆情监测从海量网络信息中识别、 发现舆情,舆情研判则对舆情进行价值和趋向判断,舆情处置前提。
2 网络舆情态势研判
公共网络舆情危机通常遵循显现期、扩散期、爆发期、消退期的规律,舆情事件刚发生时,一般只有部分网民关注并参与讨论,其影响范围限制在局部范围内。由于网络传播的快速性,网络舆情迅速进入扩散期,传播互动性将在短期内产生大量舆情言论,并通过网络媒介迅速扩散,演变成为网络聚集。爆发期指的是聚集速度减慢,也意味着扩散达到一定规模,形成网络舆论,引起某种危机。波动消退期指的是舆情爆发后得到合理处置,事件的关注度逐渐降低直至消退,但如果舆情处置出现不合理或者出现相关新事件,将重新派生新的舆情,出现波动。显现期是处置网络舆情的黄金时期,及时介入处理可以快速控制相关事件;扩散期及时的舆情处置能够避免舆论压力和损失;如果舆情进入爆发期,处置难度较大,损失往往已经造成,需要采取非常措施来挽救事态。在波动消退期,处理平息事态意外,对舆情根源的消除措施及长效机制应该被考虑。
研判聚焦舆情发生演变规律,对舆情发展态势做出预测,对舆情信息传播影响决策行为价值进行判断。从危机管理角度来看,最经济的方法是避免危机发生或将其初期消灭[3],所以网络舆情分析研判的任务之一是为处置者提供决策依据及一定程度上的应对选择。所以,我们基于舆情传播影响、舆情处理考虑,构建一个网络舆情态势研判体系,如表1所示。该体系指标包括3个维度一级指标:内容特性、传播扩散、网民态度。
内容特性包括主题敏感性、来源可靠性、内容质量3个二级指标。网民及网络媒体比较关注的敏感主题集中于民生、官腐、民主、司法公正等议题,敏感议题的信息更容易扩散、更快速地进入爆发期。舆情研判必须辨别信息真伪,防止虚假信息传播带来的损害,来源可靠性与内容质量可以帮助判断信息真实性。通常来自网络媒体机构发布的信息具有较高的真实性,可靠性较高,而对于个人发布者,从知名度、活跃度、在事件中的主体身份等判断来源可靠性。内容质量从内容的性质(描述/评论)、内容详略考察舆情信息的真实性,越详细真实性越高。
传播扩散是舆情作用的必然途径,传输扩散过程及信息衍生变化反映出舆情影响度,多种传输平台、传播者对舆情的扩散具有不同的作用。根据舆情扩散特性,设置5个子指标:报道的网络媒体数量、意见领袖关注数量、转发量、浏览量,持续时间。转发量、浏览量反映了网民对某个舆情话题的关注程度,数据越大,关注度越高,也说明事态容易扩大。报道的网络媒体数量、意见领袖的关注数量反映舆情热度,接入的媒体机构、知名意见领袖越多,其热度越高,这两个指标也一定程度上体现了信息来源的可靠性。
网民态度是网民对舆情话题的心理倾向及看法,包括情感倾向、认知层次、行为意向3个二级指标。情感倾向是网民对舆情对象做出的情感体验,表现出喜欢/厌恶、同情/漠然、仇恨/尊崇等;认知层次则是网民对舆情对象的认识,一般通过评述表现,反映出对舆情对象的理解、认识、赞成/中立/反对、信任/怀疑等,评述越详尽、态度越剧烈,则认知层次越高。行为意向是网民对舆情对象的反应或行为可能性。有些网民会在转发、评论的过程中直接体现,也可从其认知评述、感情倾向进行判断,漠然态度下基本不会有潜在行为意向,而“仇恨”的潜在报复行为可能性较高。
3 网络舆情监测分析技术
海量网络信息下的舆情发现依赖信息技术手段支持。从社会科学角度的研究为认识网络舆情提供了理论依据,是网络舆情监测分析的基础,将理论关注的显著特征定性化、数量化,设计实现舆情监测预警系统具有较强的现实意义。
根据舆情演变规律,监测分析过程应包括信息采集、信息预处理、舆情分析研判3个阶段。信息采集是利用软件程序,主动抓取网页信息到本地及其存储,并不断更新,主要采用的是基于主题抓取技术,应用较多的是面向主题的网络爬虫。基于主题的舆情信息采集一般支持自定义URL的网页数据抓取,但对网络上其他类型的文件采集和分析仍有待进一步研究与开发。信息预处理将采集的信息进行去噪、中文分词,然后利用布尔模型或向量空间模型对网页信息进行主题过滤与聚合,统一文本特征的格式。舆情分析对主题进行识别、追踪并研判话题演化趋势,一般在主题语义分析的基础上获取热点话题,通过情感分析技术进行舆情意见挖掘和观点分析,利用基于用户准则构建的舆情研判模型对热点话题进行判定及演化趋势预测。舆情管理提供对舆情信息及分析结果的保存、查询支持,并在舆情分析的基础上提供相应舆情预警及处置建议。网络舆情监测各阶段所使用技术如表2所示。
中文分词指的是将一个汉字序列切分成单独的词,以便进行语义识别,目前常用的中文分词包括字符串匹配法、统计法、理解法3种。从采集到的网页中提取出正文信息,要根据需求针对不同网站制订相应的采集规则、构造分类器,实现网页内容的自动抽取为了便于后续的分析工作,分词后的内容要使用特定的文本表示技术,中文网页还需要转换统一编码格式,以方便文本特征的表示和特征提取。根据页面内容判断与主题相关的提取技术使用基于网页框架、词频、语义、聚类、向量空间的提取方法。
舆情分析研判是舆情研究的核心内容,主要包括话题识别、话题追踪、倾向性分析及热点分析。目前网络舆情话题识别技术,已经从线性文本聚类发展到使用注重内容特征的话题标引统计识别。话题跟踪指将后续内容归类到已存在的若干话题类型,一般采用文本分类方法实现,其过程分成两步,首先进行话题模型训练,获得话题分类模型,然后对后续文档进行分类。热点是反映舆情信息扩散演变的趋势,话题追踪过程中发现热点有助于对舆情管理主体的应对。热点发现采用的方法又基于词频统计排序、基于相似性的热度排序、基于聚类的热度排序、基于社会网络分析的关注度统计等。
倾向性分析可以探查网络传播者的意图和倾向,对倾向性意见与观点判断采用的是情感分析技术,从粒度上情感分析可以分成词语、句子、文档、整体性倾向4个层次。情感词是情感分析的基础,情感词汇抽取及极性评价是一体的过程,通常采用基于语料库、基于词典、基于图的方法。对于意见挖掘,基于词汇和语义特征评分的方法利用关键词统计、语义分析从数量特征与数量关系上判断舆情特点与规律。对文档情感倾向性分析包括简单统计方法、机器学习方法、细粒度情感相关性方法。
4 舆情研判预警系统构建
基于上述分析,我们构建用于网络舆情预警的系统,其结构如图1所示。系统自底向上分为数据层、研判层、决策层,数据层完成信息采集及预处理的工作,并将信息数据放置于数据库中。在研判层,舆情分析人员根据研判指标体系采用合理的研判技术对舆情态势进行研判,并将研判结果提供给决策层。决策层根据舆情态势发出预警报告,处置机构根据舆情态势、处置程序采取应急处置方案,一般情况下,处置必须满足回应及时、信息透明、处置公正、问责到位的基本要求。
5 结 语
舆情管理是政府重要的管理工作之一,网络舆情研判是开展舆情管理的基础和关键环节。本文根据舆情信息处理分析及处置过程提出了舆情研判体系并构建舆情监测预警系统框架,为舆情系统设计实现提供了参考和指导。
主要参考文献
[1] 作者不详. 第32次中国互联网络发展状况统计报告[EB/OL],http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201307/t20130717_40664.htm.
[2] 韩红星, 赵恒煜. 基于裂变式传播的新媒体噪音初探——以微博为例[J]. 现代传播,2012,34(7).
[3] 张小明. 公共危机预警机制设计与指标体系构建[J]. 中国行政管理,2006(7):14 -19.
[4] 陈忆金,曹树金,陈少驰,等. 网络舆情信息监测研究进展[J]. 图书情报知识,2011(6).