大数据在社会舆情管控及预防应用研究
2018-03-05杨俊斌贾王晶
◆杨俊斌 曹 敏 贾王晶
大数据在社会舆情管控及预防应用研究
◆杨俊斌 曹 敏 贾王晶
(山西警察学院 山西 030401)
社会舆情是特定境遇内的社会群体对当下一些突出问题的言论和评价,社会舆情可以通过多种渠道演化形成并迅速扩散,往往会对社会公共部门的形象造成极大影响,必然会引起社会各方面的强烈关注。社会舆情生命周期是以数据的形式存在并发挥作用。随着社会的快速发展,社会舆情数据日益呈现出海量、结构复杂、瞬时和价值密度底的特点,进而演变成了社会舆情大数据。只要能对社会舆情大数据进行采集、处理和分析,就拥有了社会舆情的预防和管控的主导权,并将拥有社会舆情大数据优势转化为社会舆情预警优势、社会舆情应急处理和社会舆情管控优势。本文通过深入分析社会舆情大数据的现状及存在的问题,提出了以大数据技术为抓手,采集、处理和挖掘社会舆情大数据,进而实现社会舆情的全新预警导控,使社会舆情治理更加科学高效。
大数据;社会舆情;预警;管控
0 引言
随着社会不断的发展和技术不断的进步,公众在表达自己观点和诉求、评价政府决策措施时,可以通过现实和虚拟两种方式,快速传播出去,形成非常大的影响力。而事件本身与公众认知,以及公众认知与政府决策上的偏差,容易导致冲突的产生,有损政府的权威性和公信力,不利于社会的稳定。这也会逆向反逼各级政府部门寻找一个新的思维、新的技术来助推调整工作和管理方式的变革。
世界万物都可归结为数据,汇聚到一起称之为“大数据”。大数据的出现给人对传统数据的认知有了新的深度。随着众多移动终端和各种传感器的普及,产生了海量的舆情数据,形成了“社会舆情大数据”。舆情大数据不仅给人们带来了采集处理海量数据的巨大压力,而同时,大数据相关技术也为社会舆情治理提供了新的思路。有了大数据技术的支撑,社会舆情的监测、应急、预警和导控更加科学有效。
1 社会舆情
“舆情”的概念实际上最早是被18世纪的法国人卢梭提出的,只不过当时的名称还叫做“公众意见”。直到20世纪的时候,“舆情”这个词才被更多的国家使用。然而,直到现在,不同的学科从不同的角度对舆情会有不同的理解和看法。现在主流的看法认为社会舆情是特定的时间和范围的社会公众对社会现实事件的主观反映或者明确的态度[1]。社会舆情是一种十分复杂的社会现象,通过一定的媒体方式形成并传播,其发展遵循着一定的规律,对社会公共秩序产生十分重要影响,因而会引起政府和公众的广泛关注[2]。随着新的传感器和移动终端的不断发展,社会舆情数据的增长呈现井喷态势。
2 大数据
“大数据”这个概念早在1980就被美国的托夫勒提出,但受困于当时的科学技术和社会生产力低下,所以并不被人们重视。直到2008年Nature上发表“Big Data”[3],该文从多个角度介绍了“大数据”带来的机遇和挑战,宣告大数据就正式登上了历史的舞台。
随着社会的不断发展和进步,大数据及其相关的技术研究已经成为学术界的研究热点。大数据是指在特定的时间段内无法用传统数据采集处理工具对其进行采集、存储、处理和分析的海量数据集合[4]。大数据科学是一个新兴的多学科交叉一个方向,主要涉及到信息科学、计算机科学、社会科学、统计学、网络科学、神经学、经济学等。由于大数据潜在蕴涵着巨大的社会和经济价值,已引起了各行各业的高度重视,我国也将大数据列为一项重要的国家战略来进行部署研究。大数据有其特有的5V特点和维度,分别是“ volume”( 数据量大) 、“velocity”(流动速度快) 和“variety”( 数据类型繁多)、“veracity”(真实性)和“value”(价值密度低)[5]。
大数据究其来源极其广泛,主要是互联网交易、移动终端、各种网络设备和传感器、社交媒体等,广泛应用于企事业单位管理、商业、医疗、交通、金融和教育等领域。大数据一方面加速了社会舆情的生成、发展和演化,加速了社会舆情的传播和社会舆情事件的生成, 数据的流量之大、复杂度之高、流动之快导致其可获取性难度增大,给社会各部门对社会舆情监测、采集、处理、分析及决策带来了巨大的压力,造成了巨大的社会危害,损害了有关部门的正面权威形象;同时,大数据相关技术的研究及其应用的不断成熟也为社会舆情大数据的监测、采集、处理、分析、预警和导控等科学决策提供了充分的理论技术支持。
现有的对大数据的研究,主要从大数据作为新的资源来看待,在应用的层面上则是将大数据相关技术作为一种新的技术。这些研究也同时为大数据环境下社会舆情预防和管控提供了理论和技术支持。将大数据相关技术应用到以往尚未或较少的应用到社会舆情预防及管控的领域。
3 当前社会舆情管控的现状及存在的问题
传统媒体尤其是互联网新媒体每天都产生和承载着海量社会舆情信息,这些信息蕴含着社会大众的评价和观点,如果管控不到位,极有可能引发恶劣的群体行为,甚至引发影响极大的社会舆情事件。如何实时监测、采集、处理和分析社会舆情信息,并根据分析结果进行舆情预警及导控,成为了当前社会治理工作中亟待解决的重要部分。
目前,我国社会舆情预防及导控工作中主要存在着以下问题:
一是社会舆情大数据难以采集。社会舆情尤其是网络舆情每天都会产生海量的数据和信息,想要准确、实时地采集到这行数据是一项十分困难的事情。针对社会舆情预警及管控系统而言,微信、微博、和QQ等即时通信平台以及各类贴吧和社区网站是主要的舆情信息源,他们所产生的信息量之大,而且网络视频以及微信、QQ等的信息是非常隐蔽的,使得现有社会舆情信息采集平台不能很好的采集。正所谓“巧妇难为无米之炊”,信息采集不全,直接对社会舆情预警及管控的后续数据处理及数据分析产生了较大的影响。另外,现有的舆情系统采集数据的算法较复杂,采集到的数据往往是重复的,经过人为偏向的筛选过的数据,这些数据处理和分析起来可能事与愿违。
二是社会舆情大数据挖掘分析难度大。社会舆情不仅信息量大,而且结构形式非常复杂,传统舆情分析工具难以统一分析处理。而且在网络上,网民们通常会选用内涵词汇来替代和回避敏感的关键词来变大和传播自己的意思和态度。现有社会舆情预警及管控系统在数据处理方面,一般是将采集的数据经过简单整理后直接进行人工经验判断,或者借助统计学方法进行研判[6]。可见,该方法特别适合处理少量的、结构化的数据,而对于大量的非结构化数据则束手无策。而大量的、深层的知识信息正是隐藏在这些半结构化和非结构化的数据中,却得不到深入挖掘。
三是舆情爆发周期短、传播速度快、应对难度大。网络舆情的爆发周期缩短、传播速度加快,留给舆情管理部门监控、处理、预警的时间大大减少,很多情况下还没来得及处理,舆情就快速蔓延、爆发甚至已经对社会公众和秩序产生了实际的影响,这也给政府的社会治理工作带来了较大的压力。
四是社会舆情结果科学性和实用性较弱。现有的社会舆情预警及管控系统往往采用统计学方法和人工经验方法,没有一套科学系统的研判指标体系[7],从而使得研判结果不科学,决策的有效性降低。社会舆情看似量大复杂、变幻莫测,但只要有一套科学的计算方法和精确的测量指标,将分析出来的隐晦的态度观点以量化的方式来比较,就可实现预警和管控。
4 运用“大数据”对网络舆情大数据进行预测和管控
针对现有社会舆情预警及管控系统存在的上述问题,就需要将大数据思维及相关技术贯穿到社会舆情治理的整个生命周期当中,即必须要在第一时间采集到相关的的社会舆情信息,用大数据相关技术对采集到的舆情信息进行深入挖掘分析,构建一套科学合理的舆情研判指标体系,作出全面准确的社会舆情预警及管控。
大数据技术在社会舆情预警及管控的应用具体表现为:
第一,使用大数据技术实现了社会舆情数据的准确、有效采集。影响社会舆情分析及其预警准确性、有效性的最基本的要求就是舆情数据的识别与采集。只有采集到的舆情数据是全面、真实的,才能保证处理分析出来的预警决策结果是客观、有效的。以社会舆情信息科学分类、充分获取社会舆情信息为基础,使用大数据技术实现社会舆情数据的智能采集,通过社会舆情,大数据在各类社会舆情信息服务终端的自由流动。通过对社会舆情数据进行清洗,确保采集到各类社会舆情信息全面、真实。政府部门和其他机构、个人均可以根据自己的权限从社会舆情预防及管控系统中得到相应的服务。
第二,深度分析社会舆情信息。大数据应用于舆情预防和管控系统,是通过整合大数据采集技术、大数据挖掘技术和人工智能技术,对互联网上社会舆情大数据进行采集、清洗、分类、聚类、分析和决策,为各类用户提供社会舆情监测、预警和管控等服务,形成报告、图表等分析结果,为部门提供分析依据,有利于提早做出舆情预防、全面把握舆情动态、及时做出舆情导控。社会舆情大数据中完整记录着公众当时关注点与兴趣点、移动路径、性格情绪、社会行为、社会关系链等特征。积极使用大数据强大的数据关联分析能力,对采集的数据进行深入的数据挖掘和数据分析,才能得到客观的舆情信息结果,这也是采取开展舆情预防与管控行动的直接依据,对社会舆情大数据进行数据挖掘分析就是将社会舆情中特定的事件进行事件识别、对敏感的话题进行界定与分析、对有嫌疑的群体或个人进行相应的行为分析。
第三,社会舆情预警及管控相关的部门统筹协作。网络舆情生命周期越来越短,留给舆情管控部门的时间也越来越少,社会舆情处理不当,容易引起各类性质恶劣的社会舆情事件。因此,需要采取科学、有效的社会舆情管控方法,借助传统和新媒体平台向社会公众传递正面的信息,引导公众掌握正确的咨询,不造谣传谣,营造良好的舆论环境。但在实践中,与社会舆情预警及管控相关的部门有很多,例如应急办、宣传部门、公安部门等,他们在制订与实施统一的社会舆情导控方案时,就很难进行统一的沟通协调,导致社会舆情导控管理效果大打折扣,从而增加社会舆情事件造成的影响和损失。因此,涉及社会舆情预警及管控的多个部门在制订和实施统一的对策方案时,要一起沟通协商及时采取行动进行干预与抑制。社会舆情治理过程上下级部门之间的关系是命令和服从。上级制定出来的统一的导控方案,下级必须及时完整执行。同时,平等的部门之间通过及时的、平等的协商,实现部门之间的横向协调。
第四,构建科学的社会舆情指标体系。运用大数据技术来采集舆情信息,以科学、有效的方法对齐分类;然后用大数据挖掘技术对舆情大数据进行数据加工、数据挖掘和数据处理等。在此基础上对舆情信息采用不同的方法进行客观和主观的分类,最后将客观得分与主观得分的加权和作为量化的最后得分,与制定好的舆情预警指标进行比对,得到不同的舆情预警等级。指标的分值及加权值是经过综合测试后得到的,必须具有可操作性。
5 总结展望
将大数据与社会舆情、社会舆情预警和导控结合起来,首先要营造和改进大数据应用的环境,发挥大数据推进社会舆情治理体系和治理能力现代化作用。其次要完善社会舆情的大数据管理机制。即将社会舆情大数据管理机制分为事前预警机制、事中控制机制、事后评估机制三个部分[8]。最后,创新社会舆情的引导方式。社会舆情的引导尤其是突发事件舆论引导更应依靠大数据挖掘,掌握舆情制高点,提高舆论管控的针对性,最终达到掌握舆论主动权的目的。
[1]冯希莹,王来华.舆情概念辨析[J].社会工作(学术版), 2011.
[2]张勤.网络舆情的生态治理与政府信任重塑[J].中国行政管理,2014.
[3]梁吉业,冯晨娇,宋鹏.大数据相关分析综述[J].计算机学报, 2016.
[4]杨善林,周开乐.大数据中的管理问题:基于大数据的资源观[J].管理科学学报,2015.
[5]程学旗,靳小龙,王元卓等.大数据系统和分析技术综述[J].软件学报,2014.
[6]董坚峰,肖丽艳.旅游突发事件中的网络舆情预警研究[J].现代情报,2015.
[7]董坚峰.面向公共危机预警的网络舆情分析研究[D].武汉大学,2013.
[8]蔡立辉,杨欣翥.大数据在社会舆情监测与决策制定中的应用研究[J].行政论坛,2015.
学科建设:获山西省“1331 工程”重点学科建设计划经费资助(英文缩写为“1331KSC”)。
团队建设:获山西警察学院创新团队经费支持。
2017 年山西警察学院青年课题“基于大数据的社会安全管控及预防(舆情方向)应用研究”(2017yqn011)。