APP下载

基于GIS的群体性事件网络数据分析

2017-03-08刘智敏

湖南警察学院学报 2017年3期
关键词:群体性边防分析

刘智敏,赵 虹

(中国人民武装警察部队学院,河北 廊坊 065000)

基于GIS的群体性事件网络数据分析

刘智敏,赵 虹

(中国人民武装警察部队学院,河北 廊坊 065000)

群体性事件发生前,事件相关报道的数量通常会明显增多。随着互联网的发展,此类数据将反映在网络上。通过对群体性事件网络数据进行有针对性的分类和收集,结合群体性事件网络数据的特点和GIS数据可视化的功能对数据进行分析,对可能或即将发生的群体性事件起到预警作用,寻找群体性事件发生前的网络数据的规律。进而使公安边防工作在网上线下都能发挥优势,为公安边防工作指明方向,达到及时预警、辅助决策的目的。

群体性事件;网络数据;数据分析;公安边防工作

处置群体性事件是公安边防工作的重要部分。由于群体性事件具有敏感性且影响大,如何发现群体性事件的萌芽,进而预防群体性事件,是当前国内众学者研究的重点。GIS在英美等发达国家已经得到较长时间的运用,主要被用于犯罪分析和犯罪制图,且收效甚好。现今互联网环境下,所有可能引起群体性事件的网络数据(如网络搜索引擎检索关键词、网民发帖和评论、大型社交软件等),都关联着其主机的IP地址,通过IP地址映射技术可将这些网络IP地址映射为地理位置信息,结合GIS将其IP分布显示在地图上并进行分析,研究群体性事件网络数据,并找出数据异常,为公安边防工作中预防群体性事件提供辅助决策的功能。

一、GIS网络数据分析概述

GIS即地理信息系统,是基于计算机的工具,可以对数据在地图上可视化和分析,把地图的视觉化效果、地理分析功能、数据库操作集成在一起,从而达到解释事件、预测结果、规划战略等目的。[1]

研究群体性事件的网络数据,需要重点关联数据的地理位置信息。IP 地址是连接在Internet 上的设备的唯一标识,TCP / IP 协议使用 IP地址实现不同主机间的信息传递,可以通过 IP地址来实现网络实体地理定位。网络空间映射地理空间模型原理目前比较成熟:利用网络数据中包含的已知IP地址信息,通过与存放有全国所有地级市行政区划IP域的数据库进行比较和匹配,从而明确该数据来源的站点或者发帖IP所在地区的空间位置。目前在国内应用最为广泛的 IP 地址地理位置映射数据库是纯真 IP 数据库,它收集了包括中国电信、中国移动、中国联通、长城宽带、聚友宽带等ISP的最新准确 IP 地址数据,也包括网吧数据。该IP 数据库每 5 天更新一次,最新版本的纯真 IP 数据库记录到达了四万多条。[2]GIS网络数据分析原理根据网络空间到地理空间的映射,提取网络数据对应的IP,与标准IP数据库进行比对,得出该IP所在的地理位置。在此基础上,利用GIS处理数据可以更加清晰地将数据地理位置信息呈现给分析人员和决策者。

基于GIS的网络数据分析以数字地图信息为载体,将地理信息关联到网络数据。GIS网络数据分析可实现以下功能:(1)显示特定区域内敏感词搜索、舆情分布情况;(2)网络数据异常情况分析;(3)网络数据分布的扩散趋势分析。

公安边防部门通过与相关部门进行数据共享可能得到宝贵的网络数据。将收集和监测到群体性事件网络数据实时导入数据库,GIS的可视化能够准确、高效、快捷地对特定区域的搜索引擎关键词信息、网上购物信息、论坛主题帖、视频传播和大型社交软件等网络数据进行分析,第一时间发现异常网络数据并深入分析,对可能引发群体性事件的舆情,实时跟进并从正面引导舆论和宣传,构建积极向上、和谐稳定的主流舆论;针对存在群体性事件苗头的网络数据,采取网上重点监测和实地调查等措施进行隐患排查。

二、群体性事件网络数据类型和特点

(一)群体性事件的网络数据类型分析

通常情况下,诱发群体性事件发生的根源大致有三个:一是社会利益关系发生改变,以宁波PX事件3为例,它涉及到环境、安全与地方经济利益的矛盾,人们会搜索了解与PX有关的信息如环境污染和危险性问题等;[3]二是部分地方政府工作人员没有依法行政,群众与地方存在矛盾未能得到及时解决;三是群众缺少有效的利益诉求渠道,主要表现为群众“有理无处说,说理无反馈”的现象。

现今,互联网已全面普及,此类问题也不可避免地会体现在网络上,形成大量网络数据。即群体性事件发生前,人们或多或少地会在互联网上留下痕迹。未来,由网络直接或间接引发的群体性事件将越来越多,群体性事件发生前的网络数据自然也应该得到重视。通过监测搜索引擎的关键词、论坛发帖、微博用户互相关注情况、大型社交软件等,都将是预防和分析群体性事件的宝贵数据。

1.关键词

搜索引擎是网民从网络获取信息必不可少的工具。“有问题,找百度”也成为网民的普遍思维。而搜索引擎除了能为广大网民提供索引信息,其“网络爬虫”还具有实时监测敏感词,统计各大关键词搜索量等强大功能。[4]公安机关通过与各大互联网公司进行资源共享,合理利用搜索引擎的统计和监测功能,分析特定区域网民的关注动态,能得到有助于辖区工作的情报信息。

在不同阶段或不同地区,需要锁定和监测关键词和部分敏感词也有所不同。针对特定事件实施行动前,个别群体性事件蓄谋者会在网上了解事件的发展趋势,网友的言论和态度,还有可能留下自己的观点,群体性事件的萌芽往往隐藏其中。

2.网络舆情

网络舆情是指在网络空间中,围绕社会事件的发生、发展和变化,民众通过网络对其持有的社会政治态度、信念和价值观。网络舆情是社会舆情在互联网空间的映射[5],随着互联网的发展,大众往往以信息化的方式发表各自的看法,通过技术手段获取网络舆情不仅方便快捷,且覆盖面全。目前,网络舆情的表现方式主要为:新闻评论、微博、跟帖及转帖、朋友圈转发等。

大型论坛发表的主题贴,其内容真实性参差不齐,常常带有较为激烈的言辞,极易影响网民的情绪。尤其是自身利益与主题帖内容相关的网民。此外,发帖作者的身份也具有特殊性,既有可能是为了还原事情真相的正义网民,也有可能是单纯谋求经济利益的网络水军,还可能是有不良企图的造谣者,为达到特定目的捏造或夸大事实,心理学中的认知定势理论认为人们的思维活动与接受信息前的思维定势和对信息的第一印象相关,当前大多数网民都带有仇富、仇官等心理,带有误导性的言论极易煽动网民的极端情绪,诱导网民做出不理智的行为。

视频评论,微博评论甚至“点赞”操作都可以反映出网民对事件的态度,这些评论部分带有情绪化且非理性。例如,柴静拍摄的关于环境污染的视频“穹顶之下”在网络上播出后,被网友疯狂转发和评论,虽然多数评论较为理智,也不乏攻击政府和提议游行示威的言论。群体极化理论指出,在群体决策情境中,由于群体间相互讨论的影响,群体的最终意见通常比个体的决定更具有冒险性,而网络本就是相对开放的世界,网民的言论更是毫不避讳。因此,类似言论若不被重视,一旦对现实社会带来影响,可能会引起严重的群体性事件。

3. 大型社交软件

从早期的腾讯QQ到目前流行的微信、微博等大型社交软件具有信息实时性,用户可能随时随地与他人进行信息交流,表达自己的想法。而使用大型社交软件的用户通常都具有如下特点:(1)人际紧密性,处于同一好友列表、群聊、朋友圈中的用户,其人际关系在地理位置上通常较为紧密;(2)相似性,具有好友关系的用户存在特定的背景相似性和行为相似性,背景相似性指这类人群同来具有相似的背景,如来自同一家族,生活在同一地区;行为相似性指这类人群可能发出相似的行为,如共同上班、求学,具有相似的兴趣和目标等。

随着微信的普及,微信朋友圈中的内容很大程度上扩充了人们的信息量,并能够得到迅速地扩散。这给我们的生活带来了许多便利,同时也滋生出一些不容忽视的问题。由于朋友圈中的用户多数具有相似的背景和行为,此类人群也有着相似的利益需求和行为能力,大型社交软件的实时交互功能更是给煽动情绪、谋划行动等行为提供了便利。因此,朋友圈的强大功能为网络谣言提供了散播平台,同时大大增强了网络谣言的威力。拥有较大用户关注量的公众号所发布的不实信息,很可能在朋友圈的作用下影响一个城市甚至更大的范围。

(二)群体性事件网络数据的特点

群体性事件的发生一般分为三个时期,前期(潜伏期),中期(爆发期),后期(善后期)。[6]随着网络的发展,群体性事件在潜伏期的异常现象将更多地以网络数据的形式散布于互联网。网络数据具有隐匿性,普通网民不会刻意在网络上掩盖自己的身份信息,这就大大提高了网络数据的真实性,除此之外,群体性事件网络数据还具有区域性、异常性和扩散性。对相关数据进行分类整理和分析后进而采取必要措施,能最大程度地减少群体性事件的发生,为预防群体性事件提供先机。

1.数据的区域性

群体性事件本身具有群体性和聚集性,即在特定地点上形成一定数量人群聚集的现象。群体性事件潜伏期的网络数据也存在类似特点,即数据的区域性。这是因为人们对于事件的关心程度是由事件与自身利益的关系决定的,在地域上则表现为,围绕某一事件的一定区域范围内,出现网络数据较集中的现象。基于数据的区域性研究的一大优势在于,它抛开了个体的差异性和随机性,忽略网络数据中出现的个别异常点。即便有人掩盖自己所在网络的真实IP,或发表了不实言论,并不会对特定区域内网络数据的整体趋势有大的影响,也就不影响对网络数据的区域分析。

2.数据的异常性

网络数据异常性可表现为不同区域的数据异常和不同时间段的数据异常。将数据导入GIS进行分析,可以直观真切地在地图上观测到数据的分布情况、不同时间数据的变化情况以及区域间数据分布的差异。不同区域内的数据异常指在特定时间段内,区域内不同位置数据的数量存在差异。不同时间段的数据异常指在特定区域内,不同时间段的数据发生变化且超出了合理变化范围。在分析数据是否存在异常时,若只依据数据量的多少就得出结论,往往会导致分析结果出错。主要原因是,基于以下几点:(1)不同地理位置网络数据量差异,如经济发达和经济落后地区、住宅区和工业区等;(2)不同时间段网络数据量差异,绝大部分网络数据集中出现在网民的空闲时间,部分数据可能伴随着社会重大事件(如国家大型会议、全国性活动前夕等)出现。

3.数据的扩散性

当前互联网的发展相对成熟,网络数据不但高度公开,而且传播速度快。只要条件适宜,网络上的视频、图片和文字都可以对网络世界和现实社会产生巨大的影响。网络数据扩散尤其是网络舆情的扩散,往往与相关事件的发展紧密相关。网络舆情的产生、扩散、消退不完全取决于事态的发展,很大程度上还受到网民、网络公关、网络水军等的影响。此外,网络舆情还会反过来对事态的后续发展起到导向作用。基于网络数据类型的不同,数据的扩散程度和速度也呈现不同。特定领域如科技、政治方面的网络数据,其扩散程度和速度就不如社会热点问题,原因是我国网民中普通人群基数远大于专业领域人群,这也使得从网络数据中研究和预防群体性事件成为可能。

三、基于GIS的网络数据分析方法

群体性事件的发生,从表面上看有一定的偶然性。但追根溯源,则是社会矛盾积累到一定阶段的结果。当社会矛盾不断积累且无法得到及时化解,群众很可能在网络和社会上通过情绪传递形成共振效应,进而爆发群体性事件。公安边防部门根据工作需要与有关部门进行数据共享,并通过边防情报人员有针对性地在互联网上收集和监测网络数据,再将同类数据导入GIS中进行分析,得到有价值的情报。由于不同网络数据在不同时间段的数据量不同,针对不同数据类型,在收集、监测和分析阶段都应当考虑数据与时间段之间的联系,才能得出相对正确的结论。在收集阶段,为取得大量有效数据,最好选择每日下班休息时间段和双休日;在数据监测阶段,首先需对不同时间段的各种数据设立参考系,在此基础上发现异常,如凌晨时段少量涉及政治敏感性的论坛主题帖,也应当引起重视。在分析阶段,要充分考虑特殊事件的节日给数据变化带来的影响,如某地部分区域电路故障导致的网络数据骤减,国庆节前夕对“北京”、“天安门”等关键词的搜索量剧增等现象,都应该结合该时间段的特殊事件对数据异常情况加以排查。

(一)数据分布区域分析

展示数据的空间地理分布的最为常见的方法就是散点图,这是一种较为简单的数据可视化方式。在数据量较小时,散点图可以较好的展示数据分布现象,但当数据量非常大的时候,部分点会重叠在一起,导致难以确定数据热点。由于IP是网络数据的一大重要属性,在地理空间分布中很可能出现重叠,如一栋公寓楼不同楼层均有符合特定条件的网络数据,则应用散点图显示便会产生重叠,且不能够直观地看出数据量的多少。利用GIS对网络数据进行区域分析,将分析范围由点扩大到某块特定区域,可以很大程度地减少数据量大对数据分析的影响。

由于群体性事件网络数据的区域性特点,将分析范围划分为地理上相互区分的块状区域,更能反映出数据的变化特征。目前市面上大多数的舆情监测软件拥有的一大功能就是,将所统计的数据制作成柱状图或饼状图,并通过不同的颜色来展示各个元素的数量多少。数据区域分析在此基础上加入了地理位置属性,使数据更元素的数量分布清晰地呈现在地图的相应位置,以此来分析数据在地理上分布的特点。

(二)数据异常分析

数据异常分析主要包括数据异常点分析和数据异常变化分析。当存在特定IP,其出现频次统计超过IP总数一定百分比时,GIS网络数据分析将对该IP在区域内出现的频次进行可视化,发现数据异常点。数据异常变化的判定标准会根据地理位置不同和时间段的改变而有所不同,也就是网络数据异常的相对性,它事先选定了某区域内的数据,以时间为变量分析数据。在特定区域内,某类数据的数据量明显区别于历史数据,就可称之为异常,并不需要在数量上有硬性的标准。因此,在分析数据前应有针对性地设定参考系,可通过监测和记录数据的历史平均值,将其与新数据比较并发现异常。例如在群体性事件发生前特定时间内,与该群体性事件相关的网络数据(关键词、评论、购物信息、主题帖等)会在短时间内急剧增加,且呈现扩散趋势。此外,国家大型活动、地区网络设备故障等都会引起网络数据异常。数据分析人员要充分考虑到现实情况对数据分布的影响,从网络数据异常中寻求合理解释,发现和排除异常,而这正是计算机做不到的。

(三)数据扩散分析

网络数据的扩散能力相当惊人。群体性事件网络数据若不受控制,扩散后将造成巨大影响。通过分析网络数据扩散现象,寻找其中存在的规律,可以更快发现网络数据异常。

用数据分析软件对收集到的网络数据进行分析,可以得到相对准确的数据扩散函数,将函数用于预测数据发展趋势,并设定合理的误差范围,一旦新数据的变化超出设定的数据范围,GIS可以清晰地对数据异常的时间和区域产生预警信息。数据分析人员通过研判预警信息的准确程度对函数和预警条件进行调整,找出群体性事件网络数据扩散更深层次的规律。

四、GIS网络数据分析在公安边防工作中的作用

公安边防部门将本辖区内可能涉及群体性事件的网络数据导入GIS,并通过GIS平台进行可视化的网络数据分析。要使GIS网络数据分析的强大功能得以服务于实践,需要分析人员对分析结果的判断,并最终提交给决策者以构建相应的预警机制。对于GIS网络数据分析得出的结论,分析人员要结合社会人文环境、现实条件加以分析,面对群体性事件的网络数据,采用传统的预警机制是远远不够的,相关部门在处置应对时,要做到网上线下双管齐下,在网上进行实时监测、对信息位置进行调整(正面信息顶起,负面信息下沉)等工作,线下及时调查,发现和排查安全隐患,制定和改进群体性事件预警方案等。

(一)全面掌握辖区情况

传统的公安边防工作中,为维护辖区治安稳定,通常采取定点巡逻和定期走访的形式。长期从事辖区治安业务的边防工作人员对于辖区的情况了如指掌,但经验不足的边防工作人员则难以胜任,需要长时间的经验积累和实践。

利用先进技术来了解辖区动态,是提高边防工作效率,全面掌握辖区情况的重要手段。目前,互联网已存在大量的政府网站、微博和公众号,每日都能获得许多有价值的网络数据。此类数据均可用于GIS网络数据分析来挖掘出更多有价值的情报。将GIS与边防实际工作相结合,能发挥出GIS网络数据分析应用于边防群体性事件的优势。公安边防工作人员和情报人员将日常收集到的网络数据进行整理,并采用统一标准分类后导入GIS后,可以清晰地看到辖区内数据的分布情况。在此基础上,定期进行数据更新和上传,便能在GIS上观察到信息的动态变化情况。

边防工作人员利用GIS网络数据分析平台对辖区内情况进行分析和学习,能够直观地相互交流,全面掌握辖区情况并形成决策。

(二)及时发现异常

凡是群体性事件几乎都存在一个或多个意见领袖,意见领袖对事态的发展趋势和进程起着决定性的作用。意见领袖通常发言频繁,其发布的内容易得到关注和转发,在网络数据分析中则表现为 特定IP的多次出现。GIS对数据异常点的分析过程正是将网络位置映射到地理空间,划定异常区域。在边防管理辖区内,边防工作人员对可能引发群体性事件的内容,根据GIS网络数据分析提供的方向,及时对辖区内出现的数据异常(包括分布异常、变化异常)进行人工排查。

(三)指导线下处置工作

针对无法在网上排查的疑难问题,公安边防部门发挥传统边防工作的优势,优先排查GIS网络数据分析发现的异常区域和异常点。[7]通过对异常数据进行整理和分析,形成初步的调查提纲,掌握线下的工作方向和工作内容,一方面对辖区进行走访,听取民情民意,及时化解矛盾,另一方面实施情报收集、辖区巡逻管控,及时发现和制止恶意行为。通过网上线下双重实施,能全面排查辖区内隐患,维护边防辖区的社会治安稳定。

(四)辅助网上舆论引导

当前政府部门和公安边防部门开通的门户网站、官方微博、微信公众号等,其主要的运行模式仍是被动接受信息后进行相应处理。在网上针对群众设立的官方平台,不仅是公安边防部门全面掌握辖区情况、及时发现辖区异常的重要渠道,还是进行网上正面舆论引导的主要平台。借助GIS网络数据分析,边防部门能够及时发现辖区的异常情况,化被动为主动,在网上对辖区舆论进行正面引导。[8]此外,针对存在较大安全隐患的问题,还可以配合地方媒体进行正向舆论宣传,争取最大程度地从网上排查可能引发群体性事件的隐患。

结语

随着互联网的发展和大数据时代的到来,传统的公安边防工作已难以满足实际工作需求。只有与时俱进,将传统公安边防工作与先进网络技术相结合,才能最大程度地发挥优势。GIS将复杂繁多的网络数据进行可视化处理,在辅助边防部门分析决策的同时,也在一定程度上缓解了现实工作中基层警力不足的问题,大大提高边防部门的工作效率。

[1]张鲁宁.浅谈基于GIS的可视化互联网舆情监测系统[J]. 通讯世界,2015(8):34-35.

[2]贾民政,商伟.IP地址地理位置映射技术应用研究[J].北京工业职业技术学院学报,2014(1):54-57.

[3]翁士洪,叶笑云.网络参与下地方政府决策回应的逻辑分析——以宁波PX事件为例[J].公共管理学报,2013(4):26-36.

[4]邓焕根.网络爬虫在舆情监测中的应用研究[J].广东科技,2014(6):155-156.

[5]常锐.群体性事件的网络舆情及其治理模式与机制研究[D].长春:吉林大学,2012.

[6]靳娟娟.公安边防群体性事件情报工作的SWOT分析[J]. 图书情报工作,2011(S1):262-266.

[7]安雅丽.边境地区群体性事件诱因及对策研究[J].中国公共安全(学术版),2011(1):127-130.

[8]樊荣.公安边防部队如何引导网络宣传化解“网上舆情危机”[J].湖北警官学院学报,2011(5):107-108.

Network Data Analysis of Group Incidents Based on GIS

LIU Zhi-min
(The Chinese People's Armed Police Forces Academy, Langfang, Hebei,065000)

Relevant reports usually increase before group incidents happen. With the development of Internet, more data will be exposed on the internet. After the collection and the classification of network data of group incidents, this article attempts to explore the law of group incidents by combining the features of group incidents and the visualized function of global information system, and forewarn group incidents. It helps border control work to take movements both online and offline, guide border control work by timely forewarn and facilitate decision-making.

group incidents; network data; data analysis; border control work

D631.43

A

2095-1140(2017)03-0000-00

(责任编辑:李语湘)

2017-01-05

河北社科基金“面向突发事件的情报分析与决策支持研究”(项目编号:HB15TQ002)

刘智敏(1992.7- ),男,福建莆田人,中国人民武装警察部队学院2015级硕士研究生,主要从事公安学研究;赵 虹(1966- ), 男,北京人,中国人民武装警察部队学院教授,主要从事公安情报学研究。

猜你喜欢

群体性边防分析
守卫边防的“帕米尔雄鹰”
金鸡山上守边防
隐蔽失效适航要求符合性验证分析
走边防
电力系统不平衡分析
电力系统及其自动化发展趋势分析
密切党群关系在群体性事件治理中的作用及途径
谈涉警网络群体性事件的应对之策
论网络与群体性事件
2012年上半年群体性事件分析报告