大数据下的警务管理模式创新思考
2016-03-18张宝康王小勤上海公安高等专科学校上海200189
郑 凯,张宝康,王小勤(上海公安高等专科学校,上海200189)
大数据下的警务管理模式创新思考
郑 凯,张宝康,王小勤(上海公安高等专科学校,上海200189)
摘 要:大数据于公安实践中之运用对警务管理有举足轻重的作用,但由于大数据应用的复杂多样性,目前警务管理中还存在着数据应用的各种疑难问题。据此,应认识大数据警务应用价值,稳步提高应用大数据的技术应用与管理水平,发挥数据应用对公安管理的价值。
关键词:大数据;警务管理模式;大数据警务
大数据下的警务管理,实质是警察部门在对社会治安相关数据收集、加工、分析的基础上,规划与控制日常发生的各项警务活动。回顾公安数据处理的发展,其是伴随计算机数据处理四个阶段同步发展的:第一阶段是单机信息处理,第二阶段是基于运行于小型机、大型机上的数据库进行信息处理,第三阶段是网络环境下应用跨库技术进行数据库跨库检索与数据挖掘处理的信息处理,第四阶段是利用万兆高速网、云平台和数据仓库进行全集数据的清洗挖掘的大数据信息处理。大数据时代已经到来,数据资源已经成为重要生产要素和社会财富,以大数据驱动警务变革正逐渐成为警务发展的重要趋势。因此,在大数据时代如何应用大数据进行有效的警务管理是当前的一个热点,也是一个亟待思考的问题。
一、大数据处理对警务管理的应用价值
社会科学中的统计测量方法与几何学定律、物理学万有引力定律一样,都是构建现代文明的基石。在数据收集和处理能力有限的“小数据”时代,统计学家发明了随机采样法,即通过尽可能少的数据获得尽可能接近实际情况的结果。[1]但在“大数据”时代下,需要通过将“样本”扩展到全体数据,从而提高数据分析的客观准确性,更有条件对数据进行全方位细分和探究,实现对数据的深度利用。大数据有4 个典型特征:第一,数据体量巨大。从TB 级别跃升到PB级别。第二,数据类型繁多。包括视频、图片、日志、位置信息等等。 第三,价值密度低。以视频为例,连续不间断的监控过程中,可能有用数据只有几秒。 第四,快速化。大数据的产生速度很快,处理要求也快,有时须在秒级时间给出分析结果,有些数据时间长了影响使用价值。
大数据时代必然引起警务管理模式的改变。纵观警务管理的发展历史,警务管理模式在不同时期有不同的特点,并且都受到当时的技术与方法的影响。以往警务管理大致经历了如下三个阶段:第一阶段强调专业管理,主要注重警务管理的有效和精确;第二阶段强调社会性,主要注重社会层面对警务的需求与反应;第三阶段强调职业性,主要强调警务管理的独立价值。如今进入大数据时代,基于大数据的清洗、挖掘、整合形成的具有巨大应用价值的数据引导,警务管理必然与大数据关联。但是现实问题是:目前的警务管理没有与大数据时代匹配。这是由于目前警务信息分析多还沿用传统的数据分析工具和分析方法,很多数据的处理只是简单的累加、比对和百分比计算;对很多地区视频监控信息的分析也主要依靠人工观看,信息整合度较低,多种格式的数据整合不全面,数学算法欠缺。随着大数据的应用,如何实现对海量数据的深度应用、综合应用和高端应用,促使这些数据从量变到质变的数据开发和应用,在纽约警察已有实践先例,即“计算机统计法”。该法是通过使用数学算法对海量数据进行分析和建模,让“数据说出未来”,以此来修正人类的偏见和直觉。这也证明了“大数据”时代,可以通过数据分析,挖掘出各类数据背后所蕴涵的内在的、必然的因果关系,进而研判出某一事件发生的概率,科学预测其发展趋势,以此来引导警务管理。这样,大数据处理必然对警务管理模式产生影响。
(一)使用大数据预测犯罪
使用大数据可以促使警务管理由粗放化向精细化转型。大数据平台集中应用,告别了靠手工操作和人海战术的粗放型管理模式,实现了数据自动入库、自动分析和整合应用。如美国警方使用的大数据分析工具, Texton System 的Impace软件,这些最初是为了军方和情报机构设计的,现在不仅用来帮助警方分析人员采集和分析消息文本、图像以及其他信息,还可以用于文本提取、案例组织等。据国外媒体报道,美国孟菲斯市警察局启用Blue CRUSH预测型分析系统后,过去五年暴力犯罪率大幅下降。美国马里兰州和宾夕法尼亚州也开始启用一种能极大降低凶杀犯罪率的犯罪预测软件,不但能预测罪犯假释或者缓刑期间的犯罪可能性,还能成为法庭假释条款和审判的参考依据。实践证明,警务管理引入大数据分析系统,分析历史案件、城市数据源和社交网络数据,找出其中的共同点和相关性,发现犯罪趋势、犯罪模式,并预测犯罪。这个方法就是基于:
1.大数据应用平台告别了靠手工操作和人海战术的粗放型管理模式,实现了信息自动入库、自动分析和实时监控,通过对海量数据的分析和比对,实现了精细化分析和趋势发展的掌控,推动预测进行。
2.大数据应用平台告别了风险隐蔽型管理,实现了风险的防范型管理。[2]依托大数据平台建立的风险管理系统,对重要时段、地段人流、物流的全程监控、分析,可以有效预测风险,控制重、特大事件发生。
(二)使用大数据预防犯罪
应用大数据预测分析软件整合在大数据平台中的相关数据,可以对指纹、掌纹、人脸图像、签名等一系列生物信息数据进行识别、整合和分析,便于警方对关联信息、数据进行集中管理,从中发现犯罪线索、确定犯罪方式。这是基于:
1.大数据关联性分析。在大数据中通过找到一个现象的良好关联物,相关性分析就能帮助我们捕捉现在和预防未来。美国南卡罗来那州的查尔斯顿警方,应用IBM的数据分析工具,帮助当地的400多名警察更加准确地分析犯罪模式和犯罪热点地区,并据此进行警力调配,提前预防犯罪发生,减少了当地的发案率。这是由于大事件的出现不会是瞬间的,而是慢慢形成的。事件关联信息一旦频繁出现,就可能导致犯罪事件产生,影响警务的控制力。警方应用数据分析软件以及相关数据库数据分析整合,可以提前发现大事件产生的相关数据,事前一个一个地将相关因素解决,从而有效控制大事件产生。
2.大数据精确性分析。由于受数据收集和处理技术的影响,警方获得的信息数据与事件形成的真实信息数据之间会有偏差,预防效果也许就会南辕北辙。通过大数据层面的相关数据关联、清洗、纠错,应用数据分析处理软件就可以精细分析相关单元数据,使预防策略有效发挥。在此基础上通过以警务需求为导向,把大数据应用与服务决策、服务实战、服务基层相结合,突出预防工作重点,拓宽研判视野,整合信息资源,完善工作机制,推动警务数据研判的科学化、专业化、实战化和高效化发展。
(三)使用大数据共享其价值并扩展应用
过去,警务部门拥有各自的情报信息系统,很多数据相互隔离,形成了个个信息孤岛。大数据的应用要求实现数据信息共享,最大限度地发挥数据的功效,为警务管理服务,推动警务管理从单兵作战型向协作共享型转型。
1.数据的价值应用。信息数据长期以来都是有价值的,但通常被视为附属于管理核心的一部分,或者被视为机密信息中相对狭窄的类别,但大数据时代收集的所有数据可以因不同的目的和用途进行基本利用。比如通过对相关词条搜索数据的分析,得出问题热点区域和高发时间;通过人们喜好变化数据,得出人们对某些事物的喜好,以及可能引发的流行。这样,大数据时代,新的分析工具和思路为警务管理提供了一系列新的视野,揭示了许多过去不曾注意的联系。
2.数据的扩展应用。大数据时代使得各种数据变得简单易得,而且能够从大数据中通过技术工具客观分析、解读、显化与还原数据集,获得事物要素。正因为如此,警务管理不能止步于传统管理理论与模型,而是要发展和突破以往数据分析方法、分析技术和分析思路,通过整合数据,多次扩展数据释放的信息,从大数据中捕捉影响管理的重要因素,提升警务数据收集处理的扩展应用功能。另外,数据共享还可以避免重复工作,如数据的联合查询和模糊查询的功能, 可以让用户在即便拼错单词的情况下, 以一个查询语句访问不同的数据库;或者借用一系列数据,找到事物核心。[3]
二、Hadoop与警务大数据平台构建
警务信息的计算机统计,实质就是一个警务大数据收集、清洗、挖掘处理并输出结果,获得相关信息指导警务管理的过程。大数据时代是一个数据为王的时代,需要处理海量数据,其中包含了警务相关数据。警务管理更多地要实现对海量数据的深度发掘应用、综合应用和高端应用,促使这些数据从量变到质变。因此,应用大容量、可扩展、自冗余、可容纳及处理各种数据类型的高可靠性平台,可以为警务大数据处理服务。
(一)大数据平台的典范Google
目前世界上比较成功的大数据处理平台莫过于Google数据中心以及廉价的Linux PC机组成的大型集群,支撑着全世界Google用户的各种应用。其核心组件有3个:
1.GFS(Google File System)。一个分布式文件系统,隐藏下层负载均衡、冗余复制等细节,对上层程序提供一个统一的文件系统API接口。Google根据自己的需求对它进行了特别优化。包括:超大文件的访问,读操作比例远超过写操作等;GFS把文件分成64MB的块,分布在集群的机器上,使用Linux的文件系统存放;同时每块文件至少有3份以上的冗余,中心是一个Master节点,根据文件索引,找寻文件块。
2.MapReduce。Google发现大多数分布式运算可以抽象为MapReduce操作。Map是把输入Input分解成中间的Key/Value;Reduce把Key/ Value合成最终输出Output。这两个函数由程序员提供给系统,下层设施把Map和Reduce操作分布在集群上运行,并把结果存储在GFS上。
3.BigTable。一个大型的分布式数据库,它不是关系式的数据库,而是像它的名字一样,就是一个巨大的表格,用来存储数据。
(二)Hadoop
Google的大数据平台为其专用,Google以外无人能用。然而基于Google大数据平台白皮书开发的开源系统Hadoop 不失为是警务大数据平台一个很好的选择。Hadoop 是一个软件框架,由Apache基金会开发,是一个能够储存并管理大量数据的云端平台,分析 PB 级的非结构化数据,并将其转化为可管理的形式使用。即可以在轻松的储存超过一个大型服务器所能容纳的超大档案的同时还能储存、处理、分析几千几万份超大档案。Hadoop 基于Google 的MapReduce 和GFS(Google File System)分布式文件系统构建而成,可部署于通用的网络和普通PC服务器硬件之上,因此它的成本比较低,能廉价地构建使用。
1.Hadoop的主要优点:(1)高可靠性。Hadoop按位存储和处理数据的能力值得人们信赖。Hadoop 可靠性表现在假设计算元素和存储会失败,仍然有多个工作数据副本,确保针对失败的节点重新分布处理。(2)高扩展性。Hadoop是在可用的计算机集簇间,分配数据并完成计算任务。这些集簇可以方便地扩展到数以千计的节点中。(3)高效性。Hadoop能够在节点之间动态地移动数据,以并行的方式工作,并保证各个节点的动态平衡,并行处理又能够加快处理速度。(4)高容错性。Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配。 Hadoop 针对特定任务类别进行了优化,例如大型数据集索引编制和分类、数据挖掘、日志分析和图片处理等。
2.Hadoop的构成与工作模式。从架构上而言,Hadoop 具有两个主要部分:HDFS与MapReduce。Hadoop 分布式文件系统(HDFS)使用一次写入、多次读取模式,能够将数据拆分为多个存储块,分布在多个节点之中,以实现容错和高性能。MapReduce Engine 通过其 Job Tracker节点接收来自应用的任务。该节点将工作分解成若干个小型任务,然后指派给Task Tracker 节点。当连接至网络拓扑结构感知交换基础设施时,Job Tracker 节点智能地将工作保存在与其所需数据相邻的位置。
3.Hadoop平台的配套组件。ApacheCassandra是一款为大数据量场景设计的数据库管理系统,它的关键特性是容错、扩容、Hadoop集成性和复制支持;Hbase是非关系型的支持容错的分布式数据库,专为存储大量稀疏数据而设计;Hive是为Hadoop设计的数据仓库系统,支持简单数据汇总;Apache Pig由创建数据分析程序的高级语言组成,还包括评估那些应用程序的基础;Apache ZooKeeper是用于分布式应用的一款集中服务,它维护配置信息,并提供命名注册、分布式同步和组服务;Chukwa是一个数据收集系统,可以监控大型分布式系统,包括分析结果的一个工具包。
4.Hadoop的核心竞争力。Hadoop及其配套组件所构成的大数据处理系统的核心竞争力表现在:(1)分布式计算环境下的海量超大数据并行处理技术;(2)支持以容错方式扩展,可以从一台计算机扩展到数千台,构架可动态伸缩;(3)可以处理结构化数据和非结构化数据,支持各种数据源。这个是非常有利于警务大数据处理的一个核心竞争力,也是Hadoop真正的核心价值所在。
5.Hadoop在各行业的应用。Hadoop作为一款并行数据处理可扩展系统,对分析大数据集非常有用。目前,美国有70%的智能手机数据服务背后都是由Hadoop来支撑的;全球范围内80%的在线旅游网站都在使用Hadoop;石油开采领域,利用Hadoop收集和处理海洋的地震数据,以便于找到海底油气田的位置;图像处理领域,使用Hadoop来存储并处理卫星拍摄的地面高清图像,从中探测地理变化;金融诈骗检测方面,金融服务机构利用Hadoop来存储所有的客户交易数据,包括一些非结构化的数据,能够帮助机构发现客户的异常活动,预防欺诈行为。
(三)应用Hadoop构建警务大数据处理平台
Hadoop的特性以及工作模式非常适合构建警务大数据处理平台。通过Hadoop平台可以方便地解决目前警务大数据共享整合问题。面对警务大数据横向交换和纵向汇聚的困难,Hadoop的分布式数据管理技术,通过逻辑上的统一管理和调度,让各种符合大数据定义的海量数据先统一进入Hadoop警务大数据平台,通过 Hadoop的并行计算架构和弹性扩容能力,对数据分散开来存储和计算并提供统一的大数据,支撑对外服务。由于在大数据平台内部,数据天然就是融合的,自然消除了海量数据的跨部门、跨应用交换和跨地市的数据查询和应用问题。这样,运用Hadoop自身的分布式存储和并行计算能力,从一个面上支撑警务机关众多的信息系统建设和数据融合共享,大大减低了警务大数据的整合难度。
三、创新大数据下的警务管理模式的探索
2015年7月21日公安部全面深化改革领导小组第十三次(扩大)会议强调,未来公安要建设完善警务信息综合应用平台,破解基层业务条块分割、协同不畅、信息重复采集等问题,促进资源联通共享,通过统筹规划、整合共享、因地制宜、安全应用的原则推进警综平台的建设完善。以此带动公安有关警种业务系统的融合对接,建立有效的协调管理机制,促使基层基础工作高效规范、业务有机协同、数据动态鲜活、信息高度共享,提升基础工作信息化建设水平。因此,大数据下的警务管理模式创新已经启动。
(一)建设大数据云平台和各类数据共享机制
建设大数据云平台和各类数据共享机制包括:
1.打通公安数据孤岛。公安管理部门要打破各自为战的封闭数据现状,把公安采集的所有数据引入云平台,开放公安数据系统,发挥数据的价值延伸、共享使用、挖掘警示的作用。打通警务数据孤岛在广州已有先例。2014年广东省委常委、珠海市委书记李嘉提出设想:建立一个实时客观反映地区平安状况的评价指数和推动工作的机制。后经应用大数据形成了“平安指数”的指标体系。指标体系的数据可将“发现问题”、“对症整改”和“客观评估”3类相关数据进行有效串联,同时配套运作,发挥研判、预警、督办、问责、考核于一体的“平安指数”价值。
2.警务管理部门要善于购买或共享各类数据。购买或共享各类数据,包括社会、行业的共享或专有数据在内。如百度数据、腾讯数据、阿里数据、快递数据、水电煤使用数据以及民政、卫生、食药监、银行、通信等系统数据,同时注意通过相关单位的物联网搜集交通、自然界的风雨雷电、潮汐、大气情况、水质等数据,进行数据信息关联碰撞,及时发现关联情况。“华南理工大学政府绩效评价中心”对外发布的“2014年度广东省法治政府绩效满意度报告”显示,在社会治安指标的评比中,珠海在全省21个市中得分最高,成为广东省最有安全感的城市。
3.建立数据模型,深挖数据价值。以任务需求为导向,建立相关数据深挖模型,找出现象关联点和要点,设计警务方略。珠海市7大区24个镇街应用3项考核数值包括:违法犯罪警情指数、消防安全指数、交通安全指数,它们的权重分别是60%、20%、20%,形成的综合指数提示社会平安与否。以珠海市香洲区狮山街道办7月3日“平安指数”为例,万人违法警情数值为1.062,表明该街道办每万人(实有人口)平均发生1.062起违法犯罪;万人消防警情数值为0,表明未发生火灾事故;万人交通警情数值为0.929,表明每万人(实有人口)平均发生0.929起交通事故;综合指数95分,平安提示显示为蓝色,表示治安环境良好,社会平安稳定。这些数据均由市公安局警用平台自动采集,选取体现客观性和结果性的数据,摈弃主观性和过程性的指标。根据每天客观数据测算“平安指数”,按照“蓝、黄、橙、红”4级4色预警,4种颜色分别表明优秀、良好、基本平稳、较差4种平安状况。这样,既可以通过看一个镇街的颜色了解其治安、消防、交通状况,又据此进行警务预防。
(二)大数据下的警务管理模式创新探索
1.大数据下的交通拥堵管理。可利用百度、高德的地理信息系统所收集的大数据,结合交通管理系统以往的车辆管理信息、卡口数据、车流数据、交通拥堵数据、事故统计数据、气象数据等进行整合与挖掘,应用Hadoop系统运算,形成交通大流量、时间、地点等整合数据的热力图,按此形成配置警力和车流疏导方案。同时,通过公共平台及时发布交通拥堵情况,开展车流引导,真正实现智能交通引导(ITS)。
2.大数据下的治安管理模式创新。可利用以往的案件统计数据、发案地点、发案时间以及涉案人员情况统计数据,结合街面探头图像数据,应用Hadoop系统进行整合挖掘,分析问题发生的热点分布及高发案件类型、涉案人员及作案轨迹,按此配置警力和形成工作方案。同时,通过公共平台及时发布治安热点情况,开展问题预防。
四、结语
大数据下的警务管理模式创新是时代发展的必然。应用大数据为警务管理提供更优的解决方案,有效解决警务热点问题。因此,大数据时代改革警务管理模式已势在必行。据此以提升警务工作效能,更好地为经济发展服务,为人民群众创建一个安定祥和的生活环境。
参考文献:
[1]周飞 ,石晋杰,崔磊.“大数据”时代的公安工作初探[J].上海公安高等专科学校学报,2013(4).
[2]智慧政府:大数据治国时代的来临[M].中信出版社,2014.
[3]隋玉明.数据时代集团财务共享问题探讨[J].财会月刊,2014.
责任编辑:王 燕
Thinking of Policing Management Model Innovation under Big Data
ZHENG Kai,ZHANG Bao-kang,WANG Xiao-qin
(Shanghai Police College,Shanghai 200189,China)
Abstract:The application of big data in practice is crucial to policing management.However,there exist different kinds of problems in the current policing management as the complexity of big data seems to appear in the processing of policing work.It is necessary to understand the applied value of big data,stably enhance the level of technical management and develop the value of big data applied in the policing work.
Key words:big data;policing management model;policing under big data
作者简介:郑 凯(1960-),女,上海人,上海公安高等专科学校基础部教授;张宝康(1965-),男,上海人,上海公安高等专科学校教辅中心工程师;王小勤(1962-),女,上海人,上海公安高等专科学校图书馆馆员。
收稿日期:2015-10-18
DOI:10.13310/j.cnki.gzjy.2016.01.016
[中图分类号:D631
文献标识码:A
文章编号:1671-5195(2016)01-0102-06]