APP下载

公安机关采集、管理与应用社会数据工作的若干思考

2015-06-18陈大杰

浙江警察学院学报 2015年3期
关键词:公安机关公安民警

□陈大杰

(宁波市公安局,浙江 宁波 315000)

当前,随着情报信息主导警务模式的深入推进,社会数据作为一类重要的应用资源,越来越受到各级公安机关的重视与关注,同时,对社会数据资源的采集、管理和应用的需求也日益迫切。在大数据时代,如何更好地采集、管理和应用社会数据,确保社会数据更好地服务于公安工作,值得各级公安机关深入探索实践。本文试从当前宁波市社会数据管理应用工作现状出发,分析社会数据管理应用工作的难点,提出加强社会数据采集、管理与应用的工作对策,旨在为探索社会数据转化警务工作战斗力提供可借鉴的范式。

一、社会数据及其与公安工作的关系

(一)社会数据概念。社会数据是人们在社会活动中产生的各类信息。按行业类别可分为银行类、证券类、保险类、邮政类、通信类、劳务类、社保类、卫生类、交通类(包括航空公司信息、出租车信息、汽车租赁信息等)、典当类、税务类、工商类等,是一个范围很广的概念。本文仅从公安业务的角度出发,选用狭义的社会数据概念,即公安外部信息资源。公安外部信息资源是指公安系统外的政府部门、行业主管单位、垄断性企业所掌握的,可以服务于公安侦查破案和基础工作的社会各类基础性数据信息。

(二)社会数据特性。一是社会数据的多样性。在信息化时代,无论是个人还是单位,在社会上活动必然会留下各种社会数据,如通话通信、劳动社保、房地产登记、邮政汇款、医疗保障、金融交易和公交运输等,目前国内约80%的社会数据资源由政府部门掌控。①二是社会数据的关联性。社会数据是一个信息综合体,各种关系错综复杂。在大量纷繁复杂的社会数据之间存在着一定的关联性。三是社会数据的高增长性。同一类型的数据量在快速增大,数据增长的速度在加快。哈尔·范里安是谷歌的首席经济学家,他于2000年对数据和信息进行研究后认为,每年人类社会产生的信息量大,因此无法准确计算,只能估算,他估计2000年新产生的数据量为1000PB②到2000PB,但到2010年,仅仅全球企业一年新存储的数据量就超过了7000PB。③

(三)社会数据与公安业务数据的关系

1.社会数据是公安业务数据的有益补充。在信息化时代,虽然违法犯罪嫌疑对象极力隐瞒自己的身份,但在社会生活、生产和管理过程中,他始终是社会中的一员,必须在特定的时间、地点和行业以真实身份出现,在社会上活动就必然会留下社会数据,如交通往来、住宿娱乐、通话通信、劳动社保、房地产登记、邮政汇款、医疗保障、金融交易等,从中不难发现其活动轨迹。公安机关通过收集整合各类社会数据,就是要将社会数据作为公安业务数据的有益补充,做到为我所用。

2.社会数据与公安业务数据存在交叉重叠。“在一点精确地或近似地复现在另一点所选取的讯息,这些讯息往往都带有意义”。④社会数据是一个信息综合体,既包括内外之间的关系,又包括主次之间的关系,各种关系错综复杂。同时,各类社会数据之间包括与公安业务数据之间,总会出现交叉重叠的现象,存在着一定的关联性。社会数据为公安分析研判、实现各类数据的碰撞比对提供条件。

3.社会数据促进公安业务数据的鲜活。社会数据的价值取决于社会数据的时效性,特别是反映客观事物某种发展趋势、动向的数据,时效性越强,数据的价值越大,高时效的社会数据对公安业务数据而言,补充了公安业务数据的内容,促进了公安业务数据的鲜活准确。例如,常住人口登记中的婚姻登记项目,如结合民政部门数据则更为鲜活精确。

二、宁波市社会数据管理应用工作现状

为全面了解宁波市(以下简称“我市”)社会数据管理应用工作现状,我们开展了文献调查和问卷调查。前期组织了一次公安内部社会数据采集、应用、管理网络问卷调查,针对社会数据采集、管理、应用现状,分采集情况、日常维护管理、发挥实效情况以及对此项工作建议等4 个方面设置了20 余个问题,邀请各县(市、区)公安局、公安分局情报部门、各派出所及部分民警开展问卷调查,一周时间回收问卷300 份。其中,受调查对象中来自派出所的占73.5%,业务大队占14.9%,综合部门占11.6%;受调查对象岗位包括国保、经侦、法制、刑侦、交管、警卫、网警、边防、治安、巡特警、派出所、信访办、指挥中心、禁毒等,其中派出所和治安分别占比44.8%和22.5%。(见图1)

图1 受调查对象岗位分布图

受调查对象工作年限在7年以上占三分之二。从问卷调查情况来看,我市社会信息管理应用的现状主要体现在以下四个方面。

(一)制度建设方面。2009年,我市以反恐办的名义发布《关于整合相关政府部门信息数据的通知》,要求面向政府部门采集社会数据。2011年1月,公安部与国家十四部委联合下发了《关于建立实名制信息快速查询协作执法机制的实施意见》,推动了实名制信息交流共享的开展。宁波市公安局从2007年建立情报信息处开始,启动社会数据获取工作。2007年10月,宁波市公安局职能部门提出《关于加强批量社会数据获取和管理的报告》,在全局范围开展社会数据应用情况和需求调研,明确需要采集的31 家政府(社会)单位数据。2012年,面向县级公安机关和市局业务部门拟定《全市公安机关社会数据采集工作实施方案》,明确社会数据采集三年工作规划。2012 至2014年,我市逐年下发《社会数据采集任务书》,并纳入全市重点工作、业务考核和绩效考核,开展定期通报考核。我市的县(市、区)层面,余姚市、慈溪市以市政府两办名义发文明确整合各部门信息资源,其余各地每年下发社会数据采集任务书。

(二)系统建设方面。政府层面,全市信息应用网络基础设施不断完善,党政机关内部局域网建设步伐不断加快,全市涉及社会管理、公共服务的各个政府部门相继建立了业务信息系统,如宁波电子口岸已建成区域性大通关、大物流、大外贸的统一信息平台。市政府明确宏观经济基础数据库由市发改委牵头建设,人口基础数据库由宁波市公安局牵头建设,作为智慧城市建设的一项内容。公安机关内部,截止2013年,宁波市公安局将核对梳理后的社会数据统一存储于宁波综合信息资源库,2014年起,独立建成社会数据管理系统,专门用于社会数据的存储查询,且数据与宁波综合信息资源库互享互通。余姚、慈溪、奉化、象山、镇海、海曙等多地自行开发社会数据管理系统或专题数据库,有效地推进了社会数据管理应用工作。

(三)采集管理方面。近年来,公安机关内部已存储的社会数据总类别和数量均呈逐年递增趋势。据初步统计,宁波市公安局获取社会数据总类别达200 余种,总数超2 亿多条。全市工商、机场等已建立数据实时获取专线,水、燃气、数字电视、电力、医疗就诊、教育信息、超市商业场所、市民卡、电信移动用户等十余种优质数据定时更新;全市医疗就诊、计生、社保的实时数据获取工作正在洽谈之中。部分县市已开通电信、宽带、学校、社保等信息专线,可实时获取社会数据,但同时,与外地市交换数据或民警零星采集仍然是基层社会数据采集的主要方式。从调查问卷情况来看,有66%的民警参与过社会数据采集工作,在获取的这些社会数据类型中,主要有医院类、教育类、商业类和员工类,个别的还有快递类、保险类等;每个民警每年的社会数据采集任务总体较低,10000 条以上的占39%,1000-10000 条的占30%,1000 条以下的占19%,“零”条的占12%;社会数据获取周期一年以上的占35%,半年以上的占32%,3 个月以上的占29%,从不更新的占4%。(见图2)

图2 社会数据的获取周期分布图

(四)应用实效方面。从调查情况看,基层民警对当前社会数据采集工作满意度评价,很满意的占24%,基本满意的占69%,不满意的占7%。(见图3)这说明社会数据采集工作受到了肯定,但还有很大的提升空间。

图3 当前全市社会数据采集、应用工作评价

社会数据应用工作还是集中在少数专业人员内部。调查数据显示,将近一半的民警对于本地是否有社会数据查询系统不清楚,只有31.1%的民警知道本地的查询系统在指挥中心或情报中心,有68.1%的民警从来没有使用过社会数据进行案件侦查。社会数据查询多应用于失踪人员轨迹、犯罪嫌疑人轨迹查询,利用社会数据协助案件侦查、人员查控,对专业人员而言不乏经典案例。

三、当前社会数据管理应用工作的难点

(一)法律支撑不足。当前,尚无法律法规对公安机关在社会数据整合方面的问题进行明确,以致公安机关在整合信息数据时于法无据,部分单位不理解、不支持、不配合,给此项工作带来一定阻力。如当前公安机关各职能部门仅能通过上门沟通、发函协调、签署保密协议等办法,获得部分行政单位社会数据资源,私营企业往往以诸如个人论坛网站服务器、管理人员不在本地,注册用户信息为个人隐私等为由拒绝提供相关数据。从基层调查情况看,反映社会数据采集困难的原因中“缺少法律依据”一条占比最大,为38.9%。

(二)主动获取意识不强。社会数据采集是公安机关管理工作的需要。公安机关及基层民警通过维护稳定、打击犯罪、治安管理、服务群众等活动,将人、事、物、图像、声音、痕迹等信息收集、归类,再录入相应信息系统,这一过程都需要耗费民警相当长的工作时间和精力。这就需要我们积极主动协调沟通、上门走访做工作,职能部门或责任民警由于一开始沟通不畅而产生“怕烦、厌烦”情绪,影响了数据的主动采集。

(三)数据规范不够。如何收集、保存、维护、管理、分析这些呈指数级增长的社会数据,是一个重大挑战。譬如,社会数据由于属性不同,会有不同的数据展现形式;由于来源渠道不同,存储在不同的载体中,有的在计算机硬盘里,有的在数据仓库内;由于部分社会部门实名制标准制定不久,规范采集的信息尚需时日,譬如,医院登记的就医人员信息、通信部门登记的手机信息、电力部门登记的用电户信息、自来水部门登记的用水户信息、互联网中的微博信息等。部分社会部门在信息采集中,有信息项缺项、数据重复填写等问题存在,例如,在一社区卫生院采集的数据中,就有同一电话号码对应193 名不同的就诊人员的情况。这些数据的不规范影响了社会数据资源整合的效益,公安机关需要呼吁政府层面来统筹解决这一问题。

(四)技术标准不统一。由于此项工作涉及各行各业的不同系统,而公安机关在处理这些社会数据资源时均按照本行业的技术标准和行为习惯进行,导致信息库无法整体获取、信息要素不齐全等问题,需要大量的人工入库工作,过程复杂、耗费时间长,大大降低了信息工作的时效性。很多部门的系统建库工作进展缓慢,或由省级管理部门研发,县级采集信息、开展应用,部门与部门之间信息交流的平台多没有搭建。在基层调查中,反映数据获取缺少技术手段和对方单位数据电子化程度低的问题分别占比11.8%和16.2%。

(五)整合应用不够。近年来,公安机关各业务部门结合自身管理职能和警种优势,建立了社会数据应用管理系统,但受限于缺乏上层统一的整合管理机制和长远统筹规划,致使各层面社会数据资源的应用、整合较为松散、孤立,无法形成高端综合应用的规模效应。通过问卷调查的数据分析,存在三个方面问题:一是部分优质数据仍未整合。在获取的社会数据中,医院类、教育类、物流类、交通类、商业类、外来人口类等社会数据占比比较大,最具应用效益,但目前民警迫切需要物流类、社保类、商业类、铁路类的实时数据还未整合。二是部分字段关联查询尚未实现。对基层民警而言,平常查询时应用比较多的字段是身份证号码、电话号码、车牌等信息,从目前清理的数据来看,尚未能做到关联查询。三是权限开放与专业有限共享之间的矛盾时刻存在。由于社会数据涉密的原因,权限管理控制严格,仅限部分专业警种使用,而民警希望加大开放权限的呼声比较高。

四、加强社会数据采集、管理与应用的工作对策

加强社会数据采集、管理与应用,是公安信息化建设的必然趋势,是提升公安机关核心战斗力的必由之路。根据社会数据资源的特点和整合过程面临的问题,笔者结合实际情况,提出如下加强社会数据采集、管理与应用的工作对策。

(一)丰富社会数据资源源头采集模式。一是推动政府主导下的信息采集。公安机关要为各级党委、政府做好参谋,就社会数据获取工作主动建言献策,积极推动政府层面有关社会数据整合的政策文件出台落实,使整合利用社会数据工作有据可依、有章可循。要结合当前公安机关“四项建设”和我市人口基础数据库建设工作,利用“智慧宁波”建设的契机,从反恐应急处置工作高度出发,争取得到当地党委、政府的重视和支持,将整合社会数据工作纳入党委、政府的整体工作,采取相应工作措施,使整合社会数据工作责任明确、措施到位。二是尝试以协议和购买服务的形式开展社会数据采集,可以借鉴美国的做法。美国国家执法电子通信系统是一个由各州联合组建的为全国执法部门服务的系统,总部设在亚利桑那州的凤凰城。用户每月需支付1700 美元的服务费,以保证该系统的运转。全美50 个州和联邦执法机构都是该系统的用户。该系统是唯一用来专门传送司法信息的系统,并由州政府管理操作,系统昼夜服务,获取信息快速、方便、完整。现该系统包括各州的犯罪历史记录档案、机动车和船只注册档案、国家犯罪局档案、加拿大档案、联邦调查局档案等各种档案。此外,美国的金融犯罪执法网络(FinCEN)与联邦、各个地方执法机构达成信息共享协议,以付费和签订协议形式,进行信息间的沟通与交换;通过该网络,可以获得包括商业、企业、个人等涉及的各种经济活动、社会生活中所有有价值的信息资料,包括住址、出生年月、特征、家庭成员、邻居名字、健康状况以及财务情况,个人或家庭使用水电煤、电子通讯等记录资料,以及外国企业单位的资料。⑤宁波市公安局在此项工作上也有突破,2014年上半年与民航旅客数据的管理单位协商,以购买数据服务的形式获取本地机场旅客实时数据,提升了旅客数据的完整性和时效性。三是立足全警开展非标信息采集。有一部分社会信息,既无法由社会组织机构向公安机关直接汇集,也没有专门社会组织机构掌握这一部分信息并与公安机关建立信息交流共享机制,因此,只能由公安机关组织民警直接搜集。通过动员辖区派出所民警、信息员、社区联络员等力量,从各方面、多角度收集社会数据资源,并加以整合。2012年起,宁波市公安局每年编制社会数据任务书,指导基层整合各类数据,每年获取零散数据2000 余万条。在此,要避免一个误区,即片面强调社会数据的数量,因为当社会数据资源总体量达到一定级别后,县级部门很难有大量更新的数据。所以,在下发每年社会数据采集的任务时,应该参考各地的人口因素、警力因素、社会治安复杂程度因素、经济发展因素等。

(二)创新社会数据资源质量管理模式。一是实行情报部门对社会数据的统一归口管理。将社会数据资源职能统一划归情报部门,以情报部门牵头,其他职能部门配合,派出所为根基,共同做好社会数据资源的整合工作。二是完善数据品质标准管理。要规范社会数据采集标准,在采集数据项标准、采集周期上进行规范。要依托社会各部门力量,推进实名制信息管理,规范社会数据实名制采集的行为,推动政府和相关部门共同落实社会活动实名登记制度。要注重数据品质问题,将整合的社会数据资源,在入库前进行“清洗”,特别对粗放型、伪质性、表面性的信息数据进行精加工。三是寻找数据之间的相关关系。“我们必须关注,当数据点以数量级方式增长的时候,我们会观察到许多似是而非的相关关系”。相关关系最早由达尔文的表弟高尔顿爵士于1888年提出,在大数据时代来临前很久,相关关系就已经被证明大有用途。大数据背景下产生的相关关系分析法则更准确、更快。目前,公安机关处理的大多是结构化的数据。据Gartner的分析报告,随着数据量的增长,将有95%的非结构化数据,公安机关需要寻找它们之间的相关关系并予以利用。四是建立数据采集奖惩机制。建立信息质量终身负责制度,实行采集、应用民警双奖制,在奖励应用民警的同时,对采集民警加大奖励力度,鼓励基层民警采集社会数据的积极性,对采集数据中弄虚作假的,也制定相应惩罚措施。

(三)推动社会数据资源应用共享模式。加强公安机关社会数据的综合利用,应打破“条”“块”分割局面,建立社会数据资源整合、共享机制,实现情报价值的增值。因此,一是要汇集整理深层次业务需求。目前公安机关对社会数据的应用仅限于简单查询,基层民警平常查询时应用比较多的字段是身份证号码、姓名、电话号码、户籍、车牌等信息。随着数据量的爆炸式增长,传统的应用模型已经不能满足情报业务发展的实战需求,公安机关不仅应重视原始社会数据的积累与存储,还应加强对社会数据的二次开发,以满足公安工作延展性、多样性的情报需求。要全面规划云计算与大数据技术在数据深度应用中的新模式,充分借鉴“公安百度”精确或模糊的检索方式,运用HBase 分布式存储、Solr全文搜索以及Neo4j 关系挖掘的大数据技术,将其与现有公安业务有机融合,构建社会数据云服务体系,在数据整合、信息安全、背景联查、关系挖掘、信息布控及多维碰撞等方面进行整体规划。⑥二是做好数据平台统一维护。全市人口基础数据库作为社会数据交换的一个前端系统,要做好管理工作,增加服务器配置、明确各类型数据接入方式。开展社会数据管理库的维护管理,定期对服务器的容量、运行状况进行检测,清除存在的隐患和问题,确保系统的稳定性。在公安机关社会数据的开发利用上,要做到集成多样,开发多种信息载体和信息传递方式,提供集文字、图形、数据、语音为一体的多媒体信息服务。三是要加强民警信息应用培训。信息应用的成效极大依赖于人的素质,要整合社会数据、应用社会数据,关键在于有懂业务懂计算机的民警。因此,要结合公安机关“四项建设”内容,把基层民警信息应用技能包括社会数据应用技能培训作为日常培训的一项基础课程和必训内容,使全体民警能够熟练掌握各类数据应用,做到学透、学精、学活,形成社会数据应用培训的常态机制。要在基层民警中宣传利用社会数据破案的案例,进一步增强应用社会数据的自觉性和主动性,使民警完成从被动使用到愿意使用再到自觉使用的转变。

(四)转变社会数据资源安全管理模式。随着对社会数据获取、处理分析能力的提高,大量数据得以应用。这种情况下,数据安全从传统计算机网络安全等可控安全管理变为不可控的安全管理,数据泄密时有发生。同时,基层单位对数据公开、开放的需求与数据安全之间的矛盾更加突出。公安机关应通过制定相关制度,严格权限管理,既要促进社会数据的交流共享及广泛应用,也要避免社会数据安全管理上的漏洞。大量社会数据涉及公民的个人隐私,如社交关系网、活动轨迹、生理特征等个人信息,一些社会数据表面上并不涉及个人信息,但经分析处理后可以追溯至个人,而且,大数据技术应用使数据的二次利用非常广泛,许多创新性的用途事先无法预知,恶意利用公民隐私的技术门槛大大降低,一些隐私保护策略难以奏效。数据采集与存储数量的剧增、规模的扩大,必将对公民隐私形成挑战,甚至损害公民人身安全。公安机关在社会数据的开发利用中,应承担隐私保护的责任,避免侵犯公民的隐私。⑦我们建议,要建立严格的数据资源使用管理制度,既激发数据的创新性再利用,又确保个人隐私免受侵害;要加强数据使用管理,指定专人负责,完善数据使用审批登记制度。对涉及国家或商业秘密、个人隐私或其他法律、法规禁止公开的信息,公安机关必须依法规范使用。同时,要推行新技术方式来促进隐私保护。例如,引入“差别隐私”概念,即故意将数据模糊处理,促使对数据的查询只显示模糊的结果。譬如,对某一信息呈现“有登记信息10 条”这样的结果,更进一步的使用权限则只开放给更高级别的用户。

注释:

①彭知辉:《公安情报应用专题研究》,中国人民公安大学出版社,2013年版。

②PB 是计算机的计量单位,1PB 相当于千万亿字节。

③涂子沛:《大数据》,广西师范大学出版社,2012年版。

④转引自詹姆斯·格雷克:《信息简史》,人民邮电出版社,2013年版。

⑤孔宪明:《中国警官走进美利坚》,上海人民出版社,2004年版。

⑥富静:《公安机关对社会信息资源的开发和利用》,《辽宁行政学院学报》2012年第6期。

⑦彭知辉:《大数据:开启公安情报工作新时代》,《公安研究》2014年第 1期。

[1]张小兵.美国联邦警察制度研究[M].北京:中国人民公安大学出版社,2011.

[2]维克托·迈尔.大数据时代[M].杭州:浙江人民出版社,2013.

[3]杨槐.我国政府信息资源增值利用的机制创新 [J].重庆科技学院学报,2010(16).

[4]张红胜,吕幂.浅议政府信息资源共享[J].中国科技资源导刊,2009(5).

猜你喜欢

公安机关公安民警
关于公安机关“情指勤舆”一体化实战化运行机制改革情况的调研报告
博物馆:上海公安史图片展
民警轩哥说案
民警轩哥说案
民警轩哥说案
民警轩哥说案
Frequent attacks on health workers in China: social changes or historical origins?
衡阳市公安机关党员风采剪影
公安部印发《公安机关执法公开规定》的通知
“10岁当公安”为何能畅通无阻