公共安全迎接大数据挑战
2017-05-12胡传平
■ 文 /胡传平 梅 林 齐 力 徐 峥 戴 杰
胡传平,河南铁道警察学院副院长,研究员,博士。
梅林,公安部第三研究所物联网中心主任,研究员,博士。
齐力,公安部第三研究所物联网中心副主任,副研究员,博士。
徐峥,公安部第三研究所物联网中心助理研究员,博士。
戴杰,公安部第三研究所物联网中心助理研究员,博士。
公共安全领域进入大数据时代。
安全是公众的基本需求,因此,在智慧城市的建设过程中,应当充分利用大数据、云计算、物联网等技术使城市的安全管理做到更智慧、更高效、更安全。党和国家领导人对大数据,尤其是大数据在公共安全领域的应用高度重视。2017年2月17日,中共中央总书记、国家主席、中央军委主席、中央国家安全委员会主席习近平在北京主持召开国家安全工作座谈会并发表重要讲话。习近平强调,要筑牢网络安全防线,提高网络安全保障水平,强化关键信息基础设施防护,加大核心技术研发力度和市场化引导,加强网络安全预警监测,确保大数据安全,实现全天候全方位感知和有效防护。
认识公共安全大数据
公共安全大数据是指围绕社会公共安全需求的,国家政策法规允许的,用于支持公共安全保卫的所有数据。按照数据采集方式来区分,公共安全大数据的主要数据来源有3类。第一类是对象被动产生的数据。这类数据主要是通过各种强制的法规或者手段,采集公共安全事件涉及的对象产生的数据,例如在宾馆住宿时需要登记身份证信息、乘坐飞机或高铁需要进行安检等。这类数据是传统意义上的公共安全数据。第二类是对象主动产生的数据。这类数据主要是公共安全事件涉及的对象在案件过程中,为了达到犯案目的所主动产生的,例如同伙之间的通联数据、事件对象在案发现场的视频监控数据等。这类数据的价值通常最高。第三类是对象自动产生的。这类数据是在对象不知情的情况下,从对象身上自动获取的,例如人的定位信息、车辆的定位信息等。这类数据的规模最大,种类也最多,但有价值的信息最少。
大数据都具有4V特征:数据容量大(volume),数据类型繁多(variety),商业价值高(value),处理速度快(velocity)。公共安全大数据除具有一般大数据的4V特征之外,还包含4个特征,简称公共安全大数据的4P特征。一是政策性(policy),公共安全大数据的采集、处理、分析等过程,高度依赖国家相应的政策法规,在政策法规允许范围内的数据,才可以被采集。二是私密性(privacy),与一般数据不同,公共安全大数据很大一部分是与对象相关的隐私数据,例如地理位置信息、通联记录等。因此,公共安全大数据具有隐私性。三是精准性(precision),公共安全大数据的挖掘分析结果需要极高的精准性,公共安全事关人民群众的最高利益。因此,公共安全大数据必须做到精准处理。四是时效性(promptness),公共安全事件处理对时效性要求很高,处理方式主要为事前精准预防预警、事中快速响应、事后准确溯源。公共安全大数据的分析、挖掘要求极高的时效性。
面临的挑战
大数据本身是一把“双刃剑”,对于公共安全行业来说,它既带来了前所未有的机遇,也相伴而生许多挑战。
公共安全领域面临的一大挑战是公共安全领域数据处理成本与收益之间的矛盾。大数据的一个重要特性是海量性,数据规模越大,存储成本越高。由于大数据强调在全量数据中进行挖掘分析而非传统的抽样调查,因此更增加了处理成本。如何快速过滤无价值的数据,对公共安全数据进行准确处理是一个重要的挑战。公共安全领域面临的另一个挑战是公共安全数据互联互通需求与管理体制之间的矛盾。大数据的重要特性是建立数据之间的关联,通过关联挖掘提取数据的价值。但是,各类安全数据之间统一标准的缺乏,现有组织、部门、制度间的分割以及信息管理理念的滞后,往往导致“数据孤岛”现象的出现。第三大挑战是公共安全数据处理技术的快速发展与缺乏相应的标准之间的矛盾。大数据技术发展迅速,但缺乏相应的标准对其进行规范。
亟待解决的问题
要应对公共安全大数据的挑战,公共安全大数据领域亟待解决以下几个关键问题。
首先,公共安全大数据如何由存不起转变为存得起。大数据的重要特征是对全量数据进行分析,“全量数据”意味着要对大量的数据进行存储。公共安全领域迫切需要解决数据存储安全与空间成本的问题。数据存储多久,如何存储,采用分布式还是集中式,都是亟待解决的问题。
其次,公共安全大数据如何由联不通转变为互联互通。大数据在公共安全领域的应用是对数据进行关联分析,然后从中获取数据的价值。由于体制、数据类型、数据模态等多种问题,公共安全相关的数据依然无法做到有效地互联互通。如何建立数据之间的联通机制,如何对数据进行有效的关联融合,也是亟待考虑的问题。
再次,公共安全大数据如何由找不准转变为找得到、看得准、挖得深。目前,国家仍然缺乏非常有效的手段对公共安全相关数据进行处理。例如,针对视频信息的分析,现阶段的技术水平依然无法做到精准的对象识别,因此,仍需要有效的数据分析手段,把原始的非结构化的数据转变为结构化的可理解、可分析的数据。
“三朵云”支撑公安业务
公安数据中心主要由“三朵云”组成,分别为管理云、应用云和视频云,这三朵云通过统一运营维护来获得安全保障。应用云的数据由两大部分组成:一部分来自从管理云、视频云及公安业务系统抽取的业务数据;另一部分来自业务系统内部数据。
大数据云平台通过多租户、多项目空间、项目保护空间等数据隔离机制,可以把来自不同警种的数据隔离和保护起来。大数据云平台提供安全可靠的数据安全策略和访问权限体系,不仅能够控制数据的访问权限、各警种的数据访问权限,还能够对数据访问进行多粒度的权限访问。
在公安大数据平台基础之上,公安部第三研究所规划建设了公安业务数据开放加速引擎,该引擎可用来提供上层公安业务系统对大数据平台的授权访问权限。在数据加速引擎的支撑下,各类公安业务都可以基于大数据平台进行数据访问、数据分析、数据挖掘、数据创新。数据加速引擎还能支撑各个公安业务开发商的大数据业务系统,形成公安业务的应用超市。基于大数据强大的分布式计算能力,该引擎能对公安多警种复杂数据进行大规模数据加工、处理和计算,建设公安各类数据库,对人际关系网络进行深度分析,利用数据挖掘和机器学习技术,引领公安领域大数据创新。