新智认知:大数据护航平安中国
2020-03-16韩丽佳
韩丽佳
以过去20多年服务于公安行业用户的经验作为积淀,新智认知按公安部标准规范指导,以更成熟、更完善的大数据融合服务平台产品,协同合成指挥产品、人工智能产品,为基于大数据的智慧警务建设,贡献智慧和力量。
2014年,在央视春晚上,沈腾和马丽表演的小品《扶不扶》相信很多人还记忆犹新。在这个小品里,沈腾和马丽通过精彩幽默的表演,对社会上的碰瓷行为进行了讽刺。事实上,对于每个驾车者而言,遇到碰瓷都是一件十分棘手的事。特别是如果遇到专门从事碰瓷的犯罪团伙,那就更头疼了。
不过,现在驾车者可以松口气了。大数据技术的应用将会很好地解决这一难题。华中地区某市警方,依托数据中心利用保险理赔、车辆维修信息事故相关录入数据、视频卡口等几十项数据,根据民警们以往打击车辆碰瓷骗保案件的经验,建立了“车辆碰瓷骗保分析模型”。模型输出了一批疑似有上述非法犯罪行为的车辆,并将与车辆相关的嫌疑人一并展示。民警根据模型结果顺藤摸瓜,一次性挖出几个专门从事此类案件的犯罪团伙。
而在以往此类案件中,经验不足的交警往往会当做正常事故处理。哪怕个别事故被识别出存在碰瓷骗保嫌疑,由于各业务警种数据不互通,社会数据并未接入,也很难将整个团伙连根拔起。
五个阶段
上述案例只是大数据在公安行业广泛应用的一个缩影。在新智认知数字科技股份有限公司大数据融合服务平台总经理郑再鹏看来,如今随着大数据、云计算人工智能移动互联网物等技术的发展,警务模式也正式迈入了智慧警务的阶段。“智慧警务以大数据战略为路径,各省市公安机关,纷纷建设自己的大数据中心、云平台以及基于大数据的移动警务应用平台。指挥、情报、网安等各条线在大数据的驱动下,实现高度融合、数据共享、协同作战、统一运作,逐步将公安信息化建设,推向一个跨时代的发展方向。”
新智认知公司的前身是博康智能。公司从1995年成立起,便致力于公安行业信息化和安防方面的建设。2018年,公司正式更名为新智认知。可以说,这20多年来,新智认知一路见证了公安行业信息化建设的发展。在郑再鹏看来,公安行业的信息化建设大致可以分为5个阶段:
在1998年之前,是人力警务阶段,警务工作主要靠大量的人力完成。接处警、巡逻、盘查等警务工作没有信息化支撑。大量信息、档案、资料,以纸质文件的形式,储存在档案室。1998年到2006年,随着金盾工程的建设,公安行业信息化进入了第二阶段:数字警务阶段。此时,基层警务工作,从纯人力、纸质化,转向利用计算机进行信息采集、查询。同时,随着手台和个人PC的普及,“三台合一”也应运而生。警务工作拥有了基础的数字化能力和协同作战能力,信息管理水平和工作效率大幅提升。第三阶段是网络警务阶段,从2007年到2012年,各警种开始建设具有自身警种特色的信息系统。随着金盾二期工程的全面展开,各种业务信息系统纷纷落地。第四阶段是合成警务阶段。此时,以情报主导的合成指挥系统,应运而生。各地纷纷尝试多警种、跨部门、跨区域的合成指揮警务作战。
“慢慢开始探索,如何以数据驱动警务工作。但受限于大数据技术的不成熟,取得的成果不多。”郑再鹏介绍道。而从2017年起,则真正进入到了智慧警务阶段。
价值有“三化”
在郑再鹏看来,大数据对于智慧警务的建设,有着非常重要的价值。“我们一直在说要建设平安中国,幸福中国。而大数据在公安行业的应用,将会成为构建平安中国、幸福中国的重要因素之一”。具体而言,郑再鹏认为,大数据在智慧警务建设中的应用价值,可以用“三化”来概括。
一是海量数据的高效融合化。这是智慧警务的数据支撑基础。众所周知,因为历史原因,很多行业都存在着数据孤岛林立、数据质量脏乱差、标准格式不同意等问题。而要想发挥数据的价值,那么数据的治理、接入、汇聚是前提。
二是专家经验的人工智能化。郑再鹏认为,有了数据支撑基础,公安的孤岛被打通,但这并不意味着这些高效融合化的数据具有价值。“数据存储在物理空间中,本身是没有价值的。只有将治理后的数据,进行要素关联,形成对应的要素库、主题库,依托于业务场景,利用相关警务专家的智慧,结合神经网络、机器学习、语义识别等技术,构建行业知图谱,凝结公安数据模型,才能真正发挥出数据的价值。”
三是案件事件的前瞻预警化。在郑再鹏看来,智慧警务时代相较于人工警务时代,警务工作的重点必然要从事后研判,逐渐转移到事前预警。
确实,在现阶段,在案件积累够多、大数据技术完善的基础上,提炼同类案件中,事后研判所发现的规律,与数据中心已有的资源进行关联碰撞,必然能发现某类案件的特点,从而精准定位,防患于未然。
“长三角地区某市机场分局,分析了多年来抓获的机上扒手的数据,根据提取其户籍特征、目的地特征等几个重要数据项。得知犯罪嫌疑人大多来自与河南某地,且飞行目的地,多为境外或国际航班的中转站。由此结合旅客信息、航班信息、机场物联感知设备(如智能化监控、人脸相机等)数据,建立预警模型。在疑似人员进行团伙作案前,给予重点关注,极大提升了此类案件的破案效率。”郑再鹏介绍说。
挑战和机遇
当然,在发挥重要价值的同时,公安行业的大数据应用仍然面临一些挑战。比如,公安机关各个信息化系统产生的数据量庞大,以单个抓拍探头为例,每天就能产生上万张图像和上万条对应的车辆数据信息。每个监控摄像头,每天也能产生几十上百GB的视频数据。在进入智慧警务时代之前,公安数据库往往只是存储那些汇聚到公安网上的数据。但在智慧警务时代,随着大数据和云计算技术的发展,各地纷纷自建数据中心,使得数据来源除了公安网之外,还包括各警种专网、视频专网、互联网、物联网等网络空间。
再比如,传统的公安数据库存储的往往是静态的数据,一段时间再统一更新一次。而随着数据中心的建设,公安大数据从静态演变为动态,甚至要求秒级甚至毫秒级实时更新。
每个业务系统的一次响应,每个物联感知设备一次记录,都要动态地同步到民警眼前。警务工作,特别是情报、指挥工作,很多情况下时机转瞬即逝。这就需要具有快速响应的公安大数据中心,作为业务支撑。
此外,随着物联感知设备的发展,结构化数据所占比例越来越小,未来文本、图片、视频、音频等非结构化数据将占据主导。这导致数据量巨大,而有价值的数据又非常少。以视频监控举例,几个小时的视频,往往只有秒甚至几帧的有效画面。同时,人、事、地、物、组织不再是孤立存储的数据,随着时空大数据相关技术的发展,知识图谱、数据建模、关系库关联库在逐步进行建设,为情报搜集、分析研判、案事件处置等警务工作提供了关键支撑。
在郑再鹏看来,目前数据价值仍未转化为战斗力,主要体现在两个方面:
第一,基层不了解整体数据规划、数据资源状况、数据使用方法。
第二,部分省级、地市级部门,做数据中心规划时,未能深入了解基层需求。进行数据中心设计的部门,对各警种业务理解不够深刻。
但问题和挑战,往往也意味着机会。在郑再鹏看来,智慧警务的发展,未来必将走向智能化、自动化,而且将会以预防控制为主。这就意味着,大数据、人工智能等技术将会有更广阔的应用空间。“以过去20多年服务于公安行业用户的经验作为积淀,新智认知将不忘初心,按公安部标准规范指导,以更成熟、更完善的大数据融合服务平台产品,协同合成指挥产品、人工智能产品,为基于大数据的智慧警务建设,贡献智慧和力量。”郑再鹏说道。
最佳实践:新智认知大数据融合服务平台在华北某市公安局的应用
行业背景
1.数据量大、来源多
公安机关各个信息化系统产生的数据量庞大,以单个抓拍探头为例,每天就能产生上万张图像和上万条对应的车辆数据信息。每个监控摄像头,每天也能产生几十上百G的视频数据。在进入智慧警务时代之前,公安数据库往往只是存储那些汇聚到公安网上的数据。但在智慧警务时代,随着大数据和云计算技术的发展,各地纷纷自建数据中心,使得数据来源除了公安网之外,还包括各警种专网、视频专网、互联网、物联网等网络空间。
2.数据具有动态性
传统的公安数据库存储的往往是静态的数据,一段时间再统一更新一次。而随着数据中心的建设,公安大数据从静态演变为动态,甚至要求秒级甚至毫秒级实时更新。每个业务系统的一次响应,每个物联感知设备一次记录,都要动态地同步到民警眼前。警务工作,特别是情报、指挥工作,很多情况下时机转瞬即逝。这就需要具有快速响应的公安大数据中心,作为业务支撑。
3.数据价值难以挖掘
随着物联感知设备的发展,结构化数据所占比例越来越小,未来文本、图片、视频、音频等非结构化数据将占据主导。这导致数据量巨大,而有价值的数据又非常少。以视频监控举例,几个小时的视频,往往只有秒甚至几帧的有效画面。同时,人、事、地、物、组织不再是孤立存储的数据,随着时空大数据相关技术的发展,知识图谱、数据建模、关系库關联库在逐步进行建设,为情报搜集、分析研判、案事件处置等警务工作提供了关键支撑。
目前数据价值仍未转化为战斗力,主要体现在两个方面:
第一,基层不了解整体数据规划、数据资源状况、数据使用方法。
第二,部分省级、地市级部门,做数据中心规划时,未能深入了解基层需求。进行数据中心设计的部门,对各警种业务理解不够深刻。
4.数据共享程度低
数据共享程度低主要存在以下两点问题:
第一,各警种、各下级公安机关,是否能为上级数据中心,提供有效的数据来源?由于历史原因,不少系统存在重建漏建等问题,不少数据的录入工作也存在大量的瑕疵。
第二,上级数据中心完成数据汇聚后,是否能以数据服务的形式,将治理过的数据、建设好的知识图谱或模型,分发给各警种以及下级单位,为基层警务工作提供数据支撑。目前有一些地方的数据中心,为了汇聚数据而单项采集,却没有让数据双向流动起来。
说到底,数据共享程度低的根源问题在于,顶层设计不足。从而导致各平台技术架构互通互融性差,数据清洗和数据标准化工作迟迟写在纸面上,不能落实。各级公安机关,对于元数据管理、各种标准规范等基础支撑部分的建设不够重视。造成数据杂乱,难以流通共享的现状。
核心能力
新智认知勇于面对大数据时代的挑战,致力于为智慧警务建设做出贡献。为此,推出融合大数据平台产品—龙渊—大数据融合服务平台,为公安乃至政府、企事业单位,提供专业的大数据治理能力。产品严格按照《公安大数据处理》的标准建设,并根据公安部新一代公安信息网的要求,进行了全新的规划设计和架构重组。
目前,大数据融合服务平台已于华北某市公安局落地。构建起了上下级联、横向贯通的公安信息资源服务体系,为基层民警、业务警种和领导决策提供全方位的信息资源服务支撑。大数据融合服务平台的每部分功能,都在实战中,解决了当地智慧警务工作中的痛点,获得了各级领导、一线民警的一致好评:
1.数据接入—一键采集,高度同步
数据接入包括数据探查、数据定义、数据读取、数据对账。负责从公安系统内外部采集各类结构化、非结构化和半结构化数据。在尽可能保证低延时高响应的情况下,采集到的数据保存数据治理平台中,供各类公安业务应用使用。目前已接入公安内外部近400项数据源。
2.数据处理—后台强大,挖掘价值
数据处理包括数据提取、数据清洗、数据关联、数据比对、数据标识。通过数据接入功能采集到系统中的数据,进行清洗和标准化等 ETL处理,将数据处理到原始库中,再对原始库中的数据进行关联分析,为后续抽取到资源库、主题库、业务库中做准备。从非结构化数据提取结构化数据,解决了数据量大但利用价值低的问题。按照统一标准进行清洗,解决了数据源脏乱差,难以进一步利用的问题。为数据打标签,有利于后续进一步做建模分析。
3.数据组织—有序分布,贴紧业务
数据组织包括原始库、资源库、主题库、业务库、业务要素索引库、知识库。主要是结合业务,挖掘个数据要素间的关联,统合各主体间的数据,形成跨业务领域的人、地、案、事、物、组织的统一视图,为各业务警种提供数据支撑
4.数据治理—规划完整,透明可控
数据治理包括数据资源目录、数据分级分类、数据血缘、标签管理、模型管理、数据质量管理、数据运维管理。数据治理是对数据资源全生命周期的规划设计、过程控制和质量监督。通过规范化的数据治理,可实现数据资产的透明、可管、可控,厘清数据资产,完善数据标准落地、规范数据处理流程、提升数据质量、保障数据安全使用,促进数据流通与价值提炼。
5.数据服务—支撑应用,实现共享
数据服务包括数据管理、数据操作、数据鉴权、数据推送、模型分析、比对订阅、查询检索。支持上层公安业务应用的实现。同时,各业务警种、各基层单位,也能申请数据服务,为自身警务工作赋能。其实战性和可操作性,与一些地市为汇聚而建设数据中心,不注重实战的表面工程,形成鲜明对比。新智认知将不忘初心,按公安部标准规范指导,以更成熟、更完善的大数据融合服务平台,协同合成指挥产品、人工智能产品,为基于大数据的智慧警务建设,贡献智慧和力量。
方案价值
1.海量数据,高效融合化
从2015年开始各分县局、各警种的信息化建设招投标文件中,逐渐出现“大数据”一词。但是随着数据汇聚得越来越多,数据变成了美丽的烦恼。
首先,是繁杂冗余的数据,占据了大量的存储空间,但实际上又未被有效使用。其次,各个系统间的数据,烟囱林立,信息孤岛化严重,甚至存在重复建设的问题。再次,数据质量脏乱差,未治理过的数据进行共享,由于各部门、各警种间,业务逻辑不同,各系统的数据标准也不一,造成了数据共享流于表面。共享后的数据,没有发挥应有的价值。
海量数据,高效融合化,是智慧警务的数据支撑基础。华北地区某市公安局数据中心,整合了全市公安业务系统、其他政府部门系统、社会数据信息等近400项数据源,按照公安部下发的《公安大数据规范性文件汇编》,在数据中心完成了数据接入和治理,解决了烟囱林立、数据脏乱差的问题。
同时,该市局按照部标,建设了原始库、资源库、主题库等数据组织,并建立了一套完整的数据请求、分发机制,使得下级公安机关、各业务警种,能充分享受数据中心治理后的成果,对警务实战具有重大价值。
2.专家经验,人工智能化
有了数据支撑基础,公安的数据孤岛被打通,但这并不意味着这些高度融合化的数据具有价值。数据存储在物理空间中,本身是没有价值的。只有将治理后的数据,进行要素关联,形成对应的要素库、主题库,依托于业务场景,利用相关警务专家的智慧,结合神经网络、机器学习、语义识别等技术,构建行业知识图谱,凝结公安数据模型,才能真正发挥出数据的价值。
华中地区某地市警方,依托数据中心,利用保险理赔数据、车辆维修信息、车辆事故相关录入数据、视频卡口数据等几十项数据,根据民警们以往打击车辆碰瓷骗保案件的经验,建立了“车辆碰瓷骗保分析模型”。模型输出了一批疑似有上述非法犯罪行为的车辆,并将与车辆相关的嫌疑人一并展示。民警根据模型结果顺藤摸瓜,一次性挖出几个专门从事此类案件的犯罪团伙。
3.案件事件,前瞻预警化
智慧警务时代相较于人工警务时代,警务工作的重点必然要从事后研判,逐渐转移到事前预警。现阶段,在案件积累够多,大数据技术完善的基础上,提炼同类案件中,事后研判所發现的规律,与数据中心已有的资源进行关联碰撞,必然能发现某类案件的特点,从而精准定位,防患于未然。
长三角地区某市机场分局,分析了多年来抓获的机上扒手的数据,根据提取其户籍特征、目的地特征等几个重要数据项。得知犯罪嫌疑人大多来自与河南某地,且飞行目的地,多为境外或国际航班的中转站。由此结合旅客信息、航班信息、机场物联感知设备(如智能化监控、人脸相机等)数据,建立预警模型。在疑似人员进行团伙作案前,给予重点关注,极大提升了此类案件的破案效率。