论大数据思维在警务实战中的应用
2022-11-21张彬
张 彬
当前公安信息化建设快速发展,各省市积极推进基础信息化工作,采集获取了公安业务、社会管理和互联网等数据资源,建立公安大数据云平台,解决了“平台孤岛”等一系列问题,形成了从数据到知识转化的数据治理理念,促进了多警种业务协同和信息共享,在实战中积累了一定的经验,发挥了重要价值。面对复杂的国际国内形势,如何利用大数据思维充分挖掘大数据平台蕴藏的海量数据价值,武装“互联网新一代”民警的智慧警务大脑,全面提升公安队伍的警务实战应用能力,成为智慧公安建设工作的重大问题。
一、大数据思维在警务实战中的应用思路
(一)从“流程”为核心转变为以“数据”为核心。智慧公安时代,业务流程“躯体”不断升级改造的情况下,作为核心“血液”的数据在其中扮演愈来愈重要的角色,基于数据的分析研判已经渗透在各个环节中,警务实战工作要从以“流程”为核心转变为以“数据”为核心[2]。
(二)从“抽样”分析转变为以“全量”分析。受制于传统业务系统数据存储和计算的限制,民警只能在有限时间范围和有限维度条件下分析公共安全态势和事件,得到的结论一般不具备普适性和复用性;而在大数据时代,基础设施建设能够满足警务实战工作对于全量数据存储和计算的需求,基于全量数据样本得到的模型真实性也较高,并能够在较大范围内复用[3]。
(三)从“不能预测”转变为“可以预测”。除了少数黑天鹅事件外,对于当今社会风险趋势预测,在借助大数据、机器学习和深度学习等能力条件下,已经成为可能。现在的预测类模型,已经从上一代“专家系统”转变为海量数据机器学习模式,构建成本已经大幅度降低,并随着增量数据不断学习完成迭代,预测精准度不断提升。
(四)从“人找信息”转变为“信息找人”。从人找信息到信息找人,是交互时代的一个转变,也是智慧公安建设的要求。“信息找人”这四个字,预示着大数据时代可以让信息找人,原因是平台懂风险,机器懂用户,各级民警需要什么信息,平台和机器提前知道,而且主动提供他们需要的信息。
二、大数据思维在警务实战中的应用实践
(一)从以信息化角度进行数据治理,到以业务需求角度进行数据治理。当前标准的公安大数据处理工作(广义的数据治理),首先要接入公安数据、政府数据、行业数据、互联网数据以及其他数据;其次要针对不同业务系统中的同类数据按照统一规则进行转换,也就是数据标准化处理过程;再次,通过业务抽象融合,从标准数据中提炼出有价值的业务信息,通过提炼人、事、地、物、组织等五大业务实体,构建业务实体之间的关系,标明业务实体之间的内在联系和内在的业务规则。以科信部门为主导进行的数据治理,实现了从数据接入、数据处理、数据组织、数据服务到数据治理的完整技术流程,但治理后的数据不能与业务紧密结合,导致数据不可取、数据不可联,应用能用数据,但往往效果不理想。
总结来说,以业务警种需求为核心的业务库、知识库、业务要素索引库等数据组织工作难以通过标准数据治理工作实现,这是因为警种的业务需求分散在各业务部门,无法以中心化数据仓库方式进行构建。由此可尝试进行以业务警种需求为核心的深度数据治理,可基于标准库和主题库构建数据各警种的业务数据空间,业务数据空间可包含业务知识库、业务资源库、业务标签库、业务关系库等,也可基于警种实际需求构建其他业务库。
(二)从手动采集数据进行局部数据分析,到从自主建模进行全量数据分析。目前,常规的基于案件的数据分析以手动采集数据为主,数据广度较窄、数据维度有限、数据时限受限,很难从全业务流程入手进行分析。而基于大数据平台的自主建模可打破以上限制,完成从数据获取、数据汇聚到数据建模、数据可视化的全流程分析。
(三)从案发后滞后打击研判分析,到案发前预先人工智能预警。传统的打击研判分析模式,在于案件发生以后,在应对以实地现场为中心的传统犯罪尚具有优势,而在面对模糊现场甚至无现场犯罪案件时就会显得局促无力[4]。人工智能利用大数据技术、机器学习技术,根据公安的业务特点进行建模。通过对已知的重点人员、重点组织、犯罪行为等样本进行模型学习以及训练,结合公安民警经验总结,从人员的基本信息、组织机构的基本信息、轨迹信息、关系网络、犯罪记录、网络舆情等内外部数据中,利用机器学习算法,自动抽取模型特征,并根据此模型对隐性风险进行预测。
(四)从遍查业务信息孤岛获取无关联信息,到构筑业务知识图谱主动推送网络关联信息。近年来各地公安已构建了一系列的分析工具,但彼此之间不能分享模型成果,也做不到对公安业务需求的全覆盖,在挖掘数据价值、探索智能应用方面,远未达到“智慧”的目标。而知识图谱综合运用大数据、分布式计算、文本挖掘和图数据库等前沿技术,实现海量多元异构数据的实时汇集、处理与分析。知识图谱作为全量数据关系分析挖掘的载体,可以快速、准确、高效地为各警种提供关系查询、关系分析、关系挖掘等服务,将原来需要去不同的系统通过反复查询数据、人工关系发现、人工关系研判等工作进行优化,大大减少了“汗水警务”。
基于公安知识图谱应用,支持在全警范围内开展主动订阅服务,由大数据中心将订阅结果主动推送给订阅者,以丰富面向公安实战应用的全链路通用服务。基于公安知识图谱应用,亦可在全警范围内开展智能分发服务,通过各民警的需求,由大数据中心将各民警的所需结果精准推送给具体单位或者个人。
三、成效
(一)部分省市业务警种已基于主题库等构建业务数据空间,并在业务实战中发挥作用。以地市级治安警种业务数据治理为例,通过汇聚治安自有数据源和地市大数据平台数据资源,共同加工形成面向治安管理全要素,以治安业务原始库、资源库、知识库和实战专题库为主的治安管理信息资源体系,支撑社会治安防控体系建设。其他各警推进以治安为代表的业务数据个性化治理,最终可构建全警应用、众创共享的警务知识管理体系,实现各取所需、各尽其责、精准匹配的对象需求与突破条线的大数据交互应用的业务需求,即以业务职责任务为中心,突出业务警种数据应用需求,推动各业务警种向大数据智能化方向发展。
(二)基于大数据平台的自主建模已经在部分省市成功运营,深受科信和业务警种信赖。面对近期多变的疫情,全国绝大部分地区的公安科信、大数据、情指、刑侦等部门均深度参与了疫情防控数据分析工作,依托公安大数据平台强大的接入能力,快速整合公安、工信、公共卫生和大数据局等数据,利用自主建模工具快速构筑确诊病例全流程轨迹、密接人员关系挖掘和风险社区健康监测等一系列模型,在态势评估和个体监测等关键环节上,发挥了定海神针的关键作用。每座城市的安危化作了一块又一块零散纷乱的数据拼图,亟待精准还原出未知的全貌,让每一级党委政府心中有数,让每一个处在危险中的市民有底,公安大数据自主建模分析的业务逻辑与疫情分析的需求完全吻合。
(三)在风险人员预测和案件预测等场景下,人工智能已初露锋芒。典型的预测场景有风险人员预测和重点案件预测。基于历史案件数据分析侵财类案件的特征,包括犯罪分子的身份特征、生物特征、作案手段特征、作案对象特征等,结合大数据中心数据和运营商数据,进行犯罪嫌疑人特征画像、行为画像以及关系圈分析。同样的,可利用历史案件数据分析侵财类案件发案时的时间、地点、背景等数据,分析这类案件的作案人员的特征或涉案车辆的特征,从而预测出某重点案件在某段时间,或某个位置发生的可能。
(四)业务知识图谱主动推送,让犯罪风险无处遁形。公安知识图谱将公安中各类数据,汇总融合成为人、事、地、物、组织、虚拟身份等6大类实体,根据其中的属性联系、时空联系、语义联系、特征联系等,建立相互关系,最终形成一张由人、事、地、物、组织构成的关系大网,关系网根据数据的接入可自动更新。公安知识图谱构建的三方面技术为关系发现、语义模型、知识推理,可用于情报分析、情报挖掘和情报积累等方面。公安业务知识图谱常见应用场景包括资金流向分析、话单分析、群体分析、隐性人员挖掘分析和潜在团伙分析等。
四、讨论
随着公安大数据建设不断深入,大数据思维在数据治理、数据分析、人工智能和知识图谱等方面的应用也会越来越广,广大科技民警和实战业务警种需要不断学习掌握新的大数据思维模式以及典型的应用场景。首先,数据治理不是一蹴而就的工作,是一项长期持续的工程,科信部门要持续获取内外部资源,不断进行资源整合,完成核心六大库的完善和升级;而各警种在标准治理结果之上,也要不断挖掘内部业务痛点,在数据层面寻找痛点的“药方”,完成业务知识体系建设和优化。第二,基于这些高价值密度的数据知识资源,科信和各业务警种还需要不断学习建模方法论和工具技能,并在实际工作中不断应用,才能够实现自主建模式的全量分析,保证研判分析的准确性和可复制性。第三,随着业务应用的不断深入,在一些有规律可循的场景中,可以尝试通过机器学习等人工智能技术实现犯罪预测等场景,一方面可以验证前期建模中特征提取的科学性,另一方面,还可以发掘未曾意识到的风险特征点,在规则模型和机器学习模型的互相促进中实现业务实战思路的升华。最后,基于实体、关系、事实、原理等要素构筑的知识图谱,需要数据治理、数据建模、机器学习、自然语言处理、业务场景挖掘等多方面助力,才能够在语义搜索、智能问答、语言理解、决策分析等多个领域为公安业务带来强大助力。
五、结语
总体来讲,大数据思维在警务实战中将会持续发挥巨大作用,从根本上提高公安机关风险预测预警预防能力和维护稳定、打击犯罪、管理社会的水平,推动公安风险管控工作由传统粗放管理模式向现代精细管理模式转型升级。