APP下载

基于知识图谱的社区治安风险事件预警设计与实现
——以社区盗窃案件为例

2023-01-12胡勉宁张腾飞楠讲师

安全 2022年12期
关键词:治安图谱关联

胡勉宁 张腾飞 贾 楠讲师

(中国人民公安大学 信息网络安全学院,北京100038)

0 引言

城市群的安全取决于社区的安全[1-2]。随着社区规模日益扩大、社区居民的逐渐聚集,社区治安事件也随之增多[3-4],如2018年的杭州保姆纵火案、2020年杭州杀妻案等。社区作为城市的基本单元,其治安安全是城市安全的基础,是社区居民平安生活的基本保障[5-6]。社区治安风险具有人员、地点、事件、物件、基层组织多主体复杂交错的特点。风险因素也因此高度汇聚、相互复杂耦合关联[7],例如,人与人之间的邻里关系、婆媳关系、债权债务关系;人与物之间的携带危险物品关系;人与组织之间隶属犯罪团伙关系等。多样的主体及其之间的关系会导致不同类型的风险事件。社区治安事件是由于多个风险主体相互碰撞、相互叠加产生,因此在社区安全事件频繁发生、社区治安安全问题日益凸显的当下,厘清社区中风险多主体的关联关系,探究社区治安事件演化过程中的多主体动态关联关系[8-9]是有效预防风险事件(或切断风险事件演化)的关键。

社区风险事件存在着多主体关联性、复杂性的特征,而知识图谱以其简洁性、直观性的特点,可有效地分析社区风险事件多主体关联的复杂性问题。知识图谱是Google公司率先提出应用于搜索领域的一项新技术,由于丰富的语义信息和详细关联模型的出现,知识图谱成为各领域知识构建的有效工具,在司法、医学等领域内有很多应用[10-14]。公安领域内,不少研究学者也借用知识图谱解决了在信息检索与推荐、知识挖掘与推理、风险治理等一系列应用上的难题。例如,谢敏容[15]将公安大数据整合成知识图谱,在智能搜索方面进行实战性应用;樊舒等[16]在网络安全知识领域通过构建知识图谱,以直观的形式提取、分析、展示网络安全知识;彭雨苏[17]着重研究与公安一线关系密切的社区安全工作,通过对社区风险因素的分析,提出社区风险知识图谱构建思路,为知识图谱在社区风险事件防范中的应用奠定基础。

针对社区治安风险防范中具体预警、防范的实际需求,构建基于知识图谱的社区盗窃案件预警框架。社区治安风险知识图谱预警框架按照自顶向下的设计思路,依次进行模式层设计、数据层处理、知识计算应用。主要工作如下:

(1)利用社区治安风险事件的主体特性和关联关系搭建社区治安风险事件演化、预警框架,并将积分值和权重概念引入框架中。

(2)结合社区治安风险事件的演化、预警框架,从知识图谱构建的角度,进行实体和实体关系建模。进一步梳理社区治安风险知识及其关联关系,并结合真实数据获得不同等级的阈值,实现社区治安风险事件知识图谱预警框架中的分等级预警功能。

(3)以该预警框架为基础,搭建社区盗窃风险知识图谱的预警系统,并以某地社区盗窃案件为例进行风险预警应用落地。

1 社区治安风险及演化预警框架

1.1 社区治安风险基本特征

社区是治安风险事件的载体,其承受的社区风险主要包括潜在的社区治安事件风险、社区刑事事件风险和社区灾害事件风险。通过下沉社区调研、资料收集以及与中国人民公安大学3位从事安全风险分析的专家进行讨论,总结出社区风险具有的3大基本特征:多元异构性、隐蔽性和不确定性。

多元异构性是社区治安事件形成的原因之一。社区风险事件发生是由于异构的致灾要素不断碰撞、叠加直至形成具有隐患的事件链。要终止风险事件发生,需充分研究社区治安风险多元异构性,厘清多元关系,从多角度对其多元异构的特性进行防范。

隐蔽性也是影响社区治安风险不可忽视的因素之一。现实生活中,许多不易被人察觉的致灾要素是社区治安事件的催化剂,社区中具有较好隐蔽风险的事物有:物品——杂乱堆砌的物品中可能隐藏有易燃易爆品;地点——环境复杂的闹市以及各种监控死角等。

不确定性是指社区治安风险事件发生的随机性。这种特性往往导致人们对风险事件预防束手无策,但计算机的高速计算能力却让这种不可能变为可能,通过不断提高预警、预测的准确率来进行辅助决策,以期实现提前感知、及时预警,将不确定性变为安全性。

1.2 社区治安风险事件多主体关联关系分析

为防范社区治安事件的发生,根据团队前期的研究结果可知社区风险主体包含人员、地点、事件、物件、基层组织(人—地—事—物—组织)等要素,其中,由多种主体组合而构成的多元关联关系可能产生社区风险事件[18]。因此,将社区治安风险事件作为研究对象,根据人—事—地—物—组织多主体关联关系框架,梳理出各风险主体知识之间复杂的关联关系。将其分为3大类:人—X二元主体关联关系;X—Y二元主体关联关系;多元主体关联关系。第一类主体关联关系的知识关系包括包含有人—地关系、人—组织关系等人—X二元主体关联关系,如盗窃前科人—盗窃高发地、重点人群—携带盗窃工具等;第二类主体关联关系的知识关系包含有物—组织关系、地—物关系等X—Y二元主体关联关系,如社区开放程度高—携带盗窃工具、防盗宣传力度低—公安机关打击力度低等;第三类主体关联关系包含有人—地—组织关系、人—地—物—组织关系等的多元主体关联关系,例如行为异常—盗窃高发地—隶属盗窃团伙、盗窃前科人员—携带盗窃工具—巡检人员巡检次数少等。以上关联关系是通过分析公安机关警情案件数据、学习警方破案思路、走访调研风险社区、查阅相关文献资料等方法归纳总结出的分类结果,根据每一类关联关系即可反推出潜在的社区风险事件,从而可以通过对风险事件关联关系的研究,找到合适的预防措施。

1.3 社区治安风险预警框架

多米诺效应常应用于安全事故风险分析领域中[19],将风险事故的多米诺效应迁移到社区治安风险事件中,提出社区多元主体关联、风险事件、后果的一系列事件演化链条,引出预警、干预的风险事件预警框架(如图1),其中社区治安事件的演化由于人—地—事—物—组织的5类社区主体风险度不断叠加至超过阈值,导致社区风险事件多米诺骨牌连锁效应,并进一步产生相关风险事件以及后果,由此可获得社区治安风险多主体叠加—风险事件酝酿—后果产生的社区治安风险演化线。

图1 社区治安风险事件演化预警框架Fig.1 Early warning framework of community security risk event evolution

在社区治安风险事件演化中,通过引入风险主体积分块以及阈值上限进行积分预警,能够及时地预判风险事件的发生,并可人为干预、终止其演化过程。依据图1,以盗窃前科人员—老年型社区—涉及盗窃案件—携带盗窃工具—巡防组织力度不足5个具体的多主体关系为例,将其融入“人—地—事—物—组织”5类风险主体中。当它们相互碰撞、叠加,会导致社区治安风险事件演化,从而接连产生风险事件。其中积分预警指在每类风险形成之初,给予不同主体不同的积分值(即图1中的积分块)和积分块的累次、叠加,当最终积分和超过设定阈值时,及时预警以提醒管理员进行人为干预。如密切监控相关风险事件中的重点人员、重点场所、重点设备、重点团体等,以期在风险事件发生之初将隐患消除,截断社区治安风险事件演变过程。

2 社区盗窃风险知识图谱模式设计

知识表示是完成知识图谱、知识组织的前提和基础。以社区盗窃风险知识图谱为例,采取自顶向下的社区盗窃风险领域本体知识表示方法来构建社区盗窃风险知识的模式层,从人、地、事、物、组织5个维度来定义社区盗窃风险领域的属性、概念和关系。从顶层开始设计,结合专家经验进行概念梳理、分类、分级和本体模型构建,实现能够直观地展现社区盗窃风险领域中各种实体之间的关系,从而保证社区盗窃图谱的完整性、准确性和客观一致性。

2.1 社区盗窃风险实体建模

社区盗窃风险知识图谱按照不同的风险维度进行细分,可以定义为人、地、事、物、组织5种概念,以各维度对体系中的实体进行建模。在社区盗窃案件中,人包含有诸多类型信息,如姓名、身份证号、性别、年龄、住址、职业、前科类型、是否在逃人员、行为异常、涉案时间、涉案地点等,但根据公安实战数据可知真正影响社区盗窃风险的实体类型只有职业、前科类型、是否在逃人员、行为异常4类,所以将此4类实体归为“人”的实体类型;地点是盗窃案件犯罪嫌疑人的重点选择对象,针对偏僻地区、特殊场所需要给予重点关注,“地”实体包括社区出入口数量、社区监控覆盖率、社区建设时间、社区周边交通设施数量等4类实体类型;社区中盗窃案件会涉及到一些盗窃工具的使用,因此防范时需要政府、物业采用宣传和巡逻等方式,“物”的实体中包括社区每月防诈宣传次数、社区每日安保巡防次数等实体类型;“事”就是通过有关事件来反应再次发生案件的情况,包括盗窃案件发生频率、极端天气情况等实体类型;社区盗窃案件涉及的组织包括政府组织、民间组织等,“组织”的实体包括是否有社区巡防组织、社区安保防范工具是否完善等实体类型。通过与一线社区民警和3位中国人民公安大学长期研究风险分析的专家进行分析、总结,得出基于实体的社区盗窃风险概念集构建,如图2。

图2 基于实体的社区盗窃风险概念集构建Fig.2 Construction of entity based community theft risk concept set

2.2 社区盗窃风险实体关系构建

实体关联关系的优劣决定着社区治安风险事件关系分析能力的强弱[17]。通过将实体和关联关系映射到社区盗窃风险领域中能形成多种关联关系类型的社区盗窃风险实体关系,见表1。当按照人—地—事—物—组织5大实体进行关系搭建时,根据社区盗窃风险实际情况可以形成12种实体关系;同时每一个实体还包含着多种具体实体类型,如图2。采用排列组合的方式可以获得每个实体的组合数量,再根据每种关系涉及实体的组合数量依次相乘得到每类实体关系的类型数量。由表1可知,社区盗窃案件涉及的实体关系复杂、多样,并且多是以“人”为中心串联起来的,而且关系中涉及到人—地—事—物—组织5大实体中主体越多,由该多实体关联关系演变成为盗窃事件的可能性就越大,如当由异常行为人—防范等级低的社区—相关人涉及的盗窃案件—社区出入口数量多—巡防组织次数少5类实体构成实体关联关系后,其风险度很大,社区治安风险事件(盗窃事件)极易发生。因此在后期的社区盗窃风险知识图谱建造中需要密切注意5大实体,尤其是“人”的相关风险实体。

表1 社区盗窃风险实体关系表Tab.1 Community theft risk entity relationship table

3 数据层构建

3.1 数据来源及预处理

知识图谱的构建需要有充分、多源的数据来支持。数据通过调研收集、文献查找、统计年鉴整理获得,并且经过筛选、清洗数据后,得出实现知识图谱预警的原数据。由于篇幅原因,附上部分数据(数据均已进行脱敏处理),见表2。

表2 部分原数据Tab.2 Some raw data

3.2 风险预警积分值及阈值设定

3.2.1 基于层次分析法设定积分值

根据社区治安风险演化预警框架和社区盗窃风险实体及关系构建可知,每类实体中包含有不同的实体类型,因此采用基于大数据的概率统计方式可以有效计算每个实体类型的积分值。

由于很多结构化数据中存在字段属性值未进行聚类赋予0、1标签的情况,无法使用机器进行概率计算,所以在大数据的基础上采用算术平均值公式(1)找出每个字段内的平均值A,然后逐个比较该数据字段中每个数据An(n=1,2,…,N),N为该数据字段中数据个数,若An≤A,将该数据重新赋值为0,若An>A,将该数据重新赋值为1,并根据实际情况将0、1标签附上是否存在风险。最后采用概率统计方法统计出该数据字段中存在风险的数量为W1,总数量为W,用公式(2)计算出该数据字段对应实体类型的风险积分值为J。

(1)

(2)

在社区盗窃风险知识图谱中以人—地—事—物—组织5类进行积分,需要将各实体类型的积分值整合赋给实体。但由于每类实体的不同实体类型重要程度存在差异,不能采取平均求值的方法,需要采用层次分析法来求各实体类型权重。层次分析法分为构建层次模型、构造各层次判断矩阵、层次排序与一致性检验共4个步骤[20-21]。

(1)构建层次模型。社区盗窃风险的层次模型,如图3,按照实体集构建情况将层次模型也分为3个层次,第一层为社区盗窃案件风险A,第二层为人、地、事、物、组织5个一级指标B1-B5,第三层为14个二级指标C1-C14。

图3 社区盗窃风险层次模型图Fig.3 Hierarchical model of community theft risk

(2)构建比较判断矩阵。采用九级标度法(见表3)通过专家打分,获取两两指标之间的相互权重关系,从而构建出判断矩阵,见表4。

接着用算术平均法计算层次模型的权重。首先,利用公式(3)计算出判断矩阵各行元素的乘积Ti;然后,利用公式(4)求出每一行乘积Ti的n次方根,并利用公式(5)进行正规化。

表3 九级标度法表Tab.1 Table of nine scale method

表4 判断矩阵表Tab.4 Judgment matrix

(3)

式中:

Ti—第i个指标与指标之间的重要等级赋值的乘积;

aij—第i个指标与第j个指标之间的重要等级赋值。

(4)

(5)

(6)

式中:

Si—第i个指标与指标之间的重要等级赋值乘积n次方根的归一化值;

Si—第i个指标与指标之间的重要等级赋值乘积的n次方根;

最后整理得到判断矩阵和权重,见表5。

(3)一致性检验。合理性判断,是指得到权重后需要进行一致性检验判断权重结果的合理性。经过对判断矩阵结果进行一致性检验,其结果显示均通过检验,因此各实体类型的权重合理,即社区盗窃风险知识图谱实体权重分配,见表6。

表5 九级标度法判断矩阵及权重表Tab.5 Judgment matrix and weight table of nine level scaling method

表6 社区盗窃风险知识图谱实体权重分配表Tab.6 Community theft risk knowledge map entity weight distribution table

通过上述层次分析法可获得各实体不同类型的权重,再将权重与各类实体的积分值J结合,并整合到人—地—事—物—组织5类实体,可获得5类实体所拥有的积分值。

为了更直观地表示每类关系的风险度,还需得到每类关系的积分和值,但由于不同区域客观环境的差异,会导致不同实体对风险事件发生的影响度不同,因此需要修正权重。首先,根据表1的实体关联关系类型,收集某社区盗窃案件数据进行整合、分类,厘清各事件的所属关联关系;然后,统计包含各实体事件数量占总事件的比例;最后,将此占比定义为在区域中该实体的权重,并结合各实体类型的积分值获得社区盗窃事件的风险度,见公式(3)。区域实体权重值,见表7。

V=MpeoplePpeople+MpositionPposition+MeventPevent

+MtoolPtool+MorganizationPorganization

(3)

式中:

V—社区盗窃事件的风险度值;

Mpeople—社区盗窃事件中实体“人”的积分值;

Mposition—社区盗窃事件中实体“地”的积分值;

Mevent—社区盗窃事件中实体“事”的积分值;

Mtool—社区盗窃事件中实体“物”的积分值;

Morganization—社区盗窃事件中实体“组织”的积分值;

Ppeople—社区盗窃事件中区域实体“人”的权重值;

Ppotiton—社区盗窃事件中区域实体“地”的权重值;

Pevent—社区盗窃事件中区域实体“事”的权重值;

Ptool—社区盗窃事件中区域实体“物”的权重值;

Porganization—社区盗窃事件中区域实体“组织”的权重值。

表7 区域实体权重值表Tab.7 Table of conceptual weights of regional entities

3.2.2 分等级预警实现

对选定社区的盗窃案件进行聚类划分,首先,将计算得出的每个案例积分和值J进行一维层面的k近邻分类(K-Nearest Neighbor Classification,KNN)聚类分析,划分出5个大类;然后,在每次聚类后,取每类中数值的平均值为该类的数值;最后,可以得到5个数值并按顺序排列(J5>J4>J3>J2>J1),即可以得到5个等级:当0

表8 预警等级划分表Tab.8 Classification of early warning levels

4 社区盗窃风险知识图谱预警应用

4.1 基于知识图谱的社区盗窃风险事件预警系统设计

笔者开发了一款基于知识图谱的社区盗窃风险事件预警系统。首先,总体框架设计了存储层服务、数据层服务、可视化服务、应用层服务4个模块,如图4。存储层服务中采用瑞典MySQL AB 公司开发的关系型数据库管理系统(Structured Query Language,SQL),MySQL数据库对公安内外数据进行安全、高效的存储;数据层服务中系统从数据接入、数据定义、数据处理3个方面完成对数据的加工;可视化服务中运用Flask、Pyecharts、Jinja2、Vue和Bootstrap4等可视化技术搭建社区盗窃风险知识图谱预警系统;应用层服务中,系统最终可以实现图谱展示、分等级预警、态势感知、多元主体分析等功能作用。

对于数据源获取的模式,系统设计2种方式,一种是文件上传模式,该模式需要将格式化的xlsx或csv数据文件通过主窗口页面进行上传;另一种模式是动态更新模式,该模式通过调整后台数据映射表文件,将MySQL数据库作为数据源进行接入,实现后台实时获取数据并动态渲染可视化界面,再异步推送渲染好的界面到用户网页端。通过以上2种不同的数据获取模式,该系统能够适应更多样的社区进行预警。

图4 社区盗窃风险预警系统总体框架Fig.4 Overall framework of community theft risk early warning system

4.2 基于知识图谱的社区盗窃风险事件预警系统实现

根据系统设计的总体框架,融入分等级预警机制,实现了基于知识图谱的社区盗窃风险事件预警。下面对系统进行展示,首先,利用数据上传界面上传数据,生成知识图谱,并给各个实体赋上相应积分值、选取合适的预警等级,一旦某类关系中实体的积分和值超过预警等级的阈值,整条关联关系可通过色彩变化予以警示。功能界面如图5,在预警功能中还带有滚动框实时滚动系统研判出潜在社区盗窃案件的风险级别、相关人、发生地等信息,同时还包括基础数据的态势感知,如性别比例、社区修建年份分布趋势等。社区管理员在工作中可以对潜在的社区盗窃案件及时预警,通知公安机关进行干预和处理,进一步减轻公安机关的破案压力、避免广大人民群众的财产损失。

图5 基于知识图谱的社区盗窃风险预警界面Fig.5 Early warning of community theft risk based on knowledge graph

4.3 社区盗窃风险知识图谱功能展示

知识图谱以盗窃事件为中心进行延伸,每一条连线都是对同一时空下碰撞后的人—地—事—物—组织5大实体的相关描述和关系进行展示,直观易懂。还可以展示其中的某一条关系链,如D某—前科—出入口较多—小区老旧—天气晴朗—社区巡防薄弱的图谱关系可明晰地展示出关联关系及信息。图谱同时还可以详细查看相关人的属性,更深入地了解当事人的基础信息。

5 结论

(1)在社区治安风险事件演化逻辑模型的基础上,提出社区盗窃案件的预警框架,并通过构建人—地—事—物—组织5类实体和实体关联关系搭建出社区盗窃风险知识图谱。

(2)在基于社区风险数据的基础上,通过筛选、整理、一致化、层级分析、概率统计、聚类等方法实现社区盗窃案件预警功能中积分值和分等级预警阈值计算,完善社区盗窃风险知识图谱的预警功能。

(3)尽管在实验层面成功实现社区盗窃风险演化预警方法,但社区治安风险事件还存在诸多类型,今后还需围绕不同类型的社区治安风险事件进行分析研究,着重完善社区治安风险知识图谱,以期为我国社区治安风险防范提供成果支撑和研究方向。

猜你喜欢

治安图谱关联
Me & Miss Bee
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
绘一张成长图谱
治安文化与治安秩序之间相互作用关系的研究*
做好企业治安保卫工作的认识与实践
“一带一路”递进,关联民生更紧
奇趣搭配
补肾强身片UPLC指纹图谱
智趣
主动对接你思维的知识图谱