APP下载

防爆安检知识图谱构建方法研究

2020-04-08柳伟新高洁

现代计算机 2020年7期
关键词:李希结构化图谱

柳伟新,高洁

(中国人民公安大学信息技术与网络安全学院,北京 100038)

0 引言

进入21世纪,我国经济社会高速发展的同时,出现各种社会矛盾和不稳定因素。爆炸犯罪活动以其爆炸结果危害大、社会影响恶劣、作案风险小的特点,越来越成为犯罪分子实施犯罪的手段。同时,作为爆炸物的炸药或化学试剂,相比于枪支更易获得,使得自制炸药成为可能。相比于其他暴力行为,爆炸更易造成大量人员伤亡和财产损失,更易造成社会恐慌和达到对政府施压的效果。

面对日益严峻的爆炸犯罪活动,防爆安检工作得到公安部门的极大重视。其工作范围涉及两大方面,一是以预防爆炸犯罪活动为目的的安全检查工作,二是关于涉爆现场的处置工作。其中,安全检查工作是从源头控制爆炸犯罪的关键性工作,具体来说,涉及对人身、物品、场地、车辆的安全检查,以排除危爆物品。涉爆现场的处置通常指已爆现场的处置工作,指借助专业器材,按照规范流程对已爆现场进行排查搜索,发现危爆物并及时、准确地进行处置,有效避免发生二次爆炸。

知识图谱作为一种表示认知世界和物理世界中信息和知识的有效载体,具有丰富的语义表达能力和灵活的结构。防爆安检知识图谱的构建工作,涵盖了防爆安检工作的全流程,包括防爆安检领域实体、实体间关系、事件以及相关法律法规等。防爆安检知识图谱的引入,整合了防爆安检领域相关知识,对于开展公安防爆安检工作具有重要意义。

1 防爆安检知识图谱构建流程

防爆安检知识图谱的构建流程如图1,分为模式层构建和数据层构建两条主线[1]。模式层是知识体系的构建,综合分析了防爆安检的相关业务、工作流程和涉及的法律法规,引领整个知识图谱的构建。数据层是数据实例的构建,指运用数据抽取技术从各种数据源中抽取知识。知识表示提供了一种统一的方式表示模式层和数据层两个层面的知识。知识存储及可视化是指用Neo4j图数据库对构建的知识图谱实例进行存储及可视化查询显示。

图1防爆安检知识图谱构建流程

2 模式层的构建

2.1 确立概念体系

基于防爆安检领域专业知识和公安领域相关数据资源,对防爆安检工作的整体架构进行分析,确定防爆安检工作的核心概念,从而形成概念体系。

2.2 定义类、属性、关系

模式层采用自顶向下的构建方式,定义了实体、事件、文档三大类,实体下分人、物、车、地四类,事件下分常规安检事件、突发情况、爆炸物处置事件三类,文档下分法律依据和处置措施两类。图2是防爆安检的概念层级:

图2防爆安检的概念层级

依据定义的三大类,创建了四种语义关系:

(a)检查——民警和被检人员、物、车、场地之间的关系,指民警对其实施安全检查。

(b)引起——被检人员、物、车、场地和事件之间的关系,指安检过程中,发现被检人员携带管制刀具等违禁物品,引起常规安检事件;发现被检人员、携带物品、车辆、场地存在爆炸物等危爆物品,引起爆炸物处置事件;发现被检人员、物品、车辆、场地出现突发情况时,引起突发情况处置事件。

(c)采取——事件和处置措施之间的关系,指事件的出现需要采取相应的处置措施。

(d)依据——处置措施和法律法规之间的关系,指采取的措施要符合相应的法律法规。

语义关系见图3。

图3防爆安检的语义关系

关键实体数据属性的定义,见表1。

表1关键实体的数据属性表

2.3 构建防爆安检本体

依据定义的概念、概念的属性和概念间关系,运用Protégé本体编辑软件构建了防爆安检本体模型如图4所示。

3 数据层构建

3.1 数据源

数据的有效获取是保证知识图谱成功构建的关键,数据按其组织形式分为结构化数据、半结构化数据和非结构化数据,本文的数据也来源于这三类数据形式。

(1)结构化数据:具有数据结构化程度高,组织形式一致的特点。本文从网上获取了《危险化学品目录》,从公安数据库中获取了部分人员、车辆以及违禁品数据。

(2)半结构化数据:半结构化数据具有一定的数据结构,其结构化程度低于结构化数据。本文利用网络爬虫技术,通过关键词检索获取了部分网络百科数据。

图4防爆安检本体模型

(3)非结构化数据:即纯文本数据。本文主要采用安检与排爆领域专业书籍、相关法律法规作为数据源。

3.2 知识获取

实体是构建知识图谱的基石,对应的实体抽取技术是知识图谱构建的关键技术,其抽取结果的高效、准确为后续工作奠定了根基,是知识图谱成功构建的重要保障。本文采用神经网络模型BiLSTM+CRF(双向长短时记忆网络和条件随机场结合)[2],其中,双向长短时记忆网络实现将输入的文字序列进行特征表示,具体实现方式为:对于一个输入序列(x1,x2,…,xt,…xn),BiLSTM模型通过一个正向LSTM表示输入序列(x1,x2,…,xt,…xn)xt左边的信息,通过一个逆向 LSTM 表示输入序列(x1,x2,…,xt,…xn)xt右边的信息,最后将左右两边的信息拼接作为最终的表示。然后将经过BiLSTM模型处理的文字序列输入到CRF模型[3]中,根据实体类型和BIO标签对每个词分类、打分,进而完成实体识别。

关系抽取采用基于特征工程的方法,通过提取具有显著区分性的特征,将其转化为分类器能够识别的特征向量,进而进行关系分类,完成关系抽取[4]。例如:Lixiis the driver of BMWx5(李希是宝马x5的驾驶人),实体“lixi”依存的单词“driver”的词性是 NN;实体“BMWx5”依存单词“of”的词性是IN。其依存树特征为:NNP-NP-S-VP-NP-PP-NP-NNP。

3.3 知识融合

本文处理的知识融合主要是指实体消歧,本文采用的方法是基于上下文的相似度计算[5],通过对比实体指称项的上下文环境和候选实体的上下文环境,从而在一定程度上比较出二者间的相似度。对于某一个待消歧的实体指称项A,经由词向量模型,可向量化表示为(A)=,其中,n 代表向量的位数,对于候选实体,通过获取实体的摘要,进行向量表示为A候选)=,通过计算(A)和之间的相似度来计算实体指称项A和候选实体A候选之间的相似度,计算公式如下:

3.4 知识表示

知识表示[6](包括模式层本体的表示和数据层实例的表示)提供了一种统一的方式表示模式层和数据层两个层面的知识。其采用语义网中知识表示方法,包括XML、RDF、RDFs、OWL等。具体体现在知识用统一的三元组来表示,三元组中的实体表现为知识图谱中的节点,实体间关系在图谱中用节点之间的边来表示,以此来存储现实世界中的知识。本文采用OWL(网络本体语言)作为知识表示语言。

OWL以rdfs:subClassOf表示类别的上下位关系,例如为“实体”类定义“人”子类,OWL语言表示如下:

以owl:ObjectProperty表示类别间语义关系,以rdfs:domain表示该关系的定义域,以rdfs:range表示该关系的值域。例如以语义关系“引起”为例,OWL语言表示如下:

3.5 知识存储及可视化

知识图谱的存储结构是基于节点和边的结构,本文选用查询语言更加完善的图数据库Neo4j对知识进行存储。Neo4j采用表现能力强,查询效率高的Cypher语言。例如创建部分节点如下:

CREATE(李希:Person{姓名:"李希",性别:"男",出生日期:"

1984.6",身份证号:5312});

CREATE(刘倩:Person{姓名:”刘倩”,性别:”女”});

CREATE(宝马:Car{品牌:”宝马”,车牌:”5631”});

创建人与人、人与物的部分代码如下:

CREATE(李希)-[:配偶]->(刘倩);

CREATE(李希)-[:驾驶]->(宝马);

对人物“李希”进行检索,对应的查询语言为:

Match(p:人物{姓名:”李希“})

Return p;

查询结果如图5所示。通过对人物“李希“的查询,可以获得其属性信息(性别、身份证号)、驾驶车辆信息及其配偶信息。因其携带雷管而引发治安管理处罚事件,处置措施为对雷管进行没收,对其本人处以拘留,所依照的法律为治安管理处罚法第30条。通过这些关系的呈现,为执法人员提供了明晰的执法指导,有利于执法人员准确高效地进行处置,提高工作战斗力。

4 防爆安检知识图谱的应用

安检防爆主要研究对安检对象可能存在的危险排查和发现爆炸物等危险物品的处置,实现对特定场所的安全控制和存在危险的排除。而知识图谱在安检防爆中的运用体现了知识的有效组织和语义关联,相比于公安现有的关系型数据库,具有更高效的操作性,更好地适用于公安防爆安检工作。

(1)相关专业性人员培训

因知识图谱中涵盖了防爆安检工作中全流程的知识,对于违禁物品的全面涵盖、处置措施的明确规定、法律法规的准确规范,可为专业人员提供各环节的科学指导,对于防爆安检工作有了全面、科学、准确的认识。借由知识图谱对相关人员进行专业的培训,对于其日后开展相关工作具有重要的指导价值。

(2)智能机器人应用模式

在防爆安检工作中,知识图谱作为机器人的智慧大脑,可实现人员信息识别、车辆信息识别、物品信息识别以及提供事件处置流程等。通过机器人的人脸识别模式或者证件核查筛选出重点人员,对警务人员发出警示。通过在道口不间断检测,通过高清摄像头对车辆车牌号、车型、车标等进行识别,将获得的数据与公安车辆数据库中的数据进行比对,发现被盗抢或套牌、假牌、肇事逃逸车辆的情况予以上报。检查卡口人员和道口车辆携带的物品,发现违禁物品时及时上报。知识图谱构建中,配置了大量的处置措施和相关法律依据,为警务人员提供了准确高效的指导。

图5防爆安检知识图谱

5 结语

本文通过构建防爆安检知识图谱,将防爆安检领域相关知识关联成一个“语义网络”,为警务工作提供基础数据支撑,在一定程度上提升了公安防爆安检工作智能化水平,提高了公安机关实战能力。作为知识图谱在防爆安检领域的初步探索,本文也存在一些不足,一些实体间关系的构建也不够详尽,希望在以后的工作中对其进行完善。同时,随着知识图谱在公安领域的深入发展,其对于公安工作的价值必将日益凸显。

猜你喜欢

李希结构化图谱
基于图对比注意力网络的知识图谱补全
借助问题情境,让结构化教学真实发生
改进的非结构化对等网络动态搜索算法
深度学习的单元结构化教学实践与思考
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
图表
遗失的味蕾
大宰相不欺小买主
主动对接你思维的知识图谱
还债的顺序