APP下载

基于复杂网络的应急情报系统案例知识库构建与应用研究*

2022-01-28

情报杂志 2022年1期
关键词:知识库图谱情报

樊 舒

(中国刑事警察学院 沈阳 110854)

案例是对具体历史事件的描述和记录,通过对事件类型、状态、过程等信息的结构化表达,实现对历史事件个性化特征及信息的规范化组织,从案例数据中,可以提炼获得有价值的共性知识,并将案例集合与知识集合构建为案例知识库[1,2]。在应急情报系统中,突发事件案例知识库的应用价值包括两点:一是记录突发事件多维度信息,为用户提供关于事件的基本信息、情景描述、发展过程,为用户认知和分析突发事件(如时空分布规律等)提供数据基础;二是在各类突发事件的应急处理过程中,当面临瓶颈问题、复杂态势或决策需求时,获取历史案例中蕴含的解决问题的方案、技战法和决策方法知识,对这些经验和知识进行修正后重用在当前问题中,实现辅助决策。因此,研究案例知识库的构建方法,加强突发事件信息和知识的表示能力,对提高应急情报系统的信息化和智能化水平、促进应急管理部门的复杂突发事件响应处置能力具有重要价值。

1 已有研究评述及本文工作

1.1突发事件案例知识库构建及应用相关研究突发事件案例知识库构建研究可以从案例库的内容、表示模型、构建方法等角度开展。在内容方面,Salamo M等认为案例内容应包含案例状况描述和所采取的问题解决策略两部分[3]。Liao S H将案例内容划分为问题描述、解答策略和决策支持系统方法三个部分[4]。杨建林等提出了描述突发事件案例的四元特征向量模型,并定义了公共卫生突发事件下,案例类型、案例描述、解决方案、决策环境等维度特征的具体内容[5]。朱恒民等认为案例内容由问题或情景描述、解决方案、方案效果三部分构成,其中前两部分为必要内容[6]。唐明伟等进一步对案例做容错处理,从案例中提取共识规则[7]。但现有研究仅考虑了案例知识库对指挥决策的支持,忽略了其对情报生产的支持功能。在案例表示模型方面,邓三鸿等采用框架表示法表示案例信息,并利用利益相关者理论对突发事件中的组织和个人进行有效分类[8]。张英菊等设计了基于应急概念树、突发事件本体模型、元事件模型等三层架构的案例表示模型,其中本体模型用于表示共性信息,元事件模型用于描述案例信息[9]。张艳琼等将突发事件划分为包含多个情景片段的情景链,并构建“情景——策略”对,实现对突发事件发展过程及应对方式的表达[10]。与文献[10]思路类似,于峰等采用ABC本体模型,定义实体、时间、空间、情景、任务、动作等类并采用关联关系连接类,实现对案例过程的细粒度分解和描述[11]。在案例知识库构建方法方面,利用本体技术对案例中蕴含的领域知识进行抽象和建模,加强知识规范表示、共享和复用能力,是目前突发事件案例知识库的主流构建方法。王傲然利用OWL语言定义应急案例本体,并设计基于本体结构的案例相似度算法[12]。谢健民等面向网络舆情突发事件案例,综合考虑本体模型与案例推理方法,并采用二者独立演化的方式,保证案例库构建的完整性[13]。王琳在对粮食突发事件的类及属性等信息进行归纳的基础上设计本体模型,用于构建粮食应急案例库[14]。张宝隆等研究了基于本体的事故案例知识库的构建和推理技术[15]。案例知识库应用的研究重点是案例或知识检索方法。检索的基本思路是计算目标案例知识与源案例知识的相似度,如王红等将民航突发事件案例相似度解析为数据类型相似度、数据值相似度和对象属性相似度,并融合三者获得计算结果[16],李慧嘉等在利用突发事件案例构建本体关联网络的基础上,将案例相似度计算问题转化为节点间的交互距离计算问题[17],钟华明等采用质心点约束的k近邻法进行知识筛选[18]。

1.2本文工作在情报生产流程中采用结构化思想,便于实现情报思维路径的重用和分享,从而保证情报生产活动的效率[19]。复杂网络可作为对客观世界中的复杂对象或系统进行结构化描述的工具,根据这一思想,樊舒等提出了基于复杂网络的结构化公安情报框架[20],其优势是将复杂网络作为事件情景、情报需求、情报分析、情报产品的统一的表示及可视化模型,将情报生产和决策问题转化为对复杂网络中元素状态的计算、预测、控制问题,从而建立情报流程各环节间的关联性,赋予情报流程有序性和体系性。鉴于突发事件也属于由多种元素耦合构成的复杂对象,文献[20]的成果也适用于应急情报处理。但根据调研,目前还没有针对复杂网络应急情报系统案例知识库的研究。鉴于此,本文基于复杂网络设计案例知识库表示模型及内容,同时设计协作使用事例型和统计型知识的情报工作方法,使案例知识库可支持基于复杂网络的情报规划、分析、决策等应急情报流程环节。

2 应急情报系统及案例知识库功能分析

2.1应急情报系统架构及知识使用可以从功能维度、组织维度、实现维度构建应急情报系统。功能维度以实现情报的生产和应用为目标,设计应急情报系统中功能模块的架构,可作为系统构建基础;组织维度关注功能架构中各情报主体的分工及协作方式;实现维度负责功能架构中各模块的具体实现方法。如图1所示,应急情报系统功能架构以情报流程为核心,可划分为情报生产、情报应用、存储系统等部分。情报流程各环节均可抽象为“输入+方法=输出”模式,如情报采集环节中,采集对象状态经采集设备及采集方法后,转化为数字数据,情报应用环节中输入为情报,输出为应急决策方案,方法包括案例库查询、专家分析等多类方法。各环节的实现过程均可分为规划和实施两个步骤,其中规划负责设计输出目标,实施负责输入内容和方法的选择及执行。如情报规划,作用是为情报生产设计输出目标,即情报需求,由于输出目标同时也是情报应用环节的输入内容,因此情报规划需同时考虑情报应用和生产的情况;相比之下,情报采集、处理及应用的输出目标比较清晰,往往不需要专门的规划环节。在上述环节中,需要依据突发事件情景状态以及领域知识,对输入、输出、方法方案做出设计和选择。知识根据知识抽象程度由弱至强排序,可划分为不同类型:事例型知识(即对方案具体行为过程的描述,如案例)、统计型知识(是基于统计方法,对案例中行为方式的描述和认识,如事理图谱)、抽象型知识(是经提炼用于描述领域运行规则等信息的知识,如模型算法)。知识抽象程度越弱,其内容对行为的描述更直接,抽象程度越强,则其适用性越强,对行为机理的描述越清楚。在应急指挥决策中,采用的专家咨询方法,本质是专家对多层次知识的综合运用。事例型知识可构成案例库,统计和抽象型知识可构成知识库。由于应急管理具有突发事件态势复杂、实时决策响应的特点和需求,目前应急情报系统的主流工作方式,是基于案例库查询,实现历史行为方案的快速复用,提高情报生产和应用效率。

图1 应急情报系统功能架构

2.2应急情报案例知识库构建思路根据上述分析,本文的研究目标是构建应急情报系统下的案例库和知识库,其中案例库用于存储事例型知识(即案例),知识库存储基于案例的统计型知识,限于篇幅,本文不考虑抽象型知识库。在内容方面,案例库和知识库应记录应急情报流程相关重要信息,即参与该流程的各元素的行为或属性信息,具体如下:a.情报客体静态情景:记录突发事件的情景描述信息,体现情景内元素集合、元素的属性以及元素间的关系;b.情报客体变化态势:记录突发事件态势产生剧烈变化情况下的信息,包括目标情景下元素集合、属性及元素间关系的相互作用及变动情况;c.情报主体的情报生产行为:记录用户解决情报生产问题的方法,内容包括情报对象,即生产所涉及的元素,以及生产采取的策略,包括对映的情报功能、由情报需求转化的复杂网络分析问题、情报分析采用的网络分析工具等,为用户在情报规划和情报分析环节中对突发事件情报进行需求解析和处理分析提供参考知识;d.情报主体的情报应用行为:记录用户处置突发事件的指挥决策策略,内容包括策略的实施主体、客体元素、处置行为内容,以及策略实施前后关键元素的状态,为情报应用环节提供决策辅助。

3 案例知识库构建方法

将案例知识库划分为案例库和知识库两个部分分别进行构建,其中案例库存储具体的历史案例信息,属于细粒度的、个性化的案例描述信息;知识库存储从历史案例中获得的统计型知识,属于共性化知识。下面,分别对案例库和知识库表示及实现方法进行设计。

3.1案例库表示方法突发事件案例库中的案例结构如图2所示,包括案例信息、子事件网络两部分,各部分具体信息如下文。

图2 突发事件案例结构

3.1.1 案例信息表示方法 案例信息表示内容包括:案例的基本属性信息,如案例的编号、突发事件发生时间、地点、危害等级、案例突发事件类型、事件简要描述等,其中,案例突发事件分类标准可参考文献[10]中的突发事件分类体系。该部分用于帮助用户快速了解突发事件的基本情况,支持用户基于事件基本特征属性进行案例检索,并在构建知识库时为案例分类提供依据。可将案例信息视为一个节点,将案例的各基本属性设置为节点的多个属性,作为案例信息的表示模型。

3.1.2 子事件网络表示方法

(1)子事件网络表示模型。从复杂系统的视角出发对突发事件进行解读,在事件中出现的人、物等元素均是具有属性的实体,事件情景是多个实体通过关联关系形成的系统,事件过程是事件情景系统在不同条件作用下持续演化的过程。不同类型突发事件下,事件情景所包含的元素集合、元素属性、元素间关系以及情景演化关系受事件类型影响,但元素构成突发事件这一复杂系统的方式是不变的。因此,可基于复杂系统思想,采用子事件网络作为突发事件进程的表示模型,子事件网络由子事件经关联关系连接形成。子事件间关联关系类型包括:组成关系:指某子事件由多个子事件构成,如事件决策中,对多个事件元素同时采取处置行为;因果关系:表示前一子事件导致后一子事件发生;顺承关系:反映子事件在发生时间上的先后顺序;并发关系:表示若干子事件的发生时间存在重合[21]。

子事件是构建子事件网络的基本单元,采用子事件图谱作为表示模型,记录突发事件进程中的关键信息。子事件图谱可划分为三个部分:子事件节点、子事件过程网络、子事件情景网络。a.子事件节点:其属性用于描述子事件基本信息,包括事件名称、发生时间、所属案例、事件类型、事件功能等。其中,事件类型包括态势变化、情报生产、情报应用三类;事件功能指事件主体发起该事件的目的或事件产生的影响。b.子事件过程网络:以事件行为节点为核心,还包括主客体元素节点,以及其他与事件行为相关的节点和节点属性信息。c.子事件情景网络:以事件主客体节点为核心,事件相关元素采用多种类型实体节点表示,如人物、物品类节点等,各节点均可设置属性以表示元素特征或状态,并用节点间的边表示元素间关联关系,即构成该子事件对映的复杂网络情景信息,可用于支持案例推理中的情景检索功能。

图3“12.31”外滩踩踏事件部分子事件网络图谱

(2)子事件网络表示内容。根据关键节点的成因,将网络中的子事件划分为三种类型,其表示内容存在差异。

a.态势变化子事件:突发事件复杂的演化发展路径,导致其演化结果存在不确定性,造成情报生产及决策处置中的瓶颈难题。突发事件的发展进程,本质是事件所含元素受多种因素影响后,其状态出现的持续变化。事件所含元素状态的剧烈变化,是推动事件演化的关键原因,期间元素状态变化的成因、变化方式、变化程度,均是可支持情报用户深入认知突发事件的有价值的知识,属于案例需细粒度记录的内容。因此,设置态势变化子事件,用于记录由非应急处置手段因素造成的事件状态剧烈变化子事件信息,核心内容包括:子事件行为即造成案例事件态势剧烈变化的元素间的作用行为,为元素节点设置状态属性来表示元素的重要状态信息。

b.情报生产子事件:情报用户作为突发事件情报流程的参与者,其在情报需求规划、分析情报、网络问题转换时曾采用的方法是可复用的知识,应作为案例的信息内容,以供情报分析人员从案例库中获取和参考使用。设置情报生产子事件,其表示内容为情报用户在历史案例中采用的分析情报数据、情报产品生产操作方法。根据前文所述,情报生产本质是对复杂网络中元素状态的计算、预测、控制问题,因此子事件网络应包括:情报生产行为节点以及该行为对映的复杂网络问题和情报需求节点,生产行为主体、客体及情景元素,生产行为采用的方法及工具节点,此外应设置各节点间的关联关系。

c.决策实施子事件:为遏制突发事件态势恶化的趋势,应急管理部门需决策并实施应急策略,其本质是通过改变部分事件元素状态,修正事件演化路径,使事件态势趋向平稳可控,属于突发事件进程中的关键子事件。决策者针对突发事件的处置行为,以及该行为产生的效果,均可作为重要知识信息在决策实施子事件中记录。从复杂网络的视角看,该类事件表示内容可包括:突发事件下待处置的问题,策略实施方、策略所针对的元素、策略行为及属性,策略实施造成的元素状态变化,策略实施影响范围内的元素及元素间关联关系。

(3)子事件网络示例。根据上海市公布的《“12.31”外滩拥挤踩踏事件调查报告》,采用报告中部分信息,构建上海踩踏事件部分子事件网络图谱如图3所示。图谱中包含两个态势变化子事件,以及情报生产子事件和决策实施子事件各一个。如子事件网络表示模型中所述,粗线轮廓的节点为子事件节点,子事件的主体、行为、客体节点构成子事件过程网络,子事件主客体以及与其相关的其他实体元素构成了子事件情景网络。

3.2知识库表示方法知识库用于表示案例库内容无法表达的具有共性及参考价值的统计型知识集合,其内容包含情景图谱、突发事件事理图谱、情报需求图谱、应急策略图谱等领域知识图谱。

3.2.1 情景图谱 情景图谱为用户提供各类案例的基于复杂网络的情景内容知识,辅助用户明确当前情景表示方法,为后续的基于情景的案例检索等操作构建基础。情景图谱中包含情景元素节点及节点间关系。构建情景图谱需要将同类型案例下子事件节点图谱做合并统计处理,具体方法为:合并子事件图谱中同类的实体元素作为情景元素节点,节点仅保留实体元素的类型属性,同时统计各类型实体元素在被合并子事件集合中的出现概率,作为情景图谱中该类型元素节点的属性,此外,合并同类实体元素间的同类型边作为情景元素节点间的边,设置边的名称并统计其出现概率属性。

3.2.2 突发事件事理图谱 该类知识用于表征各类突发事件的进程演化规律。采用事理图谱[22]作为知识表示模型,图谱内的节点是经泛化的子事件,节点间的边代表泛化事件间的关联关系。合并同类案例的子事件网络,形成事理图谱:a.仅合并子事件网络中可反映或影响突发事件发展态势的子事件,即态势变化子事件和决策实施子事件;b.行为节点内容近似的子事件节点可合并为同一泛化事件节点,泛化事件内容即事件行为内容,统计属于该泛化事件的子事件节点在案例集合中的出现概率并作为泛化事件节点属性;c.对子事件节点集合中的同类型主客体元素进行合并,将合并后的泛化主客体节点与泛化事件节点连接,统计各类元素在子事件集合中的出现概率作为泛化主客体节点属性;d.保留子事件节点间的关联关系,统计子事件节点集合间的关联边集合,计算泛化节点间关联关系的概率。

3.2.3 情报生产图谱 该类知识用于表征突发事件中应关注的情报生产知识,包括情报需求、在情报分析环节中如何将情报需求转化为具体网络问题、完成情报生产所采用的分析工具及数据。由于情报生产行为与突发事件类型及实时情景相关,因此应在对案例进行分类的基础上,对案例中的情报生产子事件集合,依据情景特征进行聚类,获得情景相似子事件集合,用于构建情报生产图谱。a.对子事件图谱中内容、类型相同的节点进行合并,记录合并节点内容,统计和记录合并节点在情景相似子事件集合中的出现概率;b.合并节点间的同类边,记录节点间边的内容,依据合并节点对映的节点集合间的关联关系,统计和记录合并节点间的关联概率。

3.2.4 应急策略图谱 该类知识表征突发事件中可能出现的需解决的难题、采用的应对策略、难题与应对策略间的对映关系。与情报生产类似,应急策略的选择也与突发事件类型及实时情景相关,其构建过程与情报生产图谱构建过程类似。在获取情景相似决策实施子事件集合基础上,首先,对子事件图谱中相同内容及类型节点进行合并、计算出现概率,其次,合并节点间同类边,并计算合并节点间的关联概率。

需要注意的是,知识库中的情报生产图谱与应急策略图谱应与参与其构建的源案例建立对映关系,以便用户在案例推理操作时,获取知识库中的对应图谱。

图4情报生产中案例知识库应用方法

3.3案例知识库实现方法根据前文中对案例知识库表示模型的阐述,可选择知识图谱作为突发事件案例库及知识库的数据结构,将构建过程分为模式层构建和数据层构建两个环节[23],分别对案例库和知识库进行构建。其中,模式层构负责对抽象事件、事件、行为、元素的类型和属性,元素间关系等案例领域知识进行定义,该部分以本体作为知识的规范化表示工具,可采用Protégé软件实现本体构建。数据层存储案例库和知识库的具体内容,需依据模式层本体从案例数据中抽取、提炼信息并进行组织。Neo4j是目前主流的图数据库,满足案例知识信息的知识表示需求,同时,配合cypher数据库查询语言可实现复杂查询,因此,可选用Neo4j作为案例知识库的构建平台。

4 案例知识库的应用方法

根据基于复杂网络的应急情报流程和应急情报系统功能架构,进一步分析情报流程各环节的规划和实施过程,与资源系统的协作方式:a.情报采集与处理:由于该环节输入、输出、方法集合规模有限,一般不需要规划环节,仅在实施步骤中从资源系统工具库获取采集或处理工具。b.情报规划:设计情报生产输出集合,该环节可以依据历史案例内容进行知识复用,也可以根据领域知识进行设计。c.情报分析:可依据历史案例内容或领域知识,确定输入数据集合以及分析方法,之后从工具库获取网络问题计算方法,完成情报生产。d.情报应用:功能是输入情报产品,输出指挥决策方案。决策方案有两类制定方法:一是基于领域知识设计或选取应急优化模型,进行优化决策;二是查询案例库,从案例中获取应急方案并根据实际情况进行修订。从上述分析可知,各环节在对输入、输出、方法进行设计时,主要是采用两种思路:一是复用历史方案,二是基于领域知识进行模型或方法构建。考虑到应急管理情报体系的实时性需求,基于案例库的CBR(案例推理)[24],复用和修订事例型知识,已成为主流的解决输入、输出、方法设计问题的方法。但该方法有几点不足:一是历史案例方案中不是所有方法或处置手段都是正确的,在实战中可能有更好的替代选择,但在基于属性检索或情景检索获得的小规模案例集合中无法体现;二是用于案例推理的案例特征不一定是完备的,可能导致检索获得的案例与当前突发事件不完全匹配,其方案内容不一定适用于当前事件,而依据领域知识进行方案修订将造成应急实时性差、效率低。以案例为基础的统计型知识的优点,在于通过对大规模案例的整理统计,实现对方案中的行为元素完备集合及元素概率分布的描述。在进行输入、输出、方法设计时,协作使用事例型知识、统计型知识和实时情报的思路如下:从实时情报获取当前场景信息,从事例型知识库(案例库)获得类似案例或场景下的方案,从统计型知识库(知识库)获得当前突发事件同类型事件可用的知识集合以及各知识元素的重要度;以历史案例中的方案为新方案设计的起点,结合突发事件实时状态及知识集合重要度,从知识集合中选取知识,对历史方案进行修订,使其适用于当前场景,从而提高应急方案的精准度。具体来说,在应急情报系统中,可以在情报生产和情报应用过程中协作使用案例库和知识库中的多层次知识,具体过程如下。

(1)情报生产。如图4,基于知识协作的情报生产分为三个步骤:a.根据知识库中当前类型突发事件对映的情景图谱,查找情景要素及边集合,获取情景表示模型,并在该模型基础上,根据实时应急情报,确定情景要素及边的属性,实现事件当前情景构建,需要注意的是,事件情景可用于事件态势监测;b.利用情景信息,基于情景匹配方法案例库进行案例检索,获取与当前事件相似的案例集合,获取情报生产方案;c.利用情景信息,从知识库中检索得到情景对映的情报生产图谱,参考该情景下的情报需求、网络问题、分析方法等情报生产知识集合及其概率属性,对已有方案进行修订,制定最终生产策略。

(2)情报应用。如图5,基于知识协作的情报应用可为四个步骤,其中,前两个步骤与情报生产一致;第三步,在获取案例中的应急决策方案后,根据情景信息,从知识库获取对映的应急策略图谱,并基于图谱中的统计型知识对应急决策方案做进一步改进;步骤四中,查询知识库中的事理图谱,对决策方案中的应急行为可能引发的决策结果及突发事件进程演化情况做预测,还可以在该步骤中引入仿真系统,基于当前事件状态,对决策方案做仿真测试,步骤四的价值在于对决策方案做质量评价,以决定是否对方案做进一步修订。

图5情报应用中案例知识库应用方法

5 结 语

本文研究如何构建及应用适用于复杂网络应急情报系统的案例知识库,使其支持突发事件应急情报核心流程中的关键行为:情报生产和情报应用。内容上,案例库包含突发事件的情景、态势变化、情报生产及应急决策等事例型知识,知识库包含从案例提炼的统计型知识;表示方法上,基于复杂网络是情报流程中统一的表示及可视化模型这一思想,案例库采用以子事件网络和子事件图谱为核心的双层表示模型,知识库采用统计型图谱和事理图谱作为表示模型。在情报流程中,协作使用案例库和知识库,以当前情景对映的历史案例中的方案为基础,结合知识库中的统计型知识集合,完成方案的评价和修订,从而提高应急方案的精准度。本文没有将基于情景匹配的案例检索方法作为研究内容做具体阐述,将其作为下一步工作重点开展研究。

猜你喜欢

知识库图谱情报
情报
基于图对比注意力网络的知识图谱补全
情报
情报
汉语近义词辨析知识库构建研究
绘一张成长图谱
图表
主动对接你思维的知识图谱
交接情报
机构知识库建设的动力研究