基于专家推理系统的目标识别方法
2020-06-08姚传明陈悦峰
姚传明,陈悦峰,邓 晶
(1.中国电子科技集团公司第二十八研究所,江苏 南京 210007;2.中国人民解放军63963部队,北京 100072;3.中国人民解放军72465部队,山东 济南 250022)
古语云,兵贵神速。放眼现代战争,赋予其含义是取得对敌信息优势,实现先敌发现、先敌决策和先敌行动,核心是取得对敌情报优势,关键是指挥信息系统需具备自动分析处理敌情信息的能力,尤其是对敌目标信息的自动识别。目前,研究人员提出多种基于规则策略方法和神经网络的目标自动识别方法[1]。前者很难由系统完全枚举且缺乏灵活的规则扩展能力,后者技术尚处于探索中,系统鲁棒性无法有效保证。针对上述情况,本文提出一种基于专家推理系统的目标识别方法。专家推理技术诞生于20世纪60年代,技术成熟度相对较高且对系统硬件资源要求不高,具有自动化处理推断能力,实现系统目标识别,同时,提出面向专家推理系统自学习方法,实现对目标知识库的不断扩充,解决系统知识规则扩展难的问题,为指挥信息系统实现对目标的自动识别提供一种潜在的途径。
1 系统架构
目标自动识别原理是通过构建目标特征级信息知识库,利用专家推理系统,实现对目标类型及相关属性的自动识别。该目标识别系统构成如图1所示。系统通过人机交互接口构建知识库和语义库,利用情报接口将情报信息输入至语义识别模块,由语义识别模块对情报信息进行分析、处理后输入至推理机,推理机利用知识库对接收到的情报信息进行推理,从而形成对目标信息情报的识别。
图1 系统构成图
目标识别系统构建过程包括知识库构建、语义库构建、语义识别、知识库扩充、正向推理和识别确认目标六个关键过程节点,具体如图2所示。
步骤1:知识库构建。将已有可表征目标类型及属性的特征信息,利用产生式规则进行描述,形成由目标特征信息构成的前件和由目标类型及属性构成的后件,按照优先级顺序排列后由前件和后件共同构成目标信息知识库。
图2 系统流程图
步骤2:语义库构建。以军用数据情报及军语信息为基础,提取出与目标信息相关的特征词,格式化特征词将其形成结构化排列的词条,该词条构成语义库的各实体单元。
步骤3:语义识别。指挥信息系统接收到情报信息并解析后,利用步骤2中形成的实体单元逐一与情报进行匹配,若匹配成功,则表明存在目标特征信息,则对该情报标记处理,并利用步骤1的知识信息与之匹配,实现对情报的分词处理,形成情报的特征词组,若匹配不成功,则不对该情报进行处理。
步骤4:知识库扩充。利用步骤3的方法,若情报同时含前件及后件信息,则将该信息增加至知识库中,实现知识库的在线扩充。
步骤5:正向推理。利用步骤3,若情报信息仅包含前件,则利用专家系统中正向推理技术,对前件信息进行推理,直到匹配到后件为止。若由指控人员输入目标前件,系统则亦采用正向推理,匹配后件,以上若匹配不成功,则推理结果返回空值。
步骤6:识别确认目标。指挥控制人员通过对目标特征信息和步骤5形成的推理的过程分析并确认后,形成目标识别结果。
需要说明的是,知识库和语义库的构建可在系统运行过程中不断学习完善,支持系统知识的自增长和扩充。
2 技术架构
2.1 知识库构建
利用系统人机交互接口,将专家提供的目标类型及属性信息输入至知识库中,知识的描述方式采用产生式规则,部分如下:
规则一:A∧B→M
规则二:C∧M→N
规则三:A∧B∧C→N
A、B、C为目标特征信息的前件,M、N为目标的后件。如规则一,前件A和B同时存在,则可推理出后件M;规则二,前件C和后件M同时存在,可推理出后件N;规则三,前件A、B和C同时存在,则可推理出N。
信息的前件由目标特征信息,如速度、外形特征等构成,后件由目标类型及属性构成,如装甲类目标、飞行类目标等构成。
目标信息的前件和后件分开存储,通过构建前件和后件的映射关系实现两者的信息关联。对于前件向后件映射过程中,可能存在同一前件对应多个不同的后件,对此冲突关系,采用优先级策略,即先推理到的后件即为最优后件,忽略后续映射关系。
2.2 语义库构建
语义库的构建旨在对情报信息预处理提供信息支撑。利用人机交互接口,将军用数据报文及军语信息中与目标信息相关的特征词格式化,并由格式化的特征词按目标特征类别构建结构化词条,如图3所示。
图3 目标语义库构成
语义库中的各特征词条CHAR成为目标特征信息的实体单元,各实体单元可彼此互斥或互融,以保证信息表征的灵活性。
2.3 语义识别
通过系统的情报接口获取情报信息后,对该信息进行处理,具体如下:
1)将语义库中的各实体单元与情报进行匹配;
2)若1)匹配成功,则表明该条情报信息存在目标信息,须对该条情报进行标记,并做分词处理;
3)若1)匹配不成功,则表明该条情报不包含目标信息,不处理;
4)对2)中分词处理方法是:利用知识库中的前件、后件信息与情报信息进行匹配,若匹配结果同时包含前件信息和后件信息,则将该条信息作为目标特征知识扩充到知识库中,并形成前件与后件的映射关系。若匹配结果仅包含前件信息,则表明该条情报信息需要专家系统进一步推理得到后件(结果)。
语义识别的关键是对文本的快速匹配。指挥信息系统中,系统接收到的情报特点是单条情报字节数均不多。但是,语义库和知识库中均包含数目较多的词条信息,为实现两者间的快速匹配,采用字符串快速匹配算法以提高匹配效率。
算法思路:通过将特征词分解成单字符,由该单字符与情报进行比较,确定单字符在情报中的具体位置,再进行其他字符间的匹配,确保在失配时,特征词能跳过尽量大的距离,减少不必要的匹配。算法流程如下:
1)设特征词为C,长度为m,情报为B,长度为n。令0≤i<m,0≤j<n;
2)若m>n,则特征词与情报不匹配;
3)若m=n,则C[i]和B[j]逐一比较,两者相等则匹配,否则不匹配;
4)若m<n,记录C[m-1]在B[0]至B[n-m-1]中出现的所有位置,构成位置序列P[k];
5)分别将C[m-1]与B[P[k]]对齐后,对其余字符从左至右逐个匹配,若匹配成功,则返回True,若不成功则跳转下一个P[k]位置,重复步骤5)。若始终无法完全匹配,则返回False。
6)返回值为True时,表明该特征词在情报中;反之,则该情报不含该特征词。
如上所述,情报信息不限于情报报文信息,亦包括经过格式化转换后的传感器系统信息等。
2.4 知识库扩充
根据语义识别相关方法,若情报同时含前件及后件信息,利用语义识别将前件和后件信息提取出来,扩充到知识库中,并增加前件与后件的映射关系,从而实现目标识别系统知识库的不断扩充,使之更加贴近作战应用需要。
一般知识推理系统其知识结构往往是固定的,不具备在线扩充和自学习能力[2],导致大量系统输入输出数据无法有效转换成作战知识。而本目标自动识别系统通过知识库的自学习扩充机制,可在一定程度上增加并完善系统的知识库,减少系统使用维护人员手工构建知识库的工作量,从而增加系统推广应用的可能性。
2.5 正向推理
正向推理由专家系统推理机实现,该推理机作为系统一个独立的功能模块,与知识库是分开设计的。启动正向推理的触发机制有如下2种。
1)若情报信息经语义识别、分析,发现仅含有目标前件信息时,则触发推理机进行正向推理,如图2流程①;
2)若指挥控制人员人为输入目标信息前件时,则亦触发推理机,如图2流程②。
推理机运行过程如图4所示。
图4 正向推理流程图
1)读入目标特征信息事实facts=(F1,F2,…),通过数据总线访问目标知识库前件forwards,在知识库规则rules=(R1,R2,…)中查找符合facts与forwards相匹配的规则R1,再把R1后件中不在facts中的后件结论M=(M1,M2,…)中与之匹配的M1添加到facts中,扩充事实facts为facts=(F1,F2,…,M1)。若存在一条可用的知识库规则Rx,且Rx的前件也在当前的事实facts中,则采用冲突消解策略,如前文所述的优先排列的规则,即同时有多条规则满足匹配条件时,则在知识库映射规则rules中选择第一条作为匹配规则。
2)对扩充后的事实facts在知识库rules中查找可用规则,当找到规则R1时,由于R1的后件结论M1已在facts中,故此时忽略规则R1,继续查找符合要求的规则R。当遍历到规则Rx符合要求时,判断Rx的后件结论M是否在当前facts中,若在,则忽略,若不在,则将其后件结论M2添加到facts中,扩充当前facts为facts=(Fx,Fy,…M1,M2)。
3)在知识库rules中查找符合当前扩充后facts的规则,若规则Ry的前件在facts中,则表明Ry是可用规则。当Ry的后件结论在facts中时,则忽略该规则,若Ry的后件结论H1不在当前扩充后的facts中时,则将规则结论H1扩充到facts中,使得facts=(Fx,Fy,…M1,M2,H1)。
4)不断在知识库rules中查找符合当前要求的facts规则,直到找不到规则的前件forwards所包含的全部条件与facts相匹配,且rules中的后件结论亦不在facts中。至此,正向推理结束。
5)目标信息推理的结果为rules的后件结论。该结论包括目标类型或目标属性信息。
如图5所示,正向推理功能模块由面向对象的结构化编程语言C++编写,主要包括七个功能函数:1个推理函数,1个调用函数和5个判断函数,各函数功能定义如图5所述。
图5 正向推理各实现模块功能图
2.6 识别确认目标
通过上述5个步骤,目标自动识别系统在后台基本完成了针对某个或多个目标特征信息的推理,并生成目标类型和相应的属性信息,为确保目标识别系统的可靠性和准确性,必要时可采用人件服务的理念[3],由指挥人员对推理过程进行核查确认,最终确定目标类型。
实际应用时,目标推理结果可以和情报信息关联,当打开情报信息时,系统便会自动给出推理结果,辅助于指挥控制人员对目标信息的处理,提高知悉信息的能力,为辅助决策提供支撑。
3 应用情况
在ReWorks系统上,利用ReDe开发工具,编写多目标识别系统软件,其中,目标特征库、知识库和语义库预先由SQLite数据库进行编写,使用过程中可动态扩展。测试用例:将50组待测固定目标、运动目标特征信息输入至专家推理系统,进行动态在线测试。测试结果与预期结果一致,正确识别率为100%,且单次推理时间均不超过2 ms,系统推理速度快、鲁棒性较好。部分测试结果见表1。
表1 部分系统应用测试结果
具体推理过程如下:
1)地面^有履带或四轮以上^有炮塔=>自行武器系统
2)自行武器系统^(炮塔位于车体中央或前部|炮塔可360度旋转|履带有裙板)=>坦克或步战车
3)自行武器系统^(炮塔位于车体后部|炮塔高大|有炮口制退器)=>自行火炮
4)坦克或步战车^(车体高大|有射击孔)=>步战车
(5)坦克或步战车^(车体低矮|炮塔较大而低矮|无尾门)=>坦克
6)空中^快速^可悬停=>直升机
4 结束语
目标自动识别是现代指挥信息系统自动化、智能化最为典型的特征之一,通过采用专家推理系统并进行适应性改进,结合知识库、语义库构建和语义识别等系列手段实现了基于目标特征信息的目标自动识别,并实现知识库扩充系统,可支撑系统知识的不断扩充,贴近实战应用,具有一定的实用推广价值。