一种基于运动目标的关联规则分析新方法及其在目标识别中的应用
2021-06-03四川九洲电器集团有限责任公司谢京华
四川九洲电器集团有限责任公司 谢京华
针对运动目标数据挖掘过程中对目标的运动趋势无法充分体现、关联规则分析出现无效频繁项集且效率较低的问题,提出一种基于运动目标的关联规则分析新方法。该方法采用改进的FP_Growth算法同时对当前tn时刻的“静态状态”数据和tn-tn-1的“动态趋势”数据进行关联规则分析,可充分、高效、实用、可靠的实现针对运动目标的数据挖掘,获取其目标属性关联知识,具有时间和空间利用效率更高、所挖掘的知识收敛有效、能充分体现动态趋势等特点,对于提升与完善我国国防、民航和通用航空的监视手段与策略具有重要的军事和社会意义。
现代空域管理和监视已经是一种大范围、快节奏的管理和监视方式,包括海、陆、空、天多维度的多方平台。随着现代空域管理和监视过程中传感器种类的增加以及传感器能力的提升,管理和监视范围进一步扩大,方式日趋复杂化,区域内目标的数据量和种类也随之剧增,由此给目标的识别带来了极大的困难。因此,在复杂环境下针对不同飞行任务、不同目标,快速、准确地完成目标识别,是未来空域管理和监视的先决条件和必要保障。
传统的目标识别手段虽然能够在一定程度上完成对目标类型、种类、属性的判别,但手段较为单一,已无法适应新的需求,其原因在于在未来空域管理和监视过程中,各种传感器获取的目标特征信息量大、类型多样、特征间关系错综复杂,并且特征具有不同的种类和表现形式。为充分利用目标的特征信息,目标识别将向综合化方向发展。只有综合分析目标的多源特征,提取或构造出用于目标识别的稳健特征信息,才能有效地实现目标属性的多方识别,提高识别正确率。
基于上述分析,本文提出了一种基于运动目标的关联规则分析新方法,综合利用侦察情报、预警探测、二次监视等情报部门采集和积累的非实时历史数据和实时数据,深入分析大数据下的目标特征规律,挖掘其可用于目标识别的关联特征,丰富目标识别的先验知识,提高目标识别的准确性和可靠性,为空域管理和监视控制提供决策支持。
1 现有技术研究情况
本文所述的基于运动目标的关联规则分析新方法主要包括数据挖掘的关联规则分析与运动目标数据预处理分析方法。
首先,在关联规则分析方面,目前最为著名的算法是Apriori算法和FP-Growth算法,此外还有DHP、STEM算法等。其中,Apriori算法采用了基于逐层搜索求解频繁项集的迭代的方法,其过程简单,且易于理解,没有复杂的算法,实现起来也比较容易,但需要扫描数据库多次且产生大量候选频繁项集,实用性不够高,效率很低;FP-Growth算法是一种不产生候选频繁项的挖掘算法,其基本思想是将事务数据库压缩到一颗FP树中,采用分而治之的思想,自底向上挖掘FP树,最终输出所有的频繁项集,但该算法在遍历FP-tree时需要消耗大量时间,且在支持度计算时需要完全遍历,无法充分利用算法的中间结果,导致时间和空间效率略低。此外,Apriori算法和FPGrowth算法都存在有一个共性的问题,二者都认为频繁项集的所有非空子集都必须也是频繁的,但是这样产生出的大量候选项集虽然都是频繁的,但有一部分是原始数据源所不曾包含的,这在某些特定应用环境下是不能够被接受的。
第二,在关于运动目标数据挖掘方面,目前的处理方式几乎都是基于当前tn时刻的“静态状态”数据进行挖掘,没有考虑针对tn-tn-1的“动态趋势”数据进行处理,因而挖掘结果缺乏对运动目标趋势特性的体现,也同时会导致一些有用知识的遗漏。
综上,从现有技术的发展情况来看,本文旨在解决运动目标数据挖掘过程中对目标的运动趋势无法充分体现、关联规则分析出现无效频繁项集且效率较低的问题,提出一种基于运动目标的关联规则分析新方法。该方法采用改进的FP_Growth算法同时对当前tn时刻的“静态状态”数据和tn-tn-1的“动态趋势”数据进行关联规则分析,可充分、高效、实用、可靠的实现针对运动目标的数据挖掘,获取其目标属性关联知识,具有时间和空间利用效率更高、所挖掘的知识收敛有效、能充分体现动态趋势等特点,对于提升与完善我国国防、民航和通用航空的监视手段与策略具有重要的军事和社会意义,且通过在民用领域的扩展应用,也将创造重要的经济价值。
图1 基于运动目标的关联规则分析总体实现框图
2 系统组成及工作流程
本文所述的基于运动目标的关联规则分析新方法其完整技术方案如图1所示,具体描述如下:
首先,根据已有的数据源数据特征以及关于数据源的说明文档,在关联程序中构建一个三维向量,从存储空间中按数据源的说明文档读取待挖掘的数据源数据。然后就这些数据进行数据清理,包括消除空缺值和野值,然后采用卡尔曼滤波对数据进行去杂、去噪处理,并形成统一描述的包括时间维、目标维、特征维的三维向量。
第二,开展动态关联工作,即采用抽取时间维对特征维和目标维进行数据挖掘,并在时间维上进行迭代的处理方法。具体描述如下:
(1)分别取tn时刻和tn+1时刻的两组数据,并就经度、纬度、高度、距离、方位角、径向速度、俯仰角等运动特征参量进行矢量相减,形成相应的目标运动趋势参数,用“-1、0、1”进行表示,其中“-1”代表目标的该项特征参量向着相反的趋势在运动,“0”代表目标的该项特征参量处于静止状态,“1”代表目标的该项特征参量向着相同的趋势在运动;而对目标属性、机型、应答信息、目标类型、雷达型号等固有特征参量进行对比分析,形成相应的目标静态属性变化参数,分别用“参量当前值、1”进行表示,其中“参量当前值”代表当时刻由tn到tn+1时刻时,目标的该项特征参量未发生变化,仍然保持一致,“1”代表当时刻由tn到tn+1时刻时,目标的该项特征参量发生了变化。
(2)将由上一步产生的tn+1时刻“减去”tn时刻的数据进行汇总整理,形成新的数据集。然后针对该数据集继续进行预处理,剔除掉其中的冗余项,运行改进的FP_Growth算法,形成FP_tree,提取关联规则,并作为中间结果暂存于缓存中。
(3)从t0时刻开始,将由上一步产生的tn+1时刻“减去”tn时刻的数据进行迭代,直至到tm时刻为止,充分挖掘从存储空间中采出的数据源数据。每次迭代均按上一步的方式进行处理:分类重构抽样数据集、剔除相同的冗余特征参量、运行改进的FP_Growth算法、提取关联规则,并将每次迭代所产生的关联知识集进行存储。
(4)对产生的所有关联规则进行统计、归类、合并,从而形成新的关联知识。
第三,开展静态关联工作,即提取非运动特征数据,形成新的三维向量,并对其进行关联挖掘。具体如下:
(1)在新的三维向量下,提取tn时刻的数据,直接对其进行运行改进的FP_Growth算法,形成FP_tree,提取关联规则,并作为中间结果暂存于缓存中。
(2)从t0时刻开始,直至到tm时刻为止,利用改进的FP_Growth算法遍历所有的时间片,并提取所有的关联规则暂存于缓存中。
(3)对产生的所有关联规则进行统计、归类、合并,从而形成新的关联知识。
第四,将动态关联和静态关联所获取到的关联知识结合场景与其他挖掘手段获取的知识共同完成融合与匹配,并交由综合识别数据融合进行处理,从而给出关于目标属性判别的辅助决策建议。
其中,本文所述的改进FP_Growth算法流程如图2所示,具体描述如下:
第一,扫描事务数据库一次,得到所有事务的总数(用于后续计算支持度)以及事务数据库中所有单项,并按设定的最小重复次数min_d得到所有单项的降序序列D。
第二,把每条事务的项按降序序列D重排,并遍历对比其余所有事务,得到共根项计数,形成逻辑FP_tree。
第三,依据D,采取分而治之的策略,得到D中以当前单项为尾的集合Vec,并递归产生该集合Vec的所有子集。
第四,对比Vec,剔除该子集内不存在的子集,并只需在Vec内计算每条子集的重复次数,便可得到该子集的实际支持度。
第五,如果降序序列D遍历未完成,则跳转到第二条;如果完成,则形成事实上的FP_tree,输出并结束。
图2 改进的FP_growth算法流程
3 应用前景分析
本文所述的基于运动目标的关联规则分析新方法,具备以下特点:
(1)不仅充分采用当前tn时刻的“静态状态”数据进行挖掘,而且还创新型的利用tn-tn-1的“动态趋势”数据进行挖掘,丰富了目标识别的特征知识,提升了识别准确率;
(2)在过程中预先剔除掉了原始数据源所不曾包含的频繁项,并在过程中完成关联知识的支持度计算,很好的提升了运算效率;
(3)更加高效的利用了空间和时间资源,完善了关联规则分析的充分性,降低了时间资源占据和空间资源占据,优化了目标识别辅助决策的整体流程。
在应用前景方面,本文所述方法已成功应用于国防体系中对侦察情报、预警探测、二次监视等部门采集和积累的非实时历史数据和实时数据的挖掘,获取丰富的目标识别先验知识,提高目标识别的准确性和可靠性,为空域管理和监视以及作战指挥控制提供决策支持;同时,本文所述方法还可应用于民航和通用航空领域,通过对运动目标的关联规则分析,优化空管系统地空监视与场面监视的手段与策略;此外,本文所述的改进FP_Growth算法可应用于国民经济的各行各业,通过挖掘,将有助于更加合理高效的制定计划以及优化决策。
结束语:本文从现有技术的发展情况进行分析,针对在运动目标数据挖掘过程中对目标的运动趋势无法充分体现、关联规则分析出现无效频繁项集且效率较低的问题,提出一种基于运动目标的关联规则分析新方法,详细描述了其系统组成和工作流程,并分析了其特点和创新之处,最后就其应用前景进行了分析,本文所述方法对于提升与完善我国国防、民航和通用航空的监视手段与策略具有重要的军事和社会意义,且通过在民用领域的扩展应用,也将创造重要的经济价值。