APP下载

基于航迹数据挖掘的目标行为分析概述

2021-11-26潘新龙程学旗王海鹏何友李敏波

指挥与控制学报 2021年4期
关键词:航迹聚类轨迹

潘新龙 程学旗 王海鹏 何友 李敏波

1. 海军航空大学信息融合研究所山东烟台264001 2. 中国科学院计算技术研究所网络数据科学与技术重点实验室北京100090 3. 复旦大学软件学院上海200433

随着信息融合理论的不断完善和信息融合技术在预警监视领域的广泛应用, 预警监视系统经过检测级、位置级和属性级融合过程,可以自动或半自动地完成对目标的检测、跟踪、航迹关联、属性判决,形成连续稳定的目标航迹[1−2],大大减轻了值班人员的工作量, 大幅提升了目标情报处理的效率和质量.随着目标种类、数量的不断增多和预警监视系统性能的不断提升, 越来越多的目标数据形成并存在于各级情报处理系统和指挥信息系统中, 需要情报处理人员全天不间断地对大量目标数据进行监视与分析判断,从而发现其中感兴趣和有威胁的目标.在情报处理过程中, 有经验的情报处理人员通过总结目标活动规律和实时目标信息, 完成对目标行为的分析,从而为指挥决策提供支撑. 通过人工方式对目标行为进行分析, 需要情报处理人员持续专注的精力和不断增长的经验知识, 具有很大的局限性. 因此,从信息融合领域和数据挖掘领域的交叉点入手[3−5],研究基于航迹数据挖掘的目标行为分析技术, 使系统高效、自动、智能地完成对目标行为的分析,可以为高层信息融合理论的完善和预警监视领域情报处理智能化水平的提高提供理论和技术支撑, 对于减轻值班人员工作压力、提高情报处理的效率和质量,以及智能地完成态势评估、威胁估计和辅助指挥决策[6−7],都具有非常重大的理论和现实意义.

基于航迹数据挖掘的目标行为智能分析技术主要包括: 目标行为规律挖掘、目标异常行为检测、目标行为模式在线分类和目标异常行为实时检测问题.目标行为规律挖掘和目标异常行为检测是对目标行为的离线分析; 目标行为模式在线分类和目标异常行为实时检测是对目标行为的在线分析.

1 目标行为规律挖掘

1.1 问题描述

目标行为规律是指目标在以往执行具体任务时表现出来的相似或相同的行为特征. 如目标在以往执行侦察任务时的相同或相似的航线、速度、航向等行为特征. 在信息融合领域,基于预警监视系统中积累的大量历史目标航迹数据, 利用数据挖掘技术中的无监督聚类技术, 通过对目标航迹数据的聚类分析,可以挖掘出目标的行为规律.

1.2 研究现状

国内外很多学者在时间序列聚类和轨迹聚类方面进行了大量的研究.Liao 对时间序列聚类的概念、距离度量、聚类算法、评估方法和应用领域进行了总结概括[8]. Berkhin 对数据挖掘领域中不同的聚类技术进行了概述[9]. Jeung 等利用轨迹数据来分析运动目标的行为模式[10]. 郑宇研究员系统地阐述了轨迹数据挖掘的相关研究和技术, 分析了现有相关技术之间的关系和差异,并提供了一些公共数据集[11].Gaffney 等提出了一种基于模型的轨迹聚类方法[12].Zhang 等对用于室外监控场景中的轨迹聚类的不同相似性度量进行了比较分析[13]. Dahlbom 等提出了一种基于样条的轨迹聚类方法, 并用于沿海监测场景[14]. Lee 等提出了一种基于划分- 合并框架和几何距离度量的子轨迹聚类算法[15]. Morris and Trivedi通过实验评估了轨迹聚类的不同相似性度量和聚类算法的性能[16]. Atev 等提出了一种基于Haudorff距离作为相似性度量的车辆轨迹聚类算法[17]. Frank 提出了一种基于点对齐的轨迹聚类方法, 并通过轨迹聚类分析挖掘出飞机的正常飞行航线[18]. Gariel 等提出了一种基于最长公共子序列的轨迹聚类框架,并用于对飞行器的监控[19]. Yuan 等通过利用轨迹段的方向、速度和角度信息构造的相似性度量实现对轨迹段的聚类分析[20]. Debnath 等提出了一种基于空间和非空间特征组合的子轨迹聚类算法[21]. Hao 等提出了一种基于长尺度Hausdorff距离的轨迹聚类算法[22]. Wu 等提出了一种基于空间位移距离和时间速度距离的K 均值轨迹聚类算法[23]. Bermingham 等通过计算N维最小边界框来对轨迹进行聚类分析[24].王超等提出了一种基于改进的模糊C-Means 航迹聚类方法[25]. 徐涛等提出了一种基于航迹点法向距离的航迹聚类方法, 对进离场的飞机航迹进行聚类分析[26]. 陈勇研究员提出了一种以航迹线段作为研究对象的目标航迹数据聚类挖掘分析方法, 用于发现目标的潜在运动轨迹[27]. 肖潇等提出了一种基于船舶自动识别系统(automatic identificatio system,AIS)信息的船舶轨迹聚类模型, 从而获得反映船舶行为规律有效的、潜在的信息[28]. 潘新龙等提出了一种基于多维航迹密度聚类的目标行为规律挖掘方法,可以在考虑目标的属性、类型、位置、速度和航向等多维特征的基础上,挖掘出目标的行为规律[29].

尽管轨迹聚类研究取得的成果比较丰富, 但是应用于目标行为规律挖掘方面仍存在一些问题, 主要包括:

1)如何通过定义最恰当的目标间距离来构造目标行为相似性度量;

2)如何设计考虑时间、空间、速度、方向和身份等综合约束的聚类算法;

3)由于航迹数据的复杂特征, 需要更加高效的聚类方法挖掘目标的潜在规律.

2 目标异常行为检测

2.1 问题描述

异常点检测是数据挖掘研究的一个热点方向,异常点是指在数据集中偏离其他绝大部分数据的那些数据,这些数据偏离得如此显著,使人怀疑这种偏离并非是随机产生,而是产生于完全不同的机制[30].在目标行为分析领域, 目标异常行为检测就是找出偏离其周围目标运动规律,达到一定程度的目标.如:目标在执行具体任务时偏离航线、违背航向、速度过快、速度过慢、突然停止等行为特征. 在空情方面,可以与入侵、投诚、叛逃、坠机、迷航、遇险、故障等异常空情相对应.通过对目标航迹数据的异常检测,可挖掘出目标的异常行为.

2.2 研究现状

国外一些学者在异常检测和轨迹异常检测方面进行了大量的研究.Chandola 等对异常检测技术、分类、应用范围和优缺点进行了全面的概述[31−32]. 现有异常检测方法可以分为基于密度的异常检测、基于距离的异常检测、基于统计的异常检测、基于深度的异常检测和基于偏离的异常检测等. 轨迹异常检测属于轨迹数据挖掘技术的重要研究内容. 现有轨迹异常检测方法可以分为基于抽取轨迹全局特征的方法、基于分类器的方法和基于点集(轨迹片段)相似度检测的方法等. Lee 等利用轨迹分区的思想构造检测框架,设计了一种双层轨迹分割策略,利用基于距离和密度混合的异常检测算法, 实现对异常轨迹的检测[33]. Li 等首先抽取典型特征构造层次特征空间, 在不同层次特征空间中进行多粒度的规则学习,提出了一种基于规则学习的异常检测框架[34].陈刚等提出了一种基于划分的异常轨迹检测算法,通过计算局部轨迹点之间的匹配程度来探测异常轨迹[35]. 鲍苏宁等针对现有算法不能有效应用于多因素轨迹异常检测的问题, 提出了基于核主成分分析的异常轨迹检测算法[36]. 毛嘉莉等对异常检测和轨迹异常检测的定义和各类轨迹异常检测的研究现状进行了详细的分析描述, 给出了一种轨迹大数据异常检测框架[37]. 潘新龙等通过构造目标行为多维度局部异常因子, 提出了一种基于多维航迹特征的异常行为检测方法[38].

现有轨迹异常检测方法主要通过考虑目标间的距离等度量关系检测目标的位置异常, 在一定程度上依赖航迹数据的距离分辨率和度量尺度. 目标异常行为检测方法需要进一步考虑拓扑结构、方向变化、形状关系等非度量因素,结合目标的身份、意图等属性信息, 高效检测出偏离绝大部分行为的异常行为.

3 目标行为模式在线分类

3.1 问题描述

利用目标行为规律挖掘技术, 可以从海量的历史目标数据中挖掘出目标执行不同任务时的行为特征规律. 目标行为模式是指目标在当前执行具体任务时表现出的行为特征. 基于挖掘出的目标行为特征规律和不断更新的目标数据, 可以利用数据挖掘中的轨迹在线分类技术, 将当前目标航迹分到对应的类中,实现对目标行为模式的在线分类,这对于态势评估、威胁估计和指挥决策都具有非常重要的意义. 轨迹分类通过对历史轨迹特征的训练来预测未知轨迹的类型标签.

3.2 研究现状

国内外一些学者对轨迹分类进行了研究.Owens和Hunter 提出了一种对视频监控系统中目标的运动模式自动分类的方法, 使用自组织特征映射神经网络的方法学习目标轨迹特征, 然后对目标的运动模式进行分类[39]. Lee 等通过利用目标的区域特征和轨迹特征构造分层的分类框架, 从而对运动目标的类别进行分类预测[40]. Nascimento 等使用一个可切换的动态隐马尔可夫模型, 在视频监控系统中对人的轨迹进行分类[41]. Lee 等提出了一种基于频繁模式分类框架的路网轨迹分类方法, 实现对路网上目标行为模式的在线分类[42]. Bolbol 等基于车载的全球定位系统(global positioning system,GPS)数据,提出了一种基于支持向量机的分类框架, 实现对目标交通行为模式的分类[43]. Nierhoff和Hirche 将轨迹分成更小的轨迹段,对轨迹段进行空间投影降维,构造不同维度的相似性度量, 在每个维度上对目标的行为模式进行分类[44]. Pokorny 等提出了一种基于抽样拓扑的分类方法, 实现对目标轨迹的自动推理分类[45]. 潘奇明利用K 均值聚类和改进的隐马尔可夫模型对运动目标的轨迹进行分类与识别[46]. 曲琳等针对智能视觉监控系统中的运动目标轨迹分类问题,提出了一种基于Hausdorff距离的轨迹分类算法[47].魏龙翔等基于轨迹的位置信息和方向信息, 提出了一种结合Hausdorff距离和最长公共子序列的轨迹分类算法[48]. 朱进等在总结现有轨迹分类方法的基础上, 提出了一种基于移动对象运动特征的轨迹分类方法,并在船舶、野生动物和飓风数据集上进行了分类实验[49]. 潘新龙等通过构造一致性多类分类器,提出了一种基于一致性多类分类的目标航迹在线分类方法,实现对目标行为模式的在线分类[50].

通过对目标航迹数据的训练学习, 可以建立分类模型确定目标的行为模式, 除了进行位置预测外,还可以预测目标可能的路线和目的地. 目前,国内外部分学者对移动轨迹的分类预测问题进行了一些研究,但是针对纷繁复杂、机动变化、高维的航迹数据,还需要进一步开展深入的研究.

4 目标异常行为实时检测

4.1 问题描述

在大量的实时目标数据中, 除了需要重点关注的重要目标, 决策者真正感兴趣和有价值的是具有异常行为的目标,如何使系统高效、自动、智能地完成对目标异常行为的在线检测与识别, 是预警监视领域亟需解决的一个重要问题[51−52]. 通过对目标航迹数据的实时异常检测, 可以实现对目标异常行为的实时检测[53].

4.2 研究现状

在预警监视领域对目标航迹数据的实时异常检测方面, 部分学者进行了一些研究. Maxime 提出了一种基于聚类学习的空中目标航迹异常检测方法[54],该方法分为学习阶段和异常检测阶段,在学习阶段利用K 均值聚类和基于密度的聚类方法对训练数据进行离线学习,得到目标的聚类航迹,在异常检测阶段, 通过计算当前目标航迹点与最近的聚类航迹的距离来判断目标是否异常, 这种方法主要针对固定航向的民航目标,并且不能实时更新聚类航迹.在海事目标航迹异常检测方面, 有一些基于目标航迹点位置和速度特征向量构建统计模型, 然后通过统计检验进行异常检测的方法[55], 分别用到了核密度评估(kernel density estimation,KDE)、自组织映射(self-organizing map,SOM)、高斯混合模型(Gaussian mixture model,GMM)、贝叶斯网络(bayesian network,BN)和多维直方图等模型. Urban 等通过结合GMM和隐马尔可夫模型(hidden Markov model,HMM)来进行两层的航迹学习和异常检测[56],第1 层,基于最大期望算法(expectation-maximization algorithm,EM)准则,利用航迹点的位置向量构建GMM;第2 层,把GMM 的每一个分量看作HMM 的一个离散状态,通过HMM 的似然度检验对目标航迹进行异常检验,利用一个非公开的仿真数据集对算法性能进行了验证. 一些文献基于神经网络提出了不同的航迹学习和异常检测算法[57]. Rhodes 等基于Fuzzy ARTMAP神经网络来实现航迹聚类, 然后通过计算当前目标航迹点与最近聚类航迹的距离来判断目标是否异常,Garagic 等用混合神经网络代替了Fuzzy ARTMAP神经网络[58]. Bomberger 等基于关联神经网络提出了一种利用目标当前的位置、速度、航向信息来预测目标将来位置的算法, 如果目标当前的位置和预测的位置不符, 就被判断为异常, 这种算法性能受局部网格分辨率影响较大[59], 因此, Rhodes 等通过利用多重标度表示位置信息来改善了算法性能[60].Piciarelli 等在视频监控领域提出了一种在线聚类算法[61]. Dahlbom 等在海事监控领域对这种在线聚类算法进行了评估[62]. Guo 等通过目标航迹的在线学习来进行异常行为检测, 但是只适用于目标位置出现异常的情况[63].

现有方法主要分学习和异常检测两步, 而且大多数算法都是进行离线学习, 一次性确定模型的参数和阈值,没有随着观测数据的不断更新,实时学习训练模型参数. 部分学者对在线学习算法进行了研究, 但是对于学习时间间隔的确定和算法复杂性问题未能很好解决. 现有方法普遍存在参数设置复杂、虚警率不可控、在线学习和实时异常检测能力较差等问题.

5 面临的挑战

轨迹数据挖掘技术得到了广泛关注和快速发展,但是基于航迹数据挖掘的目标行为分析研究才刚刚开始,还有很长的路要探索,在探索过程中存在很多的困难与挑战,主要表现在以下几个方面:

1)理论框架

缺乏一个完整的基于航迹数据挖掘的目标行为分析理论框架. 构建这个理论框架,可以解决针对不同的目标航迹数据, 有哪些目标行为模式需要挖掘,如何对这些模式采用合适的航迹聚类、异常检测、关联模式挖掘和分类预测算法, 如何提出更加有效的实现技术.

2)大数据的挑战

随着预警监视手段的不断丰富和历史数据的日积月累,目标航迹数据会逐步达到大数据的规模,必然会给航迹数据的分析与挖掘带来挑战. 必须要不断优化数据处理技术和挖掘算法, 才能高效准确地完成目标航迹数据分析与挖掘.

3)粒度控制

目标航迹数据挖掘应该能在纷繁复杂、机动变化和高维度的航迹数据中, 从不同的粒度发现目标的行为模式和异常现象, 目前的相关算法都不支持这种多粒度的按需分析挖掘.

4)多因素约束

现有方法没有考虑天气、环境、洋流、事件等其他因素和情报资源的影响, 在目标行为分析方面存在局限性. 可以在考虑各类情报影响因素的基础上,构造深度学习框架, 利用海量的真实和仿真数据进行模型训练,实现对目标行为的分析和预测.

5)应用方向

从目标航迹数据中挖掘出的规律和模式决定了成果应用, 而通过数据挖掘算法能够挖掘出的规律和模式往往是未知的. 因此,如何结合目标航迹数据挖掘出规律和模式, 找准有前景和意义的应用方向,是一个需要洞察力和前瞻性的挑战.

6 热点研究方向

在对研究现状分析和对困难挑战总结的基础上,提出本领域具有研究价值的几个热点研究方向.

1)基于多源隐性关联的多目标行为规律挖掘.在目标行为规律挖掘方面, 通常利用对目标多维航迹数据进行聚类分析, 挖掘出目标行为规律的思路开展研究.该思路在挖掘目标的行为规律时,对多个目标独立分析, 虽然能同时挖掘出多个目标的行为规律,但是没有考虑目标行为之间的关联关系,在挖掘多目标行为规律方面存在局限性. 下一步研究中,基于多源手段获取的大量历史目标数据, 考虑其他各类情报资源,设计对应不同场景的频繁项集,寻找多目标之间的多源隐性关联模式, 对多个目标的行为规律进行挖掘分析.重点突破多目标周期模式,多目标协同规律,如航母编队活动规律,舰机协同规律,多机、多舰协同规律等.

2)基于深度学习的目标行为动向分析. 现有目标行为模式在线分类和目标异常行为实时检测方法,没有考虑天气、环境、洋流、事件等其他因素和情报资源的影响,在目标行为动向分析方面存在局限性.下一步研究中, 基于多源手段获取的大量历史目标数据和实时目标数据,考虑其他各类情报资源,利用已经掌握的目标行为规律和异常行为规律, 构造相应的深度学习框架,进行模型训练,实现对目标行为动向的分析和预测. 在现有实测目标数据很难满足深度网络训练要求的情况下, 可以利用大量的同类仿真数据,对深度学习框架进行训练,学习出模型参数, 然后用实测的训练数据对学习出的模型参数进行微调,完成对深度学习模型的训练.

3)面向大数据的目标行为分析系统设计与实现.预警监视领域的目标数据来源复杂多样, 通过对多源异构目标数据进行融合处理后得到的目标多维航迹数据规模巨大,并在不间断地持续增长. 在大量的历史目标数据和实时目标数据中, 不仅包含目标的属性、位置、速度、航向等显性“态”信息,而且蕴含着目标的行为规律、动向意图、威胁程度等有价值的隐性“势”信息,需要利用大数据手段进行挖掘. 预警监视领域态势瞬息万变,目标数据实时变化,需要对实时获得的目标数据进行在线挖掘分析.因此,预警监视领域的目标数据分析问题是一个典型的为指挥决策服务的大数据问题.下一步,从目标数据分布式存储系统搭建、并行计算框架设计、目标行为分析算法分布式编程实现、目标行为分析应用系统开发等方面, 对面向大数据的目标行为分析系统设计与实现问题进行研究.

7 结论

目标行为分析是在决策层次上的信息融合, 属于高层信息融合范畴,是C4ISRK 系统指挥和辅助决策过程中的核心内容. 随着数据挖掘和大数据技术的发展,给高层信息融合带来了新的发展空间. 基于航迹数据的目标行为分析技术作为涵盖信息融合技术和数据挖掘技术的交叉技术, 是为决策问题提供服务的一项大数据技术,涉及到了数学、统计学、模式识别、人工智能、机器学习和数据库等多个领域的理论和技术, 在预警监视和指挥决策领域有着广阔的学术价值和应用前景, 必将成为今后研究的一个热点、重点和难点.

猜你喜欢

航迹聚类轨迹
基于自适应视线法的无人机三维航迹跟踪方法
一种傅里叶域海量数据高速谱聚类方法
一种多机协同打击的快速航迹规划方法
大数据分析的船舶航迹拟合研究
基于数据挖掘的船舶航迹自动识别系统
解析几何中的轨迹方程的常用求法
基于知识图谱的k-modes文本聚类研究
一种改进K-means聚类的近邻传播最大最小距离算法
轨迹
轨迹