基于事件查询的情报态势时空深度分析系统*
2015-12-02包磊,杨乐,罗兵
包 磊,杨 乐,罗 兵
(海军工程大学电子工程学院,湖北 武汉 430033)
战场情报态势数据规模大、版本多、随时间不断累积且使用期很短,相对于战场中各类传感器不断产生的巨大数据量,指挥决策人员的数据阅读和理解能力是非常有限的。态势数据的生产、传输、复制和累积,已超出了现有指挥系统以及指挥决策人员的分析、理解和应用能力。大量的数据无法得到有效利用,数据流失情况严重。如何对情报态势的时空数据模式挖掘技术进行研究,提供自动化或者半自动化的手段,帮助指挥人员从海量数据中提取信息,把数据转变为可用的知识,是领域内需要研究的重点课题。
本文研究在海量历史情报态势数据中,以查询的方式发现有价值的事件以及模式的技术,为新一代指挥信息系统的作战筹划、复盘分析提供有效的辅助决策能力。战场情报态势的评估与分析常常是一种交互式的理解与分析过程,所研究的技术利用支持自由时空事件查询的数据引擎,使指挥人员可以像使用传统关系数据库一样对各类时空事件和事件的发生模式进行自由查询分析,进而生成对态势的理解。
1 基于查询的时空分析方法
从具有海量、高维和不确定性等特性的情报态势数据中提取出隐含的、人们事先不知道的、但又潜在有用的事件模式,是典型的时空数据挖掘问题。相关研究主要有两大类:基于数据挖掘的时空模式发现方法和基于查询的时空分析方法。
基于数据挖掘的时空模式发现方法通过定义时空关联模式的语义,采用特定算法发现时空数据中的模式,如频繁模式、周期模式、共现模式、拓扑关系模式等。这些模式的发现能协助完成关于态势对象的分析、预测等任务。相关研究工作大部分是通过对时空序列的转换,采用类Apriori算法在时间维上进行遍历来完成模式的挖掘,并利用时空对象的空间信息进行合理的算法优化。如美国陆军拓扑计算实验室提出的MDCOP 算法[1]和 FDCOP 算法[2]解决态势对象在空间和时间处于近邻关系的时空共现模式(co-occurrence pattern)发现问题,用于甄别移动对象的意图和行为模式,还可用来预测对象未来的移动方向。文献[3]通过对时空数据在时间维上的直接遍历和归纳计算得到时空对象在固定的时间区间内总是遵循相同或近似相同的运动路线所展现的周期模式进行挖掘。还有研究对群体移动模式(motion pattern)[4]、流动模式(flow pat-tern)[5]、迁移模式(migration pattern)[6]以及汇聚模式(convergence pattern)[7]等时空模式进行研究并提出了相关的算法。
基于查询的时空模式发现以时空数据库相关技术为基础,采用复杂时空查询来发现时空模式。根据所采用算法基础不同相关研究主要有3大类。一类基于K最近邻轨迹检索算法,主要以K最近邻轨迹检索算法为主要基础获得基本的时空分析结果,再以此为基础采用各类经典知识发现算法发现时空模式[8]。另一类是基于语义轨迹的时空模式查询方法,这种技术提出把空间进行分区并进行标识,然后以标识构成的字符串对运动轨迹进行语义注解,从而利用字符串的识别技术把时空运动模式的发现转化为基本时空分析操作的组合[9-10]。第三类研究采用以时空谓词描述的时空查询来表达所需发现的时空模式,通过各类谓词所对应的基本时空分析操作算法按照模式蕴含的方式组合实现对该时空模式的挖掘[11]。还有研究提出可利用一些可视化的手段,通过与查询者的交互,结合一些数据变换和可视化技术,完成对时空模式的描述与查询[12]。
基于数据挖掘的时空模式发现技术一般针对某类关联模式设计,挑战性主要来自空间维度上的高维度数据关联性计算以及时间维度上的针对性处理。由于这些算法的针对性很强,因此算法的通用性和一般性较差,一般一种算法只能解决某一类问题。与基于数据挖掘的时空模式发现算法相比,时空模式查询技术具有通用性上的优势。尽管基于挖掘的算法在处理特定时空模式时的效率较高,但是采用算法前必须先具备待挖模式的先验知识。而战场情报态势的评估与分析常常是一种交互式的理解与分析过程,指挥人员往往事先不了解将分析什么样的时空模式,需要在分析过程中多次进行尝试,并根据过程中的交互信息对模式的结构进行调整。利用支持自由时空模式查询的数据引擎,指挥人员可以像使用传统关系数据库一样对时空运动模式进行自由查询分析,满足态势分析的通用性要求。
2 基于事件查询的情报态势分析系统框架设计
基于事件查询的情报态势分析技术采用基于查询的时空模式发现方法,以基本时空数据引擎为基础,把复杂时空模式解析成基本时空数据查询,通过时空模式的查询处理后执行获得态势信息的分析结果,如图1所示。
图1 基于查询的情报态势数据时空模式挖掘总体技术方案
基本时空数据引擎根据所建时空数据模型,把经初级融合后形成的战场情报态势数据进行库化存储处理,提供基本空间拓扑分析操作,如“相交”、“包含”、“相离”、“相接”、“覆盖”,并提供基本时空分析操作,包括时空拓扑分析操作、时空聚集操作以及时空投影与选择操作等。时空模式查询处理负责建立对各种时空模式的统一描述方式,并提供时空模式到基本时空分析操作的解析方法。时空模式查询优化根据各时空模式的共性特点,面对大数据量下的查询优化问题,建立相应的索引结构以及查询执行策略,对所解析生成的基本时空查询任务序列进行裁剪和优化。
在技术方案中,时空数据引擎是基础,其核心是一个完备的时空数据类型系统,能够对各类时空对象进行存储和处理,并能够提供一个完备的时空分析操作集合,用于组合实现各类态势分析需求。由于目前还没有可用的商用时空数据库系统,针对战场态势数据的特点,为了处理时空查询,在南京航空航天大学的NHSTDB[13]时空数据引擎的基础上,本文设计了一个时空数据类型系统,定义了战场态势中移动点、区域等主要3种数据类型,实现了基本数据类型以及空间、时空数据类型,以谓词形式定义了基本时空分析操作,包括时空投影、聚集、以及拓扑分析操作等,对其中的主要谓词进行了算法实现。如表1所示,这些基本谓词是实现事件与时空模式查询的基础。
3 情报态势时空事件查询与处理
态势事件一般为复合时空事件组成,可由对象间的时空关系组合而成,把各类需要进行查询的事件解析成为一系列基本时空查询,通过时空数据引擎可以对各类态势事件进行查询和检索。事件查询一般由基本时空查询在时间维上按一系列的先后约束关系组合起来,例如疑似海盗的行为模式可描述为:“与商船距离小于5000m的持续时间超过1h(跟踪),与商船相接持续(行动),最后以高速离开商船(逃离)”。图2给出了态势事件的查询系统的结构。
图2 态势事件的查询
在时空数据引擎提供的基础时空分析操作基础上,规定时空谓词的组成与连接准则,可建立起时空查询的构造方法。表1列出了主要空间、时间以及时空连接谓词。
表1 主要谓词表
表1中,空间谓词主要由时空数据引擎提供,完成对对象的空间关系进行分析计算,包括求距离(DIST)、求角度(ANGLE)、包含(CONT)、相离(DISJ)、相交(INTE)、相等(EQUA)。时间谓词描述战场目标之间或目标与场所之间空间关系的时间约束,其中KEEP描述空间关系的持续时间,OCCU描述空间关系的发生时间。比较谓词用来判断空间谓词值或时间谓词值。时空事件模式由时空事件组成,连接谓词是把多个时空事件组成复合时空事件的连接词,有并、或、非、任意、顺序等,这些连接谓词的语义如下:
设t为时空事件的触发时间,e为时空事件,则
并(AND)连接谓词:
即此事件的产生必须要求所有包含的原子时空事件都发生;
或(OR)连接谓词:
即此事件的产生只需要所包含的任意原子时空事件发生;
非(NOT)连接谓词:
即此事件的产生,必须e1,e3已经产生,并且e2不在e1,e3之间发生;
任意(ANY)连接谓词:
即此事件的产生,只要其中任意m个原子事件发生;
顺序(SEQ)连接谓词:
即此事件的产生,必须所有原子事件按序发生。
利用连接谓词,可将时空事件模式分解为原子时空事件的组合,CSTE(CP({e})),其中e既可以是原子事件,也可以是复合事件,{e}表示事件集合,CP表示连接谓词。通过各类连接谓词,可把复合时空事件表达为原子事件的组合。
例如疑似海盗行为模式,可描述为
Suspect-Pirate=SEQ(KEEP((DIST(p,m) <5000)>60),KEEP(CONT(p,m)=True) >0),KEEP((DIST(p,m)=True) >0))
根据SQL语句的文法,可以进一步给出对应的时空查询语句,提交时空数据引擎进行查询,例如疑似海盗行为模式的查询型如:
在该查询语句中,模式查询由3个时空事件查询组成,分别指代“跟踪”、“行动”与“逃离”事件,在3个事件间,满足SEQ连接关系,在查询执行时,将按照SEQconstraint控制子查询的执行以及查询结果的连接。
4 查询结果演示
根据设计的技术框架,利用NHSTDB时空数据管理引擎,演示验证原型系统以某联合护航编队的辅助分析为应用案例,以时空数据查询的方式对情报态势进行查询分析,辅助编队指挥人员决策。在场景中,设置了模拟数据,时空对象实体包括护航舰艇、商船、渔船、海盗船,各舰船使用运动点对象存储,国际推荐航道、护航舰艇保护区域、海盗船威胁区域使用运动区域对象存储。国际推荐航道为半径2nm的沿岸狭长区域;护航舰艇保护区域、海盗船威胁区域分别为护航舰艇、海盗船为中心,以一定半径形成的圆形区域。各类数据为由数据生成程序产生的模拟数据,所有时空数据跨度24h,时间切片粒度为10min,每个时空对象实体具有144个时空快照。根据各类舰船行为模拟产生了南岸各国护航舰艇20艘、通行商船100艘和1000艘身份不明的渔船。各类船只的最大速度按实际情况设置。
图3 场景静态展示
图4 运动轨迹叠加效果
图3中显示区域红色点表示护航舰艇,黄色点表示商船,白色点表示身份未知的目标,绿色透明狭长区域为国际推荐航道(国际推荐航道主要有南北两条,系统中只对南岸的一条主要航道进行显示和分析)。图4中显示的是24h内的各个运动目标轨迹的叠加效果图。
系统的核心功能在于时空查询分析,在时空数据引擎的支持下,可以按照给出的SQL的格式对态势中的简单时空关系进行查询,基本时空查询可以针对态势中的简单事件进行查询,将满足查询条件的对象筛选出来。
查询1:
Select p1.no
From ships p1,p2
Where KEEP(CONT(p1.trajectory,p2.threatenarea)) >20 AND p2.class=pirate
可将场景中累计处于疑似海盗可控范围内持续超过20min的目标检索出来。
通过将查询1中的基本时空查询进行简单拓展,可完成查询2所示的特定的时空模式查询。
查询2:
Select p1.no
From ships p1,p2,p3
Where CONT(p1.trajectory,p2.threatenarea)AND p2.class=pirate
AND Min(DIST(p1.trajectory,p3.trajectory)) > 30000 AND p3.class=warship;
查询返回态势中所有的危险商船,这里“危险商船”指处在可疑海盗船可控范围内且距离最临近军舰较远,短时间军舰无法前往援助的商船。首先通过可疑海盗威胁区与所有商船的Contain操作判断,得到疑似海盗威胁下的商船集,对商船集中每个目标与军舰进行距离上的聚集计算,判断距离,最后得到高危商船的查询结果,图5中给出了该查询的查询结果图示。
图5 简单时空关系查询分析
也可以将时空查询进一步复合组合,按上文中方法对特定的时空模式进行查询分析。
查询3:
该查询将疑似海盗模式的船只检索出来。其中时空模式可以根据专家知识自由进行设定,这里使用的海盗模式描述为:“目标与商船距离小于5000m的最大持续时间大于60min,接着目标与商船接触,然后目标与商船相离”。如图6给出了查询结果图示。
图6 时空模式查询分析
5 结束语
在作战指挥活动中,理解与识别态势是指挥人员面临的最大的挑战,尤其是面对长期积累的大量历史态势数据,由于其中往往蕴含重要的作战规律与知识,而其数据量之大又往往无法由人工来进行有效的分析和评估。基于时空事件查询的态势分析技术可以为指挥人员提供一种自由度高的手段,帮助指挥人员理解与分析态势,从海量态势大数据中获得知识与规律,快速形成决策。利用时空数据查询来实际解决态势的分析、挖掘与评估问题仍有很长的路要走,当前亟需研究的是大规模态势时空数据的采集与存储的方法,及早实现构筑态势大数据的存储处理平台,提供基本的时间、空间乃至时空检索与分析能力,在任意的时间、任意的地点、为任意的用户,提供任意数据集的任意服务。
[1] Celik M,Shekhar S.Mixed-drove spatiotemporal co-occurrence pattern mining[J].IEEE Trans on Knowledge and Data Engineering,2008,20(10):1322-1335
[2] Zhang Z,Wu W.Composite spatio-temporal co-occurrence pattern mining[C].LNCS 5258:Proc of the 3rd Int Conf on Wireless Algorithms,Systems,and Applications.Berlin:Springer,2014:454-465
[3] Hoyoung J,Qing L.A hybrid prediction model for moving objects[C].Proc of the 24th Int Conf on Data Engineering.Piscataway,NJ:IEEE,2008:70-79
[4] Hyunjin Y,Shahabi C.Accurate discovery of valid convoys from moving object trajectories[C].Proc of the IEEE Int Conf on Data Mining Workshops(ICDMW'09).Piscataway,NJ:IEEE,2009:636-643
[5] Wang J,Hsu W.FlowMiner:Finding flow patterns in spatiotemporal databases[C].Proc of the 16th IEEE Int Conf on Tools with Artificial Intelligence.Piscataway,NJ:IEEE,2004:14-21
[6] Du X,Jin R.Migration motif:A spatial-temporal pattern mining approach for financial markets[C].Proc of the 15th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining.New York:ACM,2009:1135-1144
[7] Gudmundsson J.,Kreveld M.Efficient detection of motion patterns in spatio-temporal data sets[C].In GIS’04:Proceedings of the 12th annual ACM International Workshop on Geographic Information Systems,New York,NY:IEEE,2004:250-257.
[8] Güting RH,Behr T.Efficient k-nearest neighbor search on moving object trajectories[J].VLDB J(online first).
[9] YAN Z,CHAKRABORTY D.Semantic Trajectories:Mobility Data Computation and Annotation[J].ACM Transactions on Intelligent Systems andTechnology,2012,9(4):1-34.
[10]向隆刚,吴涛.面向地理空间信息的轨迹模型及时空模式查询[J].测绘学报,2014,43(9):982-988.
[11] SAKR M,GUTING R H.Spationtemporal Pattern Queries[J].Geoinformatics,2011,15(3):497-540.
[12] Andrienko N.Designing visual analytics methods for massive collections of movement data[J].Cartographica,2007,42(2):117-138.
[13]邹永娟.时空数据库数据模型和查询语言的研究与实现[D].南京:南京航空航天大学,2009:34-60.