APP下载

基于数据挖掘的海战场态势可视化平台构建

2015-06-23陈晓峰高元博郑亚波

火力与指挥控制 2015年4期
关键词:态势战场预处理

陈晓峰,刘 兴,高元博,郑亚波

(1.海军大连舰艇学院,辽宁 大连 116018;2.海军蚌埠士官学校,安徽 蚌埠 233012)

基于数据挖掘的海战场态势可视化平台构建

陈晓峰1,刘 兴2,高元博1,郑亚波1

(1.海军大连舰艇学院,辽宁 大连 116018;2.海军蚌埠士官学校,安徽 蚌埠 233012)

可视化和数据挖掘是进行海战场态势评估、实现战场可视化的两项关键技术。海战场态势可视化能提高指挥员的战场态势感知能力,有效辅助指挥员进行当前态势评估和未来态势预测。而数据挖掘技术是对海量战场态势数据进行知识发现的有效工具,基于数据挖掘技术从顶层构建了海战场态势数据可视化挖掘平台,并对其中的各子模块进行了具体研究。

多战场态势,数据挖掘,可视化,数据挖掘平台

0 引言

战场态势可视化能提高指挥员的战场态势感知能力,有效辅助指挥员进行当前态势评估和未来态势预测[1]。而面对充斥战场的海量态势信息,如何处理和有效利用这些数据变得非常棘手。

数据挖掘技术的使用可以帮助指挥员快速地获取相关信息,及时地评估掌握的信息,科学地预测战场态势[2]。可视化技术方面,从1987年美国国家科学基金会(NSF)第一次对科学计算可视化作系统阐述[3],到1995年10月,美军训练和条令司令部(TRADOC)发表《TRADOC Pamphlet 525-70》手册对战场可视化进行定义[4],再到2001年5月,北约研究和技术组织(RTO)发表题为《海量军用数据可视化》的技术报告[5],可视化技术在军事领域,尤其是战场态势可视化方面得到广泛的应用。可见,将数据挖掘和可视化技术结合构建海战场态势数据挖掘平台具有重要的军事应用价值。在数据可视化的步骤上,有的将其划分为7个阶段[6],这里则根据海战场态势数据特点和可视化的功能需求,将海战场态势数据可视化分为数据源获取、数据预处理、数据挖掘和可视化显示几个步骤,下面在对各步骤进行分别研究的基础上,最终构建海战场态势数据可视化挖掘平台。

1 数据获取

这里将海战场态势数据分为静态数据、动态数据、关联数据和数据的数据4种,获取的一般过程为明确数据源、数据采集、数据校核验证和数据更新4个步骤,对不同数据获取过程中每个步骤的具体任务和注意事项在这里不作赘述。

图1 海战场态势数据获取过程

2 数据处理

包括数据获取后的预处理,以及预处理后进一步的数据挖掘。

2.1 数据预处理流程

图2 海战场态势数据预处理流程

数据预处理的目的是生成供数据挖掘核心算法使用的目标数据,为后续进行的数据挖掘提供高可靠性、数据集规模适当、具有一定抽象程度的数据,以提高数据挖掘效率。根据所要达到的目的,数据预处理的主要任务主要有以下几个方面:

数据净化指识别纠正或消除数据间的相互冲突、不完整的数据集、以及组合数据库共有的不兼容性;一致性处理指在数据检查的基础上对数据进行一致性处理,以规范目标数据和数据集;抽象描述指针对所要解决的军事问题对数据集进行结构和语义上的抽象,并将数据从低层概念集合映射到它们所对应的更高一层;缩减数据集规模指通过数据抽样等技术得到较原始数据小得多的数据样本,将初始挖掘付诸于小的数据集上执行,然后扩展到更大的数据集,从而降低挖掘成本。

2.2 数据挖掘层次结构

图3 海战场态势数据挖掘的层次结构

海战场态势数据挖掘的层次结构由算法层、逻辑层和应用层组成:

(1)算法层是海战场态势数据挖掘的基础,包括了关联规则、序列模式分析、分类和聚类分析、决策树、神经网络和遗传算法等一些数据挖掘的基础算法。算法层是构建海战场态势数据挖掘模型的基石,是海战场态势数据可视化的核心技术支点之一。具体选用哪一种算法或组合选用几种算法,要根据所要解决的具体军事问题而定。

(2)逻辑层封装了有关军事应用的特定规则和算法,是连接军事应用和挖掘算法的纽带,它们和相关的数据挖掘算法相结合可以求解特定的军事问题,如战役力量基础能力分析、作战编组和兵力配置优化、态势估计、威胁判断等。针对具体问题需要综合运用多种军事运筹方法,构建各种军事数学模型加以分析和计算。

(3)应用层几乎涵盖了海战场态势所关心问题的各个方面。它由战场环境分析、战役力量基础能力分析、作战编组和兵力配置优化、约束关系分析、态势评估、态势预测等子域组成。应用层也是海战场态势数据可视化的主体,它充分利用数据挖掘算法层和逻辑层的计算结果和知识发现成果,实现数据可视化在较高层次的综合展现,达到辅助指挥员感知海战场态势的目的。

2.3 数据挖掘过程模型

海战场态势数据挖掘的过程模型如下页图4所示,该模型对于海战场态势数据的提取层次由“数据”到“信息”,再到“知识”,态势数据的流程也是随着数据提取层次的深入而流动。其中,“数据”是指对数据的获取和必要的整理,“信息”是对数据的处理和挖掘过程,从中发现隐藏在数据中的有用信息;“知识”是对信息的理解和解释,这种理解和解释要针对所要解决的军事问题,进而提炼出对于解决该问题有用的知识。

在获取数据源并经过数据预处理后,数据挖掘过程是重要的一步,在对战场态势数据进行挖掘过程中,需要运用与军事应用息息相关的逻辑层算法和算法层的挖掘算法,即需要采用逻辑层的“军事运用模型库”和算法层的“数据挖掘算法库”。经逻辑层与算法层的组合应用,挖掘出的结果经模型发现后形成更新的模型库;而对挖掘结果进行知识抽取后形成知识库,模型库和知识库又反过来影响逻辑层模型库的优化和算法层挖掘算法的选择,这是一个循环优化的过程。同时,对挖掘结果进行军事层面的提炼可以得到结果知识库,结果知识库可供指挥和参谋人员参考使用和辅助战场决策。

图4 海战场态势数据挖掘过程模型

3 可视化显示模块

依据海战场态势数据的流动过程和处理过程,可视化同数据挖掘的结合主要有3种方式,即初始数据可视化、数据挖掘过程可视化和数据挖掘结果可视化,其在数据处理流程中所处的位置如图5所示。

图5 可视化与数据挖掘的3种结合方式

图6 可视化显示模块

对以上3种结合方式的显示模块进行设计(如图6所示),数据通过中间层与可视化界面映射,通过调用可视化图形库中的可视化方法在界面上进行最终的可视化显示。

(1)初始数据可视化设计。经过预处理和过滤后的待挖掘数据可以直接进行可视化,通过数据的显示可以获得有关数据的统计信息或知识,并对是否有进一步挖掘的意义和价值进行判断。同时使用者通过界面中交互控制功能进行可视化数据的交互操作,根据需要来观察、探索数据。

(2)数据挖掘过程可视化设计。主要是对其使用的算法进行可视化。使用人员可以通过界面设置数据挖掘算法的初始条件,算法运行过程中的中间结果通过数据接口提供给界面做可视化处理,整个过程是动态往复的,使用人员通过对中间结果的评判进行多次调整,以选择满意的数据项和参数值进行数据挖掘。

(3)数据挖掘结果可视化设计。其目的是为更好地理解挖掘结果模式,做出有效的评估与反馈。由于挖掘结果的多样性,需要用不同的可视化方法来展现,这要求界面在设计之初具有可扩展性。

以上3种结合方式在可视化时,由于特点各不相同,其映射层和可视化图形库接口要分别进行开发。

4 平台的设计

4.1 平台的框架结构

综合以上对海战场态势数据可视化整个实现过程的论述,进行海战场态势数据可视化挖掘平台的设计构建,其框架结构主要由数据源模块、数据预处理模块、数据挖掘算法和逻辑层模型模块、可视化显示模块和用户接口模块5部分组成,如下页图7所示。

4.2 平台的主要功能

数据可视化挖掘平台中各模块所要实现的具体功能如下:

图7 海战场态势数据可视化挖掘平台的框架结构

(1)数据源模块。主要是通过数据接口实现数据的读取和存储问题,包括从不同的数据库中读取数据作为分析用的数据源,在预处理和过滤后存储待挖掘的数据集,存储挖掘的模式集合等。

(2)数据预处理模块。主要实现数据预处理和数据过滤功能。数据过滤使预处理后的数据变成干净的、规范的、可供数据挖掘模型使用的待挖掘数据集。

(3)数据挖掘算法和逻辑层模型模块。在前面已经讨论过算法层、逻辑层和应用层三者的作用和相互关系,该模块是对数据挖掘算法和逻辑层军事运用模型的集成。由于挖掘算法和军事运用模型种类众多,因此,要使用插件的思想来组织该模块中的算法和模型,针对具体态势问题为使用人员提供不同的数据挖掘模型,以实现使用人员对数据源的挖掘处理需求。如关联规则模型、序列模式分析模型、分类模型、聚类模型等,每个模型又对应若干具体算法,使用人员可以自主地实现这些算法的插入、卸载、执行等操作,这样保证了平台的可扩展性。

(4)可视化显示模块。该模块是对数据、挖掘过程和挖掘模式的表述,除了通过可视化图形的形式表述外,还可以通过文字规则形式或其他形式表述(其设计如第4节中所述)。由于显示方法的多样性,该模块也可以用插件的形式整合到该平台上,便于可视化方法的扩展。初始数据可视化是通过一些数据可视化方法分析探索数据中蕴含的各种信息,例如平行坐标法、基于图标技术、散点图、散列图等;数据挖掘过程可视化主要是对挖掘算法和步骤进行可视化,让使用人员能够实现对挖掘过程的监测和调整;数据挖掘结果可视化主要是对所得挖掘结果进行各种可视化的表述和展现,例如单维/多维关联规则的可视化、时序规则可视化、分类的可视化和聚类的可视化等;随后,还可通过模式筛选、知识抽取和结果解释等方法进行进一步提取,形成知识的表达供军事人员直接使用。

(5)用户接口模块。该模块是使用人员和平台交互的接口,包括数据的分析定义、初始数据可视化、挖掘过程可视化监控和挖掘结果可视化及模式筛选等子模块,还可以根据需要进行子模块的扩展。

5 结束语

将数据挖掘技术与可视化技术结合构建海战场态势数据可视化挖掘平台,能够为指挥员提供直观的可视化战场态势信息,提高战场指挥员的信息处理能力和战场态势感知能力,辅助指挥员快速地做出指挥决策。而随着可视化理念和可视化技术的发展,又出现了将问题和可视化数据通过时间堆叠、信息映射等投射在具体场景的方式[7],这也为数据的可视化实现提供了更多的解决方案和模式。

海战场态势可视化挖掘平台设计是顶层设计,除此之外,还有诸如数据库设计和构建、数据管理和数据安全、可视化显示方式设计、以及可视化挖掘平台的最终实现等问题需要进一步研究。

[1]夏青,万刚,武志强.战场可视化综述[J].系统仿真学报,2001,13(增刊):273-275.

[2]纪希禹.数据挖掘技术应用实例[M].北京:机械工业出版社,2009:190.

[3]Mielson G M.Visualization in Scientific Computing[M].IEEE Computer Socelity Press,1990.

[4]TRADOC Pamphlet 525-70.United States Army Training and Doctrine Command Fort Monroe[M].Virginia 23651-5000,1995.

[5]RTO.Visualisation of Massive Military Datasets[R].Human Factors,Application,and Technologies,Published 2001:10.

[6]Ben F著,张羽,译.可视化数据[M].北京:电子工业出版社,2009:5-14.

[7]Steele J,IIiinsky N编,祝洪凯,李妹芳,译.数据可视化之美[M].北京:机械工业出版社,2011:20-22.

Structure for Naval Battlefield Situation Visualization Platform Based on Data Mining

CHEN Xiao-feng1,LIU Xing2,GAO Yuan-bo1,ZHENG Ya-bo1
(1.Dalian Naval Academy,Dalin 116018,China;2.Bengbu Naval Petty Officer Academy,Bengbu 233012,China)

Visualization and data mining are critical technologies in naval battlefield situation assessment.The visualization of naval battlefield situation can enhance the commanders’ability of battlefield situation awareness,and assist them to assess the current situation and forecast the future situation effectively.The data mining technology is an impactful measure to make the knowledge discoveries in massive battlefield situation data.It constructs a data visualization mining platform of naval battlefield situation based on data mining technology on top-level,and then makes a concrete research about each submodule.

battlefield situation,data mining,visualization,data mining platform

TP391.9

A

1002-0640(2015)04-0144-04

2014-01-05

2014-03-07

陈晓峰(1983- ),男,河南虞城人,博士研究生,讲师。研究方向:海军作战模拟、三维态势数据可视化及军事航海。

猜你喜欢

态势战场预处理
历史虚无主义的新近演化态势与特征
求解奇异线性系统的右预处理MINRES 方法
战场上的神来之笔
污泥预处理及其在硅酸盐制品中的运用
C-130:战场多面手
贴秋膘还有三秒到达战场
2019年12月与11月相比汽车产销延续了增长态势
汇市延续小幅震荡态势
国际金价能否延续上涨态势
基于预处理MUSIC算法的分布式阵列DOA估计