数据挖掘在战术导弹保障辅助决策系统中的应用
2016-11-11刘培毅,刘鑫,孙迎丰
数据挖掘在战术导弹保障辅助决策系统中的应用
针对在战术导弹保障管理过程中出现的数据种类多、业务工作量大以及数据处理效率不高的问题,提出使用辅助决策系统来优化业务流程,提高保障效率。以某型装备的保障为例,针对保障数据做出数据挖掘效果仿真,分析装备的保障特性,总结保障规律,为决策者提供科学的决策依据。
数据挖掘;决策支持;数据仓库;决策树
随着全寿命周期管理思想在装备管理中的不断应用,如何将装备保障做得更精确、更高效,已经成为我军信息化建设的一个热点。我军战术导弹装备分布广泛,型号、批次众多,即使是同一种装备,在不同的地域、不同的气候条件以及不同的保障单位等都会造成装备的性能差异。如果实施同一的维护保障手段、方法,同一的管理进度,势必影响装备性能的发挥。本文通过战术导弹保障部门积累的大量使用维护数据,应用数据挖掘方法来分析装备的保障特性,总结战术导弹保障的规律性特点,并将此融入到装备管理系统中。
1 战术导弹保障辅助决策系统的数据挖掘需求分析
辅助决策系统(Decision Support System, DSS) 在装备保障中的应用主要是以军事装备学、军事运筹学、控制论、思维科学和行为科学为基础,以计算机技术、模拟技术和信息技术为手段,面向装备保障决策问题,支持指挥员和装备保障机关对装备保障活动全过程做出决策[1]。
战术导弹保障DSS贯穿于装备的管理、使用和维护等各个环节。 应用战术导弹保障DSS可帮助装备部门快速、准确地掌握导弹装备的各种信息,有效地提高管理和决策的及时性、科学性和准确性。战术导弹装备保障流程主要包括7个部分(见图1)[2]。一般情况下,决策者都是基于对当前装备保障状况的掌握,对未来装备保障的需求和发展做出预测,从而制定相应方案。
图1 战术导弹装备保障流程
应用战术导弹保障DSS,除了利用网络将各级保障单位有机的连成一体,方便、快捷和准确地传输各种装备保障信息、装备状态参数,还应将收集的数据进行科学的分析,总结装备保障中出现的规律性现象,以达到预测问题并对症下药的效果,为决策者提供科学的决策依据。
2 战术导弹保障数据仓库组建
2.1 数据仓库的数据分析
由装备保障和仓储可靠性原理可知,影响战术导弹保障质量的主要自然因素为仓储环境和储存时间。其中,仓储环境包括自然环境因素、诱导环境因素和复合条件因素,自然环境因素如导弹仓储的温度、湿度、低气压、细菌和盐雾等,诱导环境因素如机械冲击、空气污染等,还有自然环境因素和诱导环境因素同时作用的复合条件因素等,均可对导弹仓储质量产生影响[3]。此外,还有人为因素会对保障质量产生影响,如保障方法和手段。由于导弹装备的日常维护、维修、延寿和退役等均是根据各型装备维护细则和上级机关要求完成,在实施手段上差异不大,所以本文主要讨论自然因素对导弹保障的影响。
从不同的方向分析战术导弹保障质量数据可以得到许多信息。例如,分析仓储时间,可以发现装备在一年中某个特定时间段故障率较高;分析装备的故障部件,可以发现哪些部件容易发生故障,哪些部件的可靠性较高;分析不同单位的保障数据,可以比较各单位的仓储环境。
2.2 数据仓库建模
星型模型是一种由一点向外辐射的建模范例,中间有一个对象,延半径向外连接到多个对象。星型模型反映了最终用户对故障查询的看法,检测的情况、修复的情况和换件的情况都可以通过一维或多维来描述(按时间、地理分布等)。星型模式中心的对象称为事实表,与之相连的对象称为维度表(见表1)。
表1 故障维度表
3 数据挖掘模型
目前,决策树的生成方法主要有2个著名的算法:ID3算法和C4.5算法,其中,C4.5算法是ID3算法的扩充[4],本文采用ID3算法。
信息增益是基于信息论中熵(Entropy)的概念。ID3算法总是选择具有最高信息增益(或最大熵压缩)的属性作为当前结点的测试属性。该属性使得对结果划分中的样本分类所需的信息量最小,并反应划分的最小随机性或不纯性。采用这种信息理论方法,使得对一个对象分类所需的期望测试数目达到最小,并尽量确保找到一棵简单的(但不必是最简单的)树来刻画相关的信息。
下述结合表2所示的一组简单的假想测试数据,介绍数据挖掘的数据训练过程、知识获取方法,构造导弹保障可靠性决策树。
表2 某型装备测试训练数据
设S是此装备测试数据所有数据样本的集合,表2 中的10 条测试数据即构成了一个简单的S集合。设所需要分析的结果属性具有m个不同值,定义m个不同类Ci(i=1,2,…,m),表2中共有3个结果属性,m=3。类C1对应于“部件老化”;类C2对应于“正常”;类C3对应于“随机故障”。设si是类Ci中的样本数:类C1有3个样本,类C2有3个样本,类C3有4个样本。则对给定样本分类所需的期望信息由下式给出:
(1)
式中,pi是任意样本属于Ci的概率,一般可以用si/s来估计。因为信息用二进位编码,此处对数函数以2为底。由式1得到:
(2)
式中,(s1j+s2j+…+smj)/s是第j个子集的权,并且等于子集(即A值为aj)中的样本个数除以S中的样本总数。熵值越小,子集划分的纯度就越高。根据上述给出的期望信息计算公式,对于给定的子集Sj,其期望信息由下式计算:
(3)
式中,pij=Sij/Sj是Sj中的样本属于类Ci的概率。
对于洞库仓储=“否”,s12=1,s22=2,s32=2, 由式3得:
下述计算每个属性的熵。首先计算属性为“洞库仓储”的熵。观察属性“对每个分布计算期望信息。如果样本按“洞库仓储”划分,对一个给定样本分类所需的期望信息为:
由期望信息和熵值可以得到对应的信息增益值。对于在A上分支将获得的信息增益计算公式为:
(4)
则:
同理:
利用ID3算法计算每个属性的信息增益,并选取具有最高增益的属性作为给定集合S的测试属性。对被选取的测试属性逆光创建一个结点,并以该属性标记,对该属性的每个值创建一个分支,并据此划分样本。
由上述计算结果可知,仓储温度在属性中具有最高信息增益,被选作测试属性。创建一个节点,用仓储温度标记,并对每个属性值,引出一个分支。样本按此划分,对每个分支再引出分支,用判定树归纳分类法进行分类,而后继续引出分支,最后,算法返回最终的判定树(见图2)。
图2 数据判定树
将建立的判定树归纳分类法模型所确定的检验集实例分类与正确分类值进行比较,检验集分类的正确性预示模型将来的性能。
4 数据挖掘模型的应用
为了说明上文的数据挖掘模型在实际工作中的应用,以某战术导弹保障实例,用决策树分类方法对故障部件和故障时间预测。
设某型导弹装备服役以来,下发6个单位(a,b,c,d,e,f)对其进行技术保障,各保障单位每次的检测结果都有登记。现在每个单位选取20套此型装备的近10年来故障数据,对其进行分析,以求得到相关的保障规律。本文选取的数据挖掘工具为微软Analysis Manager[5],它的决策树分类算法为C4.5算法。保障单位决策树如图3所示。
图3 保障单位决策树
由图3可以看出,此型装备的2个易损部件I和II,部件I的故障率明显高于部件II;当装备储存至第8年后开始进入故障高发期。在图右侧的直方图中可以看出,保障单位c和d所保障的装备故障率要高于其他单位。
因此,在为此型装备配备维修力量和维修备件时,应多考虑上述故障特征,对部件I要准备高于一般水平的配件数;对保障单位c和d应多配置保障力量。
5 结语
数据挖掘作为一门新兴的热点技术,将随着技术的成熟而被越来越广泛地应用于装备保障的方方面面。这也给我们当前装备保障提出了一个亟需解决的问题,即如何获得、保存第一手装备保障数据。在获得数据后,应按规范的标准将大量的保障数据保存、分类,来保证数据挖掘结果的可靠性,帮助决策者做出准确的判断,制定科学的保障方案。
[1] 马龙,李剑雄,柳少军.作战指挥决策支持系统研究评述[J].军事运筹与系统工程,2004(9):48-52.
[2] 余高达,赵潞生. 军事装备学[M].北京:清华大学出版社,2000.
[3] 陆廷孝,郑鹏洲.可靠性设计与分析[M].北京:国防工业出版社,1995.
[4] 罗可,张学茂.SPRINT算法及其改进方法[J] .计算机工程与应用, 2005(32):178-180.
[5] 罗运模.SQL Server2000数据仓库应用与开发[M].北京:人民邮电出版社,2001.
责任编辑 马彤
刘培毅,刘 鑫,孙迎丰
(92941部队92分队,辽宁 葫芦岛 125001)
The Application of Data Mining in the Decision Support System of Armament Maintenance Support
LIU Peiyi, LIU Xin,SUN Yingfeng
(Detachment 92 of 92941thUnit of PLA, Huludao 125001, China)
To tactical missile types of data appeared in the process of security management, appearing the volume of business and the low data processing efficiency, propose the use of auxiliary decision system to optimize business processes, and improve the efficiency of security. By using the method of data mining to a certain type of guarantee equipment, make a data mining effect on the security data simulation, analyze the equipment security feature, summarize the security law, and provide scientific decision for decision makers.
data mining, decision support, data warehouse, decision trees
I(s1,s2,s3)=I(3,3,4)=
I(s11,s21,s31)=
I(s12,s22,s32)=
Gain(洞库仓储)=
Gain(仓储时间>7a)=
Gain(仓储温度>18 ℃)=
Gain(仓储低气压)=
Gain(仓储湿度>40%)=
刘培毅(1978-),男,工程师,主要从事武器装备试验方法等方面的研究。
2016-06-22
TP 311
A