APP下载

火控系统嵌入式训练数据分析方法

2018-06-13王泽璞王建国石又新侯麒麟刘广才

火力与指挥控制 2018年5期
关键词:项集置信度事务

王泽璞,王建国,石又新,侯麒麟,刘广才

(北方自动控制技术研究所,太原 030006)

0 引言

训练数据分析是军事训练中的一个关键环节,对提高训练效率有着重要的影响[1]。某型火箭炮火控系统采用了嵌入式训练技术,能够在实装上进行高逼真度的训练,同时也生成了丰富、多元的训练数据。对这些训练数据,需要使用科学先进的方法加以分析,以达到对训练效果的准确评估,提升训练水平。

嵌入式训练是指将训练系统嵌入到实际装备中,在真实的装备环境下实施的训练,可使受训者获得与实战相符的心理与生理适应性,大幅提升训练质量。嵌入式训练系统会对参训人员的训练过程实时地进行全面详细的记录,为训练评估提供了大量有价值的依据。

1 训练成绩评估

现代火控系统涉及多种类型的操作,数目众多,而且有许多操作都比较复杂,既需要有一定的操作技巧,还要掌握合适的时机。要完成某一特定任务,还会有固定的操作顺序。因此,首先应该建立一套科学全面的训练评估指标体系。

根据火控系统嵌入式训练的实际情况,结合炮班教练员和士兵的反馈意见,得出的嵌入式训练的一级指标,如下页图1所示。每个二级指标都包括一些更为具体的三级指标。火箭弹发射评估指标体系如下页图2所示。

图1 嵌入式训练评估指标体系

图2 火箭弹发射评估指标体系

成绩评定采用模糊综合评价法。模糊综合评价法根据模糊数学的隶属度理论把定性评价转化为定量评价,即用模糊数学对受到多种因素制约的事物或对象做出一个总体的评价[2-3]。下面以二级指标火箭弹发射为例进行说明。

模糊综合评价法需要建立因素集,评价集,权重集,隶属度集。

因素集是指影响评判对象的所有因素的集合。设为:U=(u1u2u3)

U中元素分别代表火箭弹发射所包括的3个三级指标。

评价集是指所有评判结果的集合,本评估中共分为5个等级。设为

为实现量化,建立评价集与分数之间的模糊关系,给出分数集

权重集是指各因素对评判对象的重要程度的集合。运用层次分析法来得出权重集。

因素重要程度比例标度表如表1所示。

由此得到判断矩阵为

初步得到的权重向量为

对判断矩阵进行一致性检验,得

表1 比例标度表

判断矩阵的最大特征根为

一致性指标

随机一致性指标RI判定表如表2所示。

表2 随机一致性指标RI判定表

一致性比率

所以判断矩阵P的不一致性程度在允许范围内,A可以作为权重向量。故权重集为

隶属度集是对因素ui做出vj评判结果的可能性大小的集合。设为

表示第i个因素的隶属度集。现取某一次火箭弹发射训练的各因素的成绩的隶属度集,将所有因素的隶属度集组成隶属度矩阵为

模糊综合评价模型为

B表示综合考虑所有因素时,对评价集中每个评价结果的隶属度。按照最大隶属度原则,这次火箭弹发射的训练评估结果为良。分数为

其他二级因素、一级因素和嵌入式训练总体的训练成绩均按照此方法进行计算评估。

借助模糊综合评价法能较好地解决模糊的、难以量化的问题,得到科学合理的训练成绩。

2 单批数据的分析

最普通的数据结构是一批数,被称之为一个“批”。运用探索性数据分析[4]中的茎叶图来对单批数据进行分析。图3所示为某次训练共41名士兵的嵌入式训练成绩茎叶图。茎叶图概括了这次训练成绩数据的形状,同时又保留了数据的主要有效数字。这个特点能够清晰地显示出这次训练成绩的模式,比如总体偏向80分以上的高分,以及训练成绩数据在各区间的分布,比如离散程度总体比较平均,在85分~89分之间有特别的集中。

借助茎叶图可以方便地得到多个批次的数据的分析结果。然后进行综合的汇总分析,可以得到更为准确的士兵训练水平的整体分布规律和特殊之处,从而可以为大多数士兵或者某些特殊的士兵制定针对性的训练计划,更高效率地提升训练水平。

图3 训练成绩茎叶图

3 相关关系分析

分析不同的数据项之间的相关关系是训练数据分析的一个重要方面,比如训练次数与训练考核成绩之间的关系。表3所示为某士兵某段时间内共20次的训练考核成绩表,其中每两次的训练考核之间该士兵都要进行5次训练。这组数据的散点图中散点的分布,刨除几个特殊点之外,显示出数据之间存在一定的线性关系。运用探索性数据分析中的三组耐抗线法[5]来拟合数据间的线性关系可以取得很好的拟合效果。

表3 某士兵训练考核成绩表

3组耐抗线法的基本步骤为:

将所有的数据(xi,yi)(其中xi表示序号,yi表示训练考核成绩)按照序号(自变量)的多少进行排序,然后均匀地分成3组。

在所形成的3个组内,先求组内x值的中位数,然后单独求y值的中位数,得到总括点的x坐标和y坐标:

由于x和y独立计算,得到的这3个总括点可能是数据点,也可能不是数据点。

以斜率和中心值(也称为水平)来表示回归直线通常更有用,中心值是在x=x或x=xM,或在其附近某个方便的值。为方便起见,选择x=xM=10.5,初始线性回归直线为

其中

故初始直线为

计算每个数据点的残差

结果见表3。按先前的分组找出

利用3个残差数据的总括点用相同的方法拟合直线,得到

用残差拟合得到的斜率和水平对初始直线的斜率和水平进行调整,得到调整后的斜率和水平为

图4 拟合直线

对于数据之间的曲线相关关系,可以先进行变量变换,使变换后的变量呈线性关系,然后再使用三组耐抗线法求出直线方程,最后将直线方程转换为原变量的函数表达式。

三组耐抗线法运用中位数,很好地规避了特殊值带来的不良影响。借助三组耐抗线法可以准确地拟合出训练数据之间存在的线性关系,从而更好地对以后的训练数据进行预测和分析。

4 关联规则挖掘

除了数据之间明显存在的相关关系外,一些表面看起来似乎没什么关系的数据之间也可能存在一些隐藏的关联。运用数据挖掘领域关联规则中广泛使用的FP-growth算法[6-7]有助于发现嵌入式训练的数据中不易被发现的一些规律。

项的集合称为项集。包含k个项的项集称为k-项集。给定一个事务数据库D,项集的出现频率是D中包含项的事务数。如果项集的出现频率大于或等于给定的最小支持度与D中事务总数的乘积,则项集满足最小支持度。如果项集满足最小支持度,则称它为频繁项集。支持度是项集在事务数据库D中出现的概率。

关联规则是形如A=>B的蕴涵式,其中A∩B=Ø。规则A=>B在事务D中具有支持度和置信度。支持度是指A和B同时出现在D中的概率,即P(A∪B)。置信度是指在事务数据库D中包含A的前提下同时也包含B的概率,即P(B|A)。

首先将被分析的数据进行整理。然后将连续性的数据进行离散化处理,形成事务数据库,比如将85分以上的成绩转换为A,60分~85分的成绩转换为B,60分以下的转换为C。

然后根据实际情况和研究目标设置最小支持度和最小置信度。在此基础上扫描一次事务数据库得到频繁1-项集。

FP树由一个个的项节点构成,每个节点中会记录该节点出现的支持度。构造FP树首先新建一个根节点。再根据各项集的支持度大小分别对各事务包含的所有项进行重新排序。然后分别根据各事务中项的排序,依次向FP树中插入新的项节点,每个事务中各个项在FP树的同一个分支上,依次相连。若一个事务最初的n个项的排序与之前已经插入FP树中的某个事务最初的n个项的排序完全一样,则相同的部分无需重新建立新的项节点,只需将已经存在的相同项节点的支持度加1来表示插入新的项。直至所有事务均已插入FP树中,FP树构造完成,之后便无需访问事务数据库。

然后按照项的支持度从小到大的顺序,进行FP树的挖掘,找出频繁项集。首先遍历FP树找到项的条件模式基。条件模式基是指包含FP树中与后缀模式一起出现的前缀路径的集合。然后将条件模式基按照FP树的构造原则形成FP条件树,并将条件树中支持度小于最小支持度的项去掉。然后根据条件树经过排列组合得到该项的频繁项集。

最后计算各频繁项集蕴含的所有关联模式的置信度。将置信度小于最小置信度的模式去掉,得到最终的关联规则。

借助FP-growth算法可以高效地得到关联规则,从而为训练评估提供新的思路。比如通过对大量数据的分析得出某个年龄段士兵的训练成绩起伏更大,同时在一天中某个时间段的训练成绩同比增幅更为稳定。根据这样的结果,可以适当地增加此年龄段的士兵在此时间段内的训练,减少在其他时间段的训练,从而可以帮助此年龄段士兵的训练成绩获得更稳定的提升。

5 结论

嵌入式训练代表了军事训练技术的最新发展趋势,发挥着日益重要的作用。本文运用多种科学方法,对嵌入式训练产生的数据进行了全方位、多层次的评估分析,得到了许多有价值的结果,为提高训练水平提供了有力的支撑。

[1]管清波,冯书兴.军事训练模拟系统中的数据与数据分析问题研究 [J]. 装备指挥技术学院学报,2009,20(4):27-31.

[2]高桂清,史重建.常规导弹部队战术模拟训练评价方法[J].四川兵工学报,2013,34(5):9-12.

[3]姜为学,邓钦,李宗良,等.某型火控仿真系统模拟训练质量模糊评判[J].弹箭与制导学报,2007,27(2):300-303.

[4]DAVID C,陈忠琏,郭德媛.探索性数据分析[M].北京:中国统计出版社,1998.

[5]孙丽君.探索性数据分析方法及应用[D].大连:东北财经大学,2005.

[6]HAN J,PEI J,YIN Y.Mining frequent patterns without candidate generation[C]//In:Proc ACM SIGMOD,2000:1-12.

[7]王新宇,杜孝平,谢昆青.FP-growth算法的实现方法研究[J].计算机工程与应用,2004,40(9):174-176.

[8]杨国振,常天庆,张雷,等.改进模糊层次分析法的火控系统故障诊断方法 [J]. 火力与指挥控制,2016,41(2):162-165.

猜你喜欢

项集置信度事务
基于数据置信度衰减的多传感器区间估计融合方法
北京市公共机构节能宣传周活动“云”彩纷呈北京市机关事务管理局
一种基于定位置信度预测的二阶段目标检测方法
基于共现结构的频繁高效用项集挖掘算法
基于排序树的Node-Apriori改进算法
不确定数据频繁项集挖掘算法研究
针对基于B/S架构软件系统的性能测试研究
一种Web服务组合一致性验证方法研究
Hibernate框架持久化应用及原理探析
校核、验证与确认在红外辐射特性测量中的应用