APP下载

基于加权支持向量回归的抢修时间估计模型

2014-07-10尤志锋石全熊飞

现代防御技术 2014年4期
关键词:特征向量复杂性向量

尤志锋,石全,熊飞

(军械工程学院,河北 石家庄 050003)

0 引言

战场抢修时间的估计既可以用来确定损伤等级,辅助指挥员进行装备保障决策,又可以对抢修工艺流程进行评估优化,操作员训练时间分配提供一定支持。目前已有一定的研究成果:文献[1]利用随机网络仿真的方法对复杂系统的抢修时间进行了研究,但是其抢修活动时间分布是基于平时的基本维修作业时间及其分布进行的,不能充分反映出战场抢修的特点;文献[2]将某损伤装备的抢修时间分为等待修理时间、修理时间和修竣归建时间,并将主要的修理时间按照俄罗斯装备的э分布进行计算,因为э分布主要是针对机械化时代的装备,随着信息化程度的逐渐深入,这种假设的合理性正在逐渐降低;文献[3]针对雷达装备,综合抢修人员数量、备件率、装备损伤程度以及运送时间4个因素建立了抢修时间的计算公式,但是其中抢修标准时间的确定存在不确定性:针对不同的装备、不同的损伤其标准抢修时间是不一致的,影响了其通用性。本文详细分析了抢修时间的影响因素,将抢修任务本身的属性用其复杂性来衡量,基于图熵法给出了具体的量化方法。引入机器学习领域处理非线性、高纬度、小样本数据具有良好性能的支持向量回归机寻找抢修时间影响因素与抢修时间之间的非线性关系,利用遗传算法进行支持向量的参数寻优,较好地解决了抢修时间估计存在的问题。

1 抢修时间的影响因素及赋值

能否在规定的时间内完成任务是战场环境下所必须考虑的。某个特定任务的执行时间受众多因素的影响。经过分析影响因素主要有以下4个:

1.1 任务复杂性分析计量化

抢修时间即抢修任务的执行时间。其最根本的因素就是任务本身的属性。表征任务本身属性的方法有很多:文献[3]用损伤程度表示,文献[4]用工作量表示,文献[5]用损伤装备表示等,这些属性并不是抢修任务唯一属性,用其代替任务的本质,容易丢失信息,导致结果不准确。因此借鉴Park用抢修任务复杂性表征抢修任务的本质。抢修任务复杂性即抢修任务理解和执行的难度,其影响因素主要有:抢修操作所需资源复杂性、抢修逻辑结构复杂性、抢修所需工作量复杂性、抢修所需决策知识层次复杂性,如图1所示。

图熵法既可以体现信息复杂性又能体现逻辑及工作量复杂性,因此选择图熵法量化。图熵法是一种基于信息结构图模型和控制流程图模型的复杂性量化方法,它通过建立图熵模型表示抽象的过程信息。其计算公式为

(1)

根据文献[6],抢修所需资源的复杂性用信息结构图的二阶熵计算,抢修逻辑复杂性用动作控制图的一阶熵计算,抢修操作量(体力)的复杂性可以由动作控制图的二阶熵计算得到,而决策所需知识层次的复杂性则由知识、决策层次图的二阶熵计算。

1.2 抢修人员的技术等级

人员的数量和技术水平是影响时间的主观因素。抢修人员的技术水平越高、人员的数量越接近于需求所用的时间越短。结合抢修实际把人员的技术等级分为4级:TL1,受过专门的抢修训练、专门团队协作训练和指挥训练的技术军官;TL2:仅受过专门抢修训练的抢修技术员;这类人员在团队协作性和组织指挥性方面没有TL1人员强;TL3:受过平时维修训练,没有经受过专门抢修训练的技术员,具有较少的抢修经验和抢修知识;TL4:普通的装备使用人员。将每个技术等级作为抢修时间的影响因素,其值为相应技术等级人员的数量。

图1 抢修任务的复杂性的影响因素Fig.1 Influence factors of BDAR task

1.3 工具设备的适应程度

在抢修的过程中工具的数量和功能对抢修任务的顺利完成影响很大。数量和功能越合适任务完成的就越顺利,所用的时间就越短。工具的适应程度分为3个层次:ToA1:工具(设备)功能非常符合;ToA2:基本符合,通过采取措施(如改变工具的使用方式)使功能基本符合;ToA3:工具的功能不符合,也不能通过其他方法弥补。将这3个层次作为影响因素,其值为相应工具的数量。

1.4 环境的恶劣程度

环境因素是进行战场抢修所必须考虑的,也是其与平时维修的不同之一。将环境评价语言分为4级:非常恶劣、比较恶劣、较好、非常好。非常恶劣:严重影响操作进行,思考决策的难度很大,只有经过专门训练、具有较强适应能力的人才能够克服执行;比较恶劣:影响操作、决策的进行,但是操作仍然可以进行,没有经过专门训练的人也可以克服执行;较好:影响较小,大部分操作者可以不受影响,能够较好的克服,只有少数心里素质差的人受影响较大;非常好:与平时维修环境相似。用7标度方法:由下至上分别为1,3,5,7,介于这些中间的部分为2,4,6。

2 基于加权ε-SVR的抢修时间估计

2.1 基本支持向量回归[7-8]

支持向量回归机是20世纪90年代Vapnik等人以最优化方法和统计学习理论为基础提出一种新的机器学习方法。主要处理小样本、非线性、高纬度的数据学习问题。抢修事件一般是小样本、非线性、高纬度的,一般的回归方法处理的效果不好,因此引入支持向量回归进行建模。将支持向量回归用于抢修时间的估计,其思路为:利用第一部分的方法求取影响因素的值,将其作为输入变量, 任务的执行时间作为输出变量。通过对训练样本进行学习,建立从影响因素向量到抢修时间的非线性映射;将训练好的SVR模型作为黑箱,输入一组新的向量,推出相应抢修任务的执行时间值。其基本结构如图2所示。

2.2 加权支持向量回归

在不同的环境下,不同的任务中,影响抢修时间特征属性的重要程度对其最终的取值影响是很大的。标准的SVR中没有对特征属性的重要程度加以区分。文献[9]引入样本权重,针对不同的样本,利用权重来调节惩罚系数C,从而获得更好的分类效果。文献[10]引入特征权重,获得了较好的分类效果,但其只用于分类问题。文献[11]用特征权重向量扩充标准的欧氏距离,证明了对机器学习性能的影响。但这些方法都不能直接用于回归问题。由于战场抢修是小样本事件,数据不完整,具有灰色性。因此引入灰色关联系数确定特征属性的权重,并将之应用到核函数形成加权核。

图2 基于ε-SVR的抢修时间估计原理Fig.2 Principle of BDAR time assessment based on ε-SVR

2.2.1 权重确定[12]

设第i个样本的第j个特征向量的值为:xj=xj(i),i=1,2,…,m,j=1,2,…,n,yi为第i个样本的评估值。

首先对原始数据进行无量纲化处理:

对于效益性指标:

(2)

对于成本型指标:

(3)

对于特定值最好的指标:

(4)

式中:b为理想值。

则第j个特征向量对于yi的灰色关联系数为

(5)

式中:ρ为分辨系数,ρ∈(0,1) ,它是为了提高关联系数之间的差异显著性,通常取ρ=0.5。

将γ=(γ1,γ2,…,γm)进行归一化得第j个特征向量的权重为

(6)

2.2.2 加权核函数构造

将特征属性进行加权后,其对应的核函数就必须进行修改。设wi为第i个特征向量的权重,则:W=diag(w1,w2,…,wm),其中m为特征向量的个数,则定义在X×X上的特征加权核函数:Kf(xi,xj)为

(7)

2.3 抢修时间估计模型

考虑估计值与实际值之间的差别小于ε,根据SVR的思想引入核函数K(xi,xj)=φ(xi)φ(xj),其中φ(xi)为xi的一个非线性映射。因此,可以确定最终的非线性回归估计函数为

f(x)=WTφ(xi)+b,

(8)

式中:W为权重向量;b称为偏置量。

(9)

根据KKT条件可得支持向量(SV)的个数和b=f(W,SV),因此当W求出后便可根据支持向量求出b的值。则映射关系可以转化为

(10)

其中K(xi,xj)为核函数,代替的是特征空间中的内积,它满足Mercer条件,选择核函数时要保证其对称半正定性。常用的核函数有:线性核、多项式核、径向基核、Sigmoid核、Fourier核等。本文选择指数径向基核函数。根据式(4)可得为加权指数径向基核函数:

K(xi,xj) =exp-γ‖WTxi-WTxj‖2=

exp{-γ[(xi-xj)TWWT(xi-xj)]}.

(11)

因此最终得到基于加权SVR的抢修时间的估计模型为

(xi-xj)]}+b,

(12)

式中:xi为输入的训练样本的影响因素向量值;xj为待估计样本的影响因素向量值;f(x)为待估计样本的抢修间值;n为训练样本的数量。

2.4 抢修时间估计步骤

通过上面的分析得出基于加权SVR的抢修时间估计步骤如下:

(1) 确定评估的特征向量集;

(2) 收集特征向量与评估值之间的数据集,并按照式(2)~(4)对之进行归一化,按照式(5)~(6)求取各个特征属性的权重;

(3) 按照文献[13]的方法设置支持向量机参数(核参数γ,参数ε和惩罚参数C)的范围,设置遗传算法的参数:初始种群数、交叉概率、选择概率、终止条件;

(4) 将第2步处理好的已知数据集输入设置好运行参数的支持向量机进行训练,保留训练好的SVR模型;

(5) 将待评估对象的特征向量集输入已经训练好的SVR模型,运行SVR模型得出评估值。

3 模型的训练与验证

3.1 数据的获取及处理

回归分析是建立在数据之上的定量分析方法。数据及其准确性都直接影响回归分析的效果。由于历史数据很少,且可参考性不高,因此需要利用实验获取。随着时间的推移,会不断的有真实的损伤数据加入,以不断提高模型的精度,这是一个解决问题的思路和数据收集的方向。所获数据由表1所示。

为了消除不同量纲之间的影响,提高预测的精确性,按照2.2.1中的方法进行归一化处理。并且计算权重得W=(0.096,0.063,0.086,0.171,0.094,0.019,0.064,0.047,0.122,0.033,0.071,0.134)。

3.2 SVR参数优化

由上面分析可知训练参数为核参数γ,参数ε和惩罚参数C。参数寻优的策略有很多,其中遗传算法具有良好的应用效果,且在处理小样本时,其搜索速度慢的缺点也可以很好克服,因此选择遗传算法进行寻优。设置最大优化代数为200,初始种群数量为20,变异概率为0.05,交叉概率为0.85,将这些参数输入训练样本(图4中的前20项数据)得到所需的参数为C=11.55,g=1.34,p=0.01。其MSE随进化代数的变化趋势如图3所示。

表1 抢修时间影响因素数值表Table 1 Influence factors for BDAR time

图3 MSE随进化代数的变化趋势图Fig.3 MSE′s changing trend with evolution times

3.3 结果分析及模型评估

为了检验模型的泛化能力以及估计的精度,这里采用数据集中的最后8组数据进行验证,所得结果如图4所示。由结果可以看出模型的绝对误差在20以内,因此相对误差小于0.2,精度符合要求。

图4 训练样本和测试样本的精度比较Fig.4 Comparing between training sample and test sample

4 实例

现假定某雷达部队的抢修能力建设情况为:抢修支援分队的人员编制是7人;某雷达阵地现场抢修分队的人员编制为3人;可用于抢修的使用分队人员为5人。受到轰炸,某火控雷达和武器系统之间的电站专用输出插座被炸坏,电站功能完好,无法实现电源输出,雷达不能接电工作,整个火力打击系统的“自动火力控制系统”陷入了瘫痪状态。经过现场评估,认为电站专用输出插座被炸,无法对原件进行修复,需采用抢修方法进行。按照文献[4,6]的方法进行计算,该抢修任务的CF1=3.684,CF2=3.418,CF3=1.959,CF4=3.936。根据不同抢修级别的资源对该任务的资源分配情况,通过将数据输入上面已经训练好的模型得出抢修时间,如表2。

从估计结果可以看出,使用分队由于没有专用的电缆剥离工具,任务完成的时间最长,间超出了规定的48 min,一般不采用;而伴随分队由于有具有相关技能水平的人员,且工具适应度较高,所以其完成时间较少,小于规定的时间,且伴随力量容易获得。支援分队由于人员的协作水平较高,工具的适应度好,其完成任务的时间大大缩短。但是通常,支援分队距离较远需要考虑来回的路程,所以这里采用伴随分队进行现场抢修。

表2 时间影响因素赋值表Table 2 Time influence factors’ value

5 结束语

支持向量机在处理小样本数据时精度较高,非常适合抢修时间估计。将抢修人员的数量、技术等级、工具设备的适应程度和环境作为影响因素考虑,可以计算出使用分队、伴随抢修力量、支援分队、前方修理所及后方基地等不同单位指标值。当抢修任务固定时,可以估计不同抢修力量的具体抢修时间,为战损等级评定和抢修力量选择奠定了基础。

参考文献:

[1] 石全,李建平,刘祥凯.复杂系统抢修时间仿真模型研究[J].计算机仿真,2001(1):93-96.

SHI Quan,LI Jian-ping,LIU Xiang-kai.Simulated Modeling of Solving the Time of Quick-Repair for A Complex System[J]. Computer Simulation, 2001(1):93-96.

[2] 喻春明.战时装甲装备维修理论中若干关键问题的研究[D].沈阳:东北大学,2007.

YU Chun-ming. Some Key Problems on Maintenance Theory of Armored Equipment in Wartime [D].Shen-yang:Northeastern University,2007.

[3] 刘飞,杨江平.雷达装备战场抢修等级量化决策研究[J].装备指挥技术学院学报,2009,20(4):116-119.

LIU Fei, YANG Jiang-ping. Research on Decision-Making Quantifying of the BDAR Level for Radar Equipments[J].Journal of the Equipment Academy,2009,20(4): 116-119.

[4] PARK J, JUNG W. A Study on the Development to Task Complexity Measure for Emergency Operating Procedures of Nuclear Power Plants [J]. Reliability Engineering and System Safety, 2007,92(4): 1102-1116.

[5] 李建平,石全,甘茂治.装备战场抢修理论与应用[M].北京:兵器工业出版社,2000.

LI Jian-ping, SHI Quan, GAN Mao-zhi. Equipment BDAR Theory and Application [M]. Beijing:Arms Industry Pressed, 2000.

[6] 尤志锋,石全,胡起伟,等,基于图熵法的战场抢救抢修方案复杂性量化模型[J].军械工程学院学报,2013,25(2):7-11.

YOU Zhi-feng, SHI Quan, HU Qi-wei,et al. An Study on Quantification Model for BDR Scheme Complexity Based on Diagram Entropy Methodology[J].Journal of Ordance Engineering College,2013,25(2):7-11.

[7] 刘京礼.鲁棒性最小二乘支持向量机研究与应用[M].北京:经济管理出版社,2012.

LIU Jing-li, Researching and Application on Robustness Least Square Criterion Support Vector Machine [M].Beijing: Economic Management Press, 2012.

[8] 刘国辉,侯征,王天意,等.一种新型的地下含水层涌水量预测模型[J],地球物理学进展,2012,27(3):1268-1273.

LIU Guo-hui, HOU Zheng, WANG Tian-yi, et al. A New Model to Predict the Water Inflow of Aquifer[J].Progress in geophysics, 2012,27(3):1268-1273.

[9] 杜树新,吴铁军.回归型加权支持向量机方法及其应用[J].浙江大学学报:工学版,2004,38(3):302-306.

DU Shu-xin, WU Tie-jun. Weighted Support Vector Machines for Regression and Its Application[J].Journal of Zhejiang University:Engineering Science, 2004,38(3):302-306.

[10] 汪延华,田盛丰,黄厚宽.特征加权支持向量机[J].电子与信息学报,2009,31(3) : 514-518.

WANG Yan-hua, TIAN Sheng-feng, HUANG Hou-kuan. Characteristic Weighted Support Vector Machine[J].Electronic and Information Journal, 2009,31( 3): 514-518.

[11] KEERTHI S S,LIN C J. Asymptotic Behaviors of Support Vector Machines with Gaussian Kernel[J].Neural Computation,2003,15 (7): 1667-1689.

[12] 邓聚龙.灰色系统理论教程[M].武汉: 华中理工大学出版社,2006.

DENG Ju-long. Gray System Theory Course [M].Wuhan: Huazhong University of Science and Technology Press,2006.

[13] 杜京义,侯媛彬.基于遗传算法的支持向量回归机参数选取[J].系统工程与电子技术,2006,28(9):1430-1433.

DU Jing-yi, HOU Yuan-bin. Parameters Selection of Support Vector Regression by Genetic Algorithms[J]. Systems Engineering and Electronics, 2006,28(9): 1430-1433.

猜你喜欢

特征向量复杂性向量
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
新时代城乡学前教育均衡发展的复杂性挑战与路径优化——基于复杂性理论
向量的分解
克罗内克积的特征向量
聚焦“向量与三角”创新题
复杂性背后
PFNA与DHS治疗股骨近端复杂性骨折的效果对比
简单性与复杂性的统一
一类三阶矩阵特征向量的特殊求法
向量垂直在解析几何中的应用