基于灰色粗糙集的指标筛选方法*
2018-03-02路云飞李琳琳
路云飞,李琳琳,张 壮
(火箭军工程大学,西安 710025)
0 引言
随着系统工程、计算机网络和人工智能等学科的融合创新,作战指挥系统信息化、智能化程度的提高日益成为世界各国关注和发展的焦点。作战指挥系统是一个极其复杂的大型系统工程,如何在最短时间里,利用最有限的人力、物力和财力找到制约作战指挥系统性能提高的关键因素,对系统进行优化改进,构建合理的评估指标体系,并运用合适的数学模型,采用适当的评估方法对指标体系进行评估,得出系统效能,发现制约因素成为解决问题的关键。新一代作战指挥系统结构组成要素繁多、关系复杂,如何构建能够反映系统结构特性的评价体系,是评估作战指挥系统效能评估的基础和关键。评价指标的选取和构建的合理性不仅影响到系统效能的可信度和有效性,而且直接决定了评估模型的复杂性。
指标体系的构建因人而异,不同的评价角度和考虑方法,都会得到不一样的指标体系。针对系统效能评估的指标体系构建问题,文献[1]系统地研究了综合评价指标体系构建的思路和方法,并利用粗糙集理论中的属性约简原理,详细地介绍基于粗糙集理论的指标筛选问题。文献[2]创新性地将“熵权”思想运用评价指标的筛选过程中,提出指标“区分度”的概念,并与“重要性”概念进行了均衡性探讨,解决了因指标众多、涵盖全面,难以有效评估的指标合理筛选问题。文献[3]运用灰色层次分析法较好地解决了部分难以准确量化指标的评价问题,通过白化权函数,将模型定量化,避免了专家打分的主观依赖性,增强了系统评估的可操作性。上述文献中的方法分别针对特定系统的指标进行评估,侧重点各不相同,均有可取之处,但适用性不强。例如,粗糙集属性约简虽然解决了指标的简化问题,但仅仅适用于离散数据的指标,仍有需要改进的地方。
灰色关联度分析法对样本数据没有数量和分布规律要求,但是其临界值确定还有待研究消除争议。粗糙集指标约简可以确保评价结果大致正确,但容易误删重要指标。本文针对作战指挥系统效能评估特点,引入粗糙集理论(RST,Rough Set Theory)[4]并结合灰色关联度理论(GCT,Grey Cluster Theory)[5],将粗糙集理论和灰色关联度分析法结合起来进行指标的筛选,起到了较好的效果。
1 评价指标选取原则
根据作战指挥系统效能评估的特点,可以总结归纳出评价指标选取应满足以下基本原则:
1)目的性原则,指标的选取必须能够客观反映评价实体的基本任务特性,具有鲜明的目的性。
2)全面性原则,选取的指标必须具有全面性,能够全方位刻画评价实体的综合特性。
3)可行性原则,要确保可以保质保量地获取指标数据,保证数据的可靠性。
4)稳定性原则,也叫鲁棒性,必须确保指标体系的稳定性,对外界因素具有一定的抗干扰能力。
5)协调性原则,指标的选取应与评价方法相适应,评价方法能够反映指标的不同特性。
6)结合性原则,指标选取时应重点考虑定性与定量指标的有机结合。
然而,指标体系构建的全面性,必然导致指标的重叠,也就不可避免地产生信息冗余,而且指标全面性的提高,可能会引起部分相关性不大的指标纳入指标体系,从而影响或者覆盖重要指标的评价特性。因此,必须综合权衡指标构建的6个原则,在其中找到一个适中点,建立一个较为合理的评价指标体系。
2 评价指标权重确定
2.1 粗糙集理论
粗糙集理论是波兰学者Z.Pawlak在1982年提出的一种用以研究不完整数据、不确定知识的数学理论。其与模糊数学和概率论等其他方法相比,在处理不确定信息时不需要隶属度函数、概率分布函数等先验知识,也不受其他前提条件的约束。近几年来,关于粗糙集理论的研究与应用成为众多专家和学者关注的焦点。
不可分辨关系Ind(B)将论域U划分为k个等价类,记为
定义4 设C为一个信息系统的完整属性集,一般用完整属性集与去掉评价属性后剩余属性集的信息量之差来表示该属性的重要性,设属性c∈C,则可以求出属性c重要性为:
对于属性c的重要性权重用下式表示:
将上述权重代入下式可得综合评价值:
式中:Vj是第j个指标的综合评价结果,wi为第i个属性的权重,vij是第j个指标在第i个属性下的属性值。
2.2 灰色关联聚类
针对模糊不清的对象不便于分析处理的问题,采用灰色关联聚类的方法,假设有n个对象,则可采用专家打分或实验对每个对象取m个特征数据,如下:
得原始评价矩阵
对原始评价矩阵进行标准化处理
记标准化处理后的序列:
由关联系数可得关联矩阵A如下:
2.3 指标聚类的确定
在实际问题中,指标的确定直接影响到系统评估的结果,而指标的分类又受临界值的影响,因此,需要选择合适的临界值,来确定指标分类。为了使指标分类明确,满足评估要求,本文采用F统计量的方法来确定临界值。
通过运算可得各列向量的平均值
可得F统计量
式中:
在式(16)中,分母代表类内样本间距离,而分子代表类间样本间距离。因此,从一定意义上来说,F值的大小可以反映分类的效果。F值越大,表明分类差异越明显,反之则表示不明显。此外,根据数理统计中的显著性检验知识得知,如果F满足,就说明差异比较显著,分类较合理。如果同时有多个F值满足不等式,需根据比例式的大小来进一步确定F,选择较大的F值即可。
3 指标筛选的具体步骤
步骤1理论准备。指标体系构建之前,首先需要通过查阅文献或根据评价要求对评价对象的评价标准有一个清楚的了解,进而才有可能构建比较合理的评价指标体系。
步骤2评价指标初建。指标体系的构建是一个由大到小,由粗到细,再由细到精的过程,可采用系统分析的方法来确定。但对于作战指挥系统,一般采用头脑风暴的方法,先找出评价指标“全集”,再通过指标分析,找出主要指标。
步骤3数据收集。结合系统评价实际,通过采集历史数据或专家打分的方法找到尽可能多的有效数据。
步骤4数据标准化。采集到的数据由于量纲不同,无法统一处理。因此,必须对数据进行标准化处理,统一量纲。
步骤5建立关联矩阵A。将归一化处理后的n个对象的m个特征数据代入式(11),可得到关联矩阵A。
步骤7指标约简。通过粗糙集属性约简理论对指标进行优化筛选。
指标筛选的具体过程如图1所示。
4 应用实例
以作战指挥系统效能评估指标体系为例(如表1所示),利用上述指标筛选方法对评估指标进行约简优化,评估指标数据来源于专家打分和部队调研,实例中的专家x1~x6的打分结果分别为6个不同调研单位打分结果的平均值。
表1 作战指挥平台评估指标原始数据
为方便计算,首先用 C1,C2,C3,C4,C5,C6,C7,C8,C9,C10来表示需要评估的10个指标;其次,为便于数据处理,将表中数据统一量纲,如下页表2所示。
将表2中数据代入式(11),得关联矩阵A:
表2 标准化处理结果
根据上述F统计量法和灰色聚类分析,可得论域在完整属性集下的分类情况,如图2所示。
由图2可得完整属性集情况下的最佳分类为:
根据粗糙集约简理论,将指标C1~C10依次约简可得约简仿真分类图如图3~图8所示。
将上述结果代入式(4)、式(5),可得各属性的重要度和权重如表3:
表3 属性重要度权重表
由式(6)可得综合评价结果如下页表4所示。
由评价结果可知,指标C8,C10相对于其他8个指标评价分值较低,排名靠后,对系统评价影响较小;指标 C1,C2,C6的评价结果处于中等水平,有一定的评价价值;而指标 C3,C4,C5,C7,C9评价结果较好,是系统评价中必须考虑的指标。综上,通过粗糙集约简理论可将指标C8,C10约简去除,得最终评估指标{C1,C2,C3,C4,C5,C6,C7,C9}。
表4 指标综合评价结果
5 结论
针对经典粗糙集属性约简只适用于离散数据的问题,本文采用灰色聚类理论把原始数据离散化,并通过F统计量确定灰色聚类临界值,进而实现指标的有效分类。采用灰色聚类与粗糙集理论相结合的指标筛选方法,克服了传统指标在不确定、数据不完整条件下无法筛选的问题,且该方法理论简单,结果有效可靠。
但是,在实例验证过程中可以发现,该方法还存在一定的局限性,本方法是通过对指标聚类达到约简目的,而对于部分相似性比较高的指标并未能筛选去除,例如火力筹划和火力运用相似程度较高,该方法就未能有效约简。针对此不足,在以后科研工作中仍需加强研究。
[1]戚宗峰,韩山,李建勋.基于粗糙集的雷达抗干扰性能评估指标体系研究[J].系统仿真学报,2016,28(2):35-342.
[2]李元年.基于熵理论的指标体系区分度测算与权重设计[D].南京:南京航空航天大学,2008.
[3]李思源,谭业双.基于层次分析法和信息熵的多准则指标选取[J].计算技术与自动化,2012,31(4):99-103.
[4]刘彦,陈春良,石文华,等.基于RST-QFD-Bayes的新型装甲装备通用质量特性评价指标体系构建研究[J].计算机测量与控制,2015,23(6):2048-2051.
[5]杜俊慧.基于灰色粗糙集的评价指标筛选方法研究[J].中北大学学报(自然科学版),2012,33(5):559-562.
[6]于洪,王国胤,姚一豫.决策粗糙集理论研究现状与展望[J].计算机学报,2015,38(8):1628-1639.
[7]吴展燕,胡剑文,常青.基于指标空间的作战飞机效能分析方法[J].火力与指挥控制,2013,38(11):10-14.
[8]李向阳,潘长鹏,李伟波.基于C-AHP的指挥控制系统作战效能指标体系研究[J].舰船电子工程,2014,34(2):31-34.
[9]李远远,云俊.基于粗糙集的指标体系优化及评价方法研究[J].浙江大学学报(理学版),2010,37(4):411-415.
[10]陈春良,陈伟龙,魏兆磊,等.陆军主战装备自主式保障系统及其评价[J].装甲兵工程学院学报,2015,29(3):18-24.
[11]汪民乐,彭司萍,杨先德,等.导弹武器系统生存能力分析方法[M].北京:国防工业出版社,2015.
[12]戴利军,杨露菁.指挥信息系统效能指标体系的构建和约简[J].舰船电子工程,2015,35(5):17-20.
[13]XU R S,ZHANG J L,ZUO H B,et al.A novel model for cost performance evaluation of pulverized coal injected into blast furnace based on effective calorific value[J].Journal ofCentralSouth University ofTechnology,2015,22:3990-3998.
[14]蓝羽石,毛少杰,王珩.指挥信息系统结构理论与优化方法[M].北京:国防工业出版社,2015.