APP下载

基于灰色粗糙集的评价指标筛选方法研究✳

2012-10-09杜俊慧

中北大学学报(自然科学版) 2012年5期
关键词:约简粗糙集灰色

杜俊慧

(中北大学 经济与管理学院,山西 太原 030051)

评价指标体系是综合评价的前提,只有科学的评价指标体系,才有可能得出科学的综合评价结果.在构造综合评价体系时,评价指标的初选需要考虑指标体系的全面性、科学性、层次性、目的性等.当指标太多时,就会出现有指标之间的重复、干扰,这就需要用科学的方法进行指标筛选.

传统的指标筛选方法有:专家调研法、层次分析法、模糊评价法、主成份分析、回归分析等.专家调研法、层次分析法、模糊评价法等方法主观性强,容易出错.而主成份分析、回归分析等统计方法则需要大量的样本,而项目的综合评价,是缺乏大量的数据进行计算和分析的.现代学者也提出了一些指标筛选的方法:沈珍瑶、杨志峰提出采用灰色关联分析删除弱关联指标,进行指标的筛选[1];高杰、孙林岩提出在层次分析法中,采用区间估计删除弱权重的指标[2];张朝阳、赵涛等提出了基于粗糙集的指标约简方法[3].

灰色关联度分析法不受研究样本的限制,它不要求原始数据足够多,也不要求数据符合一定的分布规律.但是,灰色关联度分析法临界值的确定一直存在争议,还有待进一步研究.采用粗糙集进行指标的筛选,虽然可以保证评价结果大致正确,但是容易删除重要指标.所以,根据项目评价的自身特点,本文采用粗糙集理论和灰色理论结合起来进行指标筛选.由于经典粗糙集约简只适用于离散性数据的属性,采用将粗糙集和灰色聚类相结合的方法,将用灰色聚类代替经典粗糙集中的等价关系进行分类,基于灰色聚类的分类进行指标的筛选.

1 粗糙集知识约简与灰色关联聚类

1.1 粗糙集理论

粗糙集理论是由波兰的 Z· Pawlak于 1982年提出的,它是一种处理含糊和不精确问题的方法.与模糊数学、概率论统计方法等其他处理手段相比,粗糙集理论在处理不确定信息时不需要采用隶属度函数、概率分布密度等先验性知识,也不受更多的前提条件的约束,因而得到理论界、管理界的广泛采用.

定义 1 信息系统可以表示为 S=(U,AV,f),A是有限属性集,分为条件属性集 C和决策属性集 D,即 A=C∪D,C∩D=∅;V是属性值组成的集合;f是一个信息函数,它指定 U中每一个对象的属性值[4].

在信息系统中,对于 P⊆C,则 P与 S的关系 IND(P)定义为

IND(P)把对象 U划分为 k个等价类,记为

定义 2 设信息系统 S=(U,A,V,f),R∈A,R是一组等价关系,r∈R,如果 IND(R)=IND(R-{a}),则称 r是 R中不必要的,否则称r是 R中必要的;如果每一个 r∈R都是 R中必要的,则称 R为独立的,否则称 R为新来的.假设 Q∈R,如果 Q是独立的,而且 IND(Q)=IND(P),则称 Q为论域 U在属性集 P上的约简[4].

1.2 灰色关联聚类

设有 n个观测对象,每个对象观测 m个特征数据,得到的序列如下:

内容书写要按照授课对象特点调节难易程度。其主要的授课对象是住院医师规范化培训医师,有五年的医学专业课基础,刚接触临床,临床经验尚浅。讲稿书写时要求深入浅出,不能像通识教育一样只注重科普,又要易于理解。内容主要注重患者的临床诊断与临床治疗。目的是使得规培医师能够真正学习到最直接的临床诊疗知识。

对所有的 i≤j,i,j=1,2,…,m,计算出 xi与xj的灰色绝对关联度Xij.

得特征变量关联矩阵A如下:

其中,Xii=1,i=1,2,… ,m.

取定临界值λ∈[0,1],一般要求λ>0.5,当X ij≥λ(i≠j)时 ,则视xj与xi为同类特征.

特征变量 X1,X 2,…,X m在临界值 λ下的分类称为特征变量的λ灰色关联聚类[5].

λ可根据实际需要确定,λ越接近于 1,分类越细,每一组分类中的变量相对较少;λ越小,分类越粗,这时每一组分类中的变量相对地较多.

1.3 确定指标合理分类

在灰色关联聚类分析中,对不同的临界值λ可得到不同的分类.但许多实际问题需要选择某个临界值λ,以确定样本具体分类,提出了如何确定最佳临界值的问题.为了科学地得到临界值,采用 F统计量[6]确定λ最佳临界值.

设论域 U={x1,x2,…,xn}为一个样本空间(样本总数为 n),而每个样本 xi有m个特征(由试验或观测得到的 m个数据),xi=(xi1,xi2,…,x im)(i=1,2,…,n).由原始数据矩阵,利用该矩阵数据求出

作 F统计量

2 基于灰色粗糙集的指标筛选的具体步骤

步骤 1 确定评价指标.根据评价指标建立的原则,确定宽泛的评价指标集,又叫条件属性.

步骤 2 数据收集.尽可能利用已有的历史数据进行分析.如果没有现成的数据,则可以通过问卷调查等方法收集数据.

步骤 3 数据标准化.使有不同量纲的量也能进行比较,需要对数据作适当的变换.

步骤 4 建立特征变量关联矩阵 A.

步骤 5 确定指标最佳分类.根据不同的临界值λ得到不同的分类.采用 F统计量确定最佳临界值λ,得出指标的合理分类.

步骤 6 属性约简.根据粗糙集理论属性约简原理进行属性约简实现指标的筛选.

3 基于灰色粗糙集指标筛选的算例

采用文献 [7]的指标数据 (如表1所示 ),并将待选集成服务物流商扩展为 6个,用上述方法对物流服务供应链模式协同发展能力的三级指标进行约简.具体知识表达系统如表2所示.

表1 协同发展能力指标的原始数据Tab.1 Collaborative development capacity index of original data

表2 标准化的信息系统Tab.2 Standard information system

1)数据标准化处理

指标为效益型

指标为成本型

灰色关联度矩阵为

2)根据上述灰色聚类法和 F统计量法,计算得到 6个样本的最佳分类.

当临界值λ=0.91时,分类情况为:

即X=U/C={{x3,x4,x6},{x1},{x2}{x5}}.

3)根据最佳分类进行指标约简

找出删除 C指标的分类,用灰色聚类的方法进行分类.计算得各种最佳的分类情况如下:

由上所知,指标 C4,C6,C7,C8约简后不影响分结果,所以可得最小属性集为 {C1,C2,C3,C5},即原来的 8个指标约简为 4个指标.

4 结束语

本文采用灰色聚类把原有数据离散化,结合F统计量实现了数据的合理分类,解决了粗糙集属性约简只适合于离散数据,无法处理常规数据的问题;建立了灰色聚类和粗糙集属性约简理论相结合的指标体系,实现了在不确定条件下的评价指标的筛选,解决了传统指标体系无法在不确定、数据不完整的条件下进行指标筛选的问题,且该方法计算简单有效.

[1]高杰,孙林岩.区间估计:AHP指标筛选的一种方法[J].系统工程理论与实践,2005(10):43-47.Gao Jie,Sun Linyan.Range estimation priority: a method to sift out weak-weighted criteria in AHP[J].Systems Engineering-theory& Practice,2005(10):43-47.(in Chinese)

[2]沈珍瑶,杨志峰.灰关联分析用于指标体系的筛选[J].数学的实践与认识,2002(9):728-732.Shen Zhenyao,Yang Zhifeng.Gray associate analysis method in screening of index system[J].Mathematics in Practice and Theory,2002(9): 728-732. (in Chinese)

[3]张朝阳,赵涛,王春红.基于粗糙集的属性约简方法在指标筛选中的应用 [J].科技管理研究,2009(1):78-80.Zhang Zhaoyang,Zhao Tao,Wang Chunhong.Study on the application of attribute reduction based on rough set in index screening[J]. Science and Technology Management Research,2009(1):78-80.(in Chinese)

[4]王国撤.Rough集理论与知识获取 [M].西安:西安交通大学出版社,2001:20-45.

[5]刘思峰,党耀国,方志耕.灰色系统理论及其应用[M].北京:科学出版社,2004:2-8.

[6]谢季坚,刘承平.模糊数学方法及其应用 [M].武汉:华中科技大学出版社,2006:2-5.

[7]闫秀霞,孙林岩.物流服务供应链模式特性及其绩效评价研究 [J].中国机械工程,2005,16(11):969-974.Yan Xiuxia,Sun Linyan.Research on performance evaluation and characteristics in logistics service supply chain[J]. China Mechanical Engineering,2005,16(11):969-974.(in Chinese)

[8]任宏,祝连波.基于组合权法的建筑施工企业信息化水平的多层次灰色评价[J].系统工程理论与实践,2008,28(2):82-88.Ren Hong, Zhu Lianbo. Multi-hierarchical grey evaluation on the construction enterprises informatization level based on combinational weight[J].Systems Engineering-Theory&Practice,2008,28(2):82-88.(in Chinese)

[9]陈凤娟,孙静.粗糙集信息观中的绝对约简 [J].计算机工程与科学,2010,32(5):97-99.Chen Fengjuan,Sun Jing.Absolute reduction in the information view of rough sets[J]. Computer Engineering& Science,2010,32(5): 97-99.(in Chinese)

猜你喜欢

约简粗糙集灰色
粗糙集与包络分析下舰船运行数据聚类算法
基于混合增量式属性约简的中医甲状腺结节诊疗规律分析
基于Pawlak粗糙集模型的集合运算关系
基于0-1规划的最小属性约简算法
浅灰色的小猪
多粒度犹豫模糊粗糙集*
直觉模糊序决策系统的部分一致约简*
近似边界精度信息熵的属性约简
灰色时代
她、它的灰色时髦观