APP下载

基于Gini准则的客观组合评价方法研究
——以高技术产业技术创新能力评价为例

2019-04-09范德成宋志龙

运筹与管理 2019年3期
关键词:纯度排序准则

范德成, 宋志龙

(哈尔滨工程大学 经济管理学院,黑龙江 哈尔滨 150001)

0 引言

关于多属性综合评价问题,一般都会采用综合评价模型来进行评价。迄今为止,已有多种综合评价模型,如熵值法、理想解法、灰靶理论、突变级数法、变异系数法等[1~5]。由于不同的评价方法从不同的角度出发进行评价,其结果反应了多属性综合评价问题某方面的特征,其势必会造成不同评价方法结论的不一致。针对此问题,有学者提出了组合评价的思想。组合评价方法主要包括两类:一类是对排序结果进行组合,主要有平均值法、Borda法、Copeland法、改进的偏好排序法等[6,7];一类是对评价值进行组合,主要有偏差平方最小法、整体差异组合法、基于漂移度的组合法等[8]。评价值与排序结果相比包含更多的信息量,评价值所含的信息包括排序结果所含的信息,基于此运用评价值进行组合评价,将使结论更加准确[9]。因此,学者们对评价值的组合方法研究较多。国外学者,Rao等[10]提出了一种基于欧氏距离的多属性决策方法来处理工业环境中复杂的工厂或设施布局设计问题;Dewangand等[11]将TOPOSIS和AHP组合在一起对不同的岩石进行了评价;Qin等[12]提出了一种基于排序熵组合优化和最小二乘确定属性权重的新方法;Chen等[13]提出了一种新的基于区间直觉模糊加权几何平均(IVIFWGA)算子的多属性决策方法。国内学者,柳玉鹏等[14]为了最大程度地保留多评价结论所包含的评价信息,充分地整合多评价结论中的共性信息提出了基于降维思想的客观组合评价模型;张立军等[15]构建信度指标对综合评价模型的相对信度进行测度,从而提出了一种考虑各种评价方法相对优劣水平的加权组合评价方法;李珠瑞等[16]把离差最大化思想引入组合评价中,建立组合评价模型,并通过实例分析发现该组合评价方法的组合误差更小,有效性更强;张发明[17]根据“横向求同、纵向求异”的思想,提出了能够将相似与差异相融合的组合评价方法。曾宪报[18]提出分别用Kendall一致性系数检验法和Spearman等级相关系数检验法对组合评价进行事前事后检验,为组合评价的合理性提供了相应的检验方法,为以后的研究提供了帮助。

通过前面对现有研究的分析可以发现,现有研究主要是根据不同评价方法的评价值之间的差异程度来研究组合权重的确定,还没有对不同评价方法的评价值的信息纯度进行研究。而评价值的信息纯度能够反映出评价值确定性的概率,纯度越大,对应的评价结果发生的确定性越大,从而能够为管理和决策提供更加稳定可信的信息。在分类回归树中,用Gini准则来度量信息不纯度[19]。Gini系数越大,则表明信息的不纯度越大,不确定性就越大[20]。因此,可以把Gini准则引入到组合评价之中,来度量不同评价方法评价值的信息纯度,然后按照信息纯度的大小来对不同评价方法赋予权重。如果该评价方法的评价值的信息纯度较高,则对其赋予较大的权重;反之,则赋予较小的权重。分类回归树中的Gini准则和其他学者[21]提出的基尼系数客观赋权法相比较有相同之处也有不同之处。相同之处在于:两种方法都是基于度量任何不均匀分布提出的。不同于之处在于:分类回归树中的Gini准则,即基尼不纯度表示一个随机选中的样本在子集中被错分的可能性;其他学者提出的基尼系数客观赋权法的基本思想是体现出所有评价对象中任意两个评价对象之间的差异,然后按照差异程度进行赋权,仍然是基于指标差异程度进行赋权。因此,本文将把分类回归树中的Gini准则引入到组合评价之中,构建基于Gini准则的客观组合评价方法,并对其评价的可行性与相对有效性进行研究。

1 基于Gini准则的客观组合评价方法研究

1.1 基于Gini准则的客观组合评价方法思路

对于n个评价对象,m种单一评价方法得到的评价值用矩阵Y表示,即

其中,yij表示第i个评价对象在第j种评价方法中的评价值。

性质1单一评价法的评价值波动越大,其信息纯度越大,其评价结果确定性越大。反之,单一评价法的评价值波动越小,信息纯度越小,其评价结果确定性越小。当所有评价值相等时,信息纯度最小,评价结果确定性最小。

通过数学证明可以发现,当评价值波动较大(ε1较大)时,其信息不纯度越小(G(2)越小于G(1)),相应的信息纯度越大(d(2)越大于d(1)),其评价结果确定性越大。当评价结果中所有评价值相等时,信息纯度最小,评价结果的确定性最小。从评价值的直观观察来看,当某个评价结果中的评价值比较接近时,即评价值波动较小时,对评价结果做出确定性排序的概率越小,特别是当评价值相等时,将无法做出确定性排序。而当评价值之间的差别比较明显时,即评价值波动较大时,对评价结果做出确定性的排序概率越大。

1.2 基于Gini准则的组合评价方法的研究步骤

基于以上分析,可以归纳出基于Gini准则的客观组合评价方法的评价步骤,如下:

步骤1确定评价对象,评价指标体系,收集相关数据。

步骤2选择单一评价方法集,并进行评价。

步骤3运用Kendall检验来检验单一评价方法集是否一致。如果不一致则返回步骤2,重新选择单一评价方法集。

步骤4计算每种单一评价方法的信息纯度dj,计算公式如下:

(1)

步骤5根据信息纯度dj,确定每种单一评价方法的权重wj,计算公式如下:

(2)

步骤6根据每种单一评价方法的权重wj,求组合评价值zj,计算公式如下:

(3)

步骤7根据评价值对评价对象进行排序。

2 以高技术产业技术创新能力评价为例的实证研究

2.1 确定评价对象和评价指标体系

高技术产业包含的各产业的技术创新活动具有相似性,因此本文以高技术产业作为研究对象。考虑到数据的可得性和可比性,对比高技术产业(制造业)分类(2013)和相应的统计年鉴,经过筛选保留其中的17个二级产业,作为评价对象,产业选取结果见表1。为了便于分析,用英文字母来表示产业。

表1 评价产业及对应英文字母

表2 高技术产业技术创新能力评价指标体系

参考相应的文献[2,4,22~24],从产业技术创新投入能力、产出能力和支持能力三个方面来构建高技术产业技术创新能力评价指标体系,见表2。查阅《中国高技术产业统计年鉴2015》,对相关数据收集整理,得到2014年17个产业的评价指标原始数据。

2.2 单一评价方法集的确定

确定评价对象和评价指标体系之后,选取熵值法、理想解法、灰靶理论、突变级数法和变异系数法构成单一评价方法集分别对17个产业的技术创新能力进行评价。设有n个评价对象,s个评价指标,m种单一评价方法,则待评价的矩阵为H=(hij)n×s。

(1)熵值法

熵值法的核心是根据指标数据传递给决策者的信息量的大小在总信息量中所占权重的大小进行赋权。其计算步骤如下:

a)对数据进行标准化处理,公式如下:

(4)

b)计算第j个指标下第i个评价对象在该指标中所占的比重:

(5)

c)计算第j个指标的信息熵值:

(6)

d)计算第j个指标的差异系数:

gj=1-ej

(7)

e)计算各指标的权重:

(8)

f)计算综合评价值

(9)

按照综合评价值对评价对象进行排序,评价值越大,排序越靠前。

(2)理想解法

理想解法又称为TOPSIS法,该方法通过构造评价对象的正负理想解,并计算每个方案到理想方案的相对贴近度,来对评价对象进行排序,选出最优方案。其计算步骤如下:

a)根据熵值法确定的指标权重wj,计算加权标准化矩阵

(10)

b)确定正理想解和负理想解。正理想解取所有被评价对象的最满意值,负理想解取所有被评价对象的最不满意解。

正理想解:

(11)

负理想解:

(12)

c)计算到正理想解和负理想解的距离。

到正理想解的距离:

(13)

到负理想解的距离:

(14)

d)计算各方案的相对贴近度

(15)

按照相对贴近度Ci的大小,对各评价对象优劣程度进行排序。相对贴近度大着为优,相对贴近度小者为劣。

(3)灰靶理论

灰靶理论的核心在于靶心的构建,然后计算各评价对象与靶心之间的接近程度,得出靶心度,按照靶心度进行评价,步骤如下:

令wi为模式,w(k)为指标序列wi=(wi(1),wi(2),…,wi(s)),令POL(max),POL(min),POL(mem)分别为极大值、极小值和适中值极性,则:

3)当POLw(k)=POL(mem),取w0(k)=u0(指定值)。

称序列w0=(w0(1),w0(2),…,w0(s))为标准模式

靶心系数为

(16)

靶心度为

(17)

根据靶心度的大小,对评价对象进行排序,靶心度越大排名越靠前。

(4)突变级数法

突变级数法以初等突变模型为基础,同时结合了模糊隶属函数的思想。目前,主要有以下三种常见突变模型的势函数:

当上层指标由2个下层指标表示,可视其为尖点突变系统,势函数为:

f(x)=x4+ax2+bx

(18)

若a比b重要,则同层控制变量的左右顺序为a、b。

当上层指标由3个下层指标表示,可视其为燕尾突变系统,势函数为:

(19)

若重要性为a>b>c,则同层控制变量的左右顺序为a、b、c。

当上层指标由4个下层指标表示,可视其为蝴蝶突变系统,势函数为:

(20)

若重要性为b>c>a>d,则同层控制变量的左右顺序为b、c、a、d。

(5)变异系数法

变异系数法的基本思想是根据观测值的变异程度,考察其达到平均水平的难度,如果难度较大,则表明该指标有能力明确区分各评价对象,则该指标应赋予较大的权重。其评价步骤如下:

a)运用(9)式对数据进行标准化处理

b)计算各指标的平均数与标准差

(21)

(22)

c)计算各指标的变异系数和权重

(23)

d)各评价对象总得分的计算

(24)

运用以上五种评价方法对高技术产业技术创新能力进行评价,评价结果见表3。表3中EV代表评价值,R代表排名。

2.3 单一评价方法集的一致性检验

用Kendall协和系数检验,来检验熵值法、理想解法、灰靶理论、突变级数法和变异系数法的评价结果的一致性。Kendall协和系数检验的步骤分为三步:

(1)提出假设。假设H0:所选的评价方法不具有一致性;H1:所选的评价方法具有一致性。

(2)构造统计量。构造统计量χ2为:

χ2(n-1)=m(n-1)W

(25)

(26)

xij表示第i个评价对象在第j种评价方法下的排名。

(3)一致性检验

2.4 基于Gini准则的客观组合评价方法的评价结果

按照基于Gini准则的客观组合评价步骤中的步骤4到步骤7对以上所确定的五种单一评价方法的评价值进行组合评价。其中,根据公式(1)和(2),可以得到熵值法、理想解法、灰靶理论、突变级数法和变异系数法的相应权重,分别为w=(0.2098,0.2168,0.1870,0.1823,0.2041)。通过对权重进行分析可以发现:灰靶理论和突变级数法的权重较小,表明这两种评价方法得到的评价值波动较小,即评价结果的信息纯度较低,其评价结果的确定性不高,评价效果较差;而理想解法的权重最大,表明该评价方法得到的评价值波动较大,即评价结果的信息纯度最高,其评价结果的确定性较高,评价效果较好。得到每种单一评价方法的权重之后,按照公式(3)对五种评价方法的结果进行客观组合评价,得到组合评价值,并按照评价值的大小进行排序,进而得到最终的评价结果,见表3。

表3 五种评价方法和基于Gini准则客观组合评价方法的评价结果

3 与其他组合评价方法的相对有效性比较

3.1 组合评价方法的相对有效性分析方法

以上的实例分析证明了基于Gini准则的客观组合评价方法的可行性和可操作。接下来检验基于Gini准则的客观组合评价方法与其他组合方法相比的有效性,选取郭亚军等[25]提出的相对有效性方法。其基本思想与计算方法如下:

假设评价对象客观上存在正确的优劣排序。虽然无法保证第j种单一评价方法得出的排序结论是最正确的,但作为一种评价方法,其结果却有可能是最正确的,假设其排序结论是最正确的概率为pj,且对不同的单一评价法,概率pj有可能相同,也有可能不同。

假设n个评价对象在m种单一评价方法的评价结论下构成的排序矩阵为:

(27)

若λkj≥0则第k种组合方法是正有效的,若λkj≤0则第k种组合方法是负有效的,即无效的。

由于x1,x2,…,xm中任意一个排序结论xj与其余m-1个排序结论的整体一致程度是不一样的,基于大数法则的角度考虑,这种一致程度越高,其成为x(0)的相对可能性越大,因此可以依据它来确定概率pj,并选用斯皮尔曼(Spearman)等级相关系数对一致程度进行衡量,其计算公式为

(28)

式中ρjl表示第j种排序结论与第l种排序结论的等级相关系数,di为该两种评价方法对第i个评价对象排序的等级差。

(29)

(30)

(31)

3.2 相对有效性的计算结果及其分析

为了检验基于Gini准则的客观组合评价方法的有效性,需要与其它组合评价方法相比较。为此,分别选取平均值法、Borda法、Copeland法、偏差平方最小法、整体差异组合法和基于漂移度的组合评价方法进行有效性比较。

运用以上六种组合评价方法对上述例子中的五种单一评价方法的评价结果进行组合评价,评价结果见表4。根据表4的结果和公式(27)到(31)对七种组合评价方法的相对有效性进行检验。得到相对有效系数和等级相关系数矩阵分别见表5和表6。

表4 七种组合评价方法的评价结果

表5 相对有效系数表

表6 等级相关系数矩阵表

通过表6计算出概率向量p=(0.2165,0.2046,0.2120,0.1529,0.2140),依据表5和概率向量p,可以计算出平均值法、Borda法、Copeland法、偏差平方最小法、整体差异组合法、基于漂移度的组合评价方法和基于Gini准则的组合评价方法的概率相对有效度向量τ值,结果如下:τ=(-0.0639,-0.0639,-0.0639,0.0159,-0.0974,-0.0521,0.0159),由τ值可知,各组合评价法的相对有效性从高到低排序为:基于Gini准则的组合评价方法-偏差平方最小法≻基于漂移度的组合评价方法≻平均值法-Borda法-Copeland-法≻整体差异组合法。另外基于漂移度的组合评价方法、平均值法、Borda法、Copeland法、整体差异组合法的值为负,表明它们与其他组合评价方法相比是相对无效的,而基于Gini准则的组合评价方法和偏差平方最小法的τ值为正,表明它们与其他组合评价方法相比是相对有效的,且两者的τ值相同,表明两者的有效性相同。通过相对有效性检验分析,证明了基于Gini准则的组合评价方法与其他组合评价方法相比的相对有效性。基于Gini准则的组合评价方法和偏差平方最小法的排序顺序相同,最终确定了高技术产业17个产业技术创新能力的排名。

4 结论

针对多方法评价结论的非一致性问题,本文把Gini准则引入到组合评价之中,提出了基于Gini准则的客观组合评价方法。该方法可以计算出每种单一评价方法的信息纯度,然后根据信息纯度的大小,确定组合权重,最后进行组合评价。该方法具有以下特点:

(1)该方法可以计算出每种单一评价方法的信息纯度,通过信息纯度的大小可以衡量每种单一评价方法的评价效果。

(2)该方法为客观组合方法,在进行评价时需要相应的客观数据,从一定程度上避免了人为因素的干扰,突出了让数据说话的客观评价思想,使组合评价结果更加可信。

(3)该方法是根据每种单一评价方法的评价值进行组合评价的,在最大限度上利用了评价结论所提供的信息。

(4)该方法计算过程简单,且操作过程容易,易于通过计算机实现。

(5)通过实例分析,该方法与其他方法相比具有更高的有效性。因此,把Gini准则引入到组合评价方法之中具有可行性,其为解决多方法评价结论的非一致性问题提供了新的思路,是组合评价方法研究的有益补充,可以推广到客观组合评价方法之中。

猜你喜欢

纯度排序准则
排序不等式
退火工艺对WTi10靶材组织及纯度的影响
硫代硫酸钠置换滴定法测定高铁酸盐的纯度
恐怖排序
具非线性中立项的二阶延迟微分方程的Philos型准则
节日排序
基于Canny振荡抑制准则的改进匹配滤波器
间接滴定法测定氯化铜晶体的纯度
学学准则
一图读懂《中国共产党廉洁自律准则》