APP下载

基于灰关联-秩相关的绿色经济评价指标体系构建

2018-07-16李战江

统计与决策 2018年11期
关键词:经济评价海选关联度

石 震,李战江,刘 丹

(内蒙古农业大学 经济管理学院,呼和浩特 010010)

0 引言

在对各种经济指标评价的过程中,运用合理、科学、客观的指标筛选方法有着不容忽视的作用,筛选出来的指标如果不能很好地代表原始信息的含量,那么构建的指标体系对于研究的目的或者经济发展状况的评价与预测就没有任何的意义。以坚持全面促进协调可持续发展为宗旨,绿色经济评价指标体系的构建就是从海选的绿色经济指标中筛选出最具代表性的评价指标,筛选出的指标必须能对绿色经济评价结果有重要作用。

国际权威机构对经济发展评价指标的研究主要包括:世界银行工作组(2011)[1,2]就世界经济发展和非洲经济发展的现状与趋势构建的指标体系;联合国发展计划组织(2002)[3]就人类发展报告进行的指标体系研究;欧洲发展研究和培训机构协会(1991)[4]以反映经济可持续发展的指标进行了研究。因为这些经济评价指标体系是由国际权威组织发布,其优点就是权威性很强,在指标的选取方面具有重要的参考价值。但这些经济评价指标体系主要是综合了不同国家的发展能力,因此其不足之处就是无法具体对每个地区的区域经济发展状况进行评价。

而关于经济发展评价指标体系的代表性研究有文献[5,6]。此类经济评价指标体系的方法可以较好地对该地区的经济效益和经济发展能力做出评价,但是其弊端是没有考虑经济评价指标间可能存在共线性的问题。

关于经济发展评价指标体系的筛选方法包括:(1)主观法筛选经济发展评价指标体系[7,8]。其优点是可以使专家以自己的专业知识为背景,加上丰富的经验以及经济发展规律挑选出能够反映经济内涵的重要指标,但主观筛选法的弊端是无法消除挑选出的评价指标具有信息重复性。(2)客观法筛选经济发展评价指标体系[9-11]。其优点是使用定量的方法,通过具体的数据分析,科学、客观地选出重要的影响经济发展的指标。但是由于每种定量方法都有自己的不同原理和应用的前提条件,因此客观筛选方法的弊端:一是使用单一的定量方法无法保证筛选出的经济指标是合理的,二是使用单一的定量方法可能会将数据变化幅度较小,但是对经济发展起着重要影响的指标删除。

针对现有的研究方法对指标筛选存在的不足,本文依照绿色经济的发展内涵对经济评价指标进行海选与初步筛选,然后通过灰色关联和秩相关的分析方法逐步筛选指标,在经济发展这一反映社会总体运行态势的准则层下又细分了包括经济结构、经济发展效益、经济运行质量三个准则层在内的共计35个指标。

1 构建原理

1.1 海选和初步筛选的思路

(1)准则层和指标层的构建思路

在借鉴了国内外文献如何构建绿色经济评价指标体系基础上,本文通过设置经济结构、经济发展效益、经济运行质量三个准则层来体现绿色经济的内涵以及指标选取时所遵循的原则。在指标选取过程中,参考国内外文献中出现频率较高的绿色经济评价指标,按照可持续发展目标在每个准则层下选取适合该准则层的绿色经济发展评价指标。

(2)初步筛选思路

在指标海选的过程中,对于某些绿色经济发展指标样本,如果缺失的数据占到该指标层总数的1/3,就要对这些指标进行剔除。对能获得样本观测值的海选评价指标进行下一步的指标模型构建,确保初步筛选出来的指标有客观准确的数据作支撑,为接下来定量筛选奠定良好基础。

1.2 灰关联-秩相关的筛选思路

灰色关联分析方法适用于选取的样本空间小、指标关系模糊的评价体系。利用简单的加权思想计算灰色关联度。灰色关联度越大,说明该指标包含的原始信息量就越丰富。通过删除与阈值相比关联度小的指标,保留与阈值相比关联度大的指标,第一轮定量筛选出具有最大信息量的评价指标。

通过秩相关的分析方法合理弥补了灰色关联没有考虑指标之间可能存在信息共线的不足。而且秩相关分析的方法符合指标不是完全服从正态分布的实际情况,从而筛选出信息不重复且具有显著分辨能力的绿色经济发展评价指标,这是绿色经济评价指标的第二轮定量筛选。

通过灰色关联+秩相关分析反映了绿色经济评价指标定量筛选的组合思路。其好处一是精简了海选指标的数量,二是保证了最终筛选出的绿色经济评价指标对原始的信息量具有高度的替代性且无信息重复的特点。

绿色经济评价指标体系构建原理如图1所示。

图1 绿色经济评价指标体系构建的原理

2 构建方法

2.1 筛选前的数据标准化

(1)正向绿色经济指标的数据标准化公式

设:yij表示第i个样本的第j个绿色经济指标值,xij表示第i个样本第j个标准化后的绿色经济指标观测值,s表示观测对象的数目。正向绿色经济指标数据标准化计算公式为[10]:

(2)负向绿色经济指标的数据标准化公式

负向绿色经济指标数据标准化公式为[10]:

式(2)中符号的含义与式(1)相同。

2.2 定量筛选的灰色关联方法

灰色关联分析的具体步骤是:

(1)确定比较数列

假设有w个被评价对象,每个被评价对象有m个指标,则令Xkj表示第k个对象第j个指标的标准化后的数据,Xk=(Xk1,Xk2,…Xkn)就是以k个被评价对象m个指标的初始数据构成的向量。

(2)确定参考数列

由于选取的指标之间没有明确的因果关系,所以依次把各个指标作为参考数列与比较数列进行比较,参考数列记为X0,所有的指标构成的参考向量是{x0(t)}={x01,x02,x03…x0n}。

(3)设:△0p表示t个参考数列与p个比较数列差的绝对值,X0(t)表示参考数列的数值,Xp(t)表示第p个比较数列的数值。逐个计算比较数列与参考数列的绝对差数列,则△0p(t)为[9,10]:

式(3)的作用是可以把两个数列之间的差值作为衡量关联度大小的标准。

(4)计算关联系数

设:ξ0p(t)表示参考数列与比较数列的关联系数;分子的△(min)表示对第p个比较数列,把n个△0p(t)中的最小值记为△0p(min),对于n个比较数列,把△0p(min)记为△(min);分子中的ρ表示分辨系数;分子的△(max)表示对于第p个比较数列,把n个△0p(t)中的最大值记为△0p(max),对于n个比较数列,把n△0p(max)个记为△(max),ξ0p(t)的计算公式为[9,10]:

式(4)中,当ξ0p(t)=1,关联系数最大;ξ0p(t)=0,关联系数最小。由此可知,关联系数ξ0p(t)的区间为0≤ξ0p(t)≤1。

式(4)关联系数ξ0p(t)的作用是反映两个指标数列之间的紧密程度。

式(4)中分子ρ代表分辨系数,它的作用是削弱△(max)由于过大而导致信息失真的影响,ρ的变化范围是0<ρ<1,一般取值为0.5。

(5)计算关联度

设:r0p表示曲线Xi与参考数列X0的关联度,ξ0p(t)的含义同式(4)一样。根据ξ0p(t)求出各个母序列关联系数的均值即关联度,则 r0p为[9,10]:

式(5)的好处在于各个指标的信息量可以得到集中反映,因为指标之间的关联程度是由n个关联系数来体现的,信息比较分散,所以求均值是常用的集中信息量的处理方法。

2.3 定量筛选的秩相关方法

(1)秩相关系数的计算

设:ρs表示秩相关系数,di表示两两指标之间的秩次之差,di=Xi-Xj,n 为指标的对数,则ρs的计算公式为[10]:

Spearman秩相关系数描述的是两个指标变量之间联系紧密程度大小的一种统计指标,随着两个变量之间的变化趋势愈来愈接近线性的单调函数,秩相关系数的绝对值也越来越大。

式(6)的好处是Spearson秩相关系数对数据的分布并没有严格的要求,它具有非参数的性质,更符合实际中数据的特点。

(2)秩相关系数临界值的选取

本文将衡量秩相关系数的临界值设为0.9,原因一是主流文献中临界值设定的标准一般都是0.9。二是如果选取的临界值太大,无法起到精简指标的作用,而且在降低指标之间的信息重叠上效果并不显著,若是临界值设定得偏小,可能将那些没有信息重复的指标误删,影响最终绿色经济指标体系的建立。

(3)信息重复的筛选标准

当指标之间的秩相关系数绝对值大于0.9,说明这两个指标之间存在着高度的相互替代性,此时应删掉信息重复指标中灰色关联度小的指标。

这样客观筛选标准的好处一是避免误删除对绿色经济评价影响大的关键性指标;二是保证了筛选出的绿色经济评价指标既信息不重复又信息损失最小。

表1 绿色经济发展的指标数据及筛选结果

2.4 指标体系合理性的判定方法

(1)判定原理

主成分-信息熵的信息贡献率的测算思路是:首先计算筛选出的绿色经济评价指标体系的信息含量,其次计算海选的绿色经济评价指标体系的信息含量,最后两个信息含量的比值就是筛选出的绿色经济评价指标体系的信息贡献率[12]。

指标体系合理性的判定标准[12]:若绿色经济评价指标体系的信息贡献率大于80%,则说明筛选出的绿色经济评价指标体系既精简了指标个数,又绝大部分保留了原始指标信息含量,证明筛选出的绿色经济评价指标体系是合理的。

(2)判定方法

步骤1:对标准化打分后的海选绿色经济评价指标数据进行主成分分析,按照累积贡献率100%的原则选取主成分的个数,得到主成分数据fij,其中fij表示第j个主成分变量Fj的第i个观测的数据;

步骤2:对主成分数据fij进行打分,计算打分值zij,其计算公式为[12]:

步骤3:计算海选的绿色经济评价指标体系的信息量。设:I(X1…Xp)表示海选的绿色经济评价指标体系的信息量。其计算公式为[12]:

步骤4:对筛选出的绿色经济评价指标体系重复以上步骤1至步骤3,计算得到筛选出的绿色经济评价指标体系的信息量。

步骤5:计算筛选出的绿色经济评价指标体系的信息贡献率。设:X1…Xp表示绿色经济海选评价指标体系;X1…Xw表示最终构建的绿色经济评价指标体系。则筛选出的绿色经济评价指标的信息贡献率测算公式为[12]:

3 指标体系的构建与实证

3.1 构建的基础

(1)绿色经济评价指标的初筛

在剔除缺失数据占到该指标层总数1/3的绿色经济评价指标之后,建立了经济结构、经济发展效益和经济运行效率三个准则层共计35个海选绿色经济指标体系,如表1第2~3列所示。

(2)绿色经济评价指标原始及标准化数据

指标的原始数据来源于内蒙古统计局2015年的统计年鉴[13],各绿色经济评价指标的原始数据列于表1第1~35行的第5~16列。

根据表1第4列注明的指标性质,将表1中第5~16列的正向指标原始样本数据代入标准化公式(1)、负向指标原始样本数据代入标准化公式(2),得到标准化后的指标数据处理值,结果列入表1第17~28列各指标对应的行。

第一次运用灰色关联的指标筛选方法将各个绿色经济评价指标进行第一轮的分析和筛选,将筛选的结果填入表1第29列,将使用灰色关联分析方法保留下来的指标继续使用秩相关的分析方法进行下一轮的指标筛选,将筛选的结果列于表1第30列。

3.2 灰关联分析筛选指标

(1)计算关联系数

将表1中第17~28列标准化后数据代入式(3),得到参考数列与比较数列差值的绝对值。在n个△0p(t)中找出最大差值△(max)和最小差值△(min),依次将X1,X2…X35分别作为母序列,计算和剩余比较数列的关联系数,然后带入公式(4)求得关联系数ξ0p(t),结果见表2第2~36列。

表2 灰色关联系数

(2)计算关联度

将表2中第2~36列的数据代入式(5),依次计算比较数列与母序列的关联度,通过r0p来衡量各绿色经济指标之间的相近程度。结果填入表3第3列指标对应的行。

(3)灰色关联指标筛选

灰色关联筛选指标的依据,其界定阈值通常是所有母序列灰色关联度的平均值。删除低于灰关联度均值的指标,保留大于灰关联度均值的经济评价指标,此处的阈值是表3第3列指标的平均值,根据筛选的原则把结果填入表1第29列“第一次筛选”中。

将计算出来的关联度值r0p从小到大排序,列入表3第4列。

表3 灰色关联分析

3.3 秩相关分析筛选指标

将灰色关联法筛选出的20个绿色经济发展指标代入公式(6),利用sas软件计算得到20个绿色经济评价指标的秩相关系数矩阵。

需要指出的是计算秩相关系数的20个绿色经济发展的指标数据来源是表1第17~28列标准化的数据,然后将其代入公式(6)得到秩相关系数。

将绿色经济指标之间的秩相关系数在0.9以上的指标以及它们之间的秩相关系数列于表4第1~3列。依据筛选的原则,将筛选的结果列入表4第4列,用“第二次筛选删除指标”标出。

表4 秩相关分析

通过对第一次采用灰色关联的分析方法筛选出的20个绿色经济发展指标进行秩相关分析的第二次筛选,20个绿色经济发展指标最终删除8个,保留12个。保留的绿色经济评价指标体系如表5所示。

表5 构建的绿色经济评价指标体系

3.4 合理性的判定

将表5筛选出的12个指标和海选的35个指标的标准化数据依次代入公式(7)至公式(9),计算得到筛选出的12个绿色经济评价指标相对于海选的绿色经济评价指标的信息贡献率为0.95。

依据以上判定标准,由于筛选出的12个绿色经济评价指标的信息贡献率为0.95,大于临界值0.8,所以筛选出的12个绿色经济评价指标构成的指标体系是合理的。

因此,表5的绿色经济评价指标就是本文最终构建的绿色经济评价指标体系。表5显示,本文最终构建的绿色经济评价指标体系由3个准则层共计12个指标组成。

4 对比分析

绿色经济评价指标体系构建的对比研究中,本文选用了一篇相关文献——何新安的《粤东北山区绿色经济发展实证分析》中的绿色经济评价指标体系作为对比研究对象,进一步揭示本文与现有研究的差异。

选取的文献对绿色经济指标进行综合评价时所运用的方法是熵值法。为了更加直观地反映出两种方法在最终构建的绿色经济评价指标上的差异,把本文作为参考文献,上述提到相关文献作为比较文献,在最终指标的筛选结果上具体说明二者的不同,见表6。

表6 对比分析

通过表6可以看出,两种方法围绕绿色经济评价指标体系的构建最终指标体系有以下差异:

(1)比较文献中有“未选用”的指标可能与最初准则层的划分有关系,比较文献没有设置经济发展效益和经济运行效率这两个准则层。本文的准则层设置方法具有经济含义清晰的特点。

(2)对于本文使用灰色关联和秩相关的双重筛选方法最终构建的12个评价指标,在用熵值法时部分却予以删除,原因主要是熵值法计算的是单个指标对评价体系影响程度的大小,忽略了指标之间可能会存在共线性的问题。而本文采用的方法既避免了上述提到的问题,又保留了对最终指标体系构建起着关键性作用的指标。

5 结论

本文通过灰色关联和秩相关的双重筛选方法,构建了最终对绿色经济发展有着显著影响作用的指标体系,最后又运用主成分信息熵的方法测算了最终的指标评价体系是否合理。数据分析表明:筛选出的评价指标能够反映出原始指标95%的信息量,而评价指标仅占海选指标的34%。①通过灰色关联的分析方法删除反应原始信息量能力较差的指标,保证筛选出的评价指标能够充分解释原始指标所包含信息。②通过秩相关分析删除秩相关系数大的两个指标中灰色关联度较小的那个指标。保留关联度大的指标,保证了最终的经济评价指标体系既具有代表性又具有精简性。③根据主成分和信息熵的方法测算信息量的大小,评价最终绿色经济评价指标体系构建是否合理。

猜你喜欢

经济评价海选关联度
基于熵权法改进的TOPSIS法和灰色关联度分析的压榨脱水过程优化研究
建设项目经济评价中的问题及解决策略
甘肃敦煌市新泉北钒多金属矿床概略经济评价
冰壶项目“跨界跨项”选材海选阶段关键问题分析
中国制造业产业关联度分析
中国制造业产业关联度分析
基于现金流量表对投资项目的经济评价
谢文骏与刘翔110m栏分段成绩与总成绩的灰色关联度对比分析
青海省湟中县恰罗石英岩矿床技术经济评价
成都站 海选现场