APP下载

中国27个省会城市营商环境评价

2020-09-17

福建质量管理 2020年17期
关键词:省会降维特征值

钱 音

(云南财经大学 云南 昆明 650221)

一、背景及意义

良好的营商环境是吸引外商投资,促进经济发展的基础。近年来,党中央和国务院高度重视营商环境建设工作。评价各地区的营商环境,目的并不仅仅是为了评判地区营商环境的差异,以给投资者提供指导,更重要的是让地方政府认识到自己的优势及存在的问题,以利于对其改善。为了更全面、科学、客观地认识各地区营商环境的现状和问题 ,进一步明确改善和优化的方向,对营商环境进行科学评价就显得非常必要。

通过查阅文献可知,在以往对营商环境的研究中,几乎都是采用因子分析的方法进行综合评价,再通过聚类分析的方式来划分等级,最后根据因子分析得出的综合排名和聚类分析的结果给出一些合理的投资建议和改进方法。本文将利用充分降维方法中的一种算法,即切片逆回归(Sliced inverse regression for dimension,简称SIR)来对指标进行优化,这种方法对变量的提取几乎是不损失信息,并且相比因子分析来说,SIR加入了因变量Y,而因变量对降维后的聚类结果有着重要的影响。

二、营商环境评价指标体系的确定

根据营商环境的国内外相关理论,以及借鉴世界银行提出的指标体系和其他文献中的指标构建体系,本文在选取评价指标时遵循了全面性、系统性、可比性、可量化性原则。在指标选取的过程中,首先对指标项的相关性进行了检验,在排除了相关性较弱的指标后,最终构建了我国27个省会城市评价的指标体系(由于西藏、宁夏、海南、青海四个省因省会城市未进入经济总量前100名城市排行,故不对其进行评价),包括5个一级指标和15个二级指标,由于部分数据缺失严重,因此选取2017年数据,其中人均GDP由于数据缺失,因此重庆和长春采用均值插补法,即2016年和2018年数据的平均值代替。数据主要来源于EPS全球统计数据/分析平台《中国城市数据库》 和《中国城乡建设数据库》以及《中经网统计数据库》,具体见表1。

表1 我国27个省会城市营商环境评价指标

上述15个指标是解释变量X的选取,因为SIR方法还需加入响应变量Y的影响,综合考虑影响营商环境的因素,选取由《中国城市营商环境指数报告》中的营商环境指数得分来作为响应变量Y,它是由中国战略文化促进会、中国经济传媒协会、万博新经济研究院和第一财经研究院在营商环境研讨会上联合发布的。

三、省会城市营商环境评价定量分析

(一)营商环境评价方法

1、切片逆回归(SIR)

本文采用的方法是充分降维方法,该方法的思想是:考虑一维响应变量Y关于P维解释变量X的回归问题,在不假定任何参数模型以及不损失条件分布中所含有的信息的前提下,通过原始数据中高维自变量的一些线性组合来达到降维的目的。切片逆回归降维算法(Sliced Inverse Regression,SIR)是最经典的充分降维方法。SIR是李克昭教授在19991年提出的一种非参数降维方法,该方法与传统的因子分析、主成分分析等降维方法相比有极大的优势,采用切片逆回归的方法避免了维数灾难问题,逆回归是将X相对于Y进行回归,相当于处理一维到一维的回归问题。这样交换X和Y的好处就在于我们可以避开维度的问题。通过考察自变量的每个特征与因变量进行回归,将传统的高维问题转化成多个较为容易解决的一维问题,并使用切片方法融合了自变量与因变量的相关关系。

对于一维响应变量Y关于P维解释变量X=(X1,X2,X3,……,XP)T的回归问题,SIR基于如下降维模型:

(1)

其中,β1,β2,β3,……,βk是未知的P维列向量,ε是均值为0的随机变量并且与X相互独立,f是定义在R(k+1)空间上的一个任意未知的函数。SIR方法的具体算法步骤如下:

(1)对响应变量Y进行排序;

(2)对解释变量X进行标准化,用Z表示,即

(2)

(3)

(4)

(6)令K个最大特征向量(行向量)为(k=1,2,…,K),输出原始比例,是用于确定有效降维(e.d.r)的方向

(5)

上述步骤中,(3)(4)产生标准化逆回归曲线E(Z/Y)的粗略估计;(5)是对主成分分析的权重进行调整,将考虑不同切片中样本大小可能不等的情况;(6)是将比例重新转回到原始比例。

2、聚类分析

聚类分析相比因子分析而言,没有产生新的变量,它是把研究对象视作多维空间中的许多点,并合理地分成若干类,因此它是一种根据变量域之间的相似性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内在组合关系。聚类分析方法在很多多元统计书里面都有详细的介绍,在这里就不做详细介绍。

本文主要是在切片逆回归分析后基于分析得到的因子得分矩阵再做聚类分析,将27个省会城市合理地进行分类,以发现各个城市在营商环境建设发展过程中的差异所在。

(二)实证分析

在对所选取的15个指标进行分析之前,首先,需要对其15个变量进行KMO值检验Bartlett球形检验,KMO检验统计量是用于检验各个变量间相关性强弱的,当这个值越接近1时说明变量之间的相关性就越强,一般KMO值大于0.5就认为通过检验,可以用来做降维分析。利用SPSS20.0软件得到这15个变量的KMO统计值为0.796,大于0.5 ,Bartlett球形检验P值接近于0,所以原始数据通过了检验。

根据前面所介绍的切片逆回归的方法,对变量进行降维,运用matlab2014.a软件运行出最优结果。表3给出了降维后的2个方向及特征值,其它方向上特征值近似为0,Dir1表示第一主方向,Dir1表示第二主方向,因此可以得到通过SIR方法将维数降到了2维。

表2 有效降维方向及特征值

由于降维后的累计方差贡献率目前尚未有好的办法计算得到,对于特征值,我们是这样来定义的:

设A是一个n阶方阵,若存在着一个数和一个非零n维向量x,使得

AX=λX

(6)

则称λ是方阵A的特征值,非零向量X称为A对应特征值的特征向量。因此我们近似地可以将特征值看作是降维后的累计方差贡献率即89.89%,高于因子分析选取主成分82.86%的标准。进而利用标准化后的原始矩阵与有效降维后得到的特征向量矩阵做矩阵变换,得到因子得分矩阵,最后利用因子得分矩阵做聚类分析,聚类分析的方法选择“ward.D2”法。根据聚类结果和各地区之间的相似性,可以将其分为四类,结果如下表4。

表3 27个省会城市聚类分析结果

从聚类的结果来看,和《2019年中国城市营商环境指数报告》中的结果吻合。营商环境排名前10的分别是上海、北京、广州、南京、武汉、杭州、天津、成都、西安、合肥,与本文分析的结果一致。并且从降维效果上来看,SIR降维方法将维数降到了2维,而因子分析方法将其降到了3维,且SIR方法所能解释的变量部分更多,因此可以认为SIR方法在相比传统降维方法上分析结果更为精确。

四、结论

以上基于SIR的数据降维算法和聚类分析来对中国27个省会城市的营商环境进行分析,结果显示北上广深一线城市营商环境排名靠前,且有良好的营商环境,二线城市次之,三四线城市排名较为靠后一些。由于中国地理因素,人文环境和经济发展之间的差异,导致东、中、西三大地区的省会城市营商环境有着明显的差异,营商环境与经济发展之间的关系是相互作用的,相对来说东部沿海城市的营商环境会更好一些,更能吸引外商投资,并且在政府效率、人力资源、市政环境等方面都占据一定的优势,因此排名大都相对靠前一些。而相对于排名靠后的乌鲁木齐市、呼和浩特市和兰州市来说,这几个城市在政府办事效率和人力资源方面相对弱一些,使得整体的经济总量排名靠后。

总的来说,省会城市营商环境各具特色,其中昆明、贵阳、郑州的后发优势相对较为明显。此外,除宁夏、西藏、海南、青海这四个地区的省会城市未进入经济总量排名前100外,其他27个地区的省会城市排名都在前一半。优化营商环境是一项需要付出长期行动的艰巨任务,不但要注重自然环境等的改善,同时也要全面提升人才的竞争力、改善政府政策的实施,提高要素质量,降低企业经营成本 ,为企业发展创造一个有利的条件,为人民办事提供一个便利的服务。

猜你喜欢

省会降维特征值
混动成为降维打击的实力 东风风神皓极
雍正、乾隆朝省会书院制度新探
一类内部具有不连续性的不定Strum-Liouville算子的非实特征值问题
一类带强制位势的p-Laplace特征值问题
单圈图关联矩阵的特征值
A Trip to Xi’an
降维打击
把省会城市群打造成强增长极
省会党报一版编辑的三个关键词
一种改进的稀疏保持投影算法在高光谱数据降维中的应用