基于因子分析的安徽省贫困县脱贫绩效评价研究
2019-07-24戴正本任森春何良杰
戴正本,任森春,何良杰
(安徽财经大学 金融学院,安徽 蚌埠 233000)
0 引 言
党的第十九次全国代表大会报告明确提出,2020年要实现我国贫困人口全部脱贫,精准脱贫是我国全面建成小康社会决胜期的重要战略目标之一.近年来我国脱贫工作取得显著性进步,正在一步步向着最终目标迈进,但是具体到各个地区,脱贫的成效存在差异,所以有必要对脱贫绩效进行评价,挖掘不同地区脱贫工作存在的优缺点,取长补短,争取早日实现全面脱贫的宏伟目标.脱贫问题是政府工作的重心,安徽省地跨长江、淮河,安徽省贫困县分布集中于大别山连片特困区以及皖北地区,顺利完成贫困县的脱贫攻坚任务是促进安徽省经济发展的首要任务.因此本文对选取的安徽省16个贫困县脱贫效果进行评价,分析扶贫效率高低存在的主要问题,以期在脱贫攻坚决胜期能够取得更加辉煌的成绩.
1 文献综述
有关政府的扶贫政策对贫困的改善效果是显著的,一方面,政府解决贫困问题的有效途径是财政投资,并且财政投资的效率是边际递减的(郭宏宝等,2005)[1];另一方面,过高的政府补助等福利政策会使脱贫绩效下降(孙巍、冯星,2018)[2].周侃、王传胜(2016)以贫困格局和脱贫现状为出发点,分析了不同地区资源承载能力有限,在不同贫困地区应实行差别化扶贫政策[3].祝树民(2016)认为在脱贫过程中,政策性银行对金融扶贫起着引领作用,推动了贫困地区的经济发展[4].李文静等(2017)利用联合国IFAD扶贫项目调研的权威数据构建资产指数体系进行了定量分析,结果表明,总体上脱贫效果显著,不同地区存在差异[5].在对脱贫成效评价的相关研究中,有选取某个省作为评价对象,通过第三方评估,得出了较为客观公正的结果(丁先存,2018;段妍珺,2016)[6-7],也有以连片特困区作为研究对象对脱贫绩效进行评价,例如大别山连片特困区等,研究表明脱贫工作均取得了一定的成绩(朱雅寒等,2017;万君,2016)[8-9],还有对少数民族地区金融扶贫效果进行研究,提出通过发展民族绿色生态产业,发挥特色资源优势来提升脱贫效果(杨浩等,2016)[10].大量的文献研究了脱贫的总体效果,且采用定性指标作为判别准则较多,而在脱贫中对县域经济发展水平的评价相关研究较少,本文在前人研究的基础上,排除了定性指标,统一采用定量指标构建因子评价模型,对县域经济发展水平进行实证分析,得出各县的脱贫绩效.
2 模型的理论基础
在当前这个大数据信息时代,数据给我们的学习生活带来了便捷,但同时大量的数据使得我们对数据的分析难度增加,在众多的观测数据中,不同变量间可能会存在相关性,或者说,不同变量之间互相影响.因子分析是根据变量间的相关关系对原始变量进行分组,以达到同组内各变量之间的相关性较高而不同组之间的相关性较低的目的,并且通过几个潜在的主要因子来反映所有数据包含的信息.因子分析的优点是不必剔除某些变量或损失数据,确保数据完整,通过减少变量的个数突出指标之间的内在联系,在综合评价方面有着广泛的应用.本文基于上述思想,根据指标的相关性大小进行分组,进一步找出影响贫困县经济发展的几个综合指标,由评价指标体系对各个贫困县脱贫绩效进行综合评价,得出各县经济发展水平高低排名并分析相关原因.
因子分析将原始变量分为公共因子部分和独特因子部分,设X=(x1,x2,…,xp)为观察到的随机向量,F=(F1,F2,…,Fm)是不可观测的向量,一般来说m
X1=u11F1+u12F2+…+u1mFm+ε1
X2=u21F1+u22F2+…+u2mFm+ε2
⋮
Xp=up1F1+up2F2+…+upmFm+εp
也可用矩阵的形式表示为:
X=U·F+ε
式中Xi(i=1,2,…p)和Fj(j=1,2,…m)都是标准化变量.模型中的upm称为因子“载荷”,是第i个变量通过某种变换后在第j个因子上的负荷,反映了第i个原变量在第j个公共因子上的相对重要性,根据此含义,所以矩阵U称为因子载荷阵,也就是待估的系数矩阵,表示为:
同时,因子分析模型要满足下列条件:
①m≤p;
②Cov(F,ε)=0,即F和ε不相关;
3 构建评价指标体系
本文研究的是安徽省贫困县脱贫绩效,可以以各县经济发展水平为目标来进行评价,首先对各指标进行初步的分析,对选取指标的维度进行区别,剔除异常指标后,最终从居民生活水平、收入水平、各县投入产出水平以及就业状况四个方面研究贫困县经济发展水平的绩效评价,具体指标见表1.选取安徽省16个国家级贫困县作为样本构建评价指标体系,分别为潜山县、太湖县、宿松县、岳西县、临泉县、阜南县、颍上县、砀山县、萧县、灵璧县、泗县、寿县、霍邱县、舒城县、金寨县、利辛县.
表1 安徽省贫困县脱贫绩效评价指标体系
图1 碎石图
4 安徽省贫困县脱贫绩效评价
(1)数据来源
本文选取的16个贫困县的15个评价指标的数据来自安徽省统计年鉴、中经网统计数据库(中国县域经济数据库),数据来源准确可靠,具有可研究意义.
(2)无量纲化处理
在评估脱贫绩效的指标选取上,本文尽量用定量指标代替定性指标,不同的定量指标数据往往有不同的量纲,为了去除数据的单位限制,便于不同单位或量级的指标能够比较和运算,可以利用数据离差标准化的方法将各指标转化为无量纲的纯数值.由于所选取指标均为正向、定量指标,无量纲化处理公式如下:
其中,dij是第i个贫困县的第j个指标经过无量纲化处理后的数据,在0到1之间,xij是第i个贫困县的第j个指标的实际观测值,xjmax是第j项指标最大值,xjmin是第j项指标最小值.
(3)适用性检验
在做因子分析之前,运用KMO和Bartlett检验作为统计检验方法来判断变量是否适合做因子分析,检验结果如表2所示,KMO统计量为0.824,大于0.5且接近于1,表明变量适合做因子分析;Bartlett检验的显著性近似为0,故拒绝相关系数矩阵是单位阵的假设,同样表明变量适合做因子分析.
表2 KMO和Bartlett检验结果
(4)提取公因子
图1是变量因子分析的碎石图,据图可以看出,前4个因子的特征值均大于1,后面的11个因子的特征值均小于1,一般选取特征值大于1的因子作为公共因子进行后续分析,故有4个公共因子代表其他所有因子.表3反映了变量相关系数的特征值和贡献率,显然前4个因子在特征值大于1的前提下,总累计方差贡献率达到了84%,表明选取的4个主因子足以概括所有指标的信息,有效地反映出各贫困县经济发展水平,进一步突出脱贫效果.综合上述,最终提取出F1~F4共4个公共因子.
表3 相关系数的特征值和贡献率
(5)确定因子载荷矩阵
在因子分析模型中,我们可以由原始样本数据求得载荷矩阵,目的是确定能够解释观测变量之间相互关系的最小因子个数,因子载荷的估计方法有主成分法、主因子法、最小二乘法等多种方法,不同的方法主要是根据不同的信息准则确定的.这里本文选取主成分法进行估计,得到初始因子载荷矩阵,如表4所示.
表4 初始因子载荷矩阵
提取方法:主成分法
(6)因子旋转
在初始因子载荷矩阵中,虽然一个主因子可以概括多个变量的不同信息,但是仅仅只能反映某个变量的部分信息,这种情况可能会使因子变量的现实意义模糊不清.为了让读者对因子变量有比较清晰的认识,采用这样一种方法,即在理想状态下,让某个变量通过矩阵变换后在某个因子上的载荷趋于1,也就是选取的变量能够完全概括所有的信息,相反在其他因子上的载荷趋于0,这样使得各变量的含义更加清楚.变换后,因子变量成为某个变量典型代表,那么它的实际含义也就显而易见.通过软件来实现这种方法,也就是因子旋转,表是通过最大方差正交旋转法对初始因子载荷矩阵进行变换后的结果.
通过表5可以得出:主因子F1在居民储蓄存款余额、地方公共预算支出、粮食作物产量、社会服务机构数、医疗机构床位数等变量上有较大的载荷,而这些指标恰恰反映了该地区居民的生活水平,所以得到的主因子F1命名为生活水平因子;主因子F2在社会消费品零售总额、地方公共预算收入、地方税收收入、金融机构贷款额等变量上有较大的载荷,这些指标反映了地区的收入情况,所以得到的主因子F2命名为收入水平因子;主因子F3在地区生产总值、固定资产投资额、房地产开发投资、规模以上工业企业工业总产值等变量上有较大的载荷,指标中包含了地区投入和产出状况,因此将得到的主因子F3命名为投入产出因子;主因子F4在第二产业就业人数、第三产业就业人数上载荷较大,同样将F4命名为就业状况因子.
表5 方差最大化正交旋转后因子载荷矩阵
旋转方法:方差最大化
(7)计算主因子得分及总得分
因子分析评价模型:
F1=β11x1+β12x2+…+β1pxp
F2=β21x1+β22x2+…+β2pxp
…………………………………
Fm=βm1x1+βm2x2+…+βmpxp
β为因子得分系数矩阵,代入计算可得F1、F2、F3、F4四个主因子得分.然后根据方差贡献率(见表3)确定各主因子权重,主因子F1占综合因子的百分比为48.223/84.002=57.4%,主因子F2占综合因子的百分比为16.745/84.002=19.9%,主因子F3占综合因子的百分比为11.653/84.002=13.9%,主因子F4占综合因子的百分比为7.381/84.002=8.8%.故因子分析评价模型综合得分:
F=0.574*F1+0.199*F2+0.139*F3+0.088*F4
据上述函数模型,将选取的各指标值代入表达式后得到各样本县的最终得分情况和排名,如表6所示,安徽省16个国家级贫困县脱贫绩效排名由高到低为:临泉县、颍上县、阜南县、霍邱县、利辛县、萧县、寿县、灵璧县、舒城县、岳西县、砀山县、泗县、宿松县、潜山县、金寨县、太湖县.
表6 主因子得分和综合得分
续表6
5 结果分析及政策建议
根据因子评价模型得分情况分析知:临泉、阜南两县在居民生活水平方面明显高于其他县,这也是其在最终总得分排名位居前列的重要因素,由此可见,居民生活水平对脱贫的效果有重要影响;在各县收入水平方面,颍上、舒城、金寨、利辛四县位居前列,但导致这几个县的最终排名差别较大的原因可能是政府收入和居民自身收入占比不同造成,过高比例的政府税收收入不利于居民收入水平的提高;在投入产出方面,颍上、砀山、萧县的投入产出水平高,劳动生产要素密集,生产效率高,有利于改善贫困的现状,长期看来利于经济的增长;关于就业状况方面,较好的有太湖、阜南、颍上、寿县等,较差的有岳西、临泉等,有待进一步的提高.另外,总得分排名处于前7名的贫困县综合得分大于0,说明脱贫已取得一定的成效,而对于排名靠后的8个县有更高的提升空间.综合来看,地处大别山连片特困区以及靠近皖北一带的贫困县的经济发展水平有待政府进一步的扶持,多山区的贫困县在发展中处于劣势,交通不便、地理位置等因素使其与其他贫困县相比,脱贫效果的提升空间更大.
6 结束语
本文深入研究了选取的安徽省16个国家级贫困县的脱贫状况,选取了15个相关指标,构建了因子分析评价模型.具有以下几点创新点:第一,对脱贫绩效评价的指标进行了界定,构建合理的评价体系;第二,全部采取定量指标代替部分定性指标,使得到的结果具有一定的科学性;第三,在因子分析的过程中,变量权重、变换矩阵等的确定均由软件生成,具有较强的客观性.本文实证研究存在的不足主要是受模型的局限性,忽略了一些定性指标的影响,缺少实地调研搜集的数据,这在之后的研究中,应当加以改进和完善.