APP下载

基于大数据背景下的脱贫帮扶绩效评价研究

2021-04-06李宇飞陈晓红

关键词:差值居民收入村庄

李宇飞,王 伟,陈晓红

(安徽农业大学经济技术学院,安徽合肥 230601)

1 问题综述

1.1 问题背景

近年来,随着社会的发展,贫困问题获得人们的广泛关注。消除贫困、改善民生、逐步实现共同富裕是社会主义的本质要求,是我们党的重要使命。为了提高扶贫效率,政府部门启动了脱贫帮扶机制。帮扶不仅要考虑帮扶单位的能力,还要考虑帮扶对象的情况,例如:教育情况,居民收入情况,产业的发展状况,居民居住的环境,基础设施建设等。因此,怎样公平公正地评价帮扶绩效成为需要解决的问题[1-7]。

1.2 问题的提出

根据上述背景从统计局数据库选取全国的扶贫数据建立模型解决以下问题:

(1)2015 年的评分与2020 年对应的各项评分是否有着直接或者间接的关联,并分析各个评价指标的对应关系。

(2)根据数据分析,说明哪种类型的哪些帮扶单位在脱贫帮扶上有较高绩效。同时给出不同类型的帮扶单位绩效的排序和脱贫帮扶绩效前十名的帮扶单位编号。

(3)找出哪些帮扶单位分别在居民收入、产业发展、居住环境、文化教育、基础设施等评价指标上帮扶业绩明显,并列出各单项评价指标前五名的帮扶单位编号。

(4)什么因素对评“脱贫先进村庄”荣誉称号有着重要的影响。将数据中的最后10个村的评价分数先进行剔除,然后根据前面的评分数据进行填充,再与剔除的数据对比,并且判断它们是否能评上“脱贫先进村庄”荣誉称号。若将该称号分为一级和二级,它们中的谁可以评上“脱贫先进一级村庄”称号。

2 问题分析

2.1 问题1的分析

根据问题1 中所给的信息和数据对2015 年评分和2020年评分进行分析。

第1步:结合题中的信息对附件中的数据进行分析,并对所用数据进行预处理。

第2 步:基于处理后的数据,对两年的各个指标进行相关性分析,采用皮尔逊相关系数进行计算。

第3 步:利用python 进行程序的编写,计算出各指标之间的相关系数,确定2015 年和2020 年各个指标是否具有一定的联系,并分析它们的对应关系。

2.2 问题2的分析

在问题2 中由于帮扶单位的情况和村庄等基础的不同,仅仅考虑某一年的评分高低是不可以的,我们选用2015年和2020年的数据进行对比分析。

第1 步:对数据进行处理,将帮扶单位的不同类型进行筛选,并求出两者指标的差值。

第2 步:在考虑哪一类帮扶方式绩效高时,我们选取两年中指标的差值来进行判断,差值大的说明变化程度大,进而说明绩效较高,并在绩效较高的单位中进行排序,给出对应的帮扶单位编号。

第3 步:用多属性决策模型求其权重,按绩效对其进行排名,两种方法相互检验。

2.3 问题3的分析

不同的帮扶单位的侧重点有所不同,因此在研究帮扶绩效上有的时候看总的绩效评分可能结果不太明显,在研究不同帮扶单位在不同指标的帮扶业绩上,我们选取2015 年和2020 年的各个指标的数据进行分析。

第1 步:对数据进行处理,获得各个指标的增长值。

第2 步:根据处理后的数据,进行分析。大家都知道斜率的倾斜程度表示这增加的快慢程度,因此我们采用一次好函数拟合模型来进行研究。

第3步:用python编写程序进行求解,得到160个方程,在处理误差方面,采用误差平方和的极小的方法来进行处理。

第4 步:求数据以后,将各个对应的指标的绩效进行排名,并取用表格表示出其中前五名帮扶单位的编号。

2.4 问题4的分析

在第2问基础上,可以知道居住环境和基础设施所占比重较大,因此我们认为这两个指标影响着称号的评估。采用多元线性回归进行预测,通过绩效的排名来判断是否可以评上,并且评上什么称号。

3 问题假设

(1)假设不考虑一些重大自然因素;

(2)假设没有人为因素的影响;

(3)假设所有村庄的得分都为实际得分。

4 符号说明

5 模型的建立与求解

5.1 问题1的模型建立与求解

5.1.1 模型的建立

评分是否有关联需要考虑的指标有很多,而且每种指标对评分的影响程度也有所不同,为研究2015 年和2020 年的各项评分是否有相关性,选取题中所给的居民收入(SR)、产业发展(CY)、居住环境(HJ)、文化教育(WJ)、基础设施(SS)等5 个评价指标来进行相关性分析,用python中的大数据分析来进行求解,同时得到各个指标的对应关系。

因为附件中的数据已经进行了标准化,所以在这里直接进行相关系数的计算,记数据相关系数矩阵为:

根据皮尔逊相关系数公式计算相关系数:

5.1.2 模型的求解

通过python对数据进行处理和相关性分析,得到2015年各个指标和2020年各个指标之间的相关性系数,结果见表1。

表1 五种指标的相关系数

Pearson相关强度的分类见表2。

由各个指标间的相关系数并参照相关强度分类情况知:产业发展,居住环境和文化教育三者的相关系数均在0.6 以上,所以2015 年和2020 年产业发展,居住环境和文化教育的相关性为强相关;居民收入和基础设施的相关系数在0.5~0.6 之间,所以2015 年和2020年的居民收入和基础设施的关联性为中等程度相关;2015 年的总评分和2020 年的总评分的相关系数为0.78,属于强相关。因此在无特殊情况下认为2015年各项指标的评分与2020年各项指标的评分有关联。

表2 相关强度分类

通过数据分析得到各个指标之间的相关系数见表3。

表3 各个指标之间的相关系数

表3中的相关性系数均为正数,所以说各项指标均为正相关。

5.2 问题2的模型建立与求解

5.2.1 模型的建立

每个帮扶对象的情况都有所不同,而且村庄的基础也有所不同,为研究绩效的排名问题,我们采用两种方法来进行判断,第1 种方法,采用差值法,第2种方法,采用多属性目标决策。

在考虑哪一类帮扶绩效高时,选取2年中指标的差值来进行判断,差值大的说明变化程度大,进而说明绩效较高。对数据进行处理和分析,得图1。

图1 差值图

由图1 可以看出在居民收入,居住环境,文化教育和总评分等方面第四类帮扶单位的帮扶效果较为明显即绩效较高。基础设施和产业发展第五类帮扶单位帮扶效果显著。

图2 帮扶单位2015年和2020年各项指标平均值的差值

将被帮扶村庄看作160个集合,称作160个帮扶单位,共有六种(0-5)不同属性类型的帮扶单位,不同属性指国有企业,民营企业等。由图5.2 可以直观看出160个帮扶单位在2015年到2020年各项指标平均值的差值,根据差值可以排出绩效前10 的各类帮扶单位编号见表4-表9,还可以根据总值评出帮扶绩效排名前十的帮扶单位编号见表10。

表4 0类单位绩效排名

表5 1类单位绩效排名

表6 2类单位绩效排名

表7 3类单位绩效排名

表8 4类单位绩效排名

表9 5类单位绩效排名

表10 根据总值评出的帮扶单位绩效排名

根据Saaty提出的决策方案建立多属性决策模型进行分析。

首先,建立合适的指标体系,所选的指标为题中所给的指标,即居民收入、产业发展、居住环境、文化教育、基础设施。

其次确定属性权重。

(I)根据Saaty 等人提出的一致矩阵法,构建出合适的成对比较矩阵,

进而对其进行一致性检验,一致性检验公式:

(Ⅱ)查找相应的平均随机一致性指标RI。对于n=1,…,9,Saaty 给出了RI 的值,RI 值是通过随机方法构造500 个样本矩阵。随机地从1-9 及其倒数中抽取数字构造正互反矩阵,求得最大特征值的平均值λ′max,并定义:

(Ⅲ)计算一致性比例CI,

进而根据公式计算出对应权向量。

①计算矩阵每一行元素的乘积Mi

②计算Mi的n次方根

最后对决策方案集进行归一化处理,采用归一化公式:

5.2.2 模型的求解

通过对矩阵A的分析,求出最大特征值,进而求出对应的特征向量,做归一化处理得到各指标的权重,见表11。

表11 各指标的权重值

同时计算出CI和CR,计算结果为CI=0.0956,CR=0.0853 <0.1,所以通过一致性检验。之后对居民收入、产业发展、居住环境、文化教育、基础设施进行归一化处理,得到归一化后各个属性的属性值。根据最终权值,对附件的帮扶单位绩效进行了排名,所得结果与前面差值法所得结果相同。

5.3 问题3的模型建立与求解

5.3.1 模型的建立

每个帮扶单位在帮扶时侧重点有所不同,为研究帮扶单位在居民收入、产业发展、居住环境、文化教育、基础设施等评价指标的绩效,我们选取2015年和2020年的各个指标和总评分作为本问题的研究对象,先进行数据处理,找到各指标的增长值进行研究。我们采用一次线性拟合来进行求解,得到哪些帮扶单位在脱贫帮扶上绩效较高。

在处理误差上,采用误差平方和达极小来处理,误差平方和表达式为:

显然,误差平方和为待定参数的二元函数,即S会随着k0或者k1的变化而变化,因此参照最小二乘准则,确定待定参数k0和k1的值,使误差平方和S达到最小值。

5.3.2 模型的求解

除了最后10个没有总评分的数据,将剩下的数据对应指标的增长值按照帮扶单位进行拟合,得到160个拟合函数。由于我们选取的是各个指标的增长值,k1表示斜率,表示增长速度的快慢,增长速度越快说明帮扶的业绩越好,所以我们在进行排名时按照k1的变化情况来进行排名排名情况见表12~16。

表12 居民收入指标绩效排名情况

表13 产业发展指标绩效排名情况

表14 基础设施指标绩效排名情况

表15 文化教育指标绩效排名情况

表16 居住环境指标绩效排名情况

通过分析得知:

(1)在居民收入指标中,帮扶业绩提高最明显的是编号为98 的帮扶单位;编号为100 的帮扶单位位居第二位;第三,第四和第五位分别是编号为44,99,56的帮扶单位;

(2)在产业发展指标中,帮扶单位编号为19的帮扶单位在帮扶业绩上位居首位;编号为54 的帮扶单位位居次之;编号为28,110,108 的帮扶单位的帮扶业绩分别位列三,四,五名;

(3)在基础设施指标中,位居帮扶业绩首位帮扶单位编号为75;编号为72的帮扶单位位居第二名;编号为46,35,100 的帮扶单位的帮扶业绩分别排在第三名,第四名和第五名;

(4)在文化教育指标中,帮扶单位编号为53的帮扶单位在帮扶业绩上效果明显,位居榜首;编号为110 的帮扶单位位列第二;编号为13,107,15 的帮扶单位的帮扶业绩分别位列第三,四,五名;

(5)在居住环境指标中,帮扶单位编号为95的帮扶单位在帮扶业绩上获得冠军位置;编号为73 的帮扶单位获得亚军;编号为9的帮扶单位的帮扶业绩获得季军,编号86,84的帮扶单位的帮扶业绩分别位列4,5名。

5.4 问题4的模型建立与求解

5.4.1 模型的建立

全国计划给予10 000 个村庄“脱贫先进村庄”称号,有哪些因素对这个荣誉称号有着影响呢?第一步需要解决什么因素对称号的有影响,通过第一问,第二问求出指标间的权重,以及相关联系。首先是将称号条件分为三级,并且之间的比例为1∶3∶2。然后找到综合排名在前6 000的,将总分部分换成自己设立的比例模型,将模型中前6 000的剔除,剩余的比较总分增长率,选择前3 000 名,然后再将总分排名前9 000 个村庄剔除,剩余的比较单项的增长。第二步还可以把每个指标的标准差算出来,通过Excel 算出每个指标的标准差,选择标准差大的若干个指标,标准差反应了数据里均值的远近。标准差越小,可以认为帮扶单位在这个指标上没有帮助村长的改善。通过第一问第二问可以看出指标SS,SR 指标比较重要,那么就分别按照SS,SR 为标准各自选取若干个值。关于题目10 个村中问题,可以求出村庄所对应的帮扶单位及类型,对各个指标取均值,用均值作为缺失的评分分数,看能否评的上。当然也可以采取相应的机器算法,运用线性回归预测算法,通过前面所求出的值,对缺失的数据进行预测,然后在通过SS及SR 的指标进行排序,看其中是否能够有村庄评为“脱贫先进一级村庄”。

在求缺失值时,采用线性回归模型。

设该回归模型为,

y=b0+b1x1+b2x2+,…+bnxn,

其中,bj(j=0,1,2,…,n)为回归系数。

5.4.2 模型的求解

通过matlab编写程序,由于回归系数表的数据较多,不一一列出。因为b的取值均在bint的各个置信区间内,所以回归系数b0,b1,b2,…,bn在此多元回归模型中是显著的,也就是说自变量x1,x2,…,xn也都是显著的。复相关系数R2、统计量F,P值,估计误差方差δ24个参数的检验结果为:

(1)复相关系数R2=0.806 5,是服从F(1,n-p-1),说明该模型效果较好。

(2)统计量值F为14.589 3,而且满足F0.95(1,n-p-1)≤F≤F0.99(1,n-p-1),也说明了模型较好。

(3)P<α时模型才有意义,在编程时,将α=0.05代入进行计算。检验后的参数P=0.018 6,小于α,因此所建模型有意义。

(4)估计误差方差δ2=0.0119,同样,也说明了该模型效果比较好。

最终求出2020年的总评分,根据总评分评出获得荣誉称号的10 个村庄见表17。其中编号为39 257,25 149,47 883的村庄可以评上一级称号。

表17 评分表

5.5 总结

(1)在建立模型时与实际紧密联系,结合实际情况对问题进行求解,从而模型更加可信,更具有良好的推广性;(2)在建立模型时,考虑了较多的因素,回归和预测效果较好;(3)从研究问题的基本原理开始到模型建立,再到模型求解,以及模型检验,整体上结构框架较为完整;(4)在建立模型时,都考虑了模型的检验问题。综合模型得出以下4点结论:

(1)在进行脱贫帮助时,可以在不同维度和不同单位帮扶。

(2)入户调查也存在误差。农户大多有“藏富”心理,仅靠短时间的入户调查,难以对农村家庭收入完全摸清。加之还有少数群众有争当贫困户思想,有的农户在识别前将子女与父母户口分开,导致收入微薄的老年贫困户增多。

(3)是精准识别有误差。找准“人”是精准扶贫的先决条件,从目前的政策规定来看,不能准确的确定贫困户,出现假扶贫现象。贫困农户的识别主要是在镇、村两个层面,村干部是识别贫困户的关键人物。第二轮精准识别过程缺乏刚性标准,有的镇、村存在识别贫困农户时盲目采用了逐级分配指标的方法,导致在精准识别贫困户方面存在偏差。

(4)是探索产业帮扶新模式。按照“区域化布局,规模化建设,产业化经营,全产业链开发”的精准产业扶贫思路,推行“1+1+N”脱贫攻坚帮扶模式,即1名包保责任人、1 名帮扶结对能人、N项就业解困岗位,通过产业发展带动贫困户增收致富,重点打造以苗木花卉、果蔬种植、光伏为主的主打扶贫产业,对因环保问题而关闭的贫困户养殖场,实行生态补偿,支持产业转移。

猜你喜欢

差值居民收入村庄
中国整体与区域居民收入周期的协同效应分析
新疆城镇化与农村居民收入实证分析
村庄,你好
居民收入快速增长——“数说陕西70年”之居民收入
我国农村居民收入与消费关系及消费习惯转变
我国农村居民收入与消费关系及消费习惯转变
关注
清丰县新旧气象观测站气温资料对比分析
村庄在哪里
阳泉站站址迁移对观测资料的影响分析