APP下载

共同富裕视角下巩固乡村振兴成果的多维农户发展研究
——基于甘肃省白银市、金昌市调研数据

2023-10-24张钰颖敬程皓

科技和产业 2023年19期
关键词:救助指标体系农户

吴 洋,张钰颖,敬程皓

(兰州财经大学 统计学院,兰州 730000)

随着贫困治理方针的转变,现存脱贫攻坚阶段转入以巩固脱贫攻坚成果、缩小城乡发展差距为时代课题的乡村振兴阶段。如何做好巩固拓展脱贫攻坚成果向乡村振兴战略过渡成为新的时代课题。因此,现阶段搭建多维农户发展现状指标评价体系以及分析当地发展的有利和制约因素显得尤为重要。

白银市与金昌市位于甘肃省中央地带,其中,白银市会宁县作为国家级贫困县,其落后程度代表了甘肃省的经济发展最为薄弱环节。金昌市的永昌县,有金昌市80%的贫困人口,白银、金昌市作为甘肃省经济发展的薄弱环节,成为巩固拓展乡村振兴阶段性成果的重要对象。将白银市与金昌市受调查户作为分析对象,利于发现甘肃省脱贫攻坚同乡村振兴衔接阶段的关键问题。

通过分析调查数据,建立多维农户发展指标体系度量乡村振兴阶段性成果,并通过指标体系和机器学习算法对农户进行识别,发现其关键因素,为巩固拓展乡村振兴阶段性成果,多维农户发展提出可行性建议及思路,促进脱贫攻坚到乡村振兴的有效衔接。

1 相关制度探究

1.1 乡村振兴视角下农户发展影响因素

乡村振兴作为新时代中国发展的必经之路,巩固乡村振兴成果、深化乡村振兴战略的实施对农户发展的影响因素涵盖了诸多方面。在经济方面,张莉[1]认为主要有农业生产的机械化发展程度不高导致家庭收入较低、农业科技创新成果的转化率及普及率不高和农村本身劳动力流失严重导致农村发展的生力军不足3个方面的影响最为严重。在教育方面,姚立鸿和付强[2]通过采用数据包络分析(data enveloping analysis,DEA)-BCC(Banker-Charness- Cooper)模型、Malmquist指数分析2011—2020年的数据,发现西北地区对于教育支出效率水平并未得到提升,甚至有所下降。在城镇化耦合协调发展方面,张一鸣和李睿[3]通过构建指标体系,对2010—2020年西北5省的综合发展水平与耦合协调度进行量化分析发现,西北5省乡村振兴与新型城镇化综合发展水平较低,其产业结构、政府能力、交通基础设施水平对于二者耦合协调发展正向影响较大。乡村振兴需改善民生,发展经济,不断推进新的适合的政策,在发展的同时也要做好经验总结和成果巩固。

1.2 相关数据分析研究

研究的主要分析方法落脚于截面数据分析,钱建中和于玥[4]利用二元Logistic模型,分析影响大学生返乡创业的主要客观因素,对于甘肃省来说,高等教育人才返乡创业也是推动当地乡村振兴进程的重要因素;张瑜和李超海[5]从思政建设视角展开,分析了乡村振兴背景下国家农业发展提升的影响因素,采用了定量研究法,经过实地调研进行了分析;杨啸[6]采用熵值法、灰色预测法以及回归分析,对西北地区乡村振兴与城乡融合协调发展水平进行了评价。

1.3 与巩固农户脱贫成果衔接研究

随着脱贫攻坚任务的完成,学术界更多聚焦于巩固脱贫攻坚成果多维农户发展与乡村振兴的衔接问题上,主要集中于以下几个方面:关于农户脱贫攻坚与乡村振兴的内涵及相互作用机理。龙花楼、陈坤秋[7]提出脱贫攻坚向乡村振兴的衔接与过渡具有阶段性。在历史逻辑方面,张青和郭雅媛[8]认为摆脱绝对贫困只是完成了国家减贫脱贫道路的阶段性目标,达成乡村的发展振兴和有效治理才是新时代共同富裕背景下农村发展的最终目标。在实践逻辑方面,王琴等[9]认为乡村发展既是乡村振兴的产业基础,也是促进少数民族文化复兴的有效方式,后续农户持续发展需要通过产业振兴为巩固脱贫攻坚成果以及时代课题的完成提供长效的内生动力。二是关于农户脱贫攻坚与乡村振兴衔接的测度。廖文梅等[10]利用相对指数法测算了2011-2018年江西省10个贫困县(市)的脱贫攻坚指数和乡村振兴指数,利用耦合协同模型测度了二者的耦合协同度,对比不同条件下脱贫县(市)的差异性[10]。三是关于巩固农户脱贫攻坚与乡村振兴有效衔接的系统搭建与实现举措。涂圣伟[11]认为脱贫攻坚与乡村振兴有效衔接的根本导向应该是促进人的全面发展,加强地区性民生建设。在方法思路方面,张明皓和叶敬忠[12]指出有效衔接在机制层面和观念层面需要包括从顶层到基层制度的全方位巩固、贫困与非贫困兼顾全领域拓展以及防贫到振兴的全过程接续。

现有研究主要关注在脱贫攻坚与乡村振兴的耦合关系以及二者相互衔接的水平测度等重点领域。综上,以农户个体为切入点,建立多维农户现状指标评价体系具有前瞻性及必要性。为甘肃省乡村振兴的发展全局起到推动作用。

2 理论基础

2.1 可持续生计理论

可持续生计理论是20世纪80年代中期由Chambers和Conway[13]提出,是解决贫困以及在全面脱贫后,如何防止返贫现象发生、实现良性可持续发展的分析方法,在国内农户生计研究中得到了广泛应用。

国内关于可持续生计理论也有诸多的应用:孙晗霖和刘新智[14]基于脱贫户可持续生计的实证研究进行分析,为完善脱贫保障制度、加强农户的生计稳定提出了新的道路;何植民和蓝玉娇[15]将可持续生计理论与恢复力理论相结合,构建了脱贫“脆弱户”可持续生计的“脆弱性-生计恢复力”理论分析框架。

2.2 目标瞄准理论

在农村社会救助的发展过程中,瞄准效率成为衡量社会救助政策实施效果的重要指标。在确定救助对象时,主要包括4种情况:准确瞄准家庭、漏保家庭、误保家庭以及不应救助准确排除家庭。4种情况是评定农村社会救助对象的标准,也是评估救助政策执行效果的重要依据[16]。

3 多维农户发展指标体系构建

3.1 数据来源

数据来源于2021年甘肃省民政厅组织的“第三方”调查,调查地区为甘肃省白银市和金昌市所下属的3个县区(景泰县、靖远县、永昌县)。调查研究对象以享受社会救助政策的被救助户为主,共调查899户2 860人,其中包括663户享受社会救助政策的被救助户和236户普通户。调查内容涉及个人、家庭、村镇3个方面。基本信息见表1。

表1 数据基本信息

3.2 数据预处理

实地下乡数据调研过程中,存在信息不对称、信息无法直接获取、信息不准确、采样难度大、样本代表性不足、数据收集难度大等问题,需要对数据进行预处理。

采用一类支持向量机(one-class support vector machine,One-Class SVM)方法对异常值与极端值进行剔除,对数据进行归一化处理;采用自编码器对缺失值进行重新插补,将插补完成的数据进行编码处理。One-Class SVM算法能够有效地检测出数据中的异常值和极端值,以保证数据的质量和准确性。自编码器是一种无监督学习算法,可以用于数据降维、特征提取和数据重建等任务。在缺失值插补中,自编码器用于学习数据的潜在表示,并根据已知数据进行缺失值的插补。自编码器的输入为已知数据和缺失值,输出为缺失值的插补结果。通过调研收集的原始数据进行预处理,使得后续的分析和处理更加准确和可靠。

3.3 基本特征的描述性分析

农户的个体特征中包含了影响其生计资产能力的关键因素,进而影响农户的可持续发展能力。将个体特征归类后,能更加直观地得到救助家庭与非救助家庭之间的差异,为后文指标的选取提供了一定依据。

从表2中可看出,相较于非救助户而言,救助户从年龄结构来看,中老年人口较多,青壮年人口较少。从健康状况来看,残疾、患病的比例较高,因病支出金额巨大会增大农户负担,影响农户发展,所以残疾和疾病是救助户易返贫的主要原因之一;从劳动力结构来看,劳动力结构在一定程度上影响着农户收入水平,所以劳动力短缺也是救助户易返贫的主要原因;从受教育程度来看,救助户的文化程度多为文盲、小学和初中,高中以上学历人群较少。

表2 变量描述性统计

3.4 熵权法建立多维农户发展现状指标评价体系

共同富裕通过改善农民生活条件等措施推动农民增收致富,从而带动乡村振兴的可持续发展。因此,乡村振兴的一大阶段性成果就是对农户可持续发展的能力的提高。建立指标体系对农户发展现状进行评价,测度农户的可持续发展能力。

3.4.1 指标选取

农户生计资本体现了农户生活状况和可持续发展的能力,关系着共同富裕政策的实施。可持续生计分析框架,将农户生计资本分为人力资本、自然资本、物质资本、经济资本和社会资本5大类[17]。根据Sharp[18]对5个资本的定义,结合甘肃省民政厅调查问卷内容及实地调研数据反馈,使用下列指标进行指标选择。

人力资本中,健康状况、劳动力结构和受教育程度是影响农户返贫的原因之一。用健康人口比例、劳动力比例反映农户健康状况和劳动力结构,家庭成员最高学历一定程度代表受教育水平。将家庭普通劳动力比例、家庭健康人口比例、家庭成员最高学历比例3个指标列入人力资本变量指标体系。

物质资本包含基础设施及谋生的生产设备。住房、网络、交通工具直接反映农户的生活条件,住房面积从一定程度反映房屋价值。将大型农具和私家车、能否上网、住房面积3个指标纳入物质资本变量指标体系。

自然资本指农户所拥有的自然资源包含土地和野生动植物等。通过调查农户土地规模和是否有养殖业判断农户的自然资本状况。将家庭土地规模、家庭养殖业2个指标列入自然资本变量指标体系。

社会资本包含各种社会资源提高农民的生活质量和生产效率。义务教育完成率反映了农户教育资源。入户路反映政府提供的公共服务。选取义务教育完成率、入户路2个指标列入社会资本变量指标体系。

经济资产是帮助农户实现可持续发展的各项资金。家庭收入及来源、储蓄及消费支出等因素是评价农户生活水平的直观指标,总支出中的因病支出是导致农户易返贫的主要原因之一。选取人均收入、转移性收入、工资性收入、经营性收入、财产性收入、因病支出、家庭存款7个指标列入社会资本变量指标体系。

多维农户发展现状评价指标体系见表3。

表3 多维农户发展现状评价指标体系

3.4.2 计算结果及分析

根据熵权法计算指标权重,结果见表4。

表4 多维农户发展现状的指标权重

从一级指标看,经济资本变量指标权重为59.85%,表明家庭人均收入和支出、存款等是反映农户发展现状的重要指标,影响农户可持续发展能力;其次是自然资本变量,占比22.39%,家庭土地规模和家庭养殖业是农户主要的收入来源。人力资本变量占比9.09%,表明农户的劳动力、健康和受教育情况也是在关注农户发展能力时的重点。物质资本变量和社会资本变量权重占比相对较少,表明在入户路、网络和义务教育方面政策落实效果好,农户之间差异不大。

依据各指标体系权重,进一步测算多维农户发展现状的综合评价得分。为验证该指标体系是否对农户进行了恰当的评价,使用救助户作为标签(救助户=1,非救助户=0),综合得分越小,农户可持续生计资产能力越弱,更容易有返贫倾向,应被判定为救助对象。对比社会实际救助状况,得到指标体系的识别效率(表5),包含指标影响农户可持续发展能力的因素。

表5 多维农户评价指标识别效率

与呈现基于收入视角下的救助对象识别效率做对比。农村社会救助贫困测算多借助于国家贫困线标准,通过贫困线确定救助对象的方法。结合数据调查时间,以2020年甘肃省国家标准5 000元为基准,计算农户剔除救助金后的年人均收入与基准进行对比,得到农村社会救助对象识别效率(表6)。

表6 基于收入视角下目标识别效率

指标体系下的瞄准率为86.58%,比收入框架视角下识别瞄准率50.68%高出约30%,瞄偏率和误保率较收入视角下的结果也有所降低,由37.93%和49.32%降低到19.80%和13.42%。可以看出,指标体系相较于基于收入评价农户发展现状和识别救助户的效果更好,瞄准率较高也表明通过指标体系确定的指标可以衡量农户可持续发展能力,初步判断为影响乡村振兴阶段性成果的因素。

4 多维农户发展指标体系识别

多维农户发展指标体系确立了17个影响因素,为确定其中关键因素,巩固乡村振兴阶段性成果,使用随机森林算法进行分类任务,得出初步的结果。进而使用XGBOOST分类模型进行识别,分析农户是否应该被判定为救助对象,提高模型准确性、泛化能力和结果的可靠性。搭配递进方式更好利用整理后的数据集中信息,提高模型的预测能力,使所建立的指标体系具有区域性代表特征。

4.1 随机森林进行特征值筛选

使用随机森林算法获取每个特征的重要性水平,将农户是否需要救助作为二元分类标签。进行了30次特征重要性计算,得到每个特征的得分占比。将30次指标重要性计算的平均值作为特征的最终重要性,并按降序排列,展示了每个特征的重要程度。

排名靠前的特征在判断农户是否应该被救助时占有重要比重,可作为影响农户是否被判定为救助对象的重要因素。图1中展示了特征的重要程度,清晰地说明各个特征的重要性。

图1 随机森林识别特征重要性

4.2 XGBoost优化模型准确率

使用GridSearchCV交叉验证方法,在指定的XGBoost(极限梯度提升)方法参数范围内进行调优,评估模型性能的指标,得到最优参数。方法对每一组参数进行交叉验证,并计算模型在验证集上的性能指标。在交叉验证过程中,数据会被分成若干份,没分数据被用作验证集一次,其他数据用作训练集。保证模型在不同的数据集上评估,减少过拟合的风险。交叉验证后,统计每组参数的平均性能指标,选出最优参数。使用网格搜索的方法来枚举指定的参数,使用最优参数训练模型,测试集评估模型的性能。XGBoost需要验证的参数及验证得到的最优参数取值见表7。

表7 XGBoost参数取值

使用交叉验证后XGBoost最优参数取值,验证模型的准确度,使用其特征重要性函数输出指标数据组中特征排序的重要性,如图2所示。

F-score为综合考虑精确率和灵敏度的指标图2 XGBoost特征重要性排序

通过与随机森林识别的特征重要性进行对比,排名靠前的特征主要是转移性收入、人均收入、因病支出、健康人口比例及家庭存款区间这几项主要因素。表明经济资产方面是认定农户救助与否的关键指标。其次,家庭成员健康状况比例、普通劳动力数比例及家庭住房面积等数据也为认定农户救助与否的关键指标之一。XGBoost方法在验证模型准确度方面表现出色,输出结果进一步验证了随机森林算法所选特征的重要性。

ROC曲线是研究学习其泛化性能的有效工具,常用来权衡分类器的命中率与误保率。横坐标轴FPR表示负样本被错误预测为正样本的概率;纵坐标轴TPR 表示正确预测样本为正样本的概率。在分类模型预测中,AUC则是ROC曲线与横轴所围成的面积。当AUC得分越高时,模型曲线的突起程度越高,越靠近左上角,代表模型的准确率越高,分类模型的效果越好。一般来说,AUC>0.8为良好。绘制图3所示的ROC曲线。

图3 ROC曲线

根据图3,AUC为0.95,模型参数调试并在迭代次数达一定次数后,模型损失和错误率未有明显下降。说明模型能够较为准确地根据指标判断农户是否需要得到救助。

混淆矩阵是评估分类模型性能的一种矩阵。常用于评估二分类模型的性能。使用sklearn.metrics.confusion_matrix()计算混淆矩阵,得出准确率、精确率、灵敏度、特异度及F-score(表8),更全面地评估模型的性能,从而选择最优的模型。

表8 指标含义

由混淆矩阵各类指标结果可以得出,分类模型调查户是否应当被救助其准确率和精确率均能达到 92%以上,表明模型具有良好的分类预测效果,预测结果可信度较大。

4.3 SHAP可解释模型

可解释机器学习近年来逐渐变成机器学习的重要研究方向,可加性解释模型(shapley additive explanation,SHAP)可解释以解释任何机器学习模型的输出。对多维识别指标体系构建加性可解释模型,对于每个预测样本,模型都产生一个预测值,SHAP值是该样本中每个特征所分配到的数值,与传统feature importance只展示特征重要性而言,SHAP值能对于反映出每一个样本中的特征的影响力和正负性。使用Summary plot函数为每个样本绘制其每个特征的SHAP值,如图4所示,可以更好理解整体模式,并允许发现预测异常值。

图4 SHAP特征值图

由SHAP特征值图结果与随机森林、xgboost算法识别对比,其主要影响因素大致一致,特征值具有正向影响作用,侧向验证了算法识别的准确性和精准度。

5 结论与建议

5.1 结论

在可计生理论框架下,对农户的生计资本通过建立指标体系进行衡量,评价了农户发展现状,体现了农户可持续发展能力,且指标体系识别准确率达到86.58%。进一步采用机器学习方法,以指标体系中的17个指标为特征,采用随机森林算法和XGBoost算法计算各特征的重要性水平,分类后的最终识别准确率达到92%以上,提升验证了模型的识别率和泛化能力,预测效果有较为精准的可信度。多维农村社会识别指标能显著提升识别效率,有效降低识别过程中的漏保率和误保率。

通过多维农户发展现状指标体系及算法识别验证,得出了经济资本中转移性收入、人均收入、因病支出及家庭存款区间;人力资本中健康人口比例;物质资本中住房面积等关键影响因素及排序。根据白银市、金昌市调查的实际情况,结合《巩固拓展脱贫攻坚成果、共同富裕专项考核反馈问题整改台账》,将关键因素对应到乡村振兴过程中的实际问题中,得出以下结论。

5.1.1 经济资本中农户收入等方面需提升,因病支出需减少

在多维农户发展现状指标体系,经济资本所占权重最大,是农户可持续发展中的最重要的计生资本,通过机器学习算法得出经济资本的指标中的重要性排序,依次是转移性收入、人均收入、因病支出、及家庭存款的区间,都是影响乡村振兴阶段性成果的关键因素。在白银市、金昌市调研工作中,发现个别群众增收能力较弱,抽查户中个别家庭人均收入较低,增收能力较弱,存在部分脱贫人口人均纯收入不增反降情况。安置点搬迁群众家庭收入主要为劳动收入,产业单一,就业不稳定,与构建指标体系算法识别出的主要经济资本影响因素方面一致,需持续关注。

部分受调查户因病支出占总收入比重较大,进而影响人均收入。部分受调查人员对慢性病卡办理慢病卡所享受的政策不了解,导致部分村民无法享受慢病治疗的相关补助,造成因病支出这一项花销较大。

5.1.2 人力资本中劳动力比例、健康人口比例仍需增高

人力资本中的劳动力、健康人口比例均为乡村振兴阶段性的成果的重要指标和关键因素。主要影响因素中人力资本变量家庭劳动力比例较低,就业帮扶还需加强。调研过程中,发现产业带动能力还需提升。入户调查中发现,合作社和就业帮扶车间带动农户较少,带动脱贫户增收能力较弱;部分农户表示帮助措施效果一般,参加就业培训人数和再就业帮扶车间工作人数均较少,需有措施提升。

5.1.3 物质资本中人居环境需改善

物质资本变量中的住房面积也是关键因素之一,是人居环境的体现。调查中发现,有些农户的住房面积较小,或者住房的地理位置交通不够便利,极个别农户的入户路仍为土路。

随着进入乡村振兴时代,农村社会收入较低群体性质和特点发生了新变化。甘肃省作为深度贫困的省份,需要大力构建多层次的社会脱贫保障体系,探索多元主体保障村民共同富裕的机制和路径,完善农村社会政策及工作机制,提升基层办事能力,提高政策实施工作的公开、公正度,以增强帮扶对象和广大农户对相关政策和工作程序的知晓度和满意度。研究政策实施效果将有助于推广“甘肃经验”,有效衔接乡村振兴战略,为“共同富裕”完善农村社会相关政策提供理论支持。

5.2 建议

5.2.1 进一步提升增收能力

针对人均收入较低、增收能力较弱、转移性支付不足等问题,提出以下措施建议:实施农业优势产业倍增计划,加快农业产业发展,保障农产品产销通畅,带动农村居民经营性收入的增长;持续开展线上招聘、岗位下乡等活动,搭建对接平台,提高劳务输转组织化程度,提供更多优质的招聘服务和企业资源,稳步增加收入;落实产业帮扶、就业帮扶、小额信贷等政策,持续提高增收能力,拓宽增收渠道,稳定增加收入;落实兜底保障、社会帮扶、关爱行动等措施,兜牢民生底线。

5.2.2 进一步巩固责任落实提升宣传引导

针对对于办理慢病卡政策不了解,因病支出过大,无法享受慢病治疗补助问题,提出以下措施建议:加强对乡村两级医疗机构工作人员的培训。熟练掌握办理流程,对符合条件的患者及时办理,对不符合条件做好解释工作;增加群众对医保政策的知晓度,达到申办条件的能及时享受基本医疗保险待遇;优化城乡居民门诊慢病申报工作机制和流程。将医保政策宣传贯穿始终,加快推进城乡居民门诊慢病卡办理,做到应办尽办。

5.2.3 进一步提升就业帮扶措施

对于家庭劳动力比例较低、就业帮扶力度不明显的问题,提出以下措施建议:多渠道提高政策知晓度。利用现代信息媒介加强对受调查人员就业帮扶政策的宣传,公布就业帮扶政策清单、服务清单和经办机构清单。提供更多优质的招聘服务和企业资源;不间断开展就业岗位推送。认真贯彻落实国家和省市关于支持农民工返乡创业的各项政策措施,推动农民工返乡创业,带动更多农村劳动力就业;多方位搭建招聘对接平台。线上线下结合举办工企对接集中招聘活动,为求职者和企业搭建面对面对接平台,精准匹配。利用就业帮扶车间等本地经济实体,吸纳本地劳动力,促进就近就地转移就业。

5.2.4 进一步改善提升人居环境

针对人居环境改善方面的问题,提出以下措施建议:针对住房面积小的农户,给予农户一定的房屋补助,帮助农户新建住房,提高住房面积;加大资金投入力度,全面实施涉及乡镇建制村自然村(组)通行条件差道路硬化工程,重点解决具备条件的自然村通硬化路问题。同时督促对辖区内农村公路路况及时合理安排养护工作,落实主体责任,保障全县农村公路良好有序运营。

猜你喜欢

救助指标体系农户
农户存粮,不必大惊小怪
由“中华富强”轮失火救助引发的思考
让更多小农户对接电商大市场
水下救助抢险
粮食日 访农户
农户存粮调查
层次分析法在生态系统健康评价指标体系中的应用
水下救助抢险
供给侧改革指标体系初探
临时救助 “善政”还需“善为”