中国农村贫困动态特征及其区域差异
2020-09-14苏剑峰
聂 荣,苏剑峰
(辽宁大学 经济学院,辽宁 沈阳 110036)
一、引言
贫困是制约国家发展的重要因素。随着经济社会的不断发展,世界各国越来越重视消除贫困问题。我国一直致力于消除贫困工作,目前已经取得了举世瞩目的成就。国家统计局的数据显示,自从2011年实施新的国家贫困线以来,2011—2019年中国农村地区贫困人口从12238万人下降到551万人;数据呈逐年递减趋势,每年的降幅超过千万人。农村贫困人口数量的大幅度下降与经济增长、国家政策、基础设施建设等因素有关[1]。然而,中国减贫面临的形势依然严峻。虽然农村家庭绝对贫困将在2020 年底被消灭,但是农村家庭的相对贫困还会继续存在。因此政府在扶贫工作中仍需深入实施精准扶贫,明确农户短期贫困和长期贫困状态及其致贫原因,同时也要防止非贫困农户陷入贫困[2]。
农村家户脱离贫困和陷入贫困是一个动态变化的过程。在动态贫困问题研究方面,由于学者们采用的贫困标准不同,得出的贫困发生率也会有所差异[3]。而不同时期农户总体贫困发生率的变化并不能详细表述农户家户贫困的动态特征,因此有些学者追踪家户进出贫困的轨迹,将贫困的变化进行分解。Jalan[4]构建了经典的贫困分解方法,将贫困分解成暂时性贫困和持续性贫困。但是该方法没有考虑贫困家庭的贫困持续时间;章元[5]在Jalan研究基础上引入贫困经历时间,将总贫困分解为慢性贫困和暂时性贫困;洪兴建[6]将农村贫困变动分解为长期贫困效应、脱贫效应和返贫效应。总体上看,暂时贫困成分的下降是我国贫困率下降的主导因素[7]。有些学者研究农村贫困的动态过程,发现脱贫和返贫现象同时存在,大多数农村家庭经历的贫困是一种暂时性贫困[8-11]。在贫困的动态转换中,高艳云[12]发现人力资本、人口结构和地区发展差异是影响中国农户贫困动态性的主要因素;Imai[13]发现受教育水平能够显著影响越南和印度农户的贫困动态性。
上述文献虽然分析了中国农村贫困动态特征以及动态贫困影响因素,但是仍存在一些不足。第一,上述研究大多是对某一个时点农村贫困状况进行分解,或者是对不同时点的农村贫困状况进行比较分析,未能看出农户的贫困状态是暂时性的还是持久性的,上一个阶段脱离/陷入贫困的农户是否会再一次陷入/脱离贫困状态。第二,在研究方法上,已有研究多数采用马尔可夫转移矩阵和probit等回归模型,较少文献关注农户在一个固定时间段内脱贫和入贫的概率以及家户处于贫困和非贫困的持续时间对其脱贫和入贫概率的影响。基于此,本文利用2010—2018年CFPS全国性调查数据,采用生存分析方法,估计了不同地区(1)根据已有文献的惯常做法,本文将全国划分为东、中、西部三大地区,东部包括北京、天津、河北、辽宁、上海、江苏、浙江、福建、山东、广东、广西、海南;中部地区包括山西、内蒙古、吉林、黑龙江、安徽、江西、河南、湖北和湖南;西部地区包括四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆和重庆。农户贫困和非贫困状态持续时间以及风险率,并对脱贫和入贫风险率的影响因素进行考察。
二、数据来源与处理
(一)数据来源
本文采用2010—2018年中国家庭追踪调查(China Family Panel Studies,CFPS)数据。CFPS数据覆盖了25个(省/市/自治区)中105个县(区、县级市)的146个行政村的个体和家庭样本。CFPS于2010年正式开展访问,截至目前已经进行了5轮全国调查(2010、2012、2014、2016、2018年)。本文使用上述数据来考察中国农村家户贫困动态特征。
(二)数据处理
本文定义农户贫困(非贫困)持续时间是农户首次参与CFPS调查时贫困(非贫困)直至其首次脱离(进入)贫困所经历的时间,持续时间单位为调查的期数。首次脱离贫困的农户是指2010—2018年首次脱离贫困但仍保留在数据库或者是直接退出调查的农户,首次陷入贫困的农户是指2010—2018年首次陷入贫困但仍保留在数据库或者是直接退出调查的农户。由此可知,农户i贫困的持续时间是指农户i从首次参与调查并且从贫困到首次脱离贫困所经历的期数,农户i首次脱离贫困这一事件称为 “失败”事件(failures);农户i非贫困的持续时间是指农户i从首次参与调查并且从非贫困到首次陷入贫困所经历的期数,农户i首次陷入贫困这一事件称为 “失败”事件(failures)。
本文数据存在删失问题。若农户在2010年首次参与调查直到2018年最后一次参与调查时一直处于贫困状态,我们就不知道农户首次退出贫困的具体时间;若农户在2010年首次参与调查直到2018年最后一次参与调查时一直处于非贫困状态,我们就不知道农户入贫的具体时间。因此,本文采用生存分析方法处理这类数据右删失(right censoring)问题。最后,笔者对农户脱贫和入贫的调查年份进行了统计,得出了农户贫困和非贫困的持续时间,并定义了每个时间段的结局变量(2)结局变量反映失败事件是否发生,为二分类变量,失败事件发生failure=1,没有发生failure=0(右删失)。。
贫困的动态变化旨在从时间维度研究农村家庭在不同时期的贫困情况转换。对于农户而言,贫困转化在调查时间t至调查时间t+1之间有四种类型:贫困—贫困、贫困—非贫困、非贫困—贫困和非贫困—非贫困。本文将贫困状态标记为1,非贫困状态标记为0。家户在t期贫困而在t+1期非贫困的概率记为p10,相应的在t时期和t+1时期家户均处于贫困状态的概率为p11,有p10+p11=1。同理,有家户在t期非贫困而在t+1期贫困的概率为p01,家户在t时期和t+1时期均处于非贫困状态的概率为p00,有p01+p00=1。贫困状态转换后的情况不再考虑。
(三)贫困转移矩阵
本文采用国家贫困线和相对贫困线两种贫困线来判定农户是否贫困[14]:(1)国家贫困线为2300元/天(3)2011年12月中央扶贫开发工作会议将农民人均纯收入2300元(2010年不变价)作为新的国家扶贫标准。本文将所有调查年份的收入根据当年农村CPI转换成以2010年价格水平为基准的真实收入。(2010年不变价)。若当年家户真实人均年收入小于2300元,即认定为贫困。(2)相对贫困线。本文采用的是调查家户真实人均纯收入中位数的50%。若农户人均真实收入低于该标准,则认定为贫困。本文分别按照绝对贫困标准和相对贫困标准计算了农村各年份贫困发生率,见表1。
表1 各年份农村贫困发生率
可以发现,以两种贫困线为标准计算的贫困发生率总体上都呈下降趋势。这说明我国经济发展水平逐渐提高,政府的反贫困工作取得一定的成效。虽然绝对贫困发生率在调查年份中大幅下降,但是这种趋势并不能反映出相邻调查年份之间农户贫困状态的动态变化。表2展示了样本在不同贫困线水平下,每相邻两期以及调查开始与结束两期之间退出贫困和陷入贫困的概率。
表2 农户贫困转移矩阵
在国家贫困线的标准下,2010—2018年,有66.15%的贫困农户脱离贫困,有11.87%的非贫困农户进入贫困。在每两个相邻的调查年度,在上一期贫困的农户大部分在下一期脱贫,在上一期非贫困的农户只有小部分在下一期入贫。农户脱贫和入贫以非对称比例同时存在。在相对贫困线标准下,2010—2018年,有53.93%的贫困农户脱离贫困,有17.81%的非贫困农户进入贫困。在每两个相邻的调查年度,农户脱贫和入贫情况与绝对贫困标准下的结论相似。
三、农户贫困和非贫困生存函数估计
(一)估计方法
本文采用Kaplan-Meier方法估计农户贫困和非贫困生存率[15]。令T为农户贫困或非贫困的生存时间(4)CFPS每隔一年调查,以2010年调查期为起点,记为t0时刻。定义农户在两个连续调查期内被认定为贫困,则家庭贫困持续时间为1期。以此类推,若农户连续5个调查内被认定为贫困,则家庭贫困持续时间为4期。非贫困持续时间同理。,可取值t=1,2,3,4。若农户贫困或者非贫困的持续时间段完整,记Ci=0;若右删失则计Ci=1。相应的生存函数为:
Si(t)=Pr(Ti>t)
(1)
(1)式表示农户贫困或非贫困的生存时间超过t年的概率。本文采用Kaplan-Meier法对生存函数进行非参数估计:
(2)
其中,nj代表第j期处于风险状态的农户数量;mj代表第j期遭遇“失败”事件的农户数量。
风险函数为:
hi(t)=Pr(t-1
(3)
(3)式表示农户在t-1期贫困(非贫困),在t期首次非贫困(贫困)的概率。
风险函数的非参数估计表示为:
i(t)=mj/nj
(4)
基于Kaplan-Meier估计量,本文对农户贫困和非贫困的生存函数做了总体样本估计和分区域样本估计。
(二)估计结果
1.贫困生存函数估计
(1)总体估计
表3和图1给出了国家贫困线和相对贫困线两种标准下农户贫困持续时间以及生存函数。以国家贫困线为例,农户贫困持续时间均值为1.7期,中位数为1期。用KM法可知,贫困时间超过1期时间的农户比例为44.57%,表示55.43%的贫困农户在首次进入调查后的一期时间内脱贫。贫困持续时间超过4期的农户比例为3.99%,表明在最后一期调查中仍然有3.99%的农户贫困。可以看出,首次进入调查的农户在第二期调查脱离贫困的概率最大,但随着持续时间的延长,农户脱贫的可能性迅速下降。农户脱离贫困的风险函数呈明显的负依存性。相对贫困线也是大致趋势。
(2)分地区估计
表3和图2给出了两种贫困标准下各地区的贫困生存率和持续时间。以国家贫困线为例,各个地区农户贫困持续时间的中位数都为1,但是均值却存在差异。东部、中部、西部农户贫困时间均值依次上升。从生存率上看,东部地区有42.65%的农户贫困时间超过1期,中部为43.11%,西部为46.83%,东部和中部差异不大,西部最高;东部地区有2.7%的农户贫困时间超过4期,中部为5.92%,西部为3.69%。从表中可以得出结论:无论采用哪种贫困线标准,从总体上看东部地区和中部地区农户脱离贫困概率接近,明显低于西部农户脱贫概率。这也反映出西部综合性社会发展水平与东部中部还有较大差距。政策倾斜和投资倾斜使得东部发展最快,以“先富带后富”准则向西辐射,客观对东中西部地区发展差距起到一定推动作用。
表3 农户贫困生存函数的估计
图1 农户贫困生存函数曲线
图2 农户贫困生存函数曲线(分地区)
2.农户非贫困生存函数的估计
(1)总体估计
表4和图3给出了国家贫困线和相对贫困线两种标准下农户非贫困持续时间以及生存函数。以国家贫困线为例,农户非贫困持续时间均值为3.24期;非贫困持续时间超过4期的农户概率有66.11%大于50%,所以非贫困持续时间没有中位数,农户非贫困持续时间较长。从生存率看,非贫困持续时间超过1期的农户约为81.84 %,表明只有18.16 %的非贫困农户在首次进入数据库后的一期内进入贫困。可以发现,随着非贫困持续时间的延长,农户进入贫困的可能性缓慢下降。相对贫困线也是大致趋势。
表4 农户非贫困生存函数的估计
图3 农户非贫困生存函数曲线
(2)分地区估计
表4还给出了两种贫困标准下各地区的非贫困生存率和持续时间。以国家贫困线为例,各个地区农户非贫困持续时间的中位数均是无,均值却存在差异。东部、中部、西部农户非贫困时间均值依次下降。从生存率上看,东部地区有84.72%的农户非贫困时间超过1期,中部为84.05%,西部为75.58%。东部和中部差异不大,明显高于西部;东部地区有71.15%的农户非贫困时间超过4期,中部为68.30%,西部为56.91%。从表中可以得出结论:从总体上看,东部地区农户进入贫困概率略低于中部地区农户,明显低于西部农户。这也反映出在扶贫工作中还要注意非贫困农户进入贫困情况,尤其是西部地区更要重点关注。估计结果如图4所示。
图4 农户非贫困生存函数曲线(分地区)
四、农户脱贫和入贫风险率影响因素分析
(一)模型设定
农户脱离贫困和进入贫困通常为一年中的某一时间点,实际上每个农户脱贫和入贫的终止时间点都不一样。由于受CFPS调查时间限制,本文定义贫困持续时间单位为调查的期数。其对于终止点来说单位太大,此时采用clogclog模型较为合适[16]。该模型可以控制农户不可观测的异质性。本文参照叶初升和Jenkins[17]的方法,构造离散时间生存分析cloglog模型:
cloglog[1-λε(t,X)]=λ0(t)+β′X+u
(5)
其中,X是影响风险率的外生变量,λε(t,X)表示具有外生变量X的个体在时刻t的风险率,β是待估计的回归系数,λ0(t)是不随时间变化的基准风险率。误差项u=ln(ε),并且u~N(0,σ2),用于控制农户不可观测的异质性。
(二)变量选取
在微观层面上,农村家户贫困状况与户主、家庭特征有着密切关系。参考以往文献以及考虑变量的可获得性,本文选取了以下解释变量:(1)农户贫困或非贫困持续时间;(2)家庭人口特征:户主性别(男性取1)、户主的婚姻状况(已婚取1)、户主的年龄、户主年龄平方、家庭规模、人口抚养比(5)本文定义为年龄小于等于14岁和大于等于65岁的成员人数占家庭总人口的比例。;(3)家庭教育特征:户主的受教育年限、家中受到初等教育的人口比例、家中受到高等教育的人口比例(6)中等教育定义为接受了初中、高中(职高/技校/职高)的教育。高等教育定义为接受了大专及以上的教育。;(4)家庭工作特征:家中在体制内单位(7)本文借鉴了谢宇等(2013)的观点,将政府部门/党政机关/人民团体、事业单位、国有企业定义为体制内单位。工作人口比例,家中在民营企业工作人口比例;(5)家庭健康特征:家中健康(8)本文根据 CFPS数据库中的自评健康问题回答,将非常健康、很健康、比较健康合并为健康;将一般和不健康合并为不健康。人口比例;(6)家庭资产特征:做饭用水(清洁水源取1)、做饭燃料(清洁燃料取1)、家庭是否拥有耕地、家庭是否拥有小汽车、家庭是否拥有住房。
(三)实证结果
1.农户脱贫风险率影响因素分析
(1)总体回归
表5中的模型(1)(5)列给出了国家贫困线和相对贫困线标准下影响贫困农户脱贫风险率相关因素的 cloglog模型估计结果。估计结果表明,在国家贫困线标准下,农户贫困持续时间与农户脱贫风险率在1%置信水平上呈显著负向关系。农户贫困持续时间每增加一期, 农户脱贫概率减少3.87%。在家庭成员教育水平方面,户主教育年限以及家庭内部接受中等教育人数和接受高等教育人数的比例均与农户脱贫风险率呈显著正相关关系。例如户主教育年限每增加一年,农户脱离贫困的概率上升1.67%。另外,家中体制单位工作人数比例和民营企业工作人数比例均在1%置信水平上对农户脱贫风险率呈显著正向影响。家中健康人数比例对于农户脱离贫困有着显著正向影响。家中抚养比与农户脱贫风险率呈显著负相关。相对贫困线标准下农户脱贫风险率影响因素估计的结果与国家贫困线标准下的估计结果相似。
(2)分地区回归
表5中的(2)~(4)列给出了国家贫困线下东、中、西部地区农户脱贫风险率相关影响因素的回归结果。可以看出农户脱贫风险率的影响因素存在显著的区域差异。农户贫困持续时间只对中部地区农户脱贫风险率有显著正向影响。家庭教育特征方面,户主教育年限只对东西部地区农户脱贫风险率有着显著正向影响,且其对于东部地区农户脱贫风险率的正向影响程度大于西部地区。而家庭接受中等教育人口比例对于东中西三个地区农户脱贫风险率均有显著正向影响,但是家庭接受高等教育人口比例只对中部地区农户脱贫风险率有着显著正向影响。在健康特征方面,家中健康人数比例对于东中西三个地区农户脱贫风险率均有着显著正效应,且其对于东部地区农户脱贫风险率影响最大,西部地区次之,中部地区最低。家中体制单位工作人数比例和民营企业工作比例对于东中西地区农户脱贫风险率均有显著正向影响。家中在体制内单位工作人口比例对于中部农户脱贫风险率正效应最大,远超东西地区;而家中在民营企业工作人口比例对于西部地区农户脱贫风险率正效应最大。家中人口抚养比对于东中西地区农户脱贫风险率均有显著负效应。
表5 农户脱贫风险率影响因素cloglog模型回归估计结果(9) 表中各风险因素的回归系数并不是风险比率(Hazard Ratios),如模型1中年龄的风险比率应该是e0.0222=1.022,其中0.0222就是模型中的回归系数。因此,当模型回归系数为正时,风险比率将大于1;当模型回归系数为负时,风险比率将小于1。下表同。
表5中的(6)~(8)列给出了相对贫困线标准下东、中、西部地区农户脱贫风险率影响因素回归结果。农户贫困持续时间这一因素对于东中西三个地区农户脱贫风险率均有1%置信水平上的显著负效应。家中在体制内单位工作人口比例和在民营企业工作人口比例都对东部地区农户脱贫帮助最大。健康特征方面,家中健康人口比例对东中西地区农户脱贫风险率均有1%置信水平上的显著正效应,但其对东中西三个地区农户脱贫风险率的正向影响依次递减。人口抚养比对东中西三个地区农户脱贫风险率均有1%置信水平上的显著负效应,其在东中西三个地区农户脱贫风险率的负向影响依次递增。家庭人口教育水平方面,家中接受中等教育人口比例对东中西地区农户脱贫风险率均有显著正向影响,而家中接受高等教育人口比例只对中部地区农户脱贫风险率有5%置信水平上显著正向影响。户主教育年限只对东西部地区农户脱贫风险率有显著正向影响。
2.农户入贫风险率影响因素分析
(1)总体回归
表6中的模型(1)(5)分别给出了在国家贫困线和相对贫困线标准下影响农户入贫风险率相关因素的cloglog模型估计结果。估计结果表明,在国家贫困线标准下,农户非贫困持续时间与农户入贫风险率在1%置信水平上呈显著负相关关系。农户非贫困持续时间每增加一期,农户入贫概率下降4.72%。家庭教育特征方面,户主教育年限、家庭接受中等教育人数以及接受高等教育人数比例均与农户入贫风险率在1%置信水平上呈显著负相关关系。例如户主教育年限每增加一年,家户入贫概率降低3.22%。另外,家庭体制内单位工作人数比例和民营企业工作人数比例与农户入贫风险率都在1%置信水平上呈显著负相关关系;在企业工作人数比例越高的家庭,入贫风险率越低。家庭中健康人数比例与家户入贫风险率呈显著正相关关系。家庭中劳动力健康状况较差会影响其收入,进而导致整个家庭入贫风险率上升。家庭抚养比与农户入贫风险率呈显著正相关关系。相对贫困线标准下农户入贫风险率影响因素估计的结果与国家贫困线标准下的估计结果相似。
(2)分地区回归
表6中的(2)~(4)列给出了国家贫困线标准下东、中、西部地区农户入贫风险率相关影响因素的回归结果。可以看出农户入贫风险率的影响因素存在显著的区域差异。农户非贫困持续时间对东中西部地区农户入贫风险率均存在显著负相关影响,该因素对中部农户入贫风险率的负向影响最大。家庭教育特征方面,户主受教育年限只对东西部地区农户入贫风险率有着显著负相关影响,且其对于西部地区农户入贫风险率的负向影响程度大于东部地区。家庭接受中等教育人口比例只对东中部农户入贫风险率有着负向影响,该因素对于东部家户的负向影响更大。家庭接受高等教育人口比例对于东中西部地区农户入贫风险率均存在显著负向影响,该因素对西部地区农户入贫风险率负向影响最大。工作特征方面,家中在体制内单位工作人口比例和在民营企业工作人口比对于东中西部地区农户入贫风险率均存在显著负效应。在体制内单位工作人口比例对于西部地区农户入贫风险率负向影响最大,而在民营企业工作人口比例对于中部地区农户入贫风险率负向影响最大。 健康特征方面,家庭健康人口比例对于东中西部地区农户入贫风险率呈1%置信区间的显著负相关关系,其对东部地区农户入贫风险率负向影响最大。家庭抚养比只对西部地区农户入贫风险率有着显著的正效应。
表6 农户入贫风险率的影响因素cloglog模型回归估计结果
表6中的(6)~(8)列给出了相对贫困线标准下东、中、西部地区农户入贫风险影响因素的回归结果。农户非贫困持续时间只对东中部农户入贫风险率存在显著的负效应。家庭教育特征方面,户主受教育年限对于东中西部地区农户入贫风险率都有显著负向影响,该因素对于西部地区农户入贫风险率负向影响最大。家中接受中等教育人口比例只对东中部农户入贫风险率呈显著负向影响。家中接受高等教育人口比例对东中西部地区农户入贫风险率具有显著负向影响,该因素对西部地区农户入贫风险率负向影响最大。健康特征方面,家中健康人口比例对于东中西部地区农户入贫风险率具有显著负向影响,该因素对于东中西部地区农户入贫风险率负向影响依次递减。工作特征方面,家中在体制内单位工作人口比例和在民营企业工作人口比对于东中西部地区农户入贫风险率均呈1%置信水平上显著负效应。在体制内单位工作人口比例和民营企业工作人口比例均对西部地区农户入贫风险率负向影响最大。家庭抚养比只对西部地区农户入贫风险率具有显著正向影响。
(四) 稳健性检验
为了检验模型的稳健性,本文分别采用logit和probit模型估计国家贫困线和相对贫困线下农户脱贫以及入贫风险率影响因素的计量结果,并将该结果与前文的cloglog模型估计结果进行对比。发现相关影响因素的符号以及显著性并未发生明显变化,说明该研究结论具有稳健性。
五、结论与启示
本文利用2010—2018年5期中国家庭追踪调查数据的分析表明,从总体上看,国家贫困线标准下农户贫困生存时间均值是1.74期,中位数是1期;农户非贫困生存时间均值是3.24期,没有中位数。相对贫困线标准下农户贫困生存时间均值是2期,中位数是2期;农户非贫困生存时间均值是3.03期,没有中位数。分地区来看,在两种标准下,东中西部地区农户贫困平均生存时间依次递增,农户非贫困平均生存时间依次递减。
农户脱离贫困和进入贫困的过程同时存在,农户入贫的风险小于脱贫风险。生存模型的非参数分析表明,大多数贫困农户在经历短期贫困后能快速地脱贫。农户贫困持续时间越长,其脱离贫困的概率越小;农户非贫困持续时间越长,其进入贫困的概率越小。西部地区农村家户在脱贫概率上小于东部地区和中部地区的家户,其在入贫概率上大于东部地区和中部地区家户。东部地区和中部地区农村家户在脱贫和入贫的概率上差异不大。本文对农户贫困非贫困状态转变的影响因素分析表明,家中接受中等教育人数比例、家中接受高等教育人数比例、家中健康人口比例、家庭人口抚养比以及家中工作人口比例对于促进农户脱贫和阻止农户入贫具有显著正向作用。贫困持续时间对于中部地区农户脱贫负向影响最大,并且家庭抚养比对于西部地区农户脱贫风险负向影响最大。家中健康人口比例对于东部地区农户脱贫的正向影响最大。家中工作人口比例对西部地区农户脱贫风险的正向影响最大。从教育上看,户主教育年限和高等教育人口比例的增加对西部地区农户脱离贫困的正向影响最大,中等教育人口比例的增加对于中部地区农户脱贫的正向影响最大。人口抚养比对于西部地区农户脱贫的负向影响最大。
大部分农户会在短期内脱离贫困且长期保持非贫困状态。因此,政策手段应该集中在教育和保险机制方面。教育是农村居民脱离贫困的重要途径。政府应该继续加大对农村教育的扶持,通过出台相关政策吸引和稳定农村教师队伍并加大对农村地区教育经费的投入,尤其是在西部地区。在保险机制方面,家庭养老一直是农村居民最主要的养老方式,政府可以优化农村社会养老保险制度,提升该制度对农村老人经济生活的保障力度,减轻子女经济负担;完善农村地区医疗卫生服务体系,构建农村居民健康保障和疾病风险分担的安全网,进一步强化新农合等医疗保障制度在农民健康保障和经济风险分担等方面的作用。