外出务工对农户食物消费的影响研究
——基于中国西部6县的调查*
2018-11-19余颖雅聂凤英董海军黄佳琦
余颖雅,聂凤英※,董海军,黄佳琦
(1.中国农业科学院农业信息研究所,北京 100081;2.赤峰市人民政府驻北京联络处,北京 100078)
0 引言
20世纪90年代开始,中国劳动力市场发生剧烈变化,大批农民工涌入城镇务工。据国家统计局调查显示, 20世纪90年代后,农民工数量逐年上升, 2011年开始总量增速持续回落,截止2015年年底,农民工总量2.77亿人,比2014年增长1.3%,其中外出农民工*外出农民工:指在户籍所在乡镇地域外从业的农民工有1.688 4亿人,较2014年增加0.4%[1]。据中国农村贫困监测报告显示,全国扶贫重点县劳动力外出人数也逐年增加。从2002年的14.5%到2010年的20.8%,增量较大[2]。外出务工同样也是学术研究界的热点,学者们从各种角度进行挖掘,涉及经济学、农业经济学、社会学、人口学、心理学等领域。研究论题也非常广泛,包括外出务工的影响因素[3-6],外出务工对农民的收入[7-8]、农业生产[9-10]、贫困[11-12]、消费[13-14]的影响,民工返乡潮[15-16]、留守儿童[17-20]和老人[21]问题,外出务工者的婚姻状况[22]、贫困[23]、食物消费[24-26]等。
近年来,我国居民消费结构升级,粮食消费量减少,动物性食品的消费需求明显增加。这一变化趋势引起学者们对食物消费的关注,开始研究食物消费变化趋势[27]以及其结构变化的影响因素[28-31],包括收入、价格、生计资本、地域等。外出务工也逐渐成为学者研究食物消费的新切入点,重点研究外出务工对在家成员食物消费的影响。目前,国内鲜有将外出务工直接聚焦到食物消费层面的研究,研究主要集中在外出务工对农村消费结构、农民消费观念和消费倾向改变上,有少部分在消费倾向的研究中涉及到食物消费。时红艳[13]利用在陕西省安康市的农户调查数据研究发现,外出务工对农户食品消费倾向、人力资本消费倾向、社会资本消费倾向、生产性消费倾向均呈负的显著关系。袁国方等[14]对欠发达地区(陕西省)的调查研究发现,外出务工人员的流动性对食品消费倾向有显著的负效应; 外出务工收入对食品消费倾向的影响不显著。国外学者通过不同角度,对外出务工与食物消费和营养的关系进行研究,但是目前的结论也没有达成一致。Wendy R.Karamba等[32]通过对2005—2006年加纳的调查数据研究发现,外出务工会增加农户整体食物消费,也导致农户对于不营养食物(如糖,饮料等)消费的增加。Minh Cong Nguyen等[33]利用2004年和2006年越南调查数据,从外出务工人员外出持续时间上对农户的食物消费和营养进行研究,发现无论是短期还是长期,外出务工对农户人均食物支出、人均热量消耗和食物多样性都有正向影响,而短期的影响更加显著。S.Chandrasekhar等[34]使用印度农村调查数据,并使用工具变量的方法研究短期外出务工对家庭消费支出的影响。研究结果发现,短期外出务工的家庭的每月人均消费支出和每月人均食物消费支出相对较低。
针对国外外出务工对农户食物消费的研究发现,外出务工主要从以下几个方面对农户食物消费产生影响,一是外出务工人员带来的汇款收入会增加农户对食物、健康相关产品和服务的支出,从而提高获取营养食物的能力[32]。二是外出务工人员带来的信息和经验可以丰富农户在营养、健康和生产技能方面的知识,同样也会改变农户食物消费习惯,由此带来的影响可能是有利于食物消费状况的改善,但也有可能带来不利影响[32]。三是外出务工使得农户消费人口减少,消费量减少,家庭消费需求减少,但同时劳动力也相应减少,家庭收入减少,因此由此带来的影响有利有弊[32, 35]。
目前,国内外研究外出务工对农户食物消费影响的普遍较少,国内几乎空白,国外采取的数据都较为久远,无法反应现阶段的影响情况。此外,随着精准扶贫的提出,贫困地区的食物消费情况也得到了广泛关注。研究发现,贫困县的食物消费水平和食物安全状况都低于我国农村平均水平[36],那么外出务工对贫困地区食物消费状况是进一步恶化还是改善。综上所述,文章决定从外出务工角度研究西部贫困地区在家成员的食物消费情况以及其带来的影响。而外出务工变量具有内生性,许多学者采用工具变量模型[21, 37]控制其内生性,但是目前没有发现特别合理的工具变量,同时是否外出务工这两组样本的初始条件不完全相同,存在选择偏差[20]。因此,为了厘清贫困地区外出务工对农户食物消费的影响,该文利用2015年我国陕西省、贵州省和云南省的6个贫困县的调查数据,采用倾向得分匹配法(Propensity Score Matching,PSM)调整样本的选择性偏差,降低内生性导致的估计偏误,单独将处理因素——外出务工从影响农户食物消费的因素中分离出来并分析其影响效果。
1 西部贫困地区农户食物消费现状
1.1 数据
研究使用的数据来源于“中国农村食物安全与贫困综合调查”课题组2015年对陕西省镇安县和洛南县、云南省武定县和会泽县、贵州省正安县和盘县所进行的入户调研,研究采用多阶段抽样方法确定样本的农户。第一阶段,采用按照人口加权的抽样方法(PPS)在各县抽取19个村,人口越多的村抽到的概率越大。第二阶段,采用随机抽样的方法,在每个样本村中随机抽取12个农户。这样,每个县抽取19个村228户, 6个县共抽取114个村1 368农户。问卷内容包括家庭基本情况、住房和生活条件、家庭财产与财务状况、农业、生计、支出、食物来源和消费以及冲击和应对策略等内容。其中,食物消费调查采用1个月回顾法,即农户回顾过去1个月各类食物消费的情况。调研时间为2015年7—8月,不是收获或者缺粮季节,也没有大型传统节日,是正常月份,保证了调研数据的代表性以及平滑性[28]。由于有一户全家外出务工,没有在家人员的食物消费状况,故剔除,最终获得有效问卷1 367份。
1.2 农户食物消费现状*农户食物消费分析以年人均食物消费支出为主,人均食物消费支出反映食物的具体消费情况,将食物种类分成七大类,分别为:粮食、蔬菜水果、动物性食品、油脂类、调味品、烟酒茶饮料和在外用餐。其中,粮食包括谷物类、豆类和薯类; 动物性食品包括肉类、水产品、蛋类和奶类; 油脂类包括食物油和坚果等油脂性食物; 调味品包括盐、糖、味精、醋、酱油等日常调味品; 烟酒茶饮料包括烟类、茶类和饮料类
2015年调研县年人均食物总消费为3 895.06元/人·年,占总体消费的34.1%。农户食物消费以粮食类为主,人均支出为957.555元/人·年,占总食物消费的30.1%,动物性食品和蔬菜水果消费较少,烟酒茶饮料消费却不低,占总食物消费的15.0%(表1)。
表1 农户食物消费情况
表2 外出务工分类的人均食物消费支出情况
将农户按照是否外出务工分为两类,进行均值T检验,如表2。虽然是否外出务工两类农户的人均食物消费总支出差异不显著,但粮食、蔬菜水果、调味品和在外用餐食物消费具有显著差异。粮食和调味品,有外出务工的农户人均食物消费支出明显高于无外出务工农户,而在外用餐的人均消费支出,无外出务工的农户显著较高。由此看出,两类农户的部分食物消费有显著差异,这一差异很可能来自于外出务工对农户食物消费的改变。
2 模型构建
如该文所述,为了降低外出务工的内生性以及较好的控制样本选择偏差,文本采用倾向得分匹配方法研究外出务工对农户食物消费的影响。倾向得分匹配方法的基本思想是将控制组和处理组的可观测特征相同或相似的样本进行匹配,以观察实验产生的效应,社会实验通过控制多元变量以达到满意的匹配效果非常困难[20]。倾向得分匹配的优势在于可以通过一定的方法将多元变量浓缩为一个指标——倾向得分(PS)值,然后根据该值将控制组和处理组进行配对,从而在有效降低自选择以及内生性偏误的条件下得到更可信的处理效应。
基于此,该文将样本分为两大类,处理组——有外出务工的农户个体样本,控制组——无外出务工的农户个体样本。两组样本由于都生活在贫困地区,故其生活偏好、消费习惯以及家庭环境可能都较为类似。对于处理组,无法同时获得有外出务工和没有外出务工的效用,为了获得反事实的处理组样本,即没有外出务工的效应,E(Y0i|Di= 1)构建倾向得分匹配模型,设定如下:
第一步,构建农户食物消费影响因素的模型:
Yi=α+β1Di+β2X1i+β3X2i+ε
(1)
式(1)中,Y为被解释变量,表示农户的食物消费状况;Di为处理变量,表示外出务工状况,即该农户是否有外出务工;Xi为影响农户食物消费状况的一系列因素,其中,X1i为只影响农户食物消费的因素,X2i为同时影响农户食物消费和外出务工的因素;ε为扰动项,α为常数项。该模型表示了外出务工及其他影响农户食物消费因素的共同作用。
第二步,计算每户农户外出务工的倾向得分(PS)值。
首先,构建影响农户外出务工选择的模型:
Di=α+β2X2i+ε
(2)
根据式(1)和(2)通过Logit模型估计构建倾向得分模型,计算处理组的PS值:
(3)
式(3)中,Xi为影响农户食物消费状况的一系列因素,同时作为倾向得分模型中的协变量;β为对应的估计系数。根据此模型计算得出处理组和控制组的平均倾向得分。
第三步,进行倾向得分匹配,采用3种常用的匹配方法(最近邻匹配法、半径匹配法和核匹配法)进行处理组和控制组样本间的匹配。
第四步,根据匹配后样本,计算平均处理效应(ATT):
ATT=EY1i-Y0i|Di=1=EEY1i-Y0i|Di=1,pXi
=EEY1i|Di=1,pXi-EY1i|Di=0,pXi|Di=1
(4)
式(4)中,Y1i、Y0i分别表示样本农户在处理组和控制组两种不同的情形下的食物消费状况。
倾向得分匹配法的特点是创造随机试验条件以进行处理组及控制组的比较分析,其必须满足两个假设。第一是条件独立假设。假定存在一系列可以观测的协变量X,既影响农户外出务工的决策,又影响农户的食物消费状况,但反过来不会受到外出务工决策的影响。控制了这组协变量后,是否外出务工在样本中的分配则是随机的; 第二是共同支撑假设。该假设要求具有某些协变量特征的样本个体,同时具有外出务工和无外出务工的正向概率,即农户有外出务工和无外出务工的倾向得分必须有重叠的部分。满足共同支撑假设可以提高样本匹配的质量。
该文将年人均食物消费总支出的对数作为因变量,反映农户整体食物消费水平。处理变量是农户是否外出务工。根据文献研究发现,农户家庭特征、户主特征、种养殖特征这些变量影响农户外出务工选择[3-6]和食物消费[28, 30-31],但不受外出务工选择的影响,故该文选取农户家庭特征、户主特征、种养殖特征和地理位置等因素作为协变量。其中,农户家庭特征变量包括:教育水平、收入水平、是否有婴幼儿、是否遭遇自然灾害、是否为少数民族、是否有人住院和市场距离; 户主特征包括:户主年龄、户主婚姻两个变量; 种养殖特征包括:农户是否在房前屋后种植、是否种地、是否养殖和耕地面积3个变量。
该文随后采用Logit模型逐步引入协变量进行倾向得分估算,选择既满足倾向得分平衡性检验,又有最大Pseudo-R2值的变量组合作为本模型的协变量。初步选择变量如表3。
表3 初步选择变量及描述
表4 变量的描述性统计结果
3 实证结果分析
3.1 描述性统计分析
调研县农户年人均食物消费总支出的对数为8.068,有外出务工人员的农户占总体的52.2%。调研县户主平均年龄52.1岁,户主婚姻状况以已婚为主,占总体的91.4%。劳动力平均受教育年限为5.5年,表明调研县农户平均文化程度为小学,低于全国农村平均水平; 农户人均年收入为1.525 7万元。调研县少数民族户较少,仅占总体的14%; 有婴幼儿的家庭比例为22.2%; 加入合作社的极少,仅占总体的8.4%。调研县有负债的农户较多,占总体的60.5%; 2014年遭遇自然灾害的农户较多,占总体的61.7%; 有家庭成员住院的占总体的41.5%。此外,种养殖特征变量表明大部分农户家里都有种养殖行为,耕地面积平均0.3hm2。市场距离变量的均值为6.553km,表明农户与市场的距离较远。变量的描述性统计结果具体见表4。
3.2 模型估算结果
通过Logit模型逐渐引入协变量进行倾向得分回归,同时检验处理组以及控制组的倾向得分平衡性,并检查模型的Pseudo-R2值,选择既满足平衡性又使得Pseudo-R2值最大的变量组合。且多重共线性远小于10,最大的为1.47,故不存在多重共线性[38]。变量最终选择及Logit模型结果见表5。
表5 倾向匹配得分的Logit模型估算结果
(a)匹配前核密度函数 (b)最近邻匹配后核密度函数
(c)半径匹配后核密度函数 (d)核匹配后核密度函数图1 匹配前后PS值的核密度函数
通过Logit模型计算倾向得分,因变量为是否外出务工。回归结果显示,户主年龄、教育水平、房前屋后、市场距离以及地域变量对农户外出务工有显著影响,除教育水平之外,其余变量都具有显著正向影响。
3.3 匹配质量检验
3.3.1 平衡性检验
经过倾向得分匹配后,需要检查处理组和控制组之间的平衡性问题,即经过匹配后,样本组之间除了农户的食物消费存在差异外,协变量不应该存在显著的系统差异[17]。以最近邻匹配法为例,对是否外出务工两个样本组倾向得分匹配前后的平衡性检验结果如表6。匹配前,大部分变量的处理组和控制组的标准偏误都较大,且通过T检验显示大部分变量都有显著性差异。通过最近邻匹配之后,除了收入水平之外,其余所有变量的处理组和控制组的标准偏误都出现了不同程度的消减,两组的均值更加接近,标准偏误的绝对值都在10%以内,且T检验之后都没有显著差异。虽然两组的收入水平偏误略有增大,但是其标准偏误的绝对值还是在10%以内,且T检验显示依然没有显著差异。由此得出,经过匹配后,处理组和控制组变量的差异得以控制,之间已没有统计差别,基本达到了类似于随机试验的效果,这说明已大大削弱自选择所导致的估计偏误。
表6 倾向得分匹配前后变量平衡性检验(最近邻匹配法)
表7 不同匹配方法的匹配质量检验
3.3.2 匹配质量
根据是否外出务工两组的倾向得分,采用最近邻匹配法、半径匹配法和核匹配法分析比较两组的食物消费水平差异并检验稳健性。表7列出了不同匹配方法的匹配质量情况。
从Pseudo-R2值看,不同方法进行匹配后,Pseudo-R2值均有不同程度的减少,匹配前变量的Pseudo-R2值为0.0585,采用最近邻匹配法、半径匹配法和核匹配法后,Pseudo-R2值分别降到0.002、0.005、0.006,说明匹配后变量消除了系统差异。
从平均标准偏差看,匹配前,变量的平均标准偏差为15.3,通过不同的匹配方法完成匹配后,平均标准偏差都有不同程度的减少。最近邻匹配法的匹配后,匹配质量大大提高,平均标准偏差下降到了2.9,这说明匹配过程能够很好地匹配处理组和控制组的样本特征。设置0.01卡尺范围的半径匹配法以及核匹配法匹配之后,匹配质量也有所提高,平均标准偏差分别下降到了4.1和4.3。
从t-检验看,匹配前变量均值的t检验结果为110.54,通过不同匹配方法进行匹配后,t检验结果都大幅减少。t检验结果越小,说明处理组和控制组的变量均值在匹配后的差异越小,匹配效果越好。最近邻匹配法、半径匹配法和核匹配法的t检验结果分别为4.81、9.75和10.90,较110.54有较大的减少。
图1显示了不同匹配方法前后的农户PS值核密度函数,更加直观地反映了匹配前后的效果。可以看出,在匹配前处理组和控制组的PS值概率分布存在较为明显的差异。显然,如果直接比较处理组和控制组之间的农户食物消费差异,所得到的统计结果必定是有偏的,而较多研究往往忽视了这一问题。相比之下,利用不同的匹配方法完成匹配后,两组样本的PS值概率分布都已非常接近,表明两组的个体特征也非常接近。同时也表明经共同支持检验之后,实验组和控制组之间存在重叠,匹配效果较好。
3.4 平均处理效应分析
采用平均处理效应(ATT)分析外出务工对农户食物消费的处理效应。运用最近邻匹配法、半径匹配法和核匹配法估计样本的平均处理效应,并采用自抽样法(Bootstrap)反复抽样500次估计样本的标准误,如表8。可以看出,采用3种不同的匹配方法后,外出务工对于农户的食物消费支出有显著的正向作用,即外出务工的农户食物消费支出显著高于非外出务工农户。不同匹配方法的平均处理效应的方向和趋势是一致的,但是估算结果存在着较小的差异,最近邻匹配法、半径匹配法和核匹配法的平均处理效应分别为0.081、0.077和0.060。出现上述结果的原因主要是不同匹配方法的共同支撑区域是不同的,使得不同匹配方法的样本产生差异。
表8 平均处理效应
匹配前,外出务工农户与非外出务工农户的人均食物消费总支出的对数分别为8.064和8.072,且两者没有显著差异,其平均处理效应为-0.008。通过3种不同匹配方法匹配后,平均处理效应均有提高,方向变为正向,且处理组和控制组在10%显著水平下有显著差异。采用最近邻匹配法后,农户的人均食物消费总支出的对数分别为8.068和7.987,平均处理效应为0.081,即在5%显著水平下,外出务工农户的人均食物消费总支出的对数比非外出务工的农户显著高0.081个点; 采用半径匹配法后,农户的人均食物消费总支出的对数分别为8.068和7.990,平均处理效应为0.077,即在1%显著水平下,外出务工农户的人均食物消费总支出的对数比非外出务工的农户显著高0.077个点; 采用核匹配法后,农户的人均食物消费总支出的对数分别为8.072和8.013,平均处理效应为0.060,即在10%显著水平下,外出务工农户的人均食物消费总支出的对数比非外出务工的农户显著高0.060个点。这表明,考虑了外出务工的选择性偏误和内生性问题后,外出务工会提高农户的食物消费支出,这对于改善农户的食物消费状况具有重要作用。
通过不同匹配方法的结果可以看出, 3种匹配方法虽然有所不同,但是结果相似,这也说明了结果是稳健的,不依赖于具体的方法。从而表明从影响农户食物消费支出的诸多因素中将外出务工单独提取出来,以考察其对食物消费的影响效应具有一定的可信度与说服力。
4 结论与启示
外出务工对贫困地区农户食物消费的影响是热点问题也是重要问题,然而,国内对于这方面的研究少之又少。该文以西部贫困地区在家成员为研究对象,运用倾向得分匹配方法降低外出务工的内生性并控制样本选择偏差以分析外出务工对农户食物消费的影响。
4.1 结论
(1)研读文献发现,外出务工主要通过收入变化、外来的信息或经验和人口变化这3方面影响农户的食物消费。(2)调研地区农户食物消费以主食为主,动物性食品和蔬菜水果消费不多,烟酒茶饮料消费却不低; 是否有外出务工两类农户的粮食、蔬菜水果、调味品和在外用餐食物消费都有显著差异。(3)调研地区农户外出务工能提高农户的食物消费水平。倾向得分匹配后,在控制样本其他特征条件一致的情况下,外出务工使农户的人均食物消费总支出的对数最多提高0.081,最少提高0.060。不同的匹配方法形成的匹配集不同而产生了不同的共同支撑区域,从而导致了平均处理效应具有不同程度的损失,但其效应的方向和趋势是一致的,证实了外出务工对农户食物消费的正效应,且具有稳健性。外出务工提高农户的食物消费水平,这一结论与Karamba W R等[32]和Nguyen M C等[33]的研究结论较为一致,但与时红艳[13]、袁国方[14]的研究结论有一定差异,他们的研究结果显示外出务工对于食品消费倾向具有负向影响或无显著影响,可能的原因:首先,样本选择的差异,该文的样本是陕西省、云南省、贵州省的6个贫困县,而时红艳和袁国方采用的是陕西省的农村居民数据,不针对贫困地区; 其次,数据的差异,该文的食物消费数据为上月食物总消费,几乎包含了所有食物,较为全面,而时红艳和袁国方学者研究整体消费,不单针对食物消费,食物消费的数据仅包含经常食用的,不全面; 最后,研究内容的差异,该文仅研究外出务工对食物消费的影响,而时红艳和袁国方学者研究的是外出务工对消费倾向的影响,食物消费仅是其中一项,相对于其他消费来说,食物消费受到的影响较小,甚至为负向。
4.2 启示
首先,从实证结果看,外出务工显著提高农户的食物消费水平,但是外出务工影响了农户哪些食物的消费; 深入到营养层面,到底是改善了贫困地区农户的营养状况还是恶化了呢,这些也是值得深入思考和研究的问题,而且对改善贫困地区农户食物消费与营养状况的政策制定能提供相关理论依据。其次,应该更进一步研究外出务工是如何影响农户食物消费的,是外出带来的收入、外出人员的性别、外出的地点、还是在外的持续时间等因素影响了农户食物消费,这样才能真正厘清两者的影响机制,以期从不同的角度改善农户的食物消费状况。再者,由于数据的局限性,没有将在家人员的消费进行细分,如对儿童食物消费的影响,对老人的影响等。若将人口进行细分,能更好地判断出外出务工到底对哪方面人群的食物消费产生较为重要的影响,也有利于政策的更好瞄准。这也是下一步需要探索的方向。最后,在进一步实施精准扶贫中应加大对贫困地区食物消费与营养的政策性倾斜研究,关注其食物消费与营养状况,有针对性地采取措施增加贫困地区农民的可支配收入,改善贫困地区农户的食物消费结构,提高食物安全与营养水平。