互联网对农村劳动力非农就业的影响
——基于CFPS数据的实证研究
2022-10-18丁炎晨
丁炎晨 于 冷
(上海交通大学 安泰经济与管理学院,上海 200000)
0 引言
2020年是实现全面建成小康社会的决胜之年,要帮助贫困地区脱贫致富,需要帮助农村贫困地区居民增加收入,要实现这一目标有两种途径:(1)提高农业生产效率,增加农业收入;(2)促进农村劳动力非农就业,丰富收入来源。这两种途径之间存在双向因果关系,杨向阳等(2007)研究发现,非农就业水平的提高会促进农业生产率的增长,而农业生产率的增长反过来会进一步提高非农就业水平。随着生产率的不断提高,农村居民向城市流动,农村劳动力向非农产业转移,是一个国家或地区实现现代化过程中不可避免的现象。
伴随着经济增长,二、三产业对劳动力的需求日益增加,根据《2019年农民工监测调查报告》,2019年农民工总量达到29,077万人,比上年增加241万人,增长0.8%,增速比上年小幅上升0.2个百分点。就劳动力的需求增加而言,农民工的增速目前处在一个较低的水平。马俊龙等(2017)研究发现部分东南沿海等经济发展较快的城市出现“民工荒”的趋势也日益明显,越来越多的学者开始讨论中国是否即将迎来“刘易斯拐点”。虽然讨论结果不尽相同,但不可否认的是,曾一直支撑中国经济高速发展的“人口红利”在不断流失。但是,中国农村仍然存在着大量的剩余劳动力。根据《中国统计年鉴》数据,2019年第一产业GDP占比仅为7.1%,而第一产业的就业人数占总就业人数的比例达到了25.1%。近年来由于农业机械化进程的推进,农业生产效率不断提高,农业所需就业人数不断减少,吸纳劳动力能力不断降低,因此农村地区存在大量边际产出为0的剩余劳动力。帮助这些剩余劳动力实现非农就业,填补二、三产业迅速发展带来的劳动力需求,对促进农民增收、缩小城乡收入差距,以及推动社会经济全面发展都具有重要意义。
从微观角度来看,限制农村劳动力非农就业的原因主要有两点:人力资本和社会资本。人力资本包括健康水平、受教育程度、专业技能等;社会资本包括人际关系、社会网络等。互联网的使用和普及有可能帮助打破这两条限制:一方面,互联网的使用可以帮助农村居民以更低的成本,在更短的时间内接受教育或技能培训,如网络课程等,这是正规教育的重要补充,可以在一定程度上提高农村劳动力的人力资本;另一方面,互联网的即时通信功能也有助于农村居民建立自己的社会网络,增加人际关系,并且可以使用互联网搜索引擎丰富自己的信息来源,包括招聘信息等,从而增加就业渠道,提高就业几率。此外,互联网的普及还产生了一些新颖灵活的工作职位,如网约车、外卖配送等,也为农村劳动力的非农就业创造了机会。
从互联网普及率来看(见图1),目前城乡之间仍有较大差距。近些年来随着计算机、智能手机等硬件设备的发展和互联网的推广普及,中国网民数量不断攀升,城乡互联网普及率不断提高,但城乡之间差距依然明显。《CNNIC中国互联网络状况统计报告》指出,截至2020年3月,中国的网民规模达到9.04亿,较2018年底增长了7508万,互联网普及率达到64.5%,较2018年底提升4.9个百分点。其中农村网民规模达到2.55亿,占网民整体的28.2%,较2018年底上升了1.5个百分点。随着农村地区网民规模和互联网普及率的不断增长,城乡互联网普及率差异正在逐步缩小,但仍超过30%。城乡间存在差距一方面是由于城镇化进程在一定程度上影响了农村互联网普及推进工作的成果;另一方面则由地区经济发展不平衡造成,这也是城乡差距的主要原因。
同样需要注意的是,互联网是一项高技能型工具,需要学习和培训相关技能才能有效地使用,而农村劳动力大多受教育程度偏低,在接触到互联网时往往不能有效利用,无法充分发挥互联网对其就业和收入的积极效应。此外,近些年来各类短视频和直播平台的兴起,使得越来越多的农村网民接入互联网的目的是用来娱乐。《CNNIC中国互联网络状况统计报告》指出,截至2020年3月,中国网民网络视频(含短视频)用户规模为8.5亿,网络视频使用率达到94.1%,网络游戏用户规模为5.3亿,网络游戏使用率达到58.9%。过度使用互联网进行娱乐活动,不仅不能发挥互联网对就业的积极促进作用,反而可能分散精力,甚至导致沉迷网络而对就业甚至日常生活产生负面影响。
本文框架如下:第一部分为引言,阐述研究背景;第二部分为文献综述;第三部分为数据来源和模型;第四部分为实证分析;第五部分为结论和政策建议。
1 文献综述
中国庞大的农村人口是直接关系到经济发展和社会稳定的重大问题(乐章等,2010)。近年来随着农业机械化进程的推进,农业生产效率不断提高,农业吸纳就业能力不断降低,农村存在大量剩余劳动力。蔡昉等(2007)也指出了中国农村劳动力显著剩余的客观事实。对于如何减少剩余劳动力,促进农村劳动力非农就业的问题,很多学者从不同角度进行了研究。如任国强(2004)分析指出教育对农村劳动力非农就业具有显著的促进作用,且除了高中,劳动力受教育程度越高,获得的非农收入也越高。程名望等(2006)也通过研究发现,农民受教育程度对其身份转变和非农择业等意愿倾向的影响非常显著,这构成了农民非农就业的内在推力,也在一定程度上揭示了人力资本也是影响劳动者非农就业的重要因素。其他方面,魏众(2004)指出健康状况对农民的劳动参与和非农就业机会都有显著的促进作用,且对增加家庭收入有重要作用;范丽红等(2019)发现农村地区女性一般负责在家照顾老人和小孩,增加农村地区养老基础设施和服务可以释放女性劳动力从而促进其非农就业。
随着中国信息化水平的提高,越来越多的学者开始关注互联网对劳动力市场的影响。一方面,部分学者从宏观层面研究了“互联网+”背景下大学生就业创业的情况和互联网对整体就业结构的影响。中国自20世纪90年代引进互联网技术以来,信息化程度不断提高,特别是近年来相继提出“互联网+”“智慧城市”和“数字中国”等一系列信息化发展战略,旨在通过互联网技术的普及与应用促进中国经济社会全面发展(程名望,2019)。在“互联网+”背景加持下,大学生就业创业具有机会更多、平台更大、门槛更低、更加公平等新特点(程煜等,2015)。“互联网+”实现了工业化与信息化的深度融合,对于推动大学生就业创业具有十分显著的优势(金印等,2016)。丁琳等(2020)基于WIOD投入产出数据, 从理论分析和实证检验两方面分析了互联网技术进步对就业的影响,发现中国互联网技术进步减少了技术密集型制造业和建筑业的就业, 促进了第三产业就业, 长期看互联网技术进步会促进整体就业。
另一方面,更多的学者从微观层面研究互联网使用对劳动者收入水平和劳动参与的影响。刘晓倩(2018)基于2014年CFPS数据研究得出结论,互联网对不同来源的收入均有提高,尤其是对农业收入的影响更为明显;周冬(2016)利用有序Probit模型研究发现,互联网使用能够显著促进农村居民非农就业、丰富农民收入来源,从而提高农村发展水平。卜茂亮等(2011)利用2008年CFPS数据估计了信息技术的工资回报率,发现互联网的使用可以带来约60%的额外收入,其中农村地区约为78%,明显高于非农村地区的38%。在劳动参与方面,毛宇飞等(2017)研究发现,互联网使用能促进女性整体就业,且对非自雇就业的作用效果大于自雇就业。赵建国等(2019)运用Logit模型和IVProbit模型,分析了互联网对大学毕业生就业和劳动参与的影响,发现互联网使用显著促进了大学毕业生的就业和劳动参与概率,且互联网使用对大学毕业生就业的促进效应主要集中于30岁以下、农村户籍以及东部的毕业生群体中。周洋等(2017)研究了互联网对农村家庭创业的影响,发现互联网的使用对创业活动具有积极的促进作用,并且社会交往和信息获取是主要的影响机制。
此外,也有一些学者关注互联网对收入分配的影响。邱泽奇等(2016)指出,从互联网红利中受益更多的地区主要集中在东南沿海等经济发达地区;程明望等(2019)指出互联网普及对城乡收入差距的影响呈现先增加后降低的“倒U型”趋势,且互联网普及对城乡收入差距的影响在2009年左右已经越过拐点,而且互联网普及显著缩小了城乡居民消费差距, 并且是通过城乡居民生存型消费差距、享受型消费差距和发展型消费差距多维路径实现的。
但是,国内专门研究互联网对非农就业影响的文章较少。周冬(2016)使用有序Probit模型发现使用互联网能有效提高农村劳动力非农就业的概率,使得农村就业多元化,但是她的文章中并未解决内生性的问题。马俊龙等(2017)使用工具变量和Biprobit模型克服了内生性,进一步证明了互联网对农村劳动力非农就业的促进作用,并得出互联网可以通过帮助农村居民提高社会资本、减少家务时间两个渠道影响劳动者就业决策的结论。赵羚雅等(2018)研究发现互联网显著提高了农民非农就业的概率,并通过中介效应得出互联网对非农就业的促进效应中有23.88%来自社会资本。
但是以上文章都未进一步研究过度使用互联网是否会带来负面影响。近年来随着互联网的普及,各类手机游戏、短视频平台、直播平台等不断走红,在受教育程度普遍偏低、互联网使用技能较弱的农村地区,很多人使用互联网并不是用来学习或者获取信息,而是从事游戏、直播等娱乐活动,这样一来过度使用互联网非但不能促进非农就业,反而会带来负面影响,因此本文能够在一定程度上丰富该领域的研究。
2 数据与模型
2.1 数据来源和变量统计描述
本文数据来自2016年中国家庭动态跟踪调查(CFPS)数据。中国家庭动态跟踪调查是北京大学中国社会科学调查中心实施的、一个旨在通过跟踪搜集个体、家庭、社区三个层次的数据,反映中国社会、经济、人口、教育和健康的变迁,以为学术研究和政策决策提供数据为目标的重大社会科学项目。该数据库于2010年正式开始访问,样本覆盖25个省/直辖市/自治区162个县,目标样本规模为15776户,剔除正在上学的、年龄过大和年龄过小的样本,还剩13584个。调查对象包含样本家庭的全部家庭成员,数据具有较好的代表性,能够作为本文研究问题的优质数据来源。表1所列为统计数据的大致情况。
表1 主要变量的基本特征
模型被解释变量为是否非农就业,非农就业为1,务农和未就业为0。核心解释变量分为是否使用互联网和使用互联网各类用途的频率,其中是否使用互联网包含使用电脑上网和手机上网,以问卷中“是否移动上网”“是否电脑上网”为准,只要二者中有一个满足即认为使用互联网;使用互联网各类用途的频率包括“使用互联网学习的频率”“使用互联网工作的频率”“使用互联网娱乐的频率”“使用互联网社交的频率”,使用频率按照“从不”到“几乎每天”划分为7个等级,依次赋值为0~6,其中“使用互联网娱乐的频率”是本文讨论的重点。其他控制变量包括年龄和年龄平方,这是因为中年往往是工作的黄金时期,所以非农就业与年龄可能呈现倒U型关系;性别,因为农村女性承担了照顾老人孩子的职责,所以男性往往更容易非农就业;受教育程度,分为“从未受过教育”“小学”“初中”“高中”“大专及以上”,其中“从未受过教育”作为对照组,受教育程度越高,其非农就业的概率往往越大;是否有过非学历教育,作为正规教育的重要补充,非学历教育往往可以帮助劳动力掌握新的技能,从而提高其非农就业概率;健康程度,作为人力资本的重要一项,健康的人往往有更多的机会就业;是否结婚和孩子个数,家庭情况往往对个体的就业选择和就业机会有所影响,引入这些控制变量用来控制个体的家庭状况差异;是否党员,在中国党员身份可能会影响农村劳动力在某些岗位的就业机会。
2.2 实证模型
由于模型的被解释变量“是否非农就业(因变量job)”为离散的二元变量,所以本文的基本模型采用Probit模型:
Pr(job=1)=Φ(cons+αInternet+βX)
(1)
Pr(job=1)=Φ(cons+αXX_Int+βX)
(2)
其中Internet为核心解释变量“是否使用互联网”,XX_Int为“使用互联网的频率(XX代表不同途径,如学习、工作、娱乐等)”。正如前面所讨论的,本文希望分析过度使用互联网是否会对农村劳动力的非农就业产生负面效果,所以在基本模型的基础上再加入互联网使用频率的平方项(XX_Int2),这样一来式(2)就变成了:
Pr(job=1)=Φ(cons+αXX_Int+γXX_Int2+βX)
(3)
实际上,个人的就业情况与其使用互联网频率之间存在着“自选择”的问题:实现了非农就业的农村居民往往有着更高的收入,则更有可能接入并使用互联网,且非农工作相比务农本身就会更多地接触到互联网,如外卖骑手、网约车司机等。这样一来如果使用上述模型进行回归分析就高估了互联网对非农就业的促进作用,因此存在着内生性的问题。此外,该模型的内生性问题还存在另一方面:很大一部分人群,尤其在农村落后地区,使用互联网是用来休闲娱乐的,如打游戏、看视频直播等。因为他们缺乏对互联网信息技术的利用能力,那么这一部分样本就不能客观地体现出互联网对非农就业的促进作用,从而低估了互联网的影响。
为了克服内生性问题,本文采用工具变量法,而该模型中被解释变量“是否非农就业”和核心解释变量“互联网使用频率”均为离散变量,所以不能直接使用Ivprobit模型,只能采用Biprobit模型:
Pr(job=1)=Φ(cons+αXX_Int+γXX_Int2+βX,
Pr(XX_Int=i)=f(X,Z),i=0,1,2,3,4
(4)
而在使用工具变量时需引入离散变量Internet的映射,不可观测的潜在变量y*与解释变量向量X和工具变量Z存在线性回归关系,扰动项ε服从独立且正态分布,如下:
y*=cons+γZ+φX+ε
当y*的估计值落在一定的边界点内时,我们就可以观测到农民相应的互联网使用频率,假设边界点为λ1,λ2,λ3,λ4,λ5我们可以将其关系定义如下:
再由扰动项ε服从独立且正态分布有:
Pr(XX_Int=0)=Φ(λ1-φX-γZ),
Pr(XX_Int=i)=Φ(λi+1-φX-γZ)-Φ(λi-φX-γZ),i=1,2,3,4
关于工具变量的选择,要满足两个条件:(1)与内生解释变量存在相关性;(2)严格外生,只通过内生解释变量来影响被解释变量。本文选择的工具变量为个体所在区县去除个体所在村/镇的互联网普及率,计算公式为:
这样的工具变量是合理的。关于相关性:个体周边村/镇的互联网普及率越高,则个体身边使用互联网的人越多,由于同伴效应,会影响个体自身对互联网的使用决策;关于外生性:其他村/镇的互联网普及率往往并不会影响个体的非农就业概率,因此是完全外生的。
本文将使用该工具变量,运用上述Biprobit模型,分析互联网对农村劳动力非农就业的促进作用以及过度使用互联网带来的负面影响。
3 实证结果
3.1 互联网的使用对农村劳动力非农就业的影响
使用互联网对农村劳动力非农就业的影响如表2所示,在未引入互联网使用频率平方项的情况下,模型1、2分别为不加工具变量的Probit模型和使用工具变量的Biprobit模型。由分析回归结果可以看出,“是否使用互联网”前的系数显著为正,并且在引入了工具变量之后该结果依然显著为正,说明使用互联网确实可以促进农村劳动力的非农就业。
表2 “是否使用互联网”对农村劳动力非农就业的影响
其他的控制变量也都基本符合我们的预估:(1)年龄对非农就业的影响呈倒U型,这是由于青少年和中年是就业的黄金年龄,年龄过大或过小都会降低就业的概率;(2)男性比女性非农就业的概率要高,这是由于农村女性往往承担了照顾老人和孩子的责任,降低了她们外出就业的几率。因此农村投入养老基础设施可能在一定程度上解放农村妇女,促进其非农就业;(3)接受教育会使非农就业的概率增大,且受教育程度越高,促进效果越明显,接受过非学历教育同样对非农就业有促进作用;(4)健康状况前系数显著为正,说明越健康的个体参与非农就业的概率越大;(5)子女个数会影响非农就业的概率,且对其有负效应,这与(2)中讨论的结果可能有交叉,因为家中孩子越多,需要照顾孩子而被迫留在家中不能外出,非农就业的概率就越高。
在模型1、2的基础上,将核心解释变量“是否使用互联网”更换为“使用互联网娱乐频率”,并加入使用频率平方项,分析过度使用互联网进行娱乐活动是否会带来负面效应,得到模型3、4。回归结果如表3所示,可以看出,使用互联网娱乐频率前系数显著为正,而使用频率平方项前系数显著为负,并且在加入工具变量后依然显著,说明非农就业概率与使用互联网娱乐频率之间存在倒U型关系,且拐点位置位于5.3左右,即当使用互联网娱乐的频率达到“几乎每天”时,便会对农村劳动力非农就业产生负面影响,导致非农就业概率下降。
表3 “使用互联网娱乐频率”对农村劳动力非农就业的影响
3.2 进一步分析
模型4的结果显示,使用互联网娱乐的频率与非农就业概率之间存在倒U型关系,即过度使用互联网进行娱乐活动会导致非农就业概率下降。为了进一步分析该问题,本文从样本中剔除使用互联网进行学习和工作的样本,对剩下的10273个样本进行分析,这样可以观察在不使用互联网学习和工作的情况下,如果使用互联网只是用来娱乐和社交,过度使用互联网是否会有负面影响。对该组样本进行工具变量下的Biprobit模型分析,得到结果如表4。
表4 实证回归结果(剔除使用互联网学习和工作的样本)
可以看到,“使用互联网娱乐频率”前系数显著为正,而平方项系数显著为负。即非农就业概率与使用互联网娱乐频率之间仍呈倒U型关系,并且此时拐点位置有所前移,位于频率为4.9左右的位置,即在不使用互联网从事学习和工作的情况下,当使用互联网娱乐的频率达到“每周3~4次”时,便会对农村劳动力的非农就业产生负面影响。而且这还是在样本会使用互联网进行社交增加个人社会资本,从而对非农就业产生积极影响的情况下(因使用互联网娱乐和社交重叠样本过多,不宜直接分离),若单独考虑使用互联网进行娱乐的情况,这一拐点可能更加前移。对比模型4~5的结果可以看出,使用互联网确实可以促进农村劳动力非农就业,但由于互联网是一项高技能型工具,要发挥其促进作用需要使用者掌握一定的技能并合理使用,若只是使用互联网从事娱乐活动,那么过度使用互联网反而会对非农就业产生负面影响。
3.3 稳健性检验
第45次《CNNIC中国互联网络发展状况统计报告》显示,截至2020年3月,中国手机互联网用户占全部网民的99.3%,移动上网已经是中国网民最普遍的上网方式。本文将“是否移动上网”作为解释变量进行稳健性检验,结果如下表5,可以看出,无论是否加入工具变量,移动上网对农村劳动力非农就业的影响均显著为正,因此本文的研究和模型具有高度稳健性。
表5 稳健性检验:移动上网对非农就业的影响
3.4 异质性分析
表6显示了使用互联网对不同性别的农村劳动力非农就业的影响。可以看出,不管对男性还是女性,使用互联网均能提高非农就业的概率,并且对男性非农就业的促进作用更大。这主要是由于相比男性,女性在求职过程中难度更大,并且农村女性往往承担着照顾老人和孩子的责任,即使同样使用互联网,女性非农就业的概率也更低于男性。此外,不管对男性还是女性,使用互联网娱乐频率与非农就业概率之间均存在倒U型关系,即男性和女性过度使用互联网进行娱乐均会对其非农就业产生负面影响。
表6 异质性分析:互联网对不同性别样本非农就业的影响
表7结果可以看出互联网对不同年龄段的农村劳动力非农就业均有显著的促进作用,其中对30岁以下样本影响最大,这主要是由于年轻人更容易接受新鲜事物,对互联网的学习更快,使用能力更强。相比老年人,年轻人更善于利用互联网获取求职信息,并利用互联网提升自身工作能力,从而实现非农就业。
表7 异质性分析:互联网对不同年龄样本非农就业的影响
表8结果显示了互联网对不同受教育程度的农村劳动力非农就业均有显著的正向影响,并且对学历越低的样本促进效果越明显,其中对未受过学历教育的“文盲”促进效果最大。这主要是由于学历更高的农村劳动力更依靠学校教育来实现非农就业,同时也表明了互联网可以作为学校教育的重要补充,帮助学历较低的农村劳动力实现非农就业。
表8 异质性分析:互联网对不同学历样本非农就业的影响
4 结论及政策含义
本文利用2016年CFPS数据,运用Biprobit模型和工具变量法分析了互联网使用对中国农村劳动力非农就业的影响。结果发现,对整个样本进行研究时,使用互联网确实可以促进农村劳动力的非农就业。但当我们分途径研究农村居民使用互联网进行娱乐对其非农就业的影响时,发现使用互联网娱乐的频率与非农就业概率之间存在倒U型关系,且拐点位于使用频率为5.3左右,即当使用互联网娱乐的频率达到“几乎每天”时,便会对农村劳动力非农就业产生负面影响,导致非农就业概率下降。而进一步剔除样本中使用互联网学习和工作的样本后,我们发现使用互联网娱乐频率与非农就业概率之间依然存在倒U型关系,并且此时拐点前移至4.9左右,即在不使用互联网从事学习和工作的情况下,当使用互联网娱乐的频率达到“每周3~4次”时,便会对农村劳动力的非农就业产生负面影响。由此可以看出,虽然使用互联网的确可以促进农村劳动力的非农就业,但如果使用互联网只是从事娱乐活动,那么过度使用互联网会对其非农就业产生负面影响。
结合本文研究,提出下列一些建议:(1)互联网是一项高技能型工具,使用互联网本身也是一项人力资本,学习使用互联网需要时间和培训,所以为了更好地发挥互联网促进非农就业的积极作用,政府应该大力开展农村落后地区的互联网培训,帮助农村居民学习使用互联网。(2)近些年来伴随各类短视频和直播平台的兴起,越来越多的人使用互联网用来娱乐和休闲,这一现象在农村落后地区尤为明显。而投入大量时间与精力从事娱乐活动不但不能发挥互联网的积极作用,反而会造成负面影响。因此政府应当适当管制各类互联网娱乐平台,使新媒体信息传播侧重于推广有效农业信息和现代化观念,提高农民素质。在农村推广互联网普及的过程中要注意避免虚假信息的传播及错误价值导向,有效发挥互联网对非农就业的积极促进作用。