农民工就业选择决策:“盲目跟风”还是“理性选择”
2023-08-21李静,王科
李 静, 王 科
(安徽大学 a.经济学院;b.创新发展战略研究院,安徽 合肥 230601)
一、引 言
随着我国经济的快速发展与农民工群体的不断壮大,劳动力市场的就业结构和行业分布产生了巨大变化。目前农民工劳动力总量过剩但局部行业就业人数短缺,说明存在一定的劳动力资源错配,因此聚焦农民工行业选择研究具有一定的现实意义。
国内有关就业选择的研究对象多为女性[1-2]、大学生[3]这些社会特殊群体,研究顺序一般为先研究分布情况接着进行影响因素分析。有关农民工就业选择的文献大多研究就业地选择差异[4],仅有部分文献关注到行业选择的差异[5-6],考察农民工行业类型选择的文献更加少见。
在理性人假说下,农民工为了增加自身的收入水平、提高生活满意度和自我认可度,在行业选择时应当倾向于工资较高的行业,工资水平对决策有更显著的影响。康姣姣等认为个人、家庭、社会特征因素影响劳动力的就业选择[6],但个人决策往往受到社会网络中其他个体的影响,即同群效应;魏霄云和史清华通过空间计量经济学的方法证明了这一效应对农民工的非农就业选择有显著影响[7]。任义科等研究发现农民工外出务工在某种程度上具有盲目性,选择上具有扎堆趋势[8]。这一扎堆趋势体现在行业选择上则是农民工可能受到区域内从业人数较高的行业影响,存在“盲目跟风”这一低效率行为,而非“理性选择”,非理性的行业选择无法给农民工带来稳定的收入增长,还直接导致了劳动力市场的行业分布不均衡。
鉴于此,本文聚焦农民工行业选择问题,采用混合Logit模型分析农民工行业选择是“盲目跟风”还是“理性选择”,并基于研究结论提出针对性建议。本文可能的边际贡献在于:从研究视角来看,通过研究行业类型对农民工行业选择的影响,考察农民工选择行业是盲目的还是理性的,从而为优化就业选择提供建议;在行业类型划分标准上,本文在实证研究中没有将行业按照等级、单一标准或者三大产业划分,而是以国家卫生计生委中国流动人口动态监测调查(CMDS)问卷中的行业划分标准为基础,将农民工行业类型分成14种(1)CMDS调查问卷中2012年、2018年分别将农民工行业划分成15类和21类,本文将就业人数过少或工作性质类似的行业加以合并,最终得到14种行业类型是:采矿、电煤水热、房地产、建筑、交通运输、居民服务、农林牧渔、批发零售、制造业、住宿餐饮、租赁和商务、科教文卫、新兴产业、其他服务管理业。;在研究内容上,本文在实证分析时考虑行业扩张的影响,选择修正后平均工资和行业结构偏离度作为行业特征变量。
二、农民工行业分布特征
1.样本说明与数据来源
第一个数据集是CMDS数据。针对本文主要研究对象农民工,筛选得到三组样本:第一,由于 CMDS 数据调查对象为在流入地居住1个月以上,为了更符合农民工的定义,本文剔除了流入时间为调查本年的、户口非农业、行业未知的样本。2018年的数据筛选后剩下81 035个样本数据,其中男性有46 258人,女性有34 777人,性别分布较符合全国性别比例水平,并将此数据库命名为CMDS2018a。第二,剔除年龄超过60岁的农民工和流入新疆生产建设兵团的特殊农民工,得到2018年72 312个样本数据,2012年75 616个样本,分别称为CMDS2018b、CMDS2012b。第三,将第二步中2018年的宽形数据转换为长形数据(2)混合Logit模型包含行业属性,即自变量会随每个行业和个体而变,因此按照多元Logit模型的宽形数据排列格式需要转化为长形数据格式。,得到1 012 368个样本数据,称之为CMDS2018c。
第二个数据集是2012-2018年中国劳动力动态调查(CLDS)数据。在研究行业聚集程度时,考虑到CMDS的流动人口样本中近七成都是农业户口,故使用CLDS数据考察农民工行业选择与全体劳动力行业选择的差异。
第三个数据集是2012-2018年各城市以及行业数据。城市层级的数据大多来自《中国城市统计年鉴》(2012-2018),对于其中部分城市数据的缺失,查找《中国统计年鉴》《中国人口和就业统计年鉴》中的数据进行补充,共得到286个城市数据。
2.农民工行业分布情况
研究农民工的行业人数分布情况以CMDS2018a样本数据为基准,将农民工从事的行业分为21个类型(3)2018年CMDS数据库的行业类型共21类,分别是:农林牧渔,采矿业,制造业,电煤水热生产供应,建筑业,批发零售,交通运输、仓储和邮政,住宿餐饮业,信息传输、 软件和信息技术服务,金融业,房地产,租赁和商务服务,科研和技术服务,水利、环境和公共设施管理,居民服务、修理和其他服务业,教育,文体和娱乐,公共管理、社会保障和社会组织,国际组织,卫生,社会工作。。其中从事批发零售、制造业与住宿餐饮业这三大行业的农民工人数占据农民工总人数的58.07%,这三大行业中有两个都属于第三产业。
纵观所有行业类型,从事第三产业的农民工占到总人数71.87%。值得关注的是,科研技术服务业和金融业也不乏有农民工参与在其中。
从行业的区域分布来看,仍从事农林牧渔业的农民工主要分布在胡焕庸线以西偏北,那里人口较少土地辽阔,因此一批农民工进入从事农业生产以弥补当地劳动力不足,且87.67%的人学历在高中以下;从事第三产业的农民工多分布于广东,但各省份分布差异不大,且从事第三产业的农民工有37.19%具有高中及以上学历;从事第二产业的农民工主要分布在浙江、广东、江苏这三大沿海省份,该产业中具备高中及以上学历的农民工占比为32.6%。
社会进步与城市发展会带来新型产业的出现以及行业集中趋势的改变。本文参考段成荣等研究流动人口流入地分布集中程度的量化指标计算方法[9],得到农民工行业分布集中度指数计算公式:
(1)
其中:C为农民工行业分布集中程度指数;Ni为农民工选择从事i行业人口数占总农民工数的比重;Ti为从事i行业人口数占总调查人口的比重。C的取值范围在0~1,C值越小且越接近0表示农民工的行业分布越分散,相反,C值越大且越接近1表示农民工的行业分布越集中。
本文使用中国劳动力动态调查(CLDS)筛选出农民工和非农民工群体,计算得到农民工行业分布情况(4)CLDS数据库的行业类型共16类,分别是:农林牧渔,采掘业,制造业,电力、煤气及水的生产和供给业,建筑业,地质勘查业、水利管理业,交通运输、仓储及邮电通信业,批发和零售贸易、餐饮业,金融保险业,房地产业,社会服务-居民服务业,卫生、体育和社会福利业,教育、文化艺术和广播电影电视业,科学研究和综合技术服务业,国家机关、党政机关和社会团体,其他行业。,见表1所列:
表1 2012-2018年农民工行业分布集中度指数 %
可以看到农民工集中度指数一直大于40%,虽然有减少的趋势但变化不大,说明行业分布有较明显的集聚现象,且集聚程度短时间内难以缓解。
为了反映农民工在不同行业的聚集程度,借鉴高永辉和温晶晶的方法[10],使用区位商(LQi)来分析农民工这一特殊人群在各行业聚集程度大小,同时以2012-2018年的时间维度测量区位商三次变化情况,计算公式分别为:
(2)
LQ大于1,说明农民工在某一行业分布较为集中;LQ等于1,说明农民工在某一行业中的人口分布与全体就业人口在该行业的分布相同,行业分布处于均衡状态;LQ小于1,说明农民工在某一行业中分布不足。其中与1的差距越大,不均衡问题越突出,可能存在农民工进入行业壁垒等问题。
根据式(2)计算得出2012、2014、2016、2018年共计16个行业的区位商LQ和区位商变化L。其中,仅卫生、体育和社会福利业的区位商值从2012到2018年一直维持在合理波动区间,农民工在绝大多数行业分布不均衡。2012-2016年制造业的区位商值一直保持最大,到了2018年这一地位被房地产业取代,房地产的区位商值在2016到2018年间陡升,农民工从集中于制造业转向房地产业,且聚集现象尤为突出。
此外,区位商变化值在1上下波动稳定的行业有:制造业,交通运输业、仓储及邮电通信业,批发和零售贸易、餐饮业,社会服务-居民服务业,这是大多农民工会选择的传统行业;在非传统行业中金融保险业、科技研究和综合技术服务业的区位商值有所提高。
三、农民工行业选择的影响因素
1.变量说明
(1)农民工行业类型 为了较为详细地了解农民工的总体行业分布情况,本文把行业分为14类,详见表2注解。
表2 变量描述性统计
(2)行业特征变量 农民工外出务工是基于经济理性,因此就业收入是衡量农民工就业决策行为效用最大化的指标。
陈斌开和陈思宇基于2005年全国1%人口抽样调查数据的实证研究发现,当前城乡融合中传统社会资本在低端服务业中依然可以发挥影响,农民工通过信任的社会网络和社会关系,显著提高了进入低端服务业的概率,带来了行业人数的增加[11]。因此行业就业人数占比可以直接反映农民工就业决策是否存在跟随和模仿行为。
由于行业扩张会直接导致行业就业人数增加,也会对行业的平均工资产生不确定的影响,本文选择行业的修正工资水平(以行业产值比为系数对行业的年平均工资进行加权处理)、行业结构偏度(某行业产值比重/某行业就业人数相对比重-1)这两个行业特征变量。
若行业的修正工资对农民工进入非农行业概率产生正向影响则认为农民工行业决策存在“理性选择”;若行业结构偏离度对被解释变量产生负面影响则认为农民工进入非农行业存在“盲目跟风”。反之,结论相反。
(3)控制变量 一是个体特征变量。考虑数据可得性,微观个体特征选择CMDS问卷。本文将重点讨论农民工年龄、性别、婚姻情况、受教育年限、家庭平均月支出、进城年限、健康、留城意愿。在农民工年龄方面,中青年对于工作时长和工作强度承受力更强,行业选择范围更广;中老年因为身体、家庭等因素对行业选择有一定局限性。
高学历或较高学历农民工开始从事高新技术产业,老一代农民工因受教育水平所限只能继续留在第一、二产业。
早进城就业的那一批农民工往往有更强的非认知能力[12],所以2012年的CMDS对农民工进城年限的调查能在一定程度上补充农民工除学历以外的人力资本信息。
二是城市特征变量。农民工流动的推动因素与经济水平直接相关,而农民工迁入地的人均 GDP(PGDP)可以更为直观、真实地反映城市经济实力;城市人口规模(POP),以城市年平均人口数表示,可以综合反映某一时期内的城市人口规模;城市财政支出水平(GOV),以城市一般公共预算支出与城市GDP的比值表示,该指标可以衡量地方政府的经济影响力。
具体变量说明及描述性统计,见表2所列。
2.计量模型设定
新古典经济学家从个体理性选择角度出发研究劳动力迁移行为,说明该行为可以用量化的数学模型(5)以托达罗为代表的新古典经济学的微观理论从个体理性选择的角度, 用量化的数学模型来解释劳动力迁移行为。其具体公式的解释见Theories of international migration:a review and appraisal(Population and Development Review 1993年第3期 )。来解释。本文的行业类别为多分类变量,且各个行业类别是完全对等的,不区分主要、次要类别,所以可以采用多元Logit回归模型分析个体微观特征对农民工进入行业的影响,见式(3):
(3)
其中:P(Y=j)代表农民工进入j行业的概率;P(Y=1)代表对照组,本文以农林牧渔为对照组,故j行业属于非农行业(6)本文所指的非农行业是农民工在非户籍所在地从事除农林牧渔业以外的其他所有行业。;PV代表个体特征变量:年龄、性别、婚姻、家庭月支出、健康状况、留城意愿;HV代表人力资本变量:受教育年限、进城年限;SV代表社会保障:医疗保险。
3.基本估计结果
基于CMDS2012年和2018年数据,分别完成对式(3)的回归,回归对比结果见表3所列。
表3 多元Logit模型基本回归结果
以农林牧渔业为对照组,整个模型的回归结果具有显著性。首先,除批发零售和科教文卫外,2018年与2012年相比,男性农民工劳动力进入各非农行业的概率增加,可见农民工劳动力市场存在性别歧视。其次,受教育年限对农民工进入行业的概率的影响方向会依不同行业有所不同。从变化趋势来看,2018年与2012年相比,在不同行业其影响变化也是各不相同,例如,受教育年限对进入电煤水热的正向影响增加,对房地产的正向影响减小。整体来看,其对农民工选择非农行业的影响系数很小,故仅从提高农民工学历水平改善农民工劳动力资源配置是远远不够的。再次,除采矿业和其他服务管理业,2018年与2012年相比,家庭成员数对农民工进入各行业的负面影响系数减小,这可能与家庭中女性逐渐进入劳动力市场有关[1],一定程度上反映了农民工在努力平衡工作与家庭;最后,家庭平均月支出能反映农民工所在家庭的消费水平,对农民工进入各非农行业概率的影响显著为正,2018年与2012年相比,对不同行业的影响系数绝对值变化不同,但影响系数较其他变量大。因此,在分析农民工行业选择时,家庭支出水平不容忽视。
标准Logit一般要满足IIA 假设(无关选择独立性假设),即从样本中去掉某一独立的选择类别后得到的参数估计值一定要是一致的但不一定是有效的,删除选择类别后所得的参数估计值如果非一致说明删除的选择类别和剩下类别之间并非真正独立。
本文为了研究行业选择类别是否真正独立,用Hausman检验结果显示,批发零售和住宿餐饮这两个行业类型拒绝了IIA假设,表明农民工行业的14种选择并非独立的无关选择,用标准多元Logit模型研究影响农民工行业选择的因素不够合理,故必须采用混合Logit模型。
混合 Logit模型为Logit模型的积分式,与之前模型不同的是:当个体选择某一行业的某一个变量发生变化时,选择其他行业类型的概率变化的百分比取决于各自行业类型的变量和分布函数, 因此概率变化并不相同,所以该模型克服了Logit模型比值无关性的缺陷,它放松了多元Logit模型的IIA假设。
4.“盲目跟风”还是“理性选择”
混合Logit模型中必须包含随方案而变的属性,因此本节加入2018年行业特征变量进行混合Logit回归,并根据行业特征对农民工行业选择的影响来判断农民工就业决策是否理性。
选择的农民工行业特征指标(TV)有:行业产值比重(某行业增加值/国内生产总值)、就业人数相对比重(某行业就业人数/当地所有行业就业人数)、行业平均工资(7)综合考虑行业的区域差异性和数据真实可得性,本文默认全国各省份的行业产值比重相同,而各行业的就业人员人数相对比重和平均工资按照不同省份取值不同。《中国统计年鉴》私营单位各行业的就业人数不全,本文用各省份非私营企业的就业人员数和平均工资反映行业特征。等。行业产值比重在一定程度上反映了行业生产总规模和总水平。行业扩张即行业的生产总规模增加,会影响行业的劳动力需求,进而影响就业人数和平均工资。
为避免回归结果涉及多重共线性等问题,本文引入 “行业结构偏离度”[13]这一指标,它可以判断行业结构与农民工就业结构是否达到平衡状态。
当行业结构偏离度越接近零,说明该行业的行业结构与农民工就业结构越接近平衡状态,即越合理;当行业结构偏离度大于零,说明该行业农民工供给数量不足;当行业结构偏离度小于零,说明农民工供给过多。在行业产值一定的情况下,行业的结构偏离度与就业人数相对比重呈反比关系,因此,若行业的结构偏离度对农民进入各非农行业的概率产生负向影响,则就业人数比重对其具有正向影响,此时可以认为农民工进入非农行业存在“盲目跟风”。行业平均工资受到行业扩张的影响是不确定的,因此本文采用全国行业产值比为权重系数对行业的年平均工资进行加权处理得到修正后的行业平均工资,记作行业修正工资,若行业修正工资对农民工进入非农行业概率产生正向影响则认为农民工行业决策存在“理性选择”。
本节将基准回归中个体微观特征作为控制变量,以行业修正工资对数和行业的结构偏离度作为解释变量,设计数学模型研究行业特征对农民工行业选择的影响:
(4)
其中:TV代表行业特征变量,即修正后的行业平均工资、行业结构偏离度;其余变量与式(3)意义相同。混合Logit回归结果见表4所列。
表4 混合Logit模型回归结果
实证分析结果显示控制变量的影响方向与多元Logit基础回归基本相同。两个行业特征变量作为解释变量对被解释变量都有显著的影响,修正后的行业年平均工资对数的影响系数大于0,说明行业工资的增加会增加农民工进入该行业的概率,农民工趋向流入工资水平增加的行业,这是符合“理性选择”定义的。但是,行业的结构偏离度的影响系数小于0,回归结果可以解释为某行业的就业人数比重增加就会导致农民工选择该行业的概率提高,这恰恰符合了“盲目跟风”的定义。虽然农民工越来越依靠自主力量和本地朋友来找到合适的工作[14],但仍有一定比重的农民工是依靠家人、亲戚、同乡和同学,这导致就业信息获取渠道的局限性,在同群效应下农民工容易同时进入就业人数增加的行业。回归结果得到农民工选择行业保持一定理性是符合现实情况的,但考虑到一些就业人数较多的行业能提供农民工更好的工资报酬,因此工资水平的正向影响结果可能与行业就业人数对农民工进入行业的正影响有关。另外,“赚快钱”的思想加剧了农民工行业决策的同群效应,随波逐流地进入时下从业人数较多的行业分一杯羹,这也能解释2018年大量农民工从制造业集中转向房地产行业的现象。综上所述,农民工的就业选择存在“盲目跟风”现象。
四、城市特征对农民工行业选择的影响
在上述回归中考虑了个体差异,将个体微观特征变量作为控制变量。其实,我国城市之间在物价水平、生活成本、经济发展水平等方面存在较大差异,许多学者研究流动人口区域分布时发现人口较为集中在东南沿海经济发达城市[15]。因为家庭消费水平会受到所在城市经济水平的影响,所以农民工作为迁移个体在选择迁移和进入行业过程中会考虑净收益值。本文通过设置城市特征变量city与部分个体微观变量的交互项来完成城市异质性分析,具体模型设计如下:
Logit(Pi/1)=β0+β1PV+β2HV+β3SV+β4TV+β5city+β6PV×city+
β7HV×city+β8TV×city+ε(j=1,2,3,…,14)
(5)
加入的城市特征变量分别是:城市人均GDP(PGDP)、城市年平均人口数(POP)、城市财政支出水平(GOV)、城市一般公共预算支出/城市GDP(8)各行业数据来自《中国统计年鉴》和《中国人口和就业统计年鉴》。城市经济数据来自2018年《中国城市统计年鉴》,对于部分城市缺失的人均GDP值参考城市所在省的全省人均GDP ,少数民族自治州不在城市统计数据范围内故进行城市异质性分析时删去该部分样本,最后样本涉及直辖市、地级市共计286个。。式(5)中城市特征变量的具体操作是:一是行业修正工资水平除以城市人均GDP得到新的行业平均工资水平;二是年龄、受教育年限、家庭成员数与家庭月支出分别与城市人均GDP对数相乘得到新的微观个体变量;三是城市特征变量作为控制变量加入回归。异质性回归结果见表5所列:
表5 城市特征对农民工行业选择的影响
以农林牧渔业为对照组,其他个体控制变量系数与式(4)回归结果正负性相同,由于篇幅限制未展现。经过城市异质性处理过的微观个体变量:年龄、受教育年限、家庭成员数与家庭月支出,也和式(4)回归结果有着相同的影响方向。城市财政支出水平对农民工进入行业概率的影响,在电煤水热和采矿业的影响为正,其余非农行业影响为负,即城市一般公共预算支出占城市GDP比重越大,地方政府对地方经济引导作用越强,农民工进入电煤水热和采矿业的概率就会增加,进入其余非农行业的概率则降低。可能的原因是因为城市一般公共预算支出多用于电煤水热和采矿业,这两个行业的扩张导致了就业需求增加,进入其就业的概率提高。城市人口规模对农民工进入电煤水热和采矿业概率的影响为负,进入其他非农行业概率为正,可能的原因为人口规模越大的城市,电煤水热和采矿业的产业占比越低,往往大力发展其他高附加值行业,如新兴产业,因此城市人口规模对新兴产业的影响系数最大。城市人均GDP对农民工进入制造业产生正向影响,却对进入其余非农行业产生负面影响,产生差异的原因可能是:制造业属于劳动密集型产业,城市人均GDP水平越高即城市的经济发展水平越高,制造业越发达,例如,我国东部及南部沿海发达城市的小商品、服装制造蓬勃发展,对劳动力的需求较大,农民工进入制造业的概率随之提高。然而,城市经济越发达,农民工进入其他行业的概率降低主要归因于城市劳动力市场的户籍歧视,城市雇主更偏向选择城镇劳动力群体。
解释变量中行业结构偏离度的影响系数变小,但仍保持显著的负向影响,故行业的就业人数比重增加就会导致农民工选择该行业的概率提高,符合本文“盲目跟风”的定义。解释变量中的修正工资/PGDP作为新的行业平均工资水平,能反映行业工资水平对农民工进入行业概率的影响,从结果系数显著为负可以得出:考虑城市经济水平异质性后,农民工行业选择不再存在“理性选择”。可能的原因:一是行业工资水平考虑了城市经济水平差异性后更接近农民工实际工资,二是城市经济水平越发达,就业信息就越发“铺天盖地”,农民工难以理性分辨这些信息,导致在行业选择时更加“盲目跟风”。综上所述,城市异质性分析下农民工就业选择存在显著的“盲目跟风”现象且不存在“理性选择”。因此没有考虑城市异质性的混合Logit模型可能会误判行业工资对行业选择概率的影响,现实中农民工行业选择的“盲目跟风”现象可能更为严重。
五、稳健性检验及内生性处理
1.稳健性检验
为检验式(4)回归结果的稳健性,本文从替换解释变量角度,进一步验证行业的平均工资和就业人数占比对农民工就业决策行为的影响,稳健性检验结果见表6所列。
表6 稳健性检验
第一,考虑到就业比重对农民工行业选择的影响具有一定的滞后性,为了得到稳健性结果,本文用前三年各省各行业就业人数比重的平均值代入行业结构偏离度公式,回归的实证结果见表6模型(1)。结构偏离度的回归系数符号和显著性与式(4)回归结果一致,表明结果较为稳健。说明以当年就业比衡量就业选择存在误差,会使得回归系数偏大,该模型回归得到的行业工资水平的正向影响系数较大,进一步说明农民工行业选择时可能存在更多的“理性选择”。
第二,行业特征分析中所在省份各行业就业比重与个人行业选择之间存在反向因果关系,农民工行业选择会直接影响行业比重变化,所以考虑到内生性问题,本文用行业法人单位占比替代就业人数占比,计算行业的结构偏离度。回归结果见表6模型(2),其对行业选择的影响方向和显著性与式(4)回归相比没有发生改变,只是结构偏离度的影响系数绝对值变小。一方面,行业的法人单位比重不能等同于就业比重,不同法人单位的就业人员规模不同,对于劳动密集型行业,法人单位比例增长率远小于就业人数增长率;另一方面可能是各行业就业比重与个人选择的反向因果关系导致之前的回归系数较大。
第三,原本的混合Logit回归中利用各省份行业平均工资水平衡量行业收入对农民工影响,实际上不同家庭对于收入高低的衡量标准有差异。表6模型(3)报告了相对工资水平(修正后的行业平均工资水平/家庭月支出水平)代替修正后的行业平均工资,得到各影响因素系数在方向、显著性和大小上都与替代前完全一致,说明行业平均工资水平对不同家境农民工影响程度相似,行业工资水平依然是农民工在就业决策时考虑的重要因素。综上所述,以上稳健性分析结果表明式(4)回归结果稳健。
2.内生性问题处理
虽然本文考虑了微观个体特征、城市特征等各种控制变量,尽可能地避免截面数据由于遗漏变量所导致的估计偏误,但仍遗漏了各城市产业发展偏好、未来贴现的个人偏好等这类难以测度的变量。除此以外,CMDS数据库调查变量的局限性所导致遗漏了微观个体人力资本、社交活动等,最终难以排除存在遗漏变量导致内生性估计偏误的可能性。为此本文参照王伟同等的做法[16],用可观测变量度量未观测变量带来偏误的可能性,进一步消除遗漏变量可能带来的内生性问题。在此考虑两个不同控制集合的回归,第一个回归仅控制有限的控制集,第二个回归控制所有可能的控制集。将第一个回归估计的核心解释变量系数记为βR,第二个回归估计的核心解释变量系数记为βF。构造如下指数:
(6)
从分母来看,指数δ大小与(βR-βF)成反比。βR与βF之间的差异越小,可观测变量的解释能力越强,其可能的偏误问题对估计结果的影响就越小,即相对于可观测的变量,不可观测变量就需要更强的解释能力才能对整体效应产生影响。(βR-βF)越小,δ越大,未观测变量带来偏误的可能性就越低;从分子来看,βF越大,δ越大,表明已经控制的所有控制集具有很强的解释力,不可观测变量对估计结果造成偏误的可能性就越小。
本文选取了四种有限集和一个全集来构造该指数。有限集包括:一是仅控制城市特征变量;二是仅控制个体层面中除了家庭人数和家庭月支出以外的性别、年龄、受教育年限等微观个体变量;三是仅控制个体层面中家庭人数及家庭月支出;四是仅控制包括家庭特征以内的所有个体层面的变量。一个全集为式(5)中控制的所有变量。结果见表7所列:
表7 用可观测变量度量未观测变量的偏误程度
结果显示的四个值的数值范围为3.878~36.410,均值为12.805。若未观测变量可以对本文估计结果产生偏误,则其解释能力平均超过12倍,最少要是已选择的控制变量的3.9倍,本文前面的分析已经考虑了各城市和个体特征变量,因此我们有理由相信本文由未观测变量造成估计偏误的可能性是很小的,也可以基本排除估计结果因遗漏变量而出现估计偏误的可能,表明之前的结论是可信的。
六、主要结论与政策建议
本文利用全国流动人口调查数据分析农民工就业的选择决策问题,主要结论如下:一是随着社会现代化发展和农民工自身素质的提高,受教育年限对农民工就业决策的影响减小,农民工逐步进入新兴产业甚至高新技术行业。二是择业的“盲目跟风”现象存在于农民工行业选择中,导致农民工的行业分布高集聚。三是考虑城市异质性后发现农民工就业选择不仅存在“盲目跟风”,同时缺乏“理性选择”,引导农民工理性就业刻不容缓。农民工所在城市经济水平,会对农民工进入制造业以外的非农行业产生负向影响。
结合本文研究结论,提出以下政策建议:第一,政府应鼓励企业为农民工提供更多就业机会。可给予那些为农民工提供优质岗位的企业税收优惠政策或奖励,要求国有企业雇佣一定数量的农民工等。此外,行业主管部门应加强行业监管,避免企业拖欠农民工工资事件的发生。第二,政府应做好就业信息公开,拓宽农民工的就业信息获取渠道。以行政区或街道为单位,相关部门可以定期为农民工提供就业指导和培训。培训内容可结合农民工需求,解决农民工困惑,引导农民工理性地进行行业选择。除了线下培训外还可以利用互联网拓宽招聘信息公开渠道,安排相关人员定期、定点进行信息推送,降低农民工获取招聘信息的难度。第三,政府应做好宣传工作并提供政策保障。宣传农民工为城市经济、社会发展所做的贡献;深入推进户籍制度改革,避免城市落户政策“隐性门槛”等问题。