普通话对劳动力 收入的影响
2024-01-15刘文浩
刘文浩
21世纪以来,我国关于劳动力工资性收入及其影响因素的文献十分丰富,但很少有文献对普通话能力与工资水平的关系进行研究。本文采用处理效应模型(TEM)和分位数回归方法探索普通话对劳动力工资的提升作用,结果显示普通话能力对提升劳动者收入具有显著的正向影响,在低收入劳动者中更是如此。因此,本文认为向低收入地区、偏远地区以及少数民族集聚地区推广普通话仍然是一项基础性的工作,必须全力、高效地展开,以持续推进乡村振兴,促进收入分配效率与公平。
相关概述
我国作为一个地域广阔、民族多样且历史悠久的大国,在上千年的历史中形成了近百种语言和方言。改革开放前,我国劳动人口流动较少,流动范围有限,绝大多数劳动力既不需要,也不能够通过向其他城市迁移来改善就业情况,因此当时各地方劳动力以本地人居多,语言交流基本不存在障碍,加之改革开放前国家实行计划经济,劳动力的就业和工资不由市场决定,普通话对劳动力收入的作用并不明显。但改革开放之后,家庭联产承包责任制解放了大量农村劳动力,农民工开始流入城市;中西部的城镇劳动也开始向沿海开放城市转移,由于我国城乡之间的语言存在较大差别,劳动者个人语言能力的重要性开始显现。普通话较为熟练的劳动力不仅在迁移目的地的选择上更为灵活,在人际交流、学习技能和环境融入等方面也占有明显优势,因此就业条件和工资水平往往优于只会说方言的劳动力。
改革开放以来,虽然我国普通话普及率不断提高,但仍有待加强。普通话普及率的差异,不仅影响劳动力从中西部等地区向东部经济发达城市的流动,还阻碍了知识、技术等要素在落后地区的推广,对劳动力的工资收入产生不利影响。综合国内外研究,普通话能力对劳动力工资收入的影响体现在以下三个方面。
首先,从劳动力迁移角度来看,劳动力流动时会考虑流向地区的语言和文化背景。Chiswick和Miller分析了劳动力迁移的“语言适应成本”(cost of language adjustment),认为这种成本是劳动力迁移时考虑的一个重要部分。目前我国区域发展不均衡,对生活在经济较不发达的方言区中的劳动力来说,如果没有掌握普通话,就失去了向高工资水平地区流动的机会。其次,从技能培训角度而言,未掌握普通话的劳动力难以学习到新的技能。最后,从劳动力提供服务的质量角度来看,掌握普通话的劳动力能够更流畅地与同事和客户交流,在生产和服务的过程中效率更高,因此往往能够获得更高的工资。陈媛媛(2016)在研究普通话能力对我国劳动者收入的影响时发现,普通话能力对劳动者工资的提升作用显著为正。由此可见,普通话对劳动力工资的影响不容忽视,尤其对我国低收入人群而言,普通话能力可能是他们提高工资收入的必要条件。
21世纪以来,关于我国劳动力工资性收入及其影响因素的研究层出不穷,大多数文献的关注点在于教育水平、技能培训、工会以及最低工资政策等。国内有高原(2017)和陈媛媛(2016)等人针对我国劳动力的普通话能力和收入的关系进行过实证研究。在实证过程中,前者选用了CGSS作为分析数据,后者采用了CFPS、CLDS和CGSS三套数据对比分析,两篇文献的核心解释变量都是劳动力的普通话能力。至于劳动力普通话能力的衡量标准,CLDS和CFPS是由调查员对受访者的普通话水平进行评价,CGSS是由受访者自己评价普通话水平。这两种评价方式的缺陷在于调查员或受访者的主观评价标准不一,容易低估或高估样本真实的普通话水平,从而造成回归系数估计的偏差。与上述两篇国内文献不同,本文将核心解释变量设置为二值型虚拟变量,即如果劳动力上班时使用语言为方言,变量值为0,如果上班时使用普通话则变量值为1。这样一方面在一定程度上消除了受访者或调查者对普通话能力评价的偏差,另一方面更能反映掌握普通话的人群和只会讲方言的人群之间的收入差距,从而揭示推广普通话对提高劳动力收入、促进收入分配公平的积极作用。
数据和研究方法
数据 本文以2014年中国劳动力动态调查(CLDS)的个人数据作为研究基础。CLDS由中山大学社会科学调查中心主持,在我国劳动力现状和变迁的相关文献中广泛应用。调查中有关劳动力上下班时使用的主要语言、劳动力的教育程度、年龄、性别等数据,为本文提供了较为完善的资料。为了保证研究结果准确性,本文剔除重要信息存在缺失的样本、务农人员样本、工资为0的样本以及65岁以上劳动力样本,得到有效样本5099个。
处理效应模型 本文采用明瑟收入方程研究普通话对劳动者工资产生的影响,以劳动者月工资的对数作为解释变量,以劳动者上班时是否说普通話作为核心解释变量。需要说明的是,将“劳动者上班时是否说普通话”作为解释变量,会产生内生性问题的影响。内生性一方面可能由遗漏变量造成,即劳动者自身的某些特性或所处的环境同时对其普通话能力和收入水平产生影响;另一方面也有反向因果的因素影响。由于存在内生性问题,用简单最小二乘法可能存在偏误。两阶段最小二乘法(2SLS)是解决解释变量内生性的常用方法,但在本文中,内生解释变量为虚拟变量,两阶段最小二乘法不适于解决该类问题,只能用来检验工具变量有效性。
对类似本文中被解释变量为连续变量,内生解释变量为虚拟变量的问题,常用做法是采用处理效应模型(TEM)进行分析。模型的具体形式为:
其中(1)为明瑟收入方程,被解释变量表示个体月工资的对数;虚拟核心解释变量,在TEM模型中亦称作处理变量,表示个体上班时是否说普通话;代表模型中的一系列控制变量,包括明瑟方程中最基本的解释变量,如最高学历、工作经验的平方值等。为保证计量结果准确性,本文参考其他关于明瑟方程的文献,另加入其他控制变量,包括个人、家庭、社会层面的控制变量等。模型中(2)式决定处理变量,即“处理方程”。其中,1·(……)是示性函数,假设,即影响劳动者是否说普通话,但不影响劳动者的工资水平,因而可以视作的工具变量。扰动项的相关系数为ρ,是模型内生性的来源。
在本文中,我们选择“劳动者下班时是否使用普通话”和“劳动者户口迁移次数”作为工具变量。首先,劳动者上下班的主要语言是否为普通话存在相关性,但下班的主要语言不影响劳动者的工资收入。其次,劳动者迁移后往往要适应迁移地的语言环境,掌握普通话可以更好地进行交流,而未发生过迁移的劳动力生活在自己的方言区内,说方言的概率较大,所以劳动者是否掌握普通话与迁移具有相关关系。同时,没有证据表明劳动者收入与迁移次数有关。综上,“劳动者下班时是否使用普通话”和“劳动者户口迁移次数”选为工具变量。本文将通过2SLS检验是否存在弱工具变量、过度识别等问题。
分位数回归 在偏远落后地区,普通话能力影响着劳动力知识、技术的学习能力,約束着劳动力向发达省份流动的选择,在此类地区,劳动力掌握普通话后更有可能使其收入在较大幅度上得到提升。因此,本文认为普通话对低收入群体工资有明显提升作用。在OLS模型中,默认条件分布y|x是对称分布,通过回归系数了解到的是解释变量对被解释变量条件期望E(y|x)产生的影响。如果普通话对不同劳动力的收入影响存在差距,造成尖峰或厚尾分布,简单最小二乘法的估计系数将无法反映条件分布的整体情况。分位数回归能够提供关于条件分布y|x较为全面的信息,是解决该问题较为理想的方法。分位数回归本质上是假设因变量y的p分位数yp是自变量x的线性函数,在本文中可以显示普通话对不同收入水平的人群的影响。因此,本文采用分位数回归,选择劳动者总体收入分布的十分位数、四分位数和中位数作为研究对象,探究普通话是否对我国低收入劳动力影响较大,反映普通话推广对于提高居民收入的重要性。
计量结果
普通话与工资收入:处理效应模型 一方面,探究普通话对劳动力收入的整体影响。普通最小二乘法和处理效应模型对明瑟收入方程的回归结果。根据普通最小二乘法的回归结果:将个人、家庭和社会层面的变量进行控制之后,最终得到“劳动者上班时说普通话”变量的回归系数为0.204,回归结果在1%的水平上显著,说明普通话对劳动力工资有比较明显的影响。鉴于本文选取的核心解释变量“劳动者上班时是否说普通话”可能存在内生性问题,要使用处理效应模型消除内生性影响。关于模型内生性问题,经DWH检验得到有关模型内生性的统计量值为2.923,在10%的水平上显著,说明核心解释变量确实存在内生性,需要使用处理变量模型。就工具变量的有效性而言,首先得到弱工具变量检验的Cragg-Donald Wald F统计量的值为590.707,远大于10%的显著性水平上的临界值19.93,因此本文不存在弱工具变量问题;其次,在过度识别检验中,Hansen J统计量的值是0.531,对应P值为0.466,说明不存在过度识别问题,本文选取的工具变量外生有效。综上模型,可以运用TEM模型和本文最初选取的两个工具变量来解决OLS模型中核心解释变量的内生性问题。
另一方面,消除内生性影响之后,“劳动力上班时是否说普通话”这一变量的回归系数变为0.277,与OLS模型的估计系数相比上升约7%,说明OLS模型低估了普通话对劳动力收入产生的影响。对比普通话对工资的提升作用与教育收益率,初中学历对劳动力的工资提升效果较小;高中学历能够使劳动力工资提升16.7%,低于普通话的作用;本科以上学历的教育收益率超过普通话对劳动力收入的影响。同时,“劳动力是否掌握外语”的估计系数为0.061,外语能力对劳动力工资的影响远低于普通话。可见,普通话对劳动力收入的影响不容忽视,普通话推广对提高工资、促进收入分配公平具有一定的促进作用。
普通话与低收入人群工资:分位数回归 到目前为止,本文采用的方法考察的都是普通话对劳动力收入均值产生的影响,至于普通话的普及对低收入劳动力的帮助,OLS模型与处理效应模型均无法给出比较理想的解释。因此本文接下来采用分位数回归研究普通话对收入的条件分位数产生的作用,探索不同等级的收入群体分别在多大程度上受到普通话的影响。
经研究分析,普通话对劳动力中前10%收入最低的劳动力的工作提升作用最大,估计系数达到27.9%,对其他等级收入群体的收入产生的作用虽然也较为显著,但明显低于前10%收入最低人群。检验普通话对收入的条件分位数的作用是否相同的F统计量值为2.18,在5%的显著水平上拒绝普通话对各层级收入群体的工资提高作用相同的假设。分位数回归的结果进一步证明了普通话推广在提高低收入群体中发挥的重要作用。
普通话能力在过去的很长一段时间都未被视作影响收入的重要因素进行研究,我国直到最近几年才陆续出现探索普通话与工资收入关系的文献,数量虽然不多,但都得出普通话能显著提高劳动者工资收入的结论。本文参考已有文献,以明瑟收入方程为基础模型,利用处理效应模型消除普通话作为核心解释变量的内生性问题,利用分位数回归分析普通话能力对不同收入群体工资的提升作用。计量结果显示,普通话对工资有显著的提升作用。处理效应模型中普通话的估计系数大于OLS模型,说明普通话对工资的提升作用可能被低估;分位数回归中,普通话对劳动力中前10%收入最低的劳动力的工作提升作用最大,表明普通话能力对提升低收入劳动力的工资具有显著作用。
要保证低收入群体增收致富,不仅要让大量低收入地区的人口掌握一定的生产技术,还要让其能够向经济发达的地区流动,以便获得更高的工资,而普通话在劳动力技能培训和劳动力对外流动两个方面都发挥着基础性的作用,所以不可忽视其在提高收入中扮演的角色。新形势下,掌握普通话是促进低收入人口学习技能、外出流动,从而提高收入的前提。因此,必须继续加大普通话在低收入地区、偏远地区以及少数民族集聚地区的推广力度,才能持续推进乡村振兴,促进收入分配的效率与公平。
(作者单位:中国人民大学)