互联网使用的收入增长效应:理论机理与实证检验
2018-06-04华昱
华 昱
引 言
进入21世纪,互联网技术在我国加速发展并普及。最新的《中国互联网络发展状况统计报告》显示,截至2017年底,中国网民规模达7.72亿,占全球网民总数的五分之一;互联网普及率达到55.8%,超过全球平均水平4.1个百分点。信息化服务快速普及,互联网商业模式不断创新,以互联网为代表的数字技术正在加速与经济社会各领域深度融合,成为促进我国经济转型、消费与制造业升级、构建国家竞争新优势的重要推动力量。
那么,在这一进程中,劳动者的收入水平是否会随互联网技术的普及而发生变化?劳动者又是否会由于个体特征差异、使用用途差异等而获得差别化的互联网使用回报率?理解这些问题,不仅有助于加深对互联网的认识,更有助于进一步优化互联网工具,让全社会共享互联网发展的时代成果。基于上述考虑,本文依据中国家庭追踪调查(CFPS)相关数据,重点考量互联网使用对个体收入的影响。
互联网使用与个体收入:文献评述与影响机理
(一)文献评述
伴随着信息技术的飞速发展,早在20世纪90年代,国外学者就开始关注信息技术对个体收入的影响。Krueger研究发现,个人电脑的使用能带来平均25%~30%的额外工资收入。①其后大部分研究支持以电脑普及为代表的信息技术可以提高劳动者的生产率与工资,但会引起全社会收入差距的扩大。②随着互联网技术的飞速发展,国外学者也就互联网对收入的影响展开了诸多研究。总体上,研究普遍支持互联网技术的应用与普及对劳动者收入有正向影响,但是影响程度因地区、职业、受教育程度、行业、城乡等因素而存在差异。③
国内既有文献侧重于考察计算机使用与工资回报率间的关系④,涉及互联网使用与收入之间关系的研究十分有限。尽管部分研究认为互联网使用能够提高劳动者收入,但在论证方法上还有值得商榷之处。其一,一些研究采用宏观层面数据研究互联网使用与收入的关系,难以控制个体异质性对估计结果的影响。⑤其二,采用微观层面数据的研究通常将“是否使用互联网”作为核心解释变量来考察互联网使用对收入的影响⑥,这种处理方式由于没有考虑互联网的具体用途,因此无法排除学习、工作以外的上网目的对估计结果的干扰。
(二)互联网使用影响收入的逻辑机理
从基本逻辑上讲,互联网可从多种渠道影响劳动者的收入水平。首先,伴随互联网的普及,各种类型的知识、教育资源可以通过网络被获取。根据中国互联网络信息中心统计,截至2017年底,74.9%的PC端搜索用户与68.6%的手机端搜索用户会在工作和学习时使用互联网进行信息搜索。互联网使劳动者可以利用较低成本和较少时间学习新知识与技能,提高人力资本素质,是正规教育体系的重要补充。⑦劳动者可以利用网络获取更多知识与教育资源来改善人力资本质量,从而有能力实现更高的劳动生产率并相应获取更多的劳动报酬。
其次,互联网技术的快速发展极大地增加了劳动者获取信息的渠道与数量,降低了交易成本。同时,信息获取便利性的提高有效地扩展了劳动者的社会资源与社会网络⑧,既有利于增加其就业或创业机会,也有利于提高就业或创业成功概率,从而提高劳动者的收入水平。
第三,互联网在宏观上孕育出了新产业并带动了既有产业的发展,如电商、快递、网约车、共享单车等,创造出了众多的就业岗位。其中一些就业岗位吸纳了许多低技能劳动者,有助于提高这部分群体的收入水平。但是,新技术是一把双刃剑,在创造新工作岗位的同时也会毁灭一些已有的岗位,导致某些群体的收入降低。因此,从行业的角度来看,互联网对收入的影响是不确定的。
总体上,通过互联网传播知识、教育和其他各类信息资源,理论上有助于提高社会平均收入水平。尤其是原先在社会资源分配方面处于弱势的群体可以利用互联网改善自身在资源获取方面的劣势地位,从而获得提高收入的机会。
但是,互联网使用对劳动者收入的影响程度可能因个体而异。技能偏向型技术进步理论指出,技术进步会提高高素质劳动力的相对生产率与相对收入。在信息社会中,以互联网为平台的技术创新层出不穷,由此出现了一种互联网资源偏向型的技术进步趋势。如果把拥有互联网资源视为一种可以改进劳动生产率的技能,那么拥有更多的互联网资源则意味着劳动者的“技能”水平更高。现实中,由于地区网络建设水平各异以及劳动者存在收入、教育、职业等多方面的特征差异,所以无法保证所有人都可以获得同质的网络资源。因此,拥有网络资源优势的劳动者将获得更高的生产率与相应的高收入。此外,即便所有人所获取的网络资源在客观上是同质的,高素质劳动者往往可以比低素质劳动者更有效地使用这些资源。劳动者的个体特征差异也会导致网络资源在使用用途与使用效率方面存在差异,这些差异最终将反映在互联网使用回报率上。
那么,互联网使用会在多大程度上影响个体收入水平?同时,个体特征差异又会对互联网使用回报率产生何种程度的影响?回答这些问题,需要进一步的实证检验。
互联网使用对个体收入的影响:基于CFPS数据的实证分析
(一)基准模型
明瑟方程被广泛用以讨论劳动者收入水平的决定因素,基准模型如下:
lnwi=α1+β1netusei+γixi+ui
(1)
其中,lnwi为小时收入的对数,考虑到互联网可能对不同类型收入的影响存在差异,本文考量工资性收入和经营性收入两种类型;xi代表一系列控制变量,包括性别、年龄、受教育程度、户籍状况等。为考察互联网使用对收入的影响,基准模型中的自变量netusei为二元虚拟变量,如果个体使用互联网取值为1,否则为0。此外,模型中还加入了行业、地区、时间等特征变量以控制内生性问题。
(二)数据与变量
数据来源于中国家庭追踪调查(CFPS)成人库⑨。该调查自2008年测试阶段起就开始关注个体使用互联网的情况,涉及的相关问题包括“是否使用互联网”“互联网使用时间”“使用互联网学习或工作的重要程度”以及“是否以互联网作为主要信息来源”。在基准模型中,个体小时收入的对数为被解释变量,核心解释变量为虚拟变量“互联网使用”(使用=1,否则=0),控制变量包括性别二元虚拟变量(男性=1,否则=0)、年龄、户籍二元虚拟变量(城市=1,否则=0)、受教育程度(分别使用代表初中、高中、大学及以上的二元虚拟变量)以及反映地区、行业特征的变量与时间变量。
在所取样本中,互联网用户的平均小时收入的对数2010年和2014年分别为1.24和1.73,皆高于非互联网用户的0.56与0.84。2010年互联网用户中城市地区比例为65%,农村地区比例为35%,2014年分别为61%和39%。从教育水平看,随着受教育程度的提高,互联网使用比例相应增加。从年龄看,使用互联网人口的平均年龄低于不使用互联网人口。2010年信息通信、科技、金融和制造业从业人员使用互联网比例较高,2014年批发零售业和交通运输、仓储与邮政业从业人员的互联网使用比例显著上升。⑩
(三)实证结果与讨论
1.基准回归结果
在式(1)的基础上,得到四个回归方程,结果详见表1。
在不考虑个人异质性的情况下,单变量回归结果表明,使用互联网可以带来约20.6%(exp(0.187)-1)的收入溢价。在陆续控制了年龄、教育水平、性别、户口之后,互联网使用仍然可以带来约12.4%(exp(0.114)-1)的收入溢价。最后,互联网的使用具有较强的行业依赖性,并且不同地区、不同年份的互联网基础设施与普及程度可能存在一定差异。在控制了行业特征、地区特征以及年份等影响因素后,回归结果依然保持稳健,使用互联网可以带来约8.7%(exp(0.083)-1)的额外收入回报。这些结论在一定程度上说明,互联网使用可以改善人力资本,提高劳动生产率,并相应提高收入水平。
表1 互联网使用的收入回报
注:括号中为回归变量的t值,***、**、*分别对应1%、5%、10%置信水平,下表同。
2.扩展分析:互联网用途的收入效应
理论分析表明,个体可以利用网络资源改善人力资本,从而提高收入水平。比如,个体出于学习、工作的目的而使用网络,或者利用互联网高效地获取信息,将有利于提高学习、工作效率,进而提高劳动回报率。CFPS对互联网使用用途进行了调查,主要涉及两个问题:(1)“分别对使用互联网从事学习、工作、娱乐、社交的重要程度进行评价,重要程度从低到高分为五级”;(2)“通过何种渠道了解信息,选项包括电视、互联网、报纸等”。2010年的样本中,使用互联网学习、工作的重要程度的平均值分别为3.14与3.20,并有1371个观测值将互联网作为信息来源的首选;2014年的样本中,使用互联网学习、工作的重要程度的平均值分别为3.51与3.83。
本文利用这些数据进一步考量互联网使用用途对收入的影响。具体做法:设置二元虚拟变量“互联网学习”与“互联网工作”,如果观测个体对上网学习或工作的重要性的评价值为4或5,即认为非常重要,则虚拟变量取值为1,否则为0;设置二元虚拟变量“互联网信息”,如果观测个体将互联网作为信息来源的首选,则虚拟变量取值为1,否则为0。表2报告了核心解释变量的回归分析结果。
表2 互联网使用用途的收入回报
回归结果显示,互联网使用用途对收入的影响存在一定差异。从符号上来看,使用互联网学习、工作和获取信息对收入的影响皆为正,但是使用互联网工作对提高收入的作用最大,可以带来11.9%(exp(0.112)-1)的额外收入;其次有效的途径为使用互联网学习,可以增加10.8%(exp(0.103)-1)的收入;使用互联网获取信息带来的收入溢价为10.1%(exp(0.097)-1)。这可能是由于CFPS中对信息内涵没有明确细分导致的。理论上,与学习、工作或生产经营相关的信息可以帮助个体改进工作或生产效率,了解市场行情、掌握商机,从而提高收入水平。但问卷中的信息既包括与上述活动相关的信息,也包括日常新闻、娱乐、休闲等信息,这些信息对收入水平的影响通常较为间接且有限,所以“互联网信息”的回归系数值较小。此外,随着互联网技术和移动上网设备的普及,网络已逐渐成为公众了解日常资讯的基本方式之一,这可能也是导致“互联网信息”对收入的回归系数较小的原因。
进一步将“互联网学习”“互联网工作”“互联网信息”三个变量同时放入回归方程进行估计,结果显示“互联网学习”与“互联网工作”的回归系数与之前的结果基本保持一致,但是“互联网信息”的系数虽然在统计上仍然显著,但从0.097降至0.042。这可能是由于部分受访者选择互联网作为主要信息渠道的目的是为了辅助学习或工作,互联网信息主要通过影响个体的学习与工作活动而对收入施加影响,所以当加入了“互联网学习”与“互联网工作”变量后,“互联网信息”的收入效应进一步减小。总体上,当个体认为使用互联网对学习与工作非常重要,并把互联网作为重要的辅助工具时,互联网的收入增长效应较为明显,大约可以带来10%~12%的额外收入。
3.扩展分析:互联网使用回报率差异与个体特征的关系
理论分析表明,个体获得的网络资源越多、质量越高,越有助于改善人力资本和提高收入水平。劳动者的个体差异决定了网络资源获取能力与使用效率的高低。通常,城市户籍、高学历的个体在获取与使用网络资源方面具备优势。为了观察个体异质性对互联网使用回报率的影响,本文进一步加入了户籍状况、受教育程度与是否使用互联网的交互项。表3报告了交互项的回归系数。
首先,互联网使用的回归系数依旧显著为正。其次,户籍交互项系数为正,意味着拥有城市户口的个体通过使用互联网能够比非城市户口的个体额外获得3.6%(exp(0.035)-1)的收入。我们注意到,问卷中回答“使用”互联网的农村用户中,约75.63%和68.51%的人上网主要是出于娱乐和社交等休闲目的,而城市用户的相应比例为59.09%与52.18%,选择上网学习、工作的城市用户比例分别为41.50%和48.26%,远高于农村用户,这表明城市个体与农村个体在互联网使用用途方面的差异是导致户籍交互项系数为正的原因之一。此外,城乡网络设施差异可能是户籍交互项为正的另一原因,但是由于数据限制无法做出更细致的判断。在受教育程度交互项中,小学、初中交互项的系数皆不显著,而高中、大学交互项皆显著为正,其中大学交互项的系数值较高一些,说明受教育程度越高,使用互联网带来的收入溢价就越高。究其原因,受教育程度较高的个体获取和利用互联网资源的能力也较强,并且拥有的网络资源的质量也较高,因此能够获得更高的互联网使用回报。这一发现与以往文献认为高学历者可以从信息技术进步中获取更大收益的观点较为一致。总体上,这部分的回归结果表明,互联网使用回报率会有个体差异,城市人口与高学历人口从互联网技术普及中获益更多。
表3 个体获取网络资源能力对收入的影响
4.扩展分析:互联网使用对不同类型收入的影响
之前的分析中并没有对个体收入来源进行区分,而现实中互联网使用可能对不同类型收入产生差异化影响。比如,电商行业高度依赖互联网,从而导致个体从事电商业务产生的经营性收入会和互联网使用高度相关,互联网使用可能显著促进经营性收入增加。因此,此处把收入分为工资性收入与经营性收入,再次分别进行回归。表4报告了核心解释变量的估计结果。
回归结果显示,互联网使用可使工资性收入提高5.9%(exp(0.057)-1),经营性收入提高10.3%(exp(0.098)-1),对后者的影响更加明显。我们注意到,样本中从事经营性活动的个体主要来自零售批发行业,还有一部分是农业。近年来,互联网信息的传播与互联网金融的发展为零售业与农产品销售提供了更多渠道、市场和资金,由此可能引致经营性收入的上升,而互联网对于工资性收入的影响更多还是取决于行业与使用用途,所以互联网使用对经营性收入的影响相比工资性收入会更加明显。
表4 互联网使用的分类收入回报
注:回归方程中包括性别、年龄、教育水平、行业虚拟变量等所有控制变量。
5.扩展分析:样本选择问题与倾向得分法
在研究互联网使用对个体收入的影响时面临着样本选择问题。衡量互联网使用对收入的影响本质上是对“互联网使用”处理效应(treatment effect)的度量。假定模型的其他部分都被正确设定,如果对于个体来说,无论他是否使用互联网都能得到相对较高的工资性收入,那么互联网使用系数的最小二乘估计值实际上高估了互联网使用的处理效应。比如,个体使用互联网可能是由于其有经济能力购买电脑、手机等上网设备以及相关的网络与服务,或者是互联网使用行为与其他影响收入的因素相关。这样一来,即便回归结果的系数在统计上显著,也是有偏和不一致的。
本文采用倾向得分法(Propensity Score Method)处理样本选择问题。该方法是通过估计可观测变量的倾向得分对全样本进行分组配比,这样配对后因变量的组内差异理论上完全是由样本的“处理效应”引起的。因此,通过这种方法可以有效回避样本选择的误差。
从表5的倾向得分法回归结果来看,互联网使用依旧可以带来约7.8%(exp(0.075)-1)~8.1%(exp(0.078)-1)的额外收入回报,这一结果与基准模型的回归结果保持一致,说明本文的主要结论并没有受到“自我选择”问题的干扰。
表5 倾向得分法结果
注:模型1采用Logit模型估计,模型2采用Probit模型估计。
结论与政策建议
本文利用2010年和2014年中国家庭追踪调查(CFPS)数据综合分析了互联网使用对收入的影响程度及影响途径。基准模型回归结果表明,在控制了一系列个人特征变量后,互联网使用可带来12.1%的额外收入回报。在此基础上的扩展分析结果显示:(1)当个体将互联网作为学习、工作的重要辅助工具或者获取信息的主要渠道时,在同等情况下可获得更多收入溢价;(2)个体获取以及使用网络资源的能力越强,则越能够从使用网络中获得更多收入回报,而影响个体能力的因素包括户籍状况与教育水平;(3)互联网使用对经营性收入的正向影响高于对工资性收入的影响。
上述结论意味着,普及互联网使用对于提高个体收入水平有重要意义,与此同时,由于个体特征差异会影响互联网使用回报率,因此需要制定有针对性的差异化的互联网政策。(1)鉴于互联网使用对收入增长的正向效应,政府需扩大互联网基础设施投资,努力提升网络供给能力,降低互联网使用费率,改变农村网络基础设施的落后局面;(2)由于个人互联网使用技能与教育水平的提高有助于改善互联网使用的回报率,因此需进一步普及高中以上阶段教育,加强信息技术培训,尤其是需要强化低技能劳动者与农村居民的技能培训,提高其获取以及使用网络的能力;(3)互联网使用对从事零售批发行业以及农业经营性活动的个体的经营性收入有显著正向影响,为此,应大力推广“互联网+”计划,促进互联网与实体经济的深度融合,构建更加先进与便利的经营体系和网络销售平台,以此拓宽劳动者的增收渠道。
①Krueger A., “How computers have changed the wage structure: Evidence from microdata, 1984~1989”,QuarterlyJournalofEconomics, 1993, 108(1), pp.33~60.
②Goldin C., Katz K., The race between education and technology: The evolution of U.S. educational wage differentials, 1890 to 2005,NBERWorkingPaper, No.12984, 2007.
③Forman C., Goldfarb A., Greenstein S., “The internet and local wages: A puzzle”,AmericanEconomicReview, 2012, 102(1), pp.556~575.
⑤韩长根、张力:《互联网普及对于城乡收入分配的影响——基于我国省际面板数据的系统GMM分析》,《经济问题探索》2017年第8期。
⑥李雅楠、谢倩芸:《互联网使用与工资收入差距——基于CHNS数据的经验分析》,《经济理论与经济管理》2017年第7期。
⑦Banerjee, A. V., Duflo E., “(Dis)organization and success in an Economics MOOC”,AmericanEconomicReview:PapersandProceedings, 2014, 104(5), pp.514~518.
⑧边燕杰:《城市居民社会资本的来源及作用:网络观点与调查发现》,《中国社会科学》2004年第3期。
⑨中国家庭追踪调查已发布了2010年、2011年、2012年、2014年、2016年数据。其中,2012年调查没有涉及互联网使用相关问题;2011年成人库仅有1284个观测值,且限于16~18岁成人;2016年核心变量(比如收入)的有效观测值数量十分有限,所以最终选取2010年和2014年数据。
⑩本文对分行业互联网使用情况进行了统计,共计21个行业,此处为节省篇幅省略统计结果。