人工智能技术、个体能力与劳动工资：来自认知和非认知能力视角的经验证据

2022-08-02王林辉钱圆圆

东南大学学报(哲学社会科学版) 2022年4期

王林辉钱圆圆赵贺

(华东师范大学1.中国现代城市研究中心；2.经济学院,上海 200062)

一、引言

当前，随着人工智能在深度学习、自然语言处理、图像视频识别、计算机视觉等领域取得技术突破，其应用范围不断拓展，并赋能制造、金融、医疗与教育等行业，成为引领科技革命的一种颠覆性技术。那么，人工智能技术是否会大规模影响劳动就业，是否会对劳动者的工资造成冲击？这些问题引发社会各界的普遍关注。Susskind认为自动化将给就业带来威胁，一些传统劳动具备比较优势的工作任务将会被智能机器侵占，降低劳动需求，进一步诱发技术性失业与绝对工资下降[1]。Dinlersoz和Wolf的研究表明，机器人技术应用会显著降低美国劳动力的就业和工资水平[2]。结合美国经济数据，Acemoglu等研究美国机器人应用对当地劳动力市场的影响后，发现机器人应用显著降低美国通勤区域的就业和工资。人工智能作为资本增强型技术，无疑会加剧资本和劳动的收入差距，而资本与劳动要素的收入分配差距取决于二者的替代弹性[3]。DeCanio对美国横截面数据进行分布拟合后发现，若劳动者和机器人之间的替代弹性高于1.9，人工智能技术会导致总体工资水平下降，具进一步指出除非机器投资的回报在人群中广泛分配，即劳动均等享受智能化技术红利，否则未来人工智能的发展可能会降低工资和加剧收入不平等[4]。也有研究认为人工智能技术并不一定会诱发收入水平绝对下降，Graetz等利用1993—2007年17个发达国家面板数据研究机器人应用的经济效应后发现，机器人使用能够提升劳动生产率和工资，虽然机器人应用会削减低技能劳动就业，但并不会显著降低总体就业[5]。Caselli等认为，在满足市场完全竞争、利率固定、规模报酬不变和消费者偏好相似条件下，新技术不太可能导致所有工人的工资下降，当投资品的相对价格下降时，平均工资水平将会上升[6]。

事实上，人工智能技术作为物化型技术，通常以机器设备资本品为载体，更易于提高资本质量和生产条件的智能化程度，对不同类型劳动的影响具有非均等渗透和非中性特征，对不同群体的影响存在明显的异质性[7-8]。或者说，机器人等智能化设备在生产中的应用改变了技术环境，由于技能劳动更能适应环境变化，人工智能技术就表现出技能偏向性，进而易导致高技能劳动相对需求上升和工资上涨。Katz和Margo发现在1920—2010年期间，美国低技能岗位诸如农民、服务类等职业的就业份额从44.1%下降至29%，但专业技术员、经理等高技能职业的需求由12.4%上升至39.4%[9]。相关证据表明，技术更易与高技能劳动形成互补，会借助人机合作提高劳动生产率，进而提升高技能劳动者的工资；与之相反，低技能劳动者的新环境适应能力往往较低，难以快速学习新技术，劳动需求下降进而导致工资收入减少[10]。Lankisch等在内生经济增长模型中引入自动化资本，经验研究发现自动化降低了低技能工人的实际工资，诱发了技能溢价和收入不平等[11]。Zhang将自动化纳入特定要素的技术进步框架，发现自动化会产生替代效应和资本再分配效应，当劳动力和资本之间的替代弹性足够大时，资本再分配效应会提高熟练工人的工资率，拉大非熟练工人和熟练工人的收入差距[12]。Jackson 等基于产业链视角，在生产流程中嵌入人工智能、机器人中间产品后，发现自动化技术应用能够扩大高、低技能劳动的工资差距[13]。Acemoglu和Restrepo研究认为机器人对高、低技能劳动的替代程度主要取决于任务生产过程中高、低技能劳动的比较优势，实证检验结果发现机器人应用导致高中及以下学历工人的就业与工资降低[14]。

现有文献已关注到人工智能技术对劳动者工资的冲击，并考察了其对高、低技能劳动者工资的作用差异，但多数文献对于高低技能劳动的区分仅考虑劳动者的受教育程度。新人力资本理论指出，忽略个体能力而只以教育程度来衡量劳动者人力资本水平所获得的结论可能是有偏的[15]。通常，个体能力取决于先天禀赋，并受家庭、学校、社会以及其他外部环境等综合因素的影响。在经济生产过程中，个体劳动效率、环境适应能力与工作能力会因个体和环境差异而不同。相对于传统人力资本理论，新人力资本理论不再单一地采用受教育程度来表征劳动质量，而是将个体能力视为人力资本的核心，认为认知和非认知能力是个体劳动质量的关键因素，都会对工资收入产生重要影响[16]。其中，认知能力主要指计算、阅读、逻辑思维等能力，与之相对，非认知能力则主要指情感、意志、性格、动机与信念等，内容包括自信、自尊、自制、成就动机、对生活的态度等。可以看出，新人力资本理论的个体能力是一个系统框架体系，主要涵盖个体先天禀赋、后天成长与个体发展等诸多因素。个体认知能力是重要的，并会通过提升劳动质量方式影响劳动工资[17]。与此同时，非认识能力在劳动过程中也同样扮演着重要角色，个体的非认知能力如个性、人格特征、社会参与等同样会影响劳动质量和工作效率。乐君杰和胡博文指出，非认知能力能显著促进工资收入增长，其重要性并不亚于传统人力资本理论关注的受教育年限[18]。

人工智能是一种融合判断力、学习力和决策力的数字智能技术，可以替代劳动者执行程式化的工作，但对于需要创新、情感沟通和协作等能力的工作任务，人工智能技术在短时间内可能难以替代[8]。那么，在人工智能技术对劳动工资的影响中，个体的认知与非认知能力将会发挥何种作用？在人工智能技术应用过程中更易与哪一种能力互补而形成溢价？如果存在能力溢价效应，在不同类型岗位和不同性别群体中是否会表现出明显差异？基于此，本文从个体认知和非认知能力视角出发，结合中国家庭追踪调查微观数据(CFPS)，考察人工智能技术与个体能力耦合对劳动工资的影响，以及群体差异性特征。本文的边际贡献在于：第一，克服以个体受教育年限即以学历教育水平来衡量劳动者技能的局限性，从劳动者认知和非认知能力的全新视角考察劳动能力；第二，创新性地检验个体能力与人工智能技术耦合对劳动工资的影响，识别出何种能力更易与人工智能技术互补而形成溢价；第三，对比不同岗位类型和不同性别群体的个体能力与人工智能技术耦合对劳动工资影响的差异性。

二、计量模型选择、指标设计与数据来源说明

(一)计量模型设定

本文构建如下模型：

lnwagei=α0+α1lnAIj+α2abilityi+βlnAIj*abilityj+α3Xj+α4Ci+εi

(1)

其中，被解释变量lnwage表示个体的小时工资，lnAI表示人工智能技术水平，ability表示个体的能力，具体分成认知能力(cog)和非认知能力(noncog)两类。在回归过程中，分别加入认知能力和非认知能力与人工智能技术的交乘项，检验个体的认知和非认知能力是否会对人工智能技术的收入分配效应产生影响。X是省级层面的控制变量，C为个体层面的控制变量，ε为随机误差项，将标准误聚类到省份层面。

(二)指标设计

1.被解释变量和核心解释变量

本文的被解释变量是微观个体的小时工资，具体计算公式为用每月税后工资/(4*每周工作时间)；数据来源于2020年CFPS微观个人层面调查数据。人工智能技术lnAI是核心解释变量之一，用在Patenthub全球专利数据库获取的2020年31个省份与人工智能技术相关的专利申请量来表征。另外，考虑到人工智能技术对工资收入的影响可能存在滞后性，本文还运用2019年的人工智能专利数据进行稳健性检验。

认知能力和非认知能力是本文需要重点关注的两个变量。考虑到认知能力是指人脑加工、储存和提取信息的能力，从识字能力、记忆能力等角度选取指标，结合CFPS微观数据库中调查问题“是否读书”“总阅读量”“能记住主要事情吗”“是否使用外语”“智力水平”等构建综合的认知能力指标。关于非认知能力的度量，程虹和李唐[19]、王春超和张承莎[20]基于“大五人格”模型，从严谨性、顺从性、外向性、开放性以及情绪稳定性等五个方面进行综合测度。本文借鉴上述文献的“大五人格”模型，结合CFPS微观数据库中2020的调查问卷，按照相关问题回答评分，综合评价非认知能力。其中严谨性选择的问题有“对陌生人的信任度”；顺从性选取的问题有“对自己生活满意度”，“对聪明才干能得到回报”这种说法的认同度；外向性选取的问题有过去一周内“我感到孤独”发生的频率，“对有多幸福”的评分；开放性方面选取的问题分别为对“女人干得好不如嫁得好”这种说法的认同度，对“女人应该有孩子才算完整”这种说法的认同度；情绪稳定性问题为“我感到悲伤难过”发生的频率，“我觉得生活无法继续”发生的频率。选取的认知和非认知能力指标说明详见表1。为了避免主观设计权重可能引发的综合指标衡量偏误，本文运用主成分分析法分别合成认知和非认知能力指标。表2是认知和非认知能力按照受教育程度分类的描述性统计，结果显示认知和非认知能力水平的均值随着学历水平的上升而上升，表明指标设计符合预期。

表1 认知能力和非认知能力指标说明

表2 认知能力和非认知能力的描述性统计

2.控制变量

省际层面变量：产业结构lnind，以第三产业占比来表征；文化建设lnpub_cul，以人均拥有公共图书馆藏量来表征；互联网基础建设lnpub_int，以互联网宽带接入端口数来表征。省际层面数据来源于国家统计局。

个体层面变量：性别gender，其中女性取值为1，男性取值为0；劳动者受教育年限lnsch，具体而言，文盲或半文盲的受教育年限为0年、小学学历为6年、初中学历为9年、高中学历为12年、大专学历为15年、本科学历为16年、硕士学历为19年，博士学历为22年；劳动者的年龄age和年龄的平方项age2，样本的年龄区间为16～65岁。另外，对劳动者的工作相关特征进行控制，具体有是否签订劳动合同constr和劳动者的工作满意度jobsa。上述变量除了年龄外都进行了取对数处理。个体层面数据来源于CFPS2020年个体调查数据。

三、实证检验结果与评价

(一)基准回归

表3汇报了基准估计结果。其中，列(1)和列(4)分别报告了只加入认知能力和非认知能力的估计结果。结果显示，在1%的显著性水平下，认知能力的估计系数为0.0643，非认知能力估计系数为0.0928，说明劳动者的认知和非认知能力存在工资增长效应。表3的列(2)是同时加入人工智能技术和认知能力的估计结果，列(5)是同时加入人工智能技术和非认知能力的估计结果，结果显示认知能力和非认知能力的工资提升效应仍然存在。列(3)为加入人工智能技术和认知能力的交互项(lnAI*cog)的回归结果，列(6)为加入人工智能技术和非认知能力的交互项(lnAI*noncog)的回归结果。结果显示，人工智能技术和认知能力的交互项的估计系数为0.0143，在5%的水平上显著，说明在控制其他变量的情况下，人工智能技术可以让高认知能力劳动者获得更高的工资收入，表明人工智能技术与劳动者的认知能力具有良好的耦合性，个体认知能力越高则人工智能技术的工资提升效应越强，越能给劳动者带来丰厚的工作收入。同样地，人工智能技术和非认知能力的交互项的估计系数为0.0220且保持 5%的显著性水平，说明在控制其他变量的情况下，人工智能技术同样可以让高非认知能力劳动者获得更高的工资收入。可见，人工智能技术在生产中的应用不仅需要劳动者认知能力，也依赖于劳动者的非认知能力。同时，相较于认知能力，人工智能技术与非认知能力的交互项系数更大，可以初步判断人工智能技术更易与非认知能力互补形成溢价。

表3 基准回归

(二)内生性检验

1.工具变量法

为了防止指标设计偏差可能引发的偏误，在此选取2019年长途光缆线路长度的对数作为人工智能技术的工具变量，理由如下：光纤技术是现代数据中心基础设施的重要桥梁，而光纤需要借助光缆来传输，光纤技术越发达，越有利于数据传输，进而促进人工智能技术发展，满足工具变量的相关性要求；与此同时，光缆的铺设里程等主要取决于经济环境、地理环境和政策环境，与劳动者的认知能力、非认知能力以及工资收入无关[21]。选取滞后一期的2019年长途光缆线路长度，能进一步避免因反向因果造成的内生性。表4的列(1)和列(3)汇报了同时加入核心解释变量和工具变量的回归结果，人工智能技术系数显著为正而工具变量的系数并不显著，说明工具变量主要通过影响人工智能技术这一途径，对劳动个体的工资产生影响。综上可知，工具变量满足排他性要求。表4的列(2)、列(4)分别表示2SLS的回归结果。工具变量不可识别检验(Anderson LM 统计量)与弱工具变量检验(Kleibergen-Paaprk Wald F 统计量)均显著拒绝原假设，表明不存在不可识别问题和弱工具变量问题。在1%和5%的显著性水平下，交互项lnAI*cog和lnAI*noncog的系数显著为正，说明解决内生性问题后的结果依然稳健。

表4 内生性检验1：工具变量法

2.处理效应模型

考虑到不同岗位对认知和非认知能力的需求存在异质性，个体可能会凭借其高认知和高非认知能力，寻求到更合适的工作，获得更高的劳动报酬。在同等情况下，企业也会主动选择符合本企业招聘需求的高认知和高非认知能力员工。借鉴王春超和张承莎的做法，本文用处理效应来解决上述自选择引发的内生性问题[20]。相较于两阶段工具变量法，当内生变量为虚拟变量时，处理效应模型的估计效果更好[22]。鉴于此，本文首先构造第一阶段的二值变量作为被解释变量，为尽可能缓解分组的非随机问题，采取两种构造方法：方法一是根据全样本认知和非认知能力均值，分别将认知和非认知能力大于平均值的，设定为高认知能力组和高非认知能力组；同理，低于均值的划定为低认知能力组和低非认知能力组。方法二是分别将认知能力和非认知能力的0. 25和0. 75 分位点作为划分的界限，依次将分位数小于0. 25和0. 75 分位点的劳动者划分为低认知能力组和低非认知能力组，相应地将非认知能力大于等于0.25和0.75分位点的劳动者划分为高认知和高非认知能力组。然后，运用Probit模型估计劳动者进入高认知能力组和高非认知能力组的概率，见方程(2)：

ability(1,0)i=γ0+γ1X2+ε

(2)

ability(1,0)为个体所在的分组，高认知能力或者高非认知能力组取值为1，低认知能力或者低非认知能力组取值为0，γ0为常数项，X2除了包括基准回归中的控制变量X和C以外，还加入了外生排他变量即工具变量lnIV。再将第一步估计的个体进入高认知或者高非认知能力组的概率代入到基准回归模型，见方程(3)：

lnwagei=φ0+φ1lnAIj+φ2abilityj+σlnAIj*abilityi+θability(1,0)i+φ3X3+εi

(3)

其中σ反映人工智能技术与认知能力或非认知能力耦合对工资的作用，结果见表5。表5中列(1)和(4)是根据平均值分组后的回归结果，列(2)、列(3)、列(5)和列(6)是根据样本分位点分组后的回归结果。结果表明，无论是以平均值分组，还是以不同分位数点分组，lnAI*cog和lnAI*noncog的系数均显著为正，说明人工智能技术与认知能力和非认知能力均具有较强的互补性，人工智能技术应用能够给高认知能力和高非认知能力劳动个体带来明显的工资增长效应，且从系数大小和显著性上看，人工智能技术与非认知能力的互补性更强，与基准回归结论一致。

表5 内生性检验2：处理效应模型

(三)稳健性检验

本文尝试用更换变量和缩尾的方法来进行稳健性检验：一是将单位有效工资更换为每月税后工资，结果见表6的列(1)和列(2)二是将核心解释变量更换为2019年的人工智能技术水平，结果见表6的列(3)和列(4)。结果显示，lnAI*cog和lnAI*noncogn的系数仍然为正并且显著，估计结果稳健；二是考虑到部分工资数据、认知能力和非认知能力值以及人工智能技术水平可能呈现出过高或者过低现象，为了剔除这些异常值对估计结果的可能影响，进一步对上述指标进行缩尾处理，将落于(1%，99%)、(5%，95%)之外的观察值分别替换为1%和99%分位、5%和95%分位的数值，对缩尾处理后的新样本重新进行回归，结果见表7。其中列(1)和列(2)是1%缩尾后的回归结果，列(3)和列(4)是5%缩尾后的回归结果。估计结果与前文相比并未发生实质性变化，进一步支持了本文的结论。

表6 稳健型性检验1：更换变量

表7 稳健性检验2：缩尾处理

四、异质性检验

(一)不同岗位类型

分析人工智能技术与生产任务属性关系可知，人工智能技术会逐渐取代程序化的工作岗位，而非程序化工作岗位或可程序化水平低的岗位通常很难被自动化技术所替代[23]。为了检验岗位类型不同时人工智能技术与个体能力耦合所形成的工资效应差异，参照Autor和Cortes 等的分类方式[23]，按照职业的技术特点将就业岗位划分为程式化和非程式化工作。其中，程式化工作是指按照既定流程和规则，可被程序化的工作任务，更多出现在农、林、牧、渔、水利业的就业岗位，或生产、运输、建筑等岗位；非程式化工作是指工作内容没有统一的范式，在不同的环境或情形下需要采取不同的应对措施，如教育、管理和营销等岗位。人工智能技术对不同职业类型群体收入分配影响的回归结果见表8。表8的列(1)和列(2)表明，人工智能技术与认知能力耦合对从事程式化和非程式化工作的劳动者工资，都具有显著的正向作用，说明人工智能技术与认知能力耦合引发的能力溢价在两种职业类型中均存在，但程式化岗位与认知能力互补的溢价效应更高。表8的列(3)显示，人工智能技术与非认知能力耦合的溢价效应只存在于非程式化岗位。这是因为非程式化工作通常灵活性和自主性较高，往往需要人机协作来完成，更需要具有较高的非认知能力劳动者参与，因而在非程式化岗位，人工智能技术与非认知能力可实现良性互动，进而形成能力溢价效应。

表8 异质性检验1：职业类型

(二)不同性别差异

事实上，不同类型的生产任务可能表现出不同的性别偏好且劳动者通常也愿意选择与个体特征更匹配的工作岗位。一般而言，女性在体力方面存在劣势，而在沟通、协调等人际互动方面更具优势。另外，女性具有更突出的情感识别能力和语言表达能力，因而不同性别劳动个体就会选择与性别更匹配的工作岗位。而人工智能技术引致劳动者能力需求变化，某些智能化工作岗位表现出更适合女性就业的特性，那么可能为这一领域女性发挥其性别优势创造更大的空间，进而有助于缩小性别工资差距[29]。换言之，人工智能技术替代常规任务如传统需要体力或高危险性的岗位，进而减少男性就业。而智能化环境创造出更适合发挥女性性别优势的非常规性任务岗位，使得从事这类非常规任务的女性工资增长进而缩小性别收入差距[30]。表9给出了不同性别群体的人工智能技术与认知能力和非认知能力互补性的回归结果。由表9的列(1)和列(2)可以看出，在1%的显著性水平下，人工智能技术与认知能力交互项(lnAI*cog)的系数值为0.0191，且在女性群体中显著，在男性群体中系数值为0.0097并保持显著。可以发现在女性群体中系数值明显高于男性，说明人工智能技术与认知能力互补所形成的能力溢价效应，在女性群体中更高。由列(3)和列(4)易知，在1%的水平下，人工智能技术与非认知能力交互项(lnAI*noncog)的系数在女性群体中显著为0.0465，在男性群体中为负但不显著。这是由于人工智能技术应用往往会替代繁重体力劳动，但那些非常规的交互型的工作任务还无法完全由机器执行，往往需要人机协作来完成。而女性在语言表达、亲和、细心、耐性和社交等非认知能力方面要高于男性，这些隐形特质更易与人工智能技术环境互补，有利于提高女性工资收入而形成能力溢价。

表9 异质性检验2：不同性别

五、基本结论

本文利用人工智能专利数据，结合最新公布的2020年中国家庭追踪调查数据(CFPS)，引入个体认知和非认知能力因素，实证检验人工智能技术与认知和非认知能力耦合对工资的影响及异质性特征。结果显示：(1)人工智能技术与认知和非认知能力耦合，均有助于提高劳动者工资；但人工智能技术与非认知能力耦合形成的能力溢价效应要高于认知能力；运用工具变量法和处理效应模型进行内生性处理后结论依然稳健。(2)对于不同岗位类型，人工智能技术与个体能力耦合的溢价效应不同。人工智能技术与认知能力耦合对从事程式化和非程式化工作的劳动者工资，均具有显著的正向作用；而人工智能技术与非认知能力耦合的溢价效应只存在于非程式化岗位，原因在于非程式化工作通常灵活性和自主性较高，易于与劳动者的非认知能力互补而实现良性互动，进而形成能力溢价效应。(3)人工智能技术与认知能力、非认知能力耦合所形成的能力溢价效应，在女性群体中更明显。这是由于人工智能技术应用往往会替代繁重体力劳动，但那些非常规的交互型的工作任务还无法完全由机器执行，往往还需要人机协作来完成。而女性在语言表达、亲和、细心、社交等非认知能力方面要高于男性，这些隐形特质更易与人工智能技术环境融合，更有利于形成能力溢价，提高女性工资收入。

本文研究结果表明，认知和非认知能力对劳动者的收入均会产生显著影响，暗示认知和非认知能力在人工智能技术影响收入分配过程中扮演着重要的角色。因此，提高劳动者的认知和非认知能力，是应对人工智能技术冲击和缩小社会收入差距的重要渠道。据此，本文提出以下建议：首先，鼓励个体提高自我认知能力和非认知能力，尤其是非认知能力。除努力提升自身素质如接受更高教育外，个体还应积极参与各类社会活动，通过多元化的实践场景提高非认知能力。其次，激励企业加大对员工的能力培训。企业不仅需要组织常规技能等培训，同时也要注重对劳动者的非认知能力的培养，关注员工自信、自尊、成就动机等非认知能力，为提高员工的智能化情境适应能力创造良好环境。再次，引导高校优化教学内容、教育模式和教育体系。在提高学生传统认知能力的同时，注重在严谨性、情绪稳定性和外向性等方面提升学生的非认知能力，使学生能够较快较好地适应新技术环境。最后，政府应积极营造女性公平、公正的就业与工作环境。研究表明，人工智能技术更易于与女性的认知能力和非认知能力互补而形成能力溢价，政府应注重为女性创造一个更加公平的职场环境、更加完善的社会保障系统，借助于新兴技术缩小性别工资差距，提高社会平等性。