AI背景下劳动力市场合作联盟研究
2019-06-11邵全,赵奭,刘娜,冯凯
邵 全, 赵 奭, 刘 娜, 冯 凯
(1.北京建筑大学 经济与管理工程学院,北京 100044; 2.上海电机学院 商学院,上海 200240; 3.上海隧道工程股份有限公司,上海 200032)
0 引言
近年来,AI技术在工作环境中的介入给社会劳动关系带来了正反两方面的影响。一方面,企业应用AI技术进行劳动监控使得劳资双方间信息的模糊性降低、信息环境更加完全,利于企业通过采集员工的工作数据从而改进工作流程、提高生产效率、降低员工的工作风险[1]。同时员工也因此而受益,员工通过AI技术实现工作数据化,利于员工提高自身人力资本水平,有效减少工作时间,创造更多收益。另一方面,工作场所应用AI技术的劳动监控也产生了负面作用,引发了工作伦理问题,影响了劳动关系。2018年TechNews披露了亚马逊公司为一款AI腕带申请了专利技术并要求员工佩戴,这个腕带通过采集工人的工作数据,并能适时做出工作监视震动以促使工人提高生产效率[2],但这种数据的采集和工作方式也侵害了员工的隐私,遭到了员工的反对。随着企业对于数据索求意愿不断增强,企业、员工在博弈的过程中也意识到拥有数据权利是改善自身期望效用的有效策略,他们都在满足心理预期最低保障的约束条件下寻求自身效用的最大化[3]。
为了构建和谐劳动关系,形成政府规制下的劳动监察权力制衡和利益均衡途径,国内外学者对此方面展开了一系列研究。Lazear和Rosen建立了锦标赛理论提出如何形成代理人的有效激励机制,从而降低委托人支付的劳动监控成本[4]。Solow[5]、Shapiro和Stiglitz[6]通过工资模型来解释企业不能完全监控员工时,如何有效解决员工投机行为。Rubinstein[7]、Fama[8]、Weizmann[9]、Radner[10]设计声誉模型和棘轮效应模型展开最优合同的研究中涉及劳动监控问题。Holmstrom[11]、Holmstrom和Milgrom[12]、Lazear[13]采用激励机制证明了规避员工偷懒的有效方法。McAfee 和McMillan建立选择模型分析团队工作中的劳动监控问题[14]。Christiane Prange通过案例研究分析公司在数据创新管理中的合理利益分配途径[15]。Baeten Xavier基于未来内生和外生因素的影响,构建了平衡的薪酬和福利计划[16]。多数学者从契约理论、激励理论等视角来研究和解决劳动关系风险问题,但少有学者从博弈合作联盟的角度去研究博弈各方形成的一个工作联盟,来解决企业和员工间形成的不完全信息合约机制所引发的潜在收益分配不公平和数据权利不对等问题。
本文关注劳动关系博弈局势的理性参与人在何种行为策略下能形成政府协调下的劳动监控权力制衡,寻找到参与人的利益分配均衡途径。第一部分基于博弈中的信号理论分析了信息不完全是劳动力市场产生不和谐劳动关系的根源。第二部分基于合作博弈理论深入探析了在AI时代,企业、员工、政府应如何理性地组建利益相关者的工作联盟,如何对联盟成员进行合理配置,构建了由政府、企业、员工三方构成的AI背景下工作联盟,采用经典的Shapley Value方法对工作联盟收益配置进行求解。第三部分引入一个算例,模拟计算了工作联盟Shapley解,给出了AI时代,创建社会和谐劳动关系,实现联盟的社会帕累托效率的相关策略建议。
1 基于不完全信息的劳动监控博弈模型
在工作场所,劳资双方的信息是不对称的,员工会有偷懒、投机等行为,企业为了减少或最小化员工偷懒等行为所造成的收益损失,会进行必要的劳动监控,并为此支付一定的成本。企业与员工的这种博弈行为形成了一种不完全信息的信号博弈,员工和企业是信号博弈的两个博弈方,分别为信号发出方和信号接收方,员工的类型是私人信息,他们向企业发送自己的信号,企业据此做出判断并理性地选择劳动监控的相关决策。同时,员工也会对企业的劳动监控决策进行判断,理性地做出自己的最优反应策略。
1.1 模型基本假设
(1)参与人集合I={1,2},1表示员工,2表示企业。
(2)员工的类型集Θ={s,w},s表示员工偷懒,并有投机行为,w表示员工努力工作,θi∈Θ(θ1=s,θ2=w)表示员工的私人信息,它是员工的类型,员工自己知道θi的取值,而企业仅知道θi的先验概率分布,令p(θ1=s)=x,p(θ2=w)=1-x,x∈[0,1]。
(3)员工的信号集合M={m1,m2},m1表示员工按自己真实意愿行动,不刻意隐瞒自己的投机行为,受到监控被发现投机时不进行掩盖,愿意与企业合作;m2表示员工不一定按自己的真实意愿行动,若θ1=s时,员工会蓄意隐瞒自己投机行为,从而使其投机行为很难被企业发现。若θ2=w,表示当员工真实意愿为与企业合作时,其必发送m2信号。
(4)企业的行动集A={a1,a2},a1表示企业监控意愿消极,监控效率很低,在这种情况下即使员工投机,企业也监控不到;a2表示企业付出很高的管理成本而积极监控,能高效检查出员工投机行为。
(5)企业消极监控成本为c1,企业积极监控成本为c2,令c2>c1>0。
(6)员工生产率有高低之分,H表示员工投机时有高生产率,其概率为q;L表示员工投机时有低生产率,其概率为1-q;q∈[0,1]。
(7)员工产出价值为v,其中q×v表示高产出,(1-q)×v表示低产出;员工工资为ω,其中q×ω表示高工资,(1-q)×ω表示低工资;员工投机成本为g;员工投机收益为r;企业实施投机惩罚为f。
1.2 模型框架
引进“自然”N,N首先选择员工类型θi∈Θ,Θ={s,w}。因为企业与员工之间劳动契约关系已经成立,员工将根据自己的类型先选择行动,员工选择易被发现的投机行为或难以察觉的投机行为。企业后行动,企业观测到员工发出的信号,企业使用贝叶斯法则参照员工的先验概率p0=p(θi),得到其后验概率p=p(θi|mi),然后决定监控的行动。如果检查出员工投机但愿意与企业进行合作,则员工无法取得投机收益r,同时员工要担负损失为投机支付的成本g,假设r>g>0,这样员工有投机的个体理性;如果检查出员工投机但其极力掩盖,除了员工无法取得投机收益r,并且将被处于罚款f,f≥0。如果员工投机没被发现,则员工投机获得收益r-g>0。建立博弈树如图1。
博弈参与人的支付函数表示为Uij(mi,ak,θ,Vq),如表1所示,其中,θi={s,w};mi={m1,m2};ak={a1,a2},Va={(H,L)|P(H)=q,P(L)=1-q};i=1,2;j∈Z+。
图1 劳动监控博弈模型
表1 博弈参与人支付函数表
1.3 模型分析
员工向企业发送自己类型信号时有两种策略,一种是不同类型的员工依据自己的类型向企业发送不同的信号,称为分离策略。一种是不同类型的员工不管自己的类型如何都向企业发送相同的信号,称为混同策略。针对员工的工作,企业有两种监控行为。一种是高成本的劳动监控行为,一种是低成本的劳动监控行为。
1.3.1 员工的分离策略
当员工采取分离策略时,企业对员工做出后验判断概率为
p(s|m1)=1,p(s|m2)=0,p(w|m1)=0,p(w|m2)=1
企业根据对员工类型的后验判断p和员工发出的信号mi,企业选择的行为必须满足使得企业获得期望支付最大,即a*(mi)是最大化问题:
命题1员工采用分离策略时,企业偏好消极监控策略,即(m1,m2)→(a1,a1)。
证明员工依据自己的类型发出两种信号:m1,m2
(1)当mj=m1时,
=max(U2(m1,a1,s),U2(m1,a2,s))
=max(U21+U22,U23+U24)
=max(v-ω-2×c1,v-ω-2×c2)
=v-ω-2×c1
得出a*(m1)=a1。
(2)当mj=m2时,同理可解a*(m2)=a1。
命题2企业采用消极监控策略时,员工偏好发送信号m2,即(a1,a1)→(m2,m2)。
证明当给定企业采取消极监控策略时,即a*(m)=(a1,a1),员工选择的策略必须使得员工期望支付最大,即m*(θi)是最大化问题
(1)当θ1=s时,
=max(U1(m1,a1,s),U1(m2,a1,s))
=max(U11+U12,U15+U16)
=max(ω-2×g,ω-2×g+2×r)
=ω-2×g+2×r
可得m*(s)=m2。
(2)当θ2=w时,同理可得m*(s) =m2
当员工采用分离策略,员工将根据自身类型发送不同信号,此时,企业可以通过观察员工发出的信号对员工类型进行准确判断,那么企业就会偏好采取消极的劳动监控行为,以降低支付的监控成本。当企业采取消极劳动监控时,员工的信号发送偏离了分离策略,没有激励相容性显示出员工的真实类型。企业则不能通过信号对员工类型进行有效判断,企业采取低成本的监控行为是无效率的。为了提高劳动监控效率,企业必须加强劳动监控力度,这必将消耗企业大量的监控成本。
1.3.2 员工的混同策略
命题3企业偏好的劳动监控策略将随机化。同时,员工的相机劳动策略也将随机化。
证明当员工采用混同策略,即员工不努力工作,被企业监控发现时,会刻意隐瞒自己的行为,从而使其投机行为不被企业发现;当员工努力工作时,会按真实意愿发送信号,与企业合作,即:
当员工采取混同策略组合向量,企业对员工做出后验判断概率为
p(s|m1)=1,p(s|m2)=x,p(w|m1)=0,p(w|m2)=1-x
企业根据对员工类型的后验判断p和员工发出的信号mj,选择的行为必须满足使得企业获得期望支付最大,即a*(mj)是最大化问题:
解得①当θ1=s时,m*(s)=m2,②当θ2=w时,m*(w)=m2。
解得①当θ1=s时,m*(s)=m1,②当θ2=w时,m*(w) =m2。
2 AI背景下劳动联盟的合作博弈
信息不完全造成了劳资双方的成本损失,不能实现劳动市场占优的整体理性投资行为。随着人类社会进入AI时代,通过AI技术对工作数据的采集,这将大幅度降低工作环境的信息不完全性。但是,如果劳资双方仍采取工业时代劳动监控中的非合作博弈行为,企业与员工间权力距离将导致员工处于更为恶劣的工作环境,双方间的劳动关系矛盾根源也将从信息的不完全转向信息权力的不对等。而解决这种问题的唯一途径是强化和保障员工的数据权利和数据使用。因此,合理实现劳资双方对于AI工作数据权益平衡,需要政府作为组织者、协调者、制约者的多重身份参与到博弈中去,这就需要采取激励机制保证政府能公平、公开、公正地实现AI在劳动力市场中将民意化为国家意志,在劳资双方间提供对称的法律权利和义务关系[17]。本文构建政府、企业、员工三方共同参与的AI工作联盟如图2,通过在联盟内部构建收益剩余的合理分配规则,让联盟成员达成帕累托改进,从而实现AI技术应用于工作环境中的社会总体优化。
图2 AI工作聪明三方关系图
2.1 参与人合作联盟的收益分配设定
员工、企业、政府作为理性参与人参与到一个劳动经济博弈局势中,他们彼此在可置信的约束下结成劳动合作联盟。大联盟内任何联盟组合的收益用特征函数来描述如表2。
表2 各联盟状态下特征函数值
单一的员工、企业、政府无法建立符合逻辑的AI工作联盟,v({1})=v({2})=v({3})=0。
没有政府介入的、单纯的企业与员工间建立的AI工作联盟{1,2},因联盟参与人的主体地位不同,企业处于强势地位,员工处于弱势地位,联盟{1,2}的契约是不稳定的且具有弱约束力。原因在于员工受雇于企业,AI数据的透明度相对于员工更不完全,很多情况在员工签署劳动契约合同时毫无防备地或迫于就业压力地同意被隐含监视或采集员工个人数据,员工自然的弱势群体身份在这个联盟契约下,联盟{1,2}会给企业带来更多的收益,而且,这个联盟收益很可能是源于员工利益的损失。企业依据其劳资关系中强势地位,利用AI数据监控员工,侵犯员工个人隐私,垄断性地攫取员工的潜在价值,企业分析某些岗位的数据后可以更加轻松地做出机器人替代员工或者将员工当作机器人一样使用的决策。更有甚者,可以通过出卖员工工作行为、工作心理等数据牟利。因此,联盟{1,2}的特征函数值a相对于其他联盟的值最小,在整个社会环境中联盟{1,2}最不稳定且无序。
联盟{1,3}建立在政府和员工之间,将国家与公民聚集在一个开放的、有束缚力的AI数据的工作利益共同体中,宏观的社会收益将优于松散的、无序的微观企业与员工间的联盟收益,但很大程度上取决于政府对微观个体行为的监管力度。因政府的介入而使得联盟建立基础拥有政策性、法律性、公共管理的AI大数据工作联盟使得员工作为公民参与性加强,不完全信息的环境相对改变,政府更有可能将公民的意愿变为国家决策。这个联盟体现出对公民数据权利的尊重,降低了员工抗议的社会不满意度。因此,联盟{1,3}特征函数值b>a。
联盟{2,3}的建立形成一种对员工最不利的独裁性联盟组合,数据开发的惰性存在于政府和企业自身,企业在经济市场是强势的,政府在公共管理是强势的,无论在哪个方面,员工的AI工作数据权利鸿沟都是无法逾越的。AI数据红利将极大推动政治学和企业经济获利的步伐,固然要牺牲在员工损失的基础上,无论这个AI数据带来的损失是精神上还是经济上。员工在数字化生存的环境中拥有的抵抗力量是渺小的,垄断资本和国家权力扭结在一起的联盟力量是巨大的,因此,联盟{2,3}特征函数值c>b。
政府、企业、员工进行有效相关策略协商,成立有置信威胁的AI工作三方联盟。明确双向AI工作数据赋权,这意味着强调参与人角色的主体间性而不是主体性,避免任何两者关系的一元倾向。一方面,员工允许政府和企业采集、整理、分析其许可范围内的数据,允许在法律约束下的商业转让途径,但是收益要与员工共同分享,以使得员工能在一定范围内被工作数据监视的环境中保持激励,同时,AI数据的收益创造也使得政府和企业能提供更优质的数据服务。另一方面,政府和企业要允许员工拥有知道、使用、获利的权益。员工可以共享、共用AI工作数据。联盟将政府公共服务、企业数据优势、员工数据生产技能有机地结合到一起,实现数字化时代中公私合作的要义。因此,联盟{1,2,3}特征函数值d在所有可能的联盟组合中取值最大。
2.2 劳动合作联盟模型的建立
政府、企业、员工三方参与的AI工作联盟收益分配应建立在三个条件上,一是企业的积极投入和采取更加公平的数据权利分配。企业可以依靠自身资本的优势,实现AI数据在工作场所的应用,在收益合理划分与劳动关系间进行权衡,形成稳定的雇佣关系匹配,赋予员工个人数据权利,信任员工。二是员工提供有效的劳动服务数据。员工是AI工作联盟创建数据不可或缺的主体,员工应在政府保障和工会支持下,信守职业操守,杜绝投机获益的不道德行为。员工应树立数据权利意识,出现矛盾应寻求有效、合法的保护途径。三是政府的组织、协调、指导和监管。企业和员工联盟关系的稳定性必须以政府作为第三方的介入才能得到有效保障,政府利用联盟中的收益进行转移支付,对企业和员工进行政策扶持及补贴。政府、企业、员工三方形成的劳动合作联盟是一个伴随可转移效用的TU博弈。
命题4令(N,v)是一个劳动合作联盟博弈。N={1,2,3},1表示员工;2表示企业;3表示政府。
设v({1,2,3})=d,v({1,2})=a,v({1,3})=b,v({2,3})=c,v({φ})=v({1})=v({2})=v({3})=0,则劳动合作联盟博弈(N,v)是凸的,当且仅当d≥a+b,且d≥b+c,且d≥a+c。
证明(必要性) 不失一般性,取S={1},对S⊆T的所有T,有T={1,3},或T={1,2},或T={1,2,3},按以下三种情况讨论:
①当T={1,3},则{i}=N/T={2},v(S∪{i})-v({i})=v({1,2})-v({1})=a
v(T∪{i})-v(T)=v({1,2,3})-v({1,3})=d-b
因为(N,v)是凸的,则d-b≥a,即d≥a+b
②当T={1,2},则{i}=N/T={3},同理可证d≥a+b。
③当T={1,2,3},则{i}=N/T=Φ,同理可证d,a,b为任意值。
综上,S={1},有d≥a+b。
同理可证d≥b+c,d≥a+c。
所以,当劳动合作联盟博弈(N,v)是凸的,则有d≥a+b,且d≥b+c,且d≥a+c。
证明(充分性) 若d≥a+b,则
v({1,2,3})≥v({1,2})+v({1,3})
v({1,2,3})-v({1,3})≥v({1,2})
v({1,3}∪{2})-v({1,2})≥v({1}∪{2})-v({1})
同理v({1,2}∪{3})-v({1,2})≥v({1}∪{3})-v({1})
若d≥b+c,同理可证v({1,3}∪{2})-v({1,3})≥v({3}∪{2})-v({3})
若d≥a+c,同理可证v({2,3}∪{1})-v({2,3})≥v({2}∪{1})-v({2})
综上,当S⊆T⊆N,{i}=N/T时,有v(T∪{i})-v(T)≥v(S∪{i})-v(S),所以劳动合作联盟博弈(N,v)是凸的。
任何凸博弈的核非空,而且Shapley Value属于该博弈的核解,可以应用Shapley Value对联盟收益进行配置。
根据以上分析能够得出各联盟收益排序如式d≥c≥b≥a,且d≥a+b,且d≥b+c,且d≥a+c。
3 算例分析
在劳动力市场中政府也作为劳动力市场的制度制定者与劳资协调人参与其中。在AI背景下,员工、企业、政府三方参与人形成了劳动合作联盟博弈,根据各联盟收益排序,不失一般性,设a=5万元;b=10万元;c=20万元;d=50万元,利用Shapley Value的方法进行了求解,合作联盟{1,2,3}各方收益如表3。
表3 合作博弈各方收益计算表 单位:万元
根据表3得出的合作博弈各方收益计算结果,可以看出基于政府、企业、员工三方共同构成的AI工作联盟,相比较博弈中任何两两参与人结合所组建的合作联盟所获得的各方自身收益都高,联盟{1,2,3}是AI工作合作中最优化的联盟选择方式。
联盟{1,2,3}下,员工收益为12.5万元>联盟{1,3}下,员工收益5万。这表示没有企业角色的介入,不论是政府还是员工都难以将AI数据潜在的收益实现最优化。政府和企业的联盟更倾向于实现双方在政治和公共管理中的数字化诉求。员工作为公民,政府需要其采用AI化的政治及管理参与,而员工需要通过政府实现自身作为公民的AI数据权益保障。员工相比政府在政治及公共管理领域中处于绝对弱势角色,如果政府利用自身独裁地位拥有失信寻租的激励而谋求自身更大的收益,则员工所处的境地将更加恶化。而政府即使垄断性地获得了联盟{1,3}下的全部收益也仅为10万元<12.5万元。针对AI工作联盟本身的运行机制来说,政府需要依托企业本身完成AI化的市场资本投资,而员工则需要企业作为微观平台来成为实现自身更大的效用的途径。
联盟{1,2,3}下,员工收益为12.5万元>联盟{1,2}下,员工收益2.5万元。这表示没有政府角色介入,由企业和员工组建的联盟使得员工自身获益很小,这个联盟也倾向于不稳定、无序的状态,失去政府作为员工弱势群体的支撑力量,按照Karl Marx劳动价值论中,员工被资本无情掠夺的自然悲剧属性将使员工的收益存在极高的风险。除去货币收益分配不公之外,这又引发出一个违背人性工作道德伦理标准的问题,员工被企业时时刻刻、全方位监控,员工隐私被窥探,员工信息价值被盗取、转卖获利等。这正如Robert Dahl在《经济民主》中的思想论述,企业拥有的强大所有权和控制力,将加剧员工在福利、技术、信息方面的不平等[18]。
联盟{1,2,3}下,企业的收益为17.5万元>联盟{2,3}下,企业收益10万元和联盟{1,2}下,企业收益2.5万元。企业与员工之间,一方面,企业需要借助自己的员工才能实现AI数据所带来的收益;另一方,企业与员工在博弈结构里的地位极为不对等,企业总有榨取更多剩余分配的动机,而员工自我保护意识和自私性,自利性的根源使得劳资双方在这场动态的持久劳动关系博弈中总要进行投机的试探。企业与政府之间,存在结合二元独裁联盟的意愿,二元指的是劳动力市场经济和政治社会管理。联盟{2,3}依靠强势地位剥削全部员工的剩余价值进行联盟内部的再分配,这将进一步加剧劳动关系风险。
联盟{1,2,3}下,政府收益为20万元,这个合作联盟保证了政府在各种合作联盟形式下总能取得最高收益,也是参与人中获取的最高收益。这样的收益分配将有激励地、可持续地实现合作联盟中政府作为博弈规则法定者、监控者、审判者的角色定位。这种收益激励政府努力实现提升企业和员工在合作联盟中的参与感和积极性,克服他们固有的带有一定区隔的主体间性。通过对政府的激励来实现一个能充分发挥企业数据技术、数据资本投入优势,调动员工人力资本和数据缔造优势,采用政府组织、协调、引导、束缚的合作联盟规则实现理性、均衡、有效的合作AI工作制度模式。政府的收益可以在周期性失业和产业政策扶持中,对企业与员工各参与方在不同时期的形势变化中进行权衡并给予转移支付的补助性政策,从而实现经济社会的可持续发展。
4 研究结论
本文采用不完全信息的劳动监控模型解释了企业与员工之间的信息障碍。企业与员工的不完全信息工作环境,使双方均有偏离均衡的动机,企业倾向利用资本优势夺取员工的信息价值,而员工在被迫的数据监视工作环境中总有投机的抵抗利益驱使,博弈双方始终处于一种长期非合作博弈关系,容易产生不和谐劳动关系。
基于合作博弈的思想,建立一种基于政府、企业、员工三方主体的相互制衡的合作联盟博弈机制,有利于实现有序、公平的AI工作数据联盟收益分配原则。在三方合作联盟主体间,形成两两之间双向数据权益赋权,通过透明化、匿名化、系统化的数据共享来达成利益相关者间的共识。任何两两主体间的合作联盟都会因为主体地位不对等,利益分配不均衡,从而很难形成有序稳定的合作联盟。由三方构成的大联盟致力于增进政府、企业、员工之间的信任度与粘合度,在提高社会效率的前提下兼顾公平,从而形成背景下和谐的、稳定的、可持续的劳动关系。