APP用户数据交易与隐私保护问题研究
——对比讨价还价与甄别定价两种交易模式
2020-07-13彭桥肖尧陈浩
彭 桥 肖 尧 陈 浩
一 引言及问题提出
2017年,习近平主席在中央政治局集体学习中强调,在互联网经济时代,数据是新的生产要素,是基础性资源和战略性资源,也是重要生产力。2019年,十九届四中全会指出数据可作为生产要素按贡献参与分配,这意味着数据与资本、劳动等传统要素拥有了相同的地位和角色(朱扬勇和叶雅珍,2018)[1]。移动互联网的发展,促进了APP用户数量的爆炸性增长,消费者使用APP软件进行社交、购物、办公、出行等活动,每天产生大量的数据,对于企业来说,通过分析APP用户数据获取消费者的偏好信息可以获取巨大的商业价值。尤其是伴随着大数据挖掘与人工智能算法技术水平的不断提高,整合与分析数据可以发掘出新知识、新价值,创造出大知识、大科技、大利润、大发展(徐子沛,2015)[2]。2018年,Facebook将收集到的5000多万Facebook用户的个人数据卖给剑桥分析公司(Cambridge Analytica),后者对这些用户进行分类并分析他们的兴趣、爱好和政治倾向等,总结出一套算法和模型,向用户定向投放迎合他们偏好的相关信息而影响美国总统大选(陈璞,2018)[3]。
数据应用产生的巨大价值促进了我国数据产业的发展(李向阳,2020)[4],一些研究认为数据应该像其他商品一样被交易,通过市场方式将数据资源配置到能最大化数据价值的市场参与者中,但是由于数据常常涉及隐私和道德伦理问题,他们认为可交易的数据必须在原始数据基础上经过企业加工或创造性编排以及严格地匿名处理(王融,2015[5];梅夏英,2016[6];冯丽鑫,2020[7])。根据中国大数据产业联盟发布的《2017中国大数据产业发展白皮书》显示,数据交易市场在我国已经达到了相当的规模(王卫等,2020)[8],但有关数据权的归属以及数据权利体系的构建在我国学术界和法律政策层面仍未达成共识(周斯佳,2020)[9]。对于数据权利归属问题的争议主要在于数据的搜集者和数据的产生者(王渊等,2017)[10]。以APP用户数据为例,数据的产生者是APP用户,而APP用户数据由APP企业搜集。由于当前法律关于数据产权界定不明,一般将数据权利默认归属给数据搜集者(王渊等,2017)[10],APP企业可以将数据转卖给第三方企业以获取收益。对于第三方企业来说,越精确的APP用户数据能够产生的价值越大。APP企业存在将精确的用户数据卖给第三方企业的可能,第三方企业在使用精确的用户数据过程中可能危害到APP用户的利益,而APP用户却无法通过市场得到有效的赔偿。并且这种伤害有时难以被发现,比如分析消费者偏好从而实行歧视性定价榨取消费者剩余。另一方面的外部性表现为使APP用户面临隐私暴露的风险。
APP企业与第三方企业的数据交易模式主要有两种:讨价还价与甄别定价。讨价还价是APP企业与第三方企业进行的合作博弈,双方合作共享APP用户数据产生的收益;甄别定价是一种不完全信息的非合作博弈,APP企业与第三方企业采取非合作方式使自身利益最大化。在具体的交易过程中,影响APP企业与第三方企业收益的关键变量有:APP用户数据量、数据精确度以及数据交易价格等。对于APP企业来说,用户数据价格越高、数据精确度越低,越有利,如果APP企业将精确度更高的用户数据转卖给第三方企业,APP用户发现个人过于隐私的数据被卖给其他企业,将会降低对APP企业的信任度(Wang et al., 2017)[11],卸载该款APP可能性越大,用户的流失导致APP企业利益受损。对第三方企业来说,情况则相反,用户数据精确度越高,其价值也越高(Ghosh和 Ligett, 2013)[12];同时,数据价格越低,则第三方企业为获取用户数据所付出的代价越小。
但不管两者如何交易,APP用户永远是受损的一方。当前法律体系下,受隐私数据权利复杂性的影响,数据的产权往往被默认赋予数据的收集者,APP用户对自己的数据几乎没有所有权,在数据交易中被排除在外,对个人数据产生的收益没有分享的权利,却要承担数据被乱用的风险。结合实际,本文主要考察在合乎数据交易法律法规和道德伦理规则的前提下,APP企业将通过APP搜集得到的用户数据与第三方企业进行交易的问题。主要论证:在当前数据产权界定规则下,APP用户并没有从APP企业与第三方企业的数据交易和交易产生的价值中获得合理补偿,导致数据交易的边际社会成本大于边际社会收益,从而没有实现数据资源配置的帕累托最优。主张通过政府的干预或相关政策来改善数据资源的配置效率,促使数据交易的社会边际成本等于社会边际收益,增进社会福利。
本文第二部分主要回顾数据交易与隐私保护的相关研究,第三部分为相关博弈理论介绍以及模型构建,第四、五部分为博弈均衡分析,最后总结全文并提出保护APP用户隐私、优化数据资源配置效率的相关政策建议。
二 文献综述
近年来,博弈论视角的APP用户数据交易与隐私保护问题研究主要集中在以下两个方面。
1.基于双方博弈的数据交易与隐私保护研究
博弈理论角度对隐私数据保护的研究多为双方博弈。Ghosh和Ligett(2013)[12]研究了用户个体与数据分析师之间的博弈,发现用户的隐私需求、数据分析算法的匿名水平以及隐私交易价格决定数据分析师与用户的隐私数据交易量。Chorppath和Alpcan(2013)[13]研究了移动商务公司与移动用户关于获取用户地理位置信息的博弈,移动用户提供个人的地理位置信息以获取移动商务公司的精准服务,但面临隐私泄露风险,而移动商务公司利用用户地理位置信息获取精准营销的收益,双方就地理位置信息的精确度展开博弈,进一步运用机制设计理论分析公司应如何设计补贴或收益转移机制以获取它想要的用户地理位置信息。Jin et al.(2016)[14]研究如何激励移动用户配合搜集数据,由于每一个移动设备都是一个传感器,可以收集移动用户的大量信息,因此,某些企业向移动用户提供相应的报酬以换取用户采用移动设备,获取想要的数据。Pu和Grossklags(2014)[15]研究社交用户之间的隐私依赖与APP使用决策问题,社交网络中的个体在决定安装APP时不仅考虑自身的偏好还会考虑涉他偏好(Other-regarding Preferences),通过建立BA无标度网络下的社交网络用户之间的APP使用决策博弈模型进行数值模拟发现:理性个体即使知道APP在入侵他们的隐私,仍然可能继续使用该APP。
2.基于三方博弈的数据交易与隐私保护研究
这一角度的分析相对较少。Adl et al.(2012)[16]构建了一个数据用户、数据提供商和数据收集者的三方动态博弈框架,并使用逆向归纳法探索博弈均衡状态,但该模型中数据用户与数据收集者之间是一次博弈。Wang et al.(2017)[11]构建了包含手机用户、环境感知APP和恶意对手三方决策过程博弈模型,分别使用扩展式博弈和重复博弈分析三方一次博弈和多次博弈两种不同情景。Li et al.(2019)[17]在Pu和Grossklags(2014)[15]研究的基础上,将社交网络影响融入社交网络用户、社交网络服务商以及恶意对手三者关于隐私交易的研究中,对社交网络服务商以及恶意对手之间就隐私交易的讨价还价博弈进行研究。
综上可知,一些学者采用博弈模型从不同角度研究数据交易与隐私保护问题,而关于APP数据交易与隐私泄露的博弈研究中,只有Wang et al.(2017)[11]构建了手机用户、环境感知APP和恶意对手三方决策博弈模型,但他们的关注重点在于APP是否泄露隐私以及APP用户是否上传数据。Li et al.(2019)[17]研究了社交网络服务商与恶意对手之间的隐私数据交易问题,但研究对象主要是社交网络用户,并且只考察了双方交易的讨价还价模式。本文在Li et al.(2019)[17]研究方法的基础上,不仅考虑APP企业与第三方企业数据交易的讨价还价模式,还考虑甄别定价模式,详细探讨了APP用户数据的交易机制,由此针对性地提出隐私信息保护相关建议。
三 相关理论与模型构建
(一)隐私概念界定
数据隐私的概念最早由Dalenius(1977)[18]提出,是指用户在访问数据库时无法获取其他个体的确切信息,后续学者根据这一定义提出了具体的隐私保护模型和方法。但是基于该定义的隐私保护模型并不能提供一种有效且严格的方法来定量分析其隐私保护水平,而且没有足够用的安全保障(熊平等,2014)[19]。针对传统隐私定义的缺点,Dwork(2011)[20]对数据库中的隐私泄露问题提出一种新的定义——差分隐私(The Differential Privacy Preserving),它是定义在贝叶斯推测的基础上,针对数据集中的某一条数据记录,即使知道了最大的背景知识——其他所有的数据记录,仍然不可以准确推测该条数据记录。以此为基础建立的差分隐私保护模型为:
本文所涉及的APP用户隐私主要指以最大背景知识下的贝叶斯推测为基础的差分隐私,即基于APP用户相关数据对APP用户身份精确度的度量,用参数ε来表示。
(二)讨价还价与甄别定价
1.讨价还价
一个讨价还价问题是指两个参与人之间有共同利益要合作,但如何合作却存在利益冲突,因此就可能的结果集合达成一个协议使参与各方共同受益(穆素,2005)[21],讨价还价博弈用数学语言可以总结如下:在一个讨价还价问题中,个体i拥有自身偏好,用效用函数ui表示,集合X表示讨价还价的所有可能结果,di表示达不成协议或谈判破裂时个体i所获得的效用,则两个讨价还价的参与者的效用可以表述为U={(v1,v2)|v1=u1(x),v2=u2(x),x∈X},通常用(U,d)描述讨价还价问题。根据纳什关于讨价还价博弈的证明,只要讨价还价的结果满足5条性质(施锡全,2012)[22]:个体理性(Individual Rationality)、Pareto强有效性(Pareto Efficiency)、对称性(Symmetry)、仿射变换不变形(Invariance to Affine Transformations)、无关选择独立性(Independence of Irrelevant Alternatives),则称为该结果为讨价还价的均衡解,该均衡结果是公平和有效的,讨价还价均衡解的求解可以等价于如下优化问题的解:
s.t.(v1,v2)∈U
(v1,v2)≥(d1,d2)
2.甄别定价
也就是说在买者自愿参与(参与理性)且真实报告θ(激励相容)的情况下,卖者承诺出售数量q(θ)给买者,买者转移支付t(θ)给卖者,双方均实现自身收益最大化。
(三)模型假设
为了刻画APP企业与第三方企业之间可能进行的APP用户数据交易模式,本文作出如下假设:
假设1:APP企业向用户提供APP产品获得的边际收益不变,用v表示APP厂商从每个用户身上获取的边际价值,N(ε)表示APP用户数量,则APP企业从提供APP产品中获得的收益为vN(ε),并且假设提供APP的边际成本为0。
假设2:数据交易的精确度会影响APP用户数量N(ε),其中ε表示数据交易的精确度,并假设N′(ε)<0,即数据交易的精确度越高,APP用户数量越少,且在ε∈[0,a],N″(ε)<0,数据精确度的边际效应递增,在ε∈[a, 1],N″(ε)>0,即数据精确度的边际效应递减,且N(ε=1)=0(如图1),当完全精确的用户数据被交易时,用户的隐私完全被暴露给了第三方企业,此时没有用户使用该款APP。数据交易的精确度对APP用户数量的影响主要通过社交网络,数据交易精确度对用户数量影响的边际效应呈现先递增再递减的特征(Chorppath和Alpcan,2013[13];Adl et al.,2012[16])。
图1 APP用户数量与数据交易精确度关系图
假设3:w表示每个用户数据在完全精确时(ε=1)对第三方企业的价值,φ(ε)w表示数据精确度为ε时用户数据对第三方企业的价值,且φ′(ε)>0,φ″(ε)<0,φ(ε)∈[0, 1],即数据越精确价值越高,且数据精确度的边际效应递减,其中φ(ε=1)=1,φ(ε=0)=0,表示数据精度为0时该数据的价值为0,精度为1时价值为w。
(四)APP企业与第三方企业效用函数构建
1.APP企业效用函数构建
APP企业通过数据交易获得的收益主要由两部分组成:APP用户和交易数据所获得收益,则APP企业的效用函数如下:
U1(ε,p)=l[TvN(ε)+pN(0)]+(1-l)TvN(0)
l:指示变量,表示APP企业是否决定交易用户数据,l∈{0, 1},0表示不交易,1表示交易;v表示每个用户对APP企业的价值;T表示该APP产品的运营时间,为了简化模型,在不影响结论的条件下,本文并不考虑时间贴现;
N(ε):表示APP企业将精确度为ε的用户数据卖给第三方企业后使用APP的用户数量,N′(ε)<0,N″(ε)<0,N(0)表示APP企业不交易用户数据时的用户数量;
p:表示APP企业与第三方企业数据交易中每个用户数据的价格;
TvN(ε):表示APP企业将精确度为ε的用户数据卖给第三方企业后从剩下APP用户中获得的收益;TvN(0)表示APP企业不交易用户数据(ε=0)时,APP企业向用户提供APP产品获得的收益;pN(0)表示APP企业将APP用户数据卖给第三方企业获得的收益。
2.第三方企业效用函数构建
第三方企业的数据交易收益为利用APP用户数据产生的收益减去购买数据付出的成本。则第三方企业效用函数如下:
U2(ε,p)=l(wφ(ε)N(0)-pN(0))
w表示每个APP用户数据完全精确(ε=1)时的价值,φ(ε)w表示精确度为ε的用户数据给第三方企业带来的收益。
四 讨价还价交易模式的均衡分析
本部分讨论APP企业与第三方企业之间关于用户数据的讨价还价交易模式。APP企业与第三方企业对于数据的精确度和价格(ε,p)进行讨价还价,本文不考虑数据交易的数量。根据纳什讨价还价理论,两者之间的讨价还价均衡解可以被如下公式描述:
(1)
s.t.d1=TvN(0)
d2=0
U1-d1=TvN(ε)+(p-Tv)N(0)≥0
(2)
U2-d2=wφ(ε)N(0)-pN(0)≥0
(3)
p≥0,0≤ε≤1,0≤N(ε)≤N(0)
求解上述非线性规划问题,具体过程如下:
首先给定ε=ε0,则式(1)的最大值等价于:
(4)
(5)
根据式(2)和式(3)可得:
Tv[N(0)-N(ε)]≤p≤wφ(ε)N(0)
则wφ(ε)N(0)-Tv[N(0)-N(ε)]>0,式(5)可以等价于:
(6)
式(6)可以变形为:
(7)
图2 讨价还价交易均衡求解
由图2可知,当A取最大值时,函数g(ε)与N(ε)相切,此时有两种可能:
根据上述求解结果可以得到如下结论:
(1)当APP初始用户量N(0)较大、APP用户数据对于第三方企业的价值越高、APP运营时间T较短时,APP企业交易完全精确度的用户数据能获取极大的短期收益,此时APP企业会进行投机抉择,将APP完全精确度的用户数据卖给第三方企业,而APP企业将用户隐私卖给第三方企业的行为被用户发现,大量用户卸载APP,APP产品退出市场。
(2)当APP企业交易完全精确度的用户数据能获取的短期收益小于长期运营的收益时,APP企业不会进行“一锤子”买卖的投机行为,只会交易一定精确度的数据给第三方企业,获取长期收益,此时用户数据在第三方企业与APP企业之间的配置达到了帕累托最优,但是由于APP用户被排除在交易之外,APP用户因为自身数据的交易遭受损失却没有得到补偿,导致过度精确的数据被交易,没有达到社会最优状态。
(3)当APP用户数据对于APP企业产生的价值与APP用户数据对于第三方企业的价值比v/w越大时,数据交易的精确度ε越大,反之则越小,即APP企业与第三方企业之间的交易将使APP用户数据分配给能产生更大价值的一方,但并不是社会最优,应通过征收数据交易税,如同庇古税作用机制,弥补数据交易给APP用户造成的损失,约束数据交易的精确度以达到社会最优状态,从而保护用户的隐私。
(4)数据交易精确度引起的APP用户减少是制衡APP企业将用户隐私数据卖给第三方的重要因素,因此,应该增强广大公众的隐私保护意识,了解隐私泄露可能给个人造成意想不到的成本,增加消费者对隐私的敏感度,从而向上移动N(ε),使数据交易的均衡点左移,降低数据交易的精确度。
五 甄别定价模式的均衡分析
在第三方企业自愿参与交易且真实报告w的情况下,APP企业将精确度为ε(w)的用户数据卖给第三方企业,并按每个用户数据价格为p(w)收取第三方企业费用以获取最大收益。双方之间的甄别定价交易可以表达为:
(8)
s.t.U2(ε,p|w)>0
(9)
(10)
(11)
将式(11)代入式(8)得到:
化简APP企业的期望收益:
(12)
APP企业期望收益最大化的一阶条件:
(13)
根据式(13)可得到结论:在甄别定价情况下,APP初始用户量N(0)越大、APP运营时间周期越长,APP用户数据对于APP企业产生的价值与APP用户数据对于第三方企业的价值比v/w越大时,数据交易的精确度越大,反之则越小。与讨价还价结论基本一致。
根据第4部分分析得到的讨价还价均衡解一阶条件:
(14)
六 结论及政策建议
本文主要基于讨价还价与甄别定价两种交易模式讨论APP企业与第三方企业之间的用户数据交易问题,通过求解分析两种交易模式下的均衡结果得到如下结论和对应的政策建议:
1.当APP企业拥有越庞大的用户量、APP用户数据对于第三方企业的相对价值越高时,APP企业越可能进行投机抉择,将APP完全精确度的用户数据卖给第三方企业,使用户的隐私完全暴露,给用户造成极大的损失。因此,对具有庞大用户群的APP企业宜给予更加严厉的监控与规范,加大对APP企业交易用户隐私数据的惩罚力度,以起到威慑作用。
2.APP用户被排除在数据交易之外,他们自身隐私泄露遭受损失却得不到补偿,导致过度精确的隐私数据被交易,没有达到社会最优。政府应该通过对数据交易征税,如同庇古税,弥补数据交易给APP用户造成的损失,从而将交易数据的精确度控制在社会最优水平。
3.制衡APP企业过度交易用户数据行为的重要因素是过于精确的数据交易引起APP用户数量减少。因此,为有效地约束APP企业交易用户的隐私数据,宜增强广大公众的隐私保护意识,了解隐私泄露可能给个人造成意想不到的成本,增加消费者对隐私的敏感度和APP企业交易用户隐私数据的成本,从而保护用户的隐私。
4.甄别定价的数据交易精确度要小于讨价还价的数据交易精确度。因而,通过加强对APP企业与第三方企业共谋行为的处罚,阻止双方合谋交易,可以减少双方数据交易的精确度,从而降低用户隐私暴露的风险。
5.规制层面上,保护隐私最根本的办法是尽快明确数据所有权,尤其是界定APP用户对于个人数据的权利,从而明确各主体的收益与成本。为此需健全市场机制,通过市场交易的方式使数据资源达到最优的社会配置,增进社会福利。