差异化隐私保护视角下的个人信息价值评估研究进展
2018-11-12邓胜利赵海平
邓胜利 赵海平
(武汉大学信息管理学院,武汉,430072)
1 引言
在当前的大数据环境下,网络用户个人信息的安全问题受到了日益广泛的关注。一方面,企业和政府都已经意识到了海量个人信息所产生的巨大潜在价值;另一方面,个人信息的过度收集和不当使用严重地威胁到了用户的切身利益,人们逐步意识到个人信息的价值和保护个人信息的必要性。由此可见,个人信息的收集与保护之间存在的矛盾,使得用户与信息收集者之间产生利益冲突,即不提供个人信息保护、不限制信息收集范围会导致消费者的个人信息存在风险,而提供完全的个人信息保护、不允许信息收集则又会减少信息的价值,损害企业的利益,还使得消费者难以享受到便利的信息化服务。因此,对个人信息实行差异化保护、差异化收集可以平衡双方利益,使信息价值最大化。研究表明,差异化隐私保护从根本上影响着消费者贡献和保护个人信息的意愿[1]。
差异化隐私保护是指为用户的个人信息提供定制化的隐私级别,以取代目前主要的“全有或全无”方式[2]。用户对个人信息的披露和贡献是信息收集的前提,因此,要实行差异化隐私保护首先应该了解用户对个人信息的偏好。当前研究主要通过两种方式了解用户的偏好,一是直接调研,大多采用问卷调查的方式直接测量用户披露个人信息的意愿和对个人信息保护的态度;二是通过测量个人信息的货币价值评估用户对不同类型个人信息的偏好。个人信息价值是指将信息视为一种商品,在信息“交易”过程中,通过衡量交易成本和收益所得出的商品价格[3]。大多通过测量受偿意愿(WillingtoAccept,WTA)和支付意愿(WillingtoPay,WTP)两个指标衡量各类个人信息的相对重要性。但不同的研究得出了不同的结论。Huberman等的研究表明体重信息的价值为74.06美元[4],而Grossklags等的研究则表明体重信息的价值为31.80美元[5],又如Otsuki等的研究显示人们愿意每月支付1380日元(约合80元人民币)来保护个人信息[6],Kim等的研究则显示此金额为7900韩元(约44.5元人民币)。对于社交网络信息,Lim等的研究显示,社交网络信息具有最低的价值[8],但欧洲的一项报告表明人们对于社交网络信息的重视程度高于购物及支付信息和位置信息[9]。
由于当前研究方法的多样性和研究结果的不一致,有必要通过对已有文献的系统性回顾来了解现有研究方法和结果的差异以及影响用户对个人信息价值衡量的因素。因此,本文采用结构化文献综述方法对52篇主题相关的期刊、会议文章进行调研、比较和整合,旨在解答以下两个研究问题:现有的个人信息价值评估方法有哪些,影响个人信息价值评估的因素有哪些。
2 研究背景
信息的价值是指从使用信息中所获得的收益,而隐私的价值则指保留私人信息的价值[2]。由此可知,信息可用性和隐私之间存在矛盾和折衷。当人们决定是否披露个人信息时往往在风险与收益之间进行权衡[10]。根据Smith等人的研究,风险可以分为四个维度:收集、不正当访问、错误限制和二次数据使用[11]。收益则是指人们由个人交换而获得的某些利益,如便利服务或金钱补偿。当人们认为这种交换是必不可少并且收益大于风险时,则会公开个人信息[12],反之则不会公开。因此,了解人们对个人信息价值的衡量对于企业提供相应的服务是十分必要的。但实际上,评估个人信息的价值是十分困难的。首先,因为“个人信息”在很大程度上取决于“个人”,不同类型的消费者在不同的情境下对不同类型的个人信息具有不同的偏好和价值判断;其次,消费者与信息收集者之间存在信息不对称,人们没有完整和有效的信息来了解他们个人信息的用途[13];再者,当前大部分关于个人信息价值评估的研究注重计算其货币价值,但事实上人们不仅重视金钱和隐私,他们在决策时还会考虑到其他因素,比如信息服务的可用性、娱乐性、便利性等,这些价值往往是相互冲突的,追求一种价值则意味着一定程度上放弃另一种价值。
对于个人信息价值的评估,前人大多通过衡量人们的支付意愿或接受意愿来实现。前者是指人们为保护个人信息而付费的意愿,通常是以信息收集者为主动的一方,测量一段时间内人们为保护隐私而支付的固定费用或者隐私保护作为产品增值服务的溢价,注重测量隐私价值。后者则是人们为了获取某种利益而愿意公开、分享或出售个人信息的意愿,以及在信息被不正当使用后接受赔偿的意愿,通常以消费者为主动的一方。
3 文献检索策略
本研究采用Webster等人[14]和Brocke等人[15]提出的文献检索策略,将检索过程分为两个阶段,如图1所示。第一阶段,为了获得尽可能全面的相关文献,本文采用数据库检索和回溯检索两种检索方式来获取相关文献。首先,检索了WebofScience、ScienceDirect、ACMDigitalLibrary、WileyOnlineLibrary、Emerald等主要的英文学术数据库和GoogleScholar搜索引擎,主要使用标题和关键词进行检索,检索式为:((“economics”OR“worth”OR“valu*”OR“willing*”OR“pric*”)AND(“privacy”OR“personal”OR“private”)AND(“data”OR“information”))。通过阅读标题的初步筛选后,对选中的每一篇相关文献的参考文献进行检索;再经过阅读标题和摘要剔除不相关文献、去除重复文献两个步骤后共得到120篇相关文献。
第二阶段,为了确保文章内容的相关性和来源的可靠性,本文采用了严格的文献纳入和排除标准,如表1所示。需要说明的是,为了保证文章内容的有效性,本文未选取2000年以前的文献。在对120篇所得文献进行全文仔细阅读之后,最终获得相关文献52篇。
图1 文献检索过程
表1 文献纳入和排除标准
4 整体框架
经过深入阅读和数据提取,本文对52篇个人信息价值评估相关文献的研究过程进行编码,并构建整体框架,如图2所示。框架共包括五个一级编码:A理论基础、B信息类型、C衡量方式、D测量方法、E影响因素。以下内容将根据这五个部分展开叙述。
图2 整体框架
4.1 理论基础
在52篇文献中,有7篇文章应用了相关理论作为研究设计的基础,笔者将其进行二级编码,如表2所示。公平理论(A1)是指消费者提供一定的投入(如金钱或时间)以获得某种结果,参与交换关系的消费者在比较其投入与其他参与者的比例之后,决定他/她的交换关系是否公平。在Lim等人的文章中,参与者处于交换状态,他们提供某种投入(或牺牲),即个人信息,以获得某种结果,即补偿[8]。交易效用理论(A2)采用成本收益的计算方法,认为交易效用会影响消费者的购买意愿或行为。Im和Ha从该视角研究了人们在披露个人信息时的收益(由得到优惠券而获得的喜悦)和成本(由信息披露导致的垃圾邮件所带来的不满)之间的关系[16]。计划行为理论(A3)认为人的行为是经过深思熟虑的计划的结果[17]。Schreiner和Hess通过应用该理论研究隐私保护作为Facebook的增值服务时影响用户隐私支付意愿的决定因素[18]。多属性效用理论(A4)旨在知道人们如何评估一个包含多种选择和多个冲突目标的决策[19]。Nguyen等应用该理论来研究人们对智能手机隐私保护的重视程度[12]。社会影响过程理论(A5)分析了社会影响对用户行为的作用[20]。Min和Kim的研究采用社会影响过程理论考察了使用社交网站(SNS)的三种因素——进行关系管理的动机,自我呈现的感知有用性以及主观社会规范对个人信息披露意愿的影响[21]。期望理论(A6)认为人的选择是由其预期结果决定的,信息加工理论(A7)侧重于决策前发生的认知过程。Hann等根据期望理论验证了隐私问题的缓解测量与价格的正向关联,并应用信息加工理论来分析个人信息隐私关注的程度[22]。Rose基于产权理论(A8),将个人信息作为一种公共物品,从产权角度测量个人信息的经济价值[1]。
表2 理论基础
4.2 信息类型
本文总结了相关文献中所涉及的个人信息类型,并将其进行编码,如图3所示。个人基本信息是最常作为评估对象进行研究的信息类型,其次是位置信息和社交网络信息。部分学者对多种信息类型同时进行了研究,但对于每种信息类型的具体价值,不同的研究得出了不同的结论。大多数研究结果显示,个人身份信息是价值最高的信息类型[5,7],但也有研究显示位置信息是最敏感和最有价值的信息[23],而SNS信息具有较低的价值,且以SNS信息价值评估的文章大多以Facebook为研究对象[24-26]。
图3 个人信息类型
4.3 衡量方式
如前文所述,个人信息的货币价值可以通过WTP和WTA两种方式进行衡量。在52篇相关文献中,有一半的文章(26篇)通过调查WTP衡量个人信息价值,一半的文章(26篇)通过WTA来衡量。其中WTP的表述形式除了支付意愿,还表现为保护意愿(WillingtoProtect);WTA的表述形式除了接受意愿,还包括披露意愿(WillingtoDisclose)、分享意愿(WillingtoShare)和出售意愿(WillingtoSell)。
WTA(C1):大部分研究的重点在于测算不同类型个人信息的具体货币价值,如Lim等的研究显示消费者对于基本个人信息和财务信息的泄露具有最高的WTA,分别为392,335韩元和329,396韩元[8];Kim和Yeo的研究显示个人信息价值的平均值为1,500美元,但同时发现有一小部分人对个人信息价值的评估显著降低了整体价值,并且人们在性别和收入水平方面表现出显著差异[27]。另外,部分研究检验了影响人们WTA的重要因素,Danezis等的研究发现人们的WTA和信息使用目的有关,如将信息用于学术目的与商业目的相比存在差异[28];Huberman等的研究发现信息类型和个体差异也会影响人们的WTA,如体重或年龄偏离标准值或平均值的人尤其重视他们的体重或年龄信息[3]。
WTP(C2):根据综述结果,本文发现人们并不像他们陈述的那样重视自己的个人信息,虽然消费者表示如果提供足够的附加价值和可信度,他们愿意以隐私免费增值模式的形式支付隐私费用[18],但Hann等人的研究显示,只有15%至16%的参与者愿意花费半分钱的额外费用来保留搜索历史或防止与第三方共享数据[22]。在社交网络方面,当被要求简单地保存他们的Facebook个人资料时,用户的WTP通常较低[29],其中有高达62%的用户不愿意支付费用来保留他们的个人资料。与社交网络相比,人们对搜索引擎隐私保护的WTP更低。人们愿意为具有隐私保护功能的高级版本的Facebook支付每月1.67欧元,而Google的高级版本的价格则小于1.50欧元[30]。在智能手机的隐私保护方面,人们对隐私保护的WTP相对较高,对智能手机应用程序的访问权限方面较为重视[22]。另外,人们对不同类型的隐私风险具有不同的WTP,例如:不允许二次使用个人信息的价值在39.83美元至49.78美元之间[23],防止错误使用、访问不当和二次使用个人信息的价值在30.49美元至44.62美元之间[29]。
WTA和WTP的区别:尽管WTA和WTP都是测量个人信息价值的常用指标,但两者之间存在一定的区别。Grossklags等人同时测量了两项指标,发现人们的WTA远高于WTP,两者之间的比例高达105∶1,他们总是选择出售个人信息,却很少选择保护信息[5];Benndorf等也发现只有10%到20%的参与者不愿意出售个人数据[26]。因此,在进行个人信息价值评估的研究中,应该适当选择衡量方式。当人们拥有个人信息的所有权但可能随时被侵犯时,或者当人们有权利考虑是否牺牲个人信息以换取某种利益时,测量WTA来估算个人信息价值是较好的方式;当人们拥有个人信息的所有权,并且想要强化这种权利时,测量WTP则是较好的方式。
4.4 测量方法
测量方法的选择对于个人信息价值的估算有很大的影响。本文根据Breidert等对测量方法的分类,将方法分为实验法(D1)和问卷调查法(D2)[32],如图4所示。其中,16篇文章使用实验法测量个人信息价值,34篇文章使用问卷调查法进行测量[注]说明:另外2篇综述类文献不涉及测量方法。。为了尽可能确保实验或问卷的准确性和有效性,部分研究在研究之初通过焦点小组[3]或半结构化访谈[33]的形式对一部分样本进行了小范围的前期调研。
实验法也叫做观察法,作者根据观察到的个体行为来推断他们对隐私问题的关注程度[34]。相关文献中使用的实验法包括拍卖(D11)、现场实验(D12)和实验室实验(D13)三种,其中拍卖法是最常使用的方法(13篇文献);现场实验和实验室实验是指在特定地点进行的研究[13,35-36],形式较为灵活,大多是对于位置信息价值的估算[37-38],通常根据真实情境进行实际的测量(而不是假设情境);而拍卖法的形式相对比较固定,参与者需在同一时间参与。BDM机制(Becker-DeGroot-MarschakMechanism)是最常被用来测量分享个人信息所需的最低金额的方法[39],也有研究表明BDM可能是测量人们支付意愿的最有效的方式[25]。Spiekermann等测量了参与者为保留Facebook上的个人信息而付费的意愿(不付费信息就会被清空),参与者先为个人信息进行报价,但最终的成交价格是随机的,如果随机的价格低于参与者的报价,那么他将可以保留自己的信息,但如果随机价格高于报价,他将失去所有的Facebook信息[25]。同样的实验设计也应用于Benndorf等[26]以及Ishikawa等[40]的研究中。
图4 研究方法
问卷调查法包括间接调查(D21)和直接调查(D22),其中间接调查法在一些研究中也被叫做“基于问卷的在线实验法”。间接调查主要包括联合分析法(D211)和离散选择分析法(D212)。联合分析法是用来研究不同决策因素的相对重要性的常用方法[33],大多应用于电子商务[3,41]、社交网站[42-43]和智能手机[29,33,44]中以确定用户对其个人信息经济价值的估计。联合分析假设消费者将产品视为一系列具有不同价值(水平)的特征(属性),通过询问和分析人们对不同组合的偏好,推算出每个属性级别上的个人价值。与联合分析相似,离散选择分析基于随机效用理论,被用来确定在假设情境中不同组合中各属性的独立影响及其评估[24,44-45]。直接调查包括条件价值评估法(D221)和用户调研(D222)。条件价值评估法(ContingentValuationMethod,CVM)是一种通过假设情境直接询问人们对于某物品或服务发生状态变化的最大WTP或最小WTA的方法,用于评估非市场资源和没有市场价格的资产[26,30];用户调研则是通过简单的开放式或封闭式问题直接询问参与者对于个人信息的定价。
4.5 影响因素
学者大多从“成本-收益”的角度衡量个人信息价值,同时研究发现个体因素和情境因素也是影响个人信息价值评估的重要影响因素,其二级和三级编码如图5所示。
图5 影响因素
成本:有研究显示,感知风险(E11)和预期后果(E12)会影响人们披露个人信息的意愿,包括社会风险、财务风险和心理风险[12,24,46],其中女性对感知风险的担忧显著高于男性[45]。另外,人们过去的信息泄露和隐私侵犯经历(E14)与他们对隐私保护的信任呈负相关关系[47],如果消费者曾遇到个人信息泄露,则其将作为沉没成本导致这部分消费者的隐私担忧高于未经历信息泄露的人,同时,他们对于个人信息价值的预期会显著增加[8]。还有研究表明,一旦人们意识到了个人信息的潜在价值,他们就会迅速产生强烈的所有权意识(E13),并且对个人信息的预期价值会显著增加[27],同时产权意识也可以作为提高信任的机制以促进人们的个人信息保护意愿[1]。此外,人们分享个人信息的意愿会随金钱激励的增加而增加,但支付意愿会随需要支付金额(E15)的增加而减少[48]。
个体因素:关于性别(E31)对个人信息价值评估的影响,不同研究得出了相互矛盾的结论。部分研究显示,在验证性别对智能手机隐私保护意愿时,女性和男性之间存在显著差异[30,46],而另一部分研究则表明性别对个人信息披露和支付意愿没有显著影响[2,3,12]。年龄(E32)也被认为与个人信息保护意愿相关,年龄越大的受访者,他们愿意为了获得更高强度的隐私保护水平而愿意作出更大的牺牲,学者认为这一发现与老年人有更强烈的隐私担忧有关[12]。在对个人信息价值进行评估时,人们在收入水平方面(E33)也表现出显著差异[30],收入水平更高的消费者具有更强的隐私担忧和更高的WTP。关于个性特征(E34)对人们WTP和WTA影响的研究较少,Staiano等的研究发现除了宜人性,人们为保护个人信息而支付的价值和人格特质之间没有显著的相关性[23]。另外,消费者的WTP和WTA会根据个人对隐私的看法而有所不同[1],更高级别的隐私关注意味着更高的隐私保护价值[12]。但是,有研究发现人们对于个人信息披露的成本和收益的权衡并不会随个人特征的变化而变化,包括教育水平、个人主义和信任倾向[3]。
情境因素:大多数研究发现,人们对个人信息的WTP和WTA因具体的信息类型(E41)不同而存在差异[5,7,49],即使是同一种信息,如位置信息,也会因为所分享的位置不同而差异很大[48]。同时,文化背景(E42)也是影响个人信息价值评估的重要因素之一[8],如印度消费者更愿意披露敏感的个人信息,而美国消费者则披露较少的个人信息并更倾向于采取隐私保护行为[50]。未来的研究可以更多地考虑文化背景维度,如增加异质性文化背景下个人信息价值评估的对比。另外,研究发现隐私声明(E43)的存在会对人们披露个人信息的意愿产生正向影响[7],隐私保证是客户支付移动应用意愿的最大促成因素[43],因为支付意愿受到当前隐私保护水平的影响,隐私声明有利于消费者了解潜在的隐私风险,有利于促进消费和信息收集部门的信任,并减少两者之间的信息不对称,从而促进了人们保护个人信息的意愿[44]。社会影响(E44)对用户信息的披露也有显著影响,尤其是社交网络信息,如通过SNS进行关系管理的动机以及SNS用于自我呈现的感知有用性会引导用户披露信息[21]。此外,社会距离(E45)也会影响人们分享信息的意愿,从整体来看,消费者的WTA与信息收集者的社会距离没有显著的联系,但根据性别分别看待时,女性与距离近的人分享身体数据的可能性要比距离远的人小得多[39]。
收益:感知利益(E21)、赔偿金额(E25)和未来的便利服务(E24)都会影响消费者对个人信息的披露意愿[6,24,29]和对具有不同隐私政策的网站的偏好[51],同时感知利益还影响着消费者为获得高级版本服务以保护个人信息的支付意愿[18,46],其中人们愿意以隐私免费增值服务的形式支付隐私费用,前提是他们认为该版本保证基本的娱乐性(E23)和足够的有用性(E22)[21]。另外,信息泄露后的赔偿金额(E25)对于消费者决定是否接受赔偿至关重要,其接受意愿随赔偿金额的增加而增加[8]。
5 讨论
本文系统性地回顾了以个人信息价值评估为主题的52篇相关文献,并从理论基础、信息类型、衡量方式、研究方法和影响因素五个方面做了总结分析。虽然学者们都采用了WTP和WTA两种价值衡量方式、问卷调查和实验两种研究方法,但是个人信息的货币价值仍然存在较大的争议。首先,个人信息类型对信息价值评估结果的影响较大,主要是因为个人信息类型繁杂,很难进行完整、详细地分类和测量,而且每个人对不同类型信息的感知重要性不同,当涉及具体的信息时,每个人的表现则会不同。其次,样本的选择对于研究结果的影响也很重要,问卷调查的方法更利于收集更多样本,而实验法则由于时间、地点和成本的限制,只能对小部分样本开展研究。此外,样本的年龄层、教育背景、收入、生活经验等方面的分布都会对研究结果产生影响。因此,在研究过程中,对于研究变量的控制应该加以足够的关注和考虑。另外,在测量个人信息价值时,特别是以WTA为衡量方式时,奖励的选择也会影响研究结果,如现金、彩票、优惠券及增值服务等不同奖励形式、不同的奖励机制对参与者的吸引力是不同的,因此可能导致了差异化的结果。
在未来的研究中,研究过程的设计也应考虑到可能产生的影响。第一,研究情境是否为假设或虚构的,参与者陈述的态度和偏好与实际行为之间存在明显的分歧[52],即在假设的情境中与真实情境中可能会产生不一致的行为,这都直接影响到研究结果的准确性。第二,从综述结果来看,与问卷调查法相比,实验法更利于模拟真实的隐私保护环境、观察参与者的真实行为,而问卷调查法则更适合调查用户的隐私关注态度,两种方法可以互为补充。第三,研究方法本身固有的局限性会导致研究结果的倾向性。如联合分析法,对于不同属性及其水平的选择会由于研究者主观的偏差使得研究结果与实际情况不完全相符。第四,研究中往往是对某一情境或决策的简单化,如披露或不披露、保护或不保护个人信息(两极化),而在实际生活中,人们可能有更加多样化的选择。第五,当前研究在测量个人信息价值时大多侧重于用户可能获得的个人利益,未来的研究可以对其他方面(如社会利益)进行探讨,也许会得出更加有意义的结论。