垂直隐私情境中使用目的影响用户隐私披露意愿研究
2022-11-28臧国全郭镕源
臧国全 韩 苗 郭镕源
(1.郑州大学信息管理学院,河南 郑州 450001;2.郑州市数据科学研究中心,河南 郑州 450001)
隐私是数据时代的一个基本要素,也是现代社会经济文化活动的一个核心关注,但其界定比较模糊和多样[1],且因文化、民族、时代和风俗的不同而异[2]。信息技术的进步及其对个人信息保护的影响提升了隐私关注的程度,理论和实践界开发的各种隐私披露模型强调了情境的作用[3]。已有隐私披露行为的研究大多集中在个人主动的自我披露情境[4-5](即水平隐私情境),较少研究用户对第三方机构采集其个人信息的被动同意意愿(即垂直隐私情境),尽管这是在线环境中一种常见行为。与自我披露不同,用户同意通常是在高度不确定情况下授予的,缺乏第三方采集信息的范围、类型和用途等信息。因此,本研究采用问卷调查和现场实验法,分别测度垂直隐私情境中的用户同意意愿和实际同意比率,分析实验同意比率的影响因素,比较问卷调查测度的同意意愿与现场实验统计的同意比率之间关系,检验是否存在隐私悖论。为了使研究具有可行性,本研究选择3个代表性使用目的:商业应用、学术应用和安全应用。研究结果可以将垂直隐私补充到隐私理论之中,拓宽隐私理论的使用场景,并为提升第三方获取个人信息采集的用户同意意愿提供理论依据。
1 文献综述
依据研究内容,界定相关主题有个人信息使用目的、隐私披露意愿和垂直隐私,文献综述如下。
1.1 个人信息使用目的
个人信息使用目的有多个方面,但主要领域是商业应用、学术应用和安全应用。
商业应用方面。个人信息的强大盈利能力驱动了其商业化应用的快速增长,并由此产生了个人信息需求市场的兴隆旺盛,如世界各地的数据经纪人交易个人信息,各类组织和个人为各种目的消费个人信息[6]。个人数据内含大量个人隐私,个人数据商业化促进了“隐私”作为商品的概念产生,即隐私是可以用来换取服务、折扣、个性化广告及实际产品的东西[7-8],故在涉及个人信息披露时,隐私主体经常会进行成本和收益的权衡,这种行为称之为“隐私计算”[9-10],此时,补偿金额会对用户提供个人信息的意愿和行为产生重要影响[11],然而由于个人信息的未来用途难以有效评估[10],在这个存在缺陷的信息市场中很难做出理性的计算决策[12]。在许诺给用户各种收益的前提下,以使用和改善所提供商业服务等目的的服务机构向用户直接请求个人信息或通过第三方间接请求个人信息访问权已经成为日常,由此导致的垂直隐私商业化应用市场逐渐形成。
学术应用方面。社会进步驱动个人信息的学术应用。当今若调查和处理个人信息的能力欠佳甚至缺失,学术研究将难以有效进行[13]。在学术应用与个人隐私数据的相关研究上,学术界多聚焦在影响个体同意与学术应用人员分享个人信息的因素方面,包括:对学术研究团队的信任、研究主题的价值认知、提高个人利益或生活质量的期望[14],以及对社会的贡献感、帮助他人和推进研究领域知识的利他愿望、向信息主体提供的金钱补偿或医疗待遇等[15]。其中,金钱补偿也是影响个体同意的主要因素[15-16],该结论与商业应用一致。金钱补偿可以提高研究应用收集个人信息的质量[17],甚至可以改善难以接触者的合作态度,如受教育程度较低者[18]或以前拒绝提供的个体[19]。但也有一些研究得出结论,提高金钱补偿并不会增加个体贡献个人信息的同意率[20],但确实可以保证个体在需要时的继续参与[21]。
安全应用方面。信息时代,为保障国家(地区)和社会安全,政府机构监控个人行为致使采集个人信息的范围和程度不断扩张,使用各种技术跟踪和存档个人信息更是无处不在[22]。尽管监控和采集的原因有多种,但安全应用最为常见[23],常见实施者不仅有政府机构,也有私人实体。信息采集与国家(地区)安全和反恐行动相关时,公众提供个人隐私信息的意愿会上升[24]。
1.2 隐私披露意愿
对隐私问题的主要讨论大致分3个主题:隐私关注、隐私行为和隐私悖论。隐私披露意愿的实质是隐私关注。隐私披露意愿存在很多影响因素,常见有隐私情境、人口统计学因素和其他因素。近年来隐私披露意愿的相关文献梳理如表1所示。
表1 隐私披露意愿相关研究
围绕在线用户隐私信息披露意愿的影响因素,学者们主要从3个方面展开研究,一是心理因素,如隐私素养、感知收益、感知风险、感知控制等;二是客观因素,如服务商提供的奖励、隐私声明、隐私政策等;三是社会因素,如主观规范、法规政策等。
隐私披露意愿与隐私披露行为之间的偏差常被描述为隐私悖论。国内外学者对隐私悖论的研究主要集中在3个方面:一是隐私悖论的成因:如感知风险、主观认知等[40];二是影响隐私悖论的因素:如个人特征、信任、隐私认知等[41];三是隐私悖论的实证研究,如认为隐私关注与实际披露行为之间存在矛盾[42],或得出个体的隐私关注与隐私行为间无显著关系的相反结论[43]。
系统梳理相关文献后发现,面对各种隐私情境,水平隐私情境下隐私悖论的实证研究较多。用户隐私信息披露意愿的研究大多数是用户主动的自我披露(即水平隐私),较少将用户对第三方机构采集其个人信息的授权意愿作为研究情境(即垂直隐私)。
1.3 垂直隐私情景
垂直隐私(Vertical Privacy)是隐私的一种类型,是相对于水平隐私(Horizontal Privacy)提出的[3]。后者涉及同伴互动和向其他用户披露个人信息,常常伴随着使用对象和使用目的等披露因素的确定性,是已有理论和实证研究的重点。前者则涉及用户同意机构和服务商采集其个人信息的同意意愿,常常伴随着使用范围和使用用途等披露因素的不确定性,已有相关研究较少。垂直隐私产生于在线网络情景中,大多数在线网络情境下个人信息的披露行为常以用户“打勾”同意接受服务(如用户同意“服务条款”“隐私声明”等)、用户个人信息的二次流转授权以及第三方获取用户个人信息(如用户在登录一些APP应用中利用其社交媒体账户)等形式呈现。
垂直隐私泄露广泛,用户掌控困难。用户为了使用某项服务而同意注册时,只是个人信息披露的开始,虽注册信息有限,但由于用户的授权缺失时效限制,服务提供商可持续跟踪用户行为,采集用户活动信息,但该过程用户并不知晓。用户通过社交媒体账户注册使用应用服务也会产生个人信息披露,因为应用服务将共享于账号存储的个人信息,产生垂直隐私。故垂直隐私产生于用户对第三方采集其个人信息的授权同意,个人信息的延伸流动产生垂直隐私泄露,导致隐私安全风险。
已有垂直隐私相关研究多关注于用户理性同意的困境与方法,如用户隐私素养对同意意愿的影响[44],信息处理的方式模糊、控制缺乏、目的不明等造成用户同意的困难[45],鼓励用户阅读隐私政策或参与隐私政策的制定[46],规范个人数据使用声明以增加用户理性同意认知[48],丰富用户隐私知识以提升用户隐私自我监管水平[49],但是,垂直隐私情境下用户同意意愿以及情境因素对用户决策的影响探索较少。
1.4 本研究的切入点
之前的研究已经考察了情境因素对用户隐私关注的作用[50],实证和理论研究的重点是水平隐私的自我披露,但较少关注垂直隐私的用户对第三方访问其个人信息的同意意愿,尽管后者是一种常见的在线隐私行为,且对用户隐私关注有重要影响[5]。本研究界定在垂直隐私情境,采用问卷调查和现场实验,研究3种主要使用目的(商业应用、学术应用、安全应用)对用户被第三方采集其个人信息的同意意愿影响,研究成果将补充隐私理论内容。
2 研究假设
此前的研究发现[25],用户对第三方采集其个人信息的同意意愿因情境而异,与采集的个人信息类型和采集关联要素(许可与否、使用目的、使用者、延伸使用等)有关,本研究假定其他关联要素不变,使用目的(安全应用、学术应用、商业应用)作为自变量,用户同意意愿作为因变量,测度不同使用目的用户同意意愿的差异性。另外,还有研究指出[24-25],当涉及国家(地区)和社会安全以及反恐领域时,公众的支持水平明显上升,由此可以推理,与其他两个使用目的相比,安全应用的用户同意意愿会偏高。故提出假设:
假设1:使用目的不同,用户对第三方采集其个人信息的同意意愿也不同,安全应用的同意意愿高于商业应用和学术应用。
个人隐私信息的商业化使用(如个性化服务的推荐)产生了隐私作为商品的理念[7],用户在选择是否披露其个人信息时经常会权衡这种行为产生的成本与收益[4,9],向用户提供的补偿金额数量直接影响到其收益,基于此,无论基于何种使用目的,提高补偿金额会提升用户的同意意愿。另外,一些变量与用户同意特定类型个人信息访问请求具有关联性,比如,同意安全应用的访问请求可能与用户身份和对安全关注程度有关,同意学术应用的访问请求与用户支持学术应用以及对学术应用人员的信任相关[14],同意商业应用的访问可能与用户的趋利特质有关,鉴于此,用户的情境隐私偏好会影响其同意意愿。故提出假设:
假设2:补偿金额会影响用户的同意意愿,不同使用目的影响用户同意意愿的因素不完全一样。
一般认为,隐私态度与隐私行为之间存在差异,并且前者高于后者,其结果产生隐私悖论[12]。问卷调查是隐私态度的主要测度工具,现场实验是隐私行为的主要计量方法。鉴于此,本研究将分别调查用户的同意意愿(属于隐私态度),实验用户的同意比率(属于隐私行为),还原用户授权访问个人信息的真实情境。故提出假设:
假设3:问卷调查得出的用户同意意愿大于现场实验得出的用户同意比率,无论是总体上还是各使用目的。
3 研究方案
本研究分两个步骤:一是调查问卷,以商业应用、学术应用、安全应用为3个维度,设计题项,测度被调查者的同意意愿;二是现场实验,统计第三方获取个人信息的受试者实际同意率,调查影响用户同意的因素。
3.1 问卷设计
问卷分两部分:一是人口统计学特征,包括年龄、性别和学历;二是用户同意意愿的测度题项,从3个使用目的维度,设计9个潜变量,共27个题项。所有题项均参考已有研究并结合垂直隐私情境进行改编,且在预调查、修改完善后,形成正式量表实施调查。各题项均采用李克特五级量表测量,题项及参考来源如表2所示。
表2 调查问卷
3.2 垂直隐私情境设计
实验包括商业应用、科研目的、安全应用3个情境隐私框架。分别如图1~3所示。
图1 商业应用垂直隐私情境
图2 科研目的垂直隐私情境
图3 安全应用垂直隐私情境
采用上述垂直隐私情境进行实验,除了使用目的(商业应用、学术应用、安全应用),受试者并不知晓被采集信息的类型、对采集信息的处理方式等,这与在线实际情境相符。
3.3 拒绝原因的识别
当受试者不同意提供授权时,本实验调查拒绝原因,此时,无论处于何种使用目的,受试者均需从下述原因列表中选择1个或多个:
1)这将会给我带来损失。
2)这对我没有好处。
3)提供的补偿金额太少。(请描述期望的补偿金额)
4)不相信登录后,会获得约定的补偿金。
5)不相信被采集的信息会被用于承诺的目的。
6)比起补偿金,更希望保护自己的隐私。
7)我不愿意自己的信息被用于该目的。
8)纯粹是个人偏好。
9)我不能保证这些信息还在我的控制下。
10)其他原因(请详细说明)。
上述拒绝原因大致可概括为几种类型:感知风险与收益(1~3),信任倾向(4~5),个人隐私偏好(6~8),感知控制(9)。
4 调查与实验
4.1 受试者选择
以新浪微博为实证,选取用户调查,筛选条件为使用年限2年以上且为较活跃者(周发帖量10帖以上)。调查和实验于2022年2月20日—23日先后在郑州市区和郑州大学校园进行。首先,现场问卷调查,收集340份,剔除规律性作答等无效答卷32份,获得有效答卷308份,样本量达到观测变量的10倍,满足有效性要求[57]。接着,针对有效答卷者进行后续现场实验,其中8人因故未参加,实际300人。人口统计学特征如表3所示,据新浪微博数据中心2021年3月发布的《微博2020用户发展报告》[58],新浪微博用户男女性别占比分别为45.4%和54.6%,90后与00后占比近80%,70后与80后占比近20%(因50岁以上用户群体仅占微博总用户群体的1%,实验中未找到满足条件的此类受试者)。总体上受试者符合微博用户的整体特征。
表3 受访者分布 %
【注1】问卷调查中,被调查者308人,不分组。【注2】现场实验中,受试者300人,随机平均分到3个实验组,分别进行3个不同使用目的实验,每实验组100人。另外,为了测度补偿金额对同意率的影响,每个实验组的受试者又被随机平均分配到4个补偿金额不同(分别为20、40、60、80元)的实验小组,每个实验小组25人。本文中仅表8以实验小组为单位进行统计,其他均以实验组为单位进行统计。
4.2 信度效度检验
信度反映测量结果的一致性、稳定性和可靠性,采用潜变量的Cronbach’s α系数和组合系数(CR)测量,结果如表4所示,所有潜变量的两个测量值均大于阈值0.70。
表4 信度和聚合效度检验结果
效度反映测量结果的准确度和有效性。本研究的观测题项均参考于已有研究成果,保证了内容效度。聚合效度采用观测变量的因子载荷和潜变量平均方差抽取量(AVE)进行测量,结果如表4所示,所有两个指标值均大于阈值0.50。区分效度检验标准是潜变量AVE平方根大于该潜变量与其他潜变量之间的相关系数,结果如表5所示。
表5 区分效度检验结果
4.3 实验结果与讨论
针对本研究提出的3个假设,通过调查和实验,分析讨论如下。
4.3.1 不同使用目的用户同意意愿
针对问卷,共27个题项,采用李克特五级量表,满分135,以中间值67.5分为界线划分被调查者意愿为高、低两个等级。针对实验,按照受试者“同意”或“拒绝”授予其微博信息的采集权,划分为高、低两个等级。因此,两者的授权同意等级“高”和“低”的实际涵义不完全一致,但仍能客观体现同意程度的区别。统计结果如表6所示。
表6 用户同意授权统计 %
由表6知,在问卷和实验中,虽然不同使用目的对参与者意愿存在细微差别,表现为问卷中安全应用的同意意愿最高,实验中学术应用的同意率最高,但整体上对于第三方机构的授权意愿(90.6%)和实际授权同意比率都比较高(78.0%)。
选择卡方检验,分别对不同目的问卷调查结果差异和现场实验结果差异进行显著性检验,其中问卷调查结果的卡方检验渐进显著性系数为0.839(大于0.05),说明在3个使用目的中,被调查者对第三方采集其个人信息的意愿无明显差异;现场实验结果的卡方检验渐进显著性系数为0.025(小于0.05),说明使用目的对第三方采集个人信息的同意比率产生显著影响。产生上述结果可能原因在于,使用目的的边界模糊性以及二次使用的风险,使得用户在面临同意决策时,较为普遍地会采用更直接判断方法,即对自己能够明确计量的两个要素“收益”与“风险”进行权衡[4,12]。问卷调查中,被调查者的隐私信息非实际披露,也未获得实质性收益,感知收益与感知风险的值均较低,同意意愿与不同使用目的之间无明显相关,更多可能取决于用户的自我披露意愿。但实验中,受试者的隐私信息被真正采集,会认真判断并权衡不同使用目的对其个人信息采集带来的“收益”与在使用和流转过程中产生的“风险”。上述结论也验证了问卷调查中存在假设性偏误现象,即调查的情境对用户来说具有假设性,导致与现场实验实际情境中的结果存在偏差。
综上,3种使用目的中,问卷调查的被调查者同意意愿无明显差异,现场实验的受试者同意比率差异显著,且安全应用最低。故假设1部分成立。
4.3.2 实验同意率的影响因素
实验同意率的影响因素即拒绝原因,如表7所示。
表7 拒绝原因统计
实验总体上,拒绝原因中占比较高的依次为:个人隐私保护(57人,占比22%,希望保护自己隐私),用户感知控制(49人,占比19%,不能保证这些信息还在其控制下),信息采集的目的(29人,11%,不愿意被采集的信息用于这些目的),对第三方的信任倾向(28人,11%,不相信被采集信息被用于承诺目的)。后两种原因占比的差异不具显著性(卡方检验结果的渐进显著性系数为0.861,大于0.05),故可合并为“采集信任”,处理后的3类主要拒绝因素产生的拒绝率差异显著(卡方检验结果的渐进显著性系数为0.0000003,小于0.05)。该结论与之前的研究[25]结论一致。
针对3个实验组之间,高拒绝频次依次为:安全应用(132人次,占比53%)、商业应用(78人次,占比30%)和学术应用(48人次,占比19%),且三者之间的差异显著(卡方检验结果的渐进显著性系数为0.024,小于0.05)。安全应用的拒绝率最高与常规认知相左,可能原因在于,受一些家喻户晓的声称基于安全应用而采集(甚至非法采集)公众隐私信息的事件影响,比如斯诺登事件,导致用户直觉上产生强烈的不信任感(甚至反感)。另外,用于国家(地区)安全和社会安全,政府机构无需征询个人同意而采集公众信息已是不争事实,如“天网工程”和征集个人网络数据等,反而明文告知可能使用户产生怀疑。
针对每个实验组,各个使用目的的拒绝率排序与总体排序几乎一致。表明虽然使用目的不同,但每个实验组对个人隐私信息的价值认知基本一致,管理个人隐私信息的根本思维方式基本相同,即保护和掌控自己的个人隐私信息,尽力避免任何泄露,无论用于何种目的。
针对每个实验小组,实验结果如表8所示。对各个补偿金额小组之间用户的同意率进行卡方检验,得出渐进显著性系数为0.873(大于0.05),表明补偿金额与受试者同意率之间不存在显著相关性。结合表7中拒绝原因为“补偿金额太少”的占比极少(2%),可以得出结论:补偿金额几乎不影响用户的同意行为。
综上,3个使用目的拒绝率主要影响因素排序比较一致(由大到小):隐私保护、感知控制、采集信任。另外,补偿金额对用户同意率的影响不具显著性。故假设2不成立。
4.3.3 问卷与实验之间用户隐私的差异性
依据表6,总体上,问卷调查结果的整体同意意愿(90.58%)高于实验的整体同意比率(78.00%),卡方检验结果显著性系数为0.0002(小于0.05),表明两者之间差异非常显著。虽然问卷和实验的同意程度均较高,但从问卷调查到具体实践,同意程度显著下降,说明隐私悖论的存在,用户的隐私态度与其实际披露行为之间存在差距。
依据表6,不同使用目的上,问卷与实验之间用户授权意愿的差异性也有不同体现。无论是商业应用还是学术应用,问卷的同意意愿(分别为84.1%和84.5%)与实验的同意率(分别为81%和84%)均不具显著差异(卡方检验的显著性系数分别为0.471和0.921,均大于0.05);但在安全应用中,问卷的同意意愿(85.7%)显著高于实验的同意率(69%)(卡方检验的显著性系数为0.0001,小于0.05)。可能的解释是,问卷调查的是隐私关注,实验测量的是隐私行为,信任是影响隐私行为的主要因素[4,12],为了商业应用和学术应用而获取用户授权同意的情境在互联网中非常常见,用于该两种目的的可信度大,导致的隐私行为接近隐私关注;但为安全应用而获取用户授权同意的情境在日常生活中较少见,用于该目的的信任度低,导致实际隐私行为发生频次少,故实验的同意率低。这一现象在各实验组中用户拒绝原因的统计中体现明显,如表7所示,即“不相信被采集的信息被用于第三方承诺的目的”的安全应用组(19人次)远高于商业应用组(6人次)和学术应用组(4人次)。
实际上,应用目的也是隐私呈现的一类情境,上述分析的实验中不同应用目的用户同意授权采集其个人信息的比率不同,与已有研究[3]的隐私情境依赖属性相符合。
综上,问卷调查的总体同意意愿显著高于现场实验的总体同意比率,但具体到使用目的上,仅安全应用的两者差异显著,其他两个使用目的问卷调查与实验结果均不具显著差异。故假设3部分成立。
5 研究价值与局限性
理论价值。隐私具有情境依赖性,已有研究大多集中在水平隐私情境,如个人隐私信息的自我披露,较少关注垂直隐私情境,如第三方申请获取用户同意授权访问其个人隐私信息,尽管现实生活中垂直隐私情境十分常见,本研究构建垂直隐私情境框架,针对不同使用目的探索用户对第三方访问其个人信息的同意意愿,研究成果可以补充已有水平隐私理论框架。另外,本研究假设3的验证结果显示,问卷调查与现场实验的总体同意意愿出现显著性差异,表明隐私悖论不仅存在已有研究的水平隐私情境中,同样也存在垂直隐私情境之中,拓宽了隐私悖论理论的适用场景。
实践价值。与水平隐私相比,本研究的垂直隐私情境实践价值主要体现在第三方信息采集的服务商上。依据本研究假设1的验证结果,不同使用目的的现场实验受试者同意比率差异具有显著性,故在获取用户授权环节,需明确采集信息的使用目的,尤其是同意率高的使用目的,可以有效提高用户授权采集的比率。依据本研究假设2的验证结果,不同使用目的拒绝率的主要影响因素一致,包括隐私保护、感知控制、采集信任,故可以针对这些主要影响因素,采取措施降低影响程度,比如:引入更多更有效的隐私保护技术和管理手段,并在隐私声明中进行清晰说明,以满足用户“希望保护自己的隐私”的需要;创新采集信息的管理模式,给予用户适当的自我信息知情权,以满足用户“保证个人信息还在我的控制下”的需求;提升垂直隐私信息采集商的信誉,以减少甚至排除用户“不相信被采集信息被用于承诺目的”的顾虑等。
局限性。第一,本文的问卷调查和现场实验参与者大多来自郑州,缺失地域差异性的考量,后续研究需扩大样本的来源区域,提升样本的代表性。第二,本文设置的垂直隐私情境中安全应用框架构建可能存在缺陷,没有考虑现实情境中应用于该项目的个人信息采集常常是不透明的、非自愿的以及常在不知情情况下发生的,导致该组受试者对其个人信息被采集用于该使用目的产生严重怀疑,致使对受试者安全应用的授权同意率测度产生偏差,后续研究需严谨构建安全应用框架,消除测度偏差。第三,本文调查用户拒绝原因的方式采用固定列表选项,可能会产生不够全面的缺陷,后续研究可以补充访谈方式,两者结合应该更科学。