考虑不同使用场景的APP用户隐私交换行为

2022-04-07赵彦霖

系统管理学报 2022年2期

韩震,石磊,赵彦霖

(大连海事大学航运与经济管理学院,辽宁大连 116000)

随着移动互联网技术在社会生活中的广泛应用和深度融合,多数的移动应用软件(Application,简称APP)可以通过各类应用商店或扫描二维码等形式免费获取。同时,越来越多APP的功能甚至是增值服务,被设置成用户通过隐私交换的方式实现,即用户通过公开他们的个人隐私以换取APP 个性化服务带来的增值服务。免费增值模式是指服务商向用户提供免费的基础服务[1],而对增值服务模块收费的一种商业模式。从免费的基础服务状态开始吸引大量用户,以用户隐私作为使用权限的交换条件,能够为运营商带来巨大的用户数据价值,以实现精准的广告推送[2]、应用引流和个性化服务。与以往单一依靠付费的免费增值模式不同,利用隐私交换获得更多商机的免费增值模式正在成为APP 商业模式的主要逻辑。根据Braze《2020年数据隐私报告》显示,隐私交换行为广泛存在于获取和使用APP的整个过程中,70%的用户在使用APP 时存在着隐私交换行为,其中多数用户更认为隐私交换有利于自己获得个性化服务,改善使用体验。

但是这一现象却存在着不容忽视的隐私问题:一方面,随手可得的产品和服务、轻易换取的使用权限,使得用户隐私保护意识淡薄,将隐私交换行为当成“免费的午餐”,并对正常付费产生抵触情绪;另一方面,客观上存在着巨大的隐私风险,例如不断发生的隐私信息泄漏、滥用等事件。由此可见,用户需要在隐私安全和便利之间进行权衡[3]。深入解析用户在APP使用过程中隐私交换行为的动因和影响因素,探讨在免费和付费等不同使用场景下的用户行为,有效避免隐私交换行为所产生的风险和忧虑,是具有重要现实意义的研究课题。

近年来,围绕APP隐私问题的相关研究正在成为热点。除在技术层面探讨如何进行隐私保护外,多数研究都是围绕隐私要素对用户使用意愿和行为的影响展开,内容涉及隐私的感知[4-5]、匹配[6]、权衡[7-8]、授权[9]、披露[10]等多个方面。总体来看,以往研究多选取具体的APP类型[5-6]及不同的用户特征[11-12]进行分析,基于技术接受模型(Technology Acceptance Model,TAM)及其拓展模型[11,13]、隐私计算模型[12]等理论,采取结构方程[9-13]的方法进行实证,关注心理潜变量的影响[14],忽视APP使用中的客观影响因素。事实上,这种隐私交换行为还受到APP运营商使用场景设计的影响。运营商会针对用户需求情况,在不同使用场景下设置不同的隐私交换条件(即功能获取和隐私信息交换的规则),这些隐私交换条件作为客观可观测变量,其选择结果决定了用户隐私交换行为是否发生。由此可见,隐私交换行为本质上是APP 用户对不同使用场景隐私交换条件的选择行为,针对选择行为的研究应兼顾心理潜变量及使用场景变量的共同影响。

离散选择模型(Discrete Choice Model,DCM)作为研究选择行为的常用模型,通常基于效用最大化准则来描述决策者面对多个备选方案时的选择行为。由于DCM 不能直接测量态度、偏好、感知等潜变量,无法解释心理因素对决策者的影响,为此,Ben-Akiva等[15]将潜变量引入DCM,建立了ICLV(Integrated Choice and Latent Variable)模型。由于ICLV 模型在充分考虑外部客观属性的前提下,还能清楚地揭示内在主观因素对选择行为的影响,从而能够有效增强模型的解释和预测能力[15-16]。近年来,ICLV模型在出行方式[16]、居住地[17]及产品[18]等领域的选择行为研究中得到了广泛应用。以出行方式选择研究为例,ICLV模型既包括以出行属性(如出行时间、出行费用、出行距离等)为客观变量的离散选择模型,又包括以出行态度(如喜好度、满意度、舒适度等)[16]为心理潜变量的结构方程模型。为此,本文将构建隐私交换行为选择的ICLV 模型。其中,依据TAM 提出使用场景变量构建离散选择模型,依据沟通隐私管理(Communication Privacy Management,CPM)理论提出心理潜变量构建结构方程模型。通过对不同使用场景下影响因素的测度来计算用户隐私交换行为概率。

1 研究假设

1.1 基于CPM 理论的相关变量界定及假设

传统意义上,隐私是指个人与社会公共生活无关的而不愿为他人知悉的事项。如果本人愿意公开,原来的隐私就转化为非隐私了,如社交平台上的“晒”隐私现象,就不属于隐私保护内容[19]。因此,隐私在不同情境下有不同的定义。本文沿用CPM理论中隐私的定义,认为隐私是一条从自我到他人的具有弹性的边界,将隐私边界看成是一个从完全开放到完全封闭的连续体[20]。CPM 理论描述了用户管理隐私信息的过程,解释了人们如何对隐私的披露与隐藏进行决策。为了很好地保护隐私,信息藏匿和保护之间需要进行边界协调[21],制定共同遵守的规则。CPM 理论将个人隐私规则制定标准分为核心标准和催化剂标准。核心标准包括个体特征和文化,催化剂标准包括情境、动机和风险-收益比。因此,基于CPM 理论提出隐私交换收益、隐私交换风险、隐私侵犯经历、隐私保护自我效能、隐私政策关注和个性化需求6个潜变量。

CPM 理论指出用户在决定是否披露个人隐私时会进行收益风险权衡。当用户获得的收益超过风险时会倾向于披露个人隐私,反之会拒绝披露个人隐私。已有研究证明,用户会根据APP提供的价值来决定向APP披露隐私的程度[7],隐私披露的感知收益越高会积极影响他们的隐私披露意愿[7,10]。因此,提出假设:

H1隐私交换收益对隐私交换意愿有正向显著影响。

隐私交换风险[10-13,22]是指用户在使用APP 进行隐私交换时,对APP未经授权披露其隐私信息所感知到的潜在损失。已有研究表明,当用户受到隐私侵犯感知到隐私风险时会减少信息披露[23]。此外,感知隐私敏感性会加剧隐私问题,进而对隐私披露产生负面影响[24]。因此,提出假设:

H2隐私交换风险对隐私交换意愿有负向显著影响。

Gu等[24]指出用户对隐私的态度和以往经历有关,有过隐私受损经历会对个人隐私披露产生直接和间接的影响[12]。当用户发现网站滥用他们的信息时,就会觉得这个网站没有履行其职责,因而在以后使用该网站时会降低隐私交换意愿[24]。因此,提出假设:

H3隐私侵犯经历对隐私交换风险有正向显著影响。

个性化需求通常被定义为根据个人偏好和行为量身定做服务的需求[25],通过数据挖掘、统计、人工智能和基于规则的匹配等工具,平台可以预测用户的需求和偏好,并提供更符合需求的产品和服务[26]。为了满足个性化需求,用户需要披露隐私,因此,个性化需求被认为是影响隐私交换收益的一个重要因素,所以提出假设:

H4个性化需求对隐私交换收益有正向显著影响。

以往研究表明,个性化服务以获取大量用户数据为前提[27],所以具有显著个人特征。披露这些数据可能会导致不必要的广告植入、价格歧视以及未经授权的访问。尽管个性化服务带来了附加价值,但仍会带来隐私风险,因此,提出假设:

H5个性化需求对隐私交换风险有负向显著影响。

根据CPM 理论,用户隐私是否会被披露取决于环境的影响。而隐私政策会将APP如何收集和使用用户隐私告诉他们,也是保护用户隐私不会被篡改和泄露的保证。因此,隐私政策是APP使用过程中的一个环境因素。Mc Knight等[28]认为隐私政策是促进用户建立对互联网环境信任,保证供应商诚实的一种方式。由此提出假设:

H6隐私政策关注对隐私交换意愿有负向显著影响。

隐私保护自我效能是指个体为保护个人信息和空间,对自身隐私边界控制能力的感知[29]。已有研究表明,自我效能在影响用户对技术感知和使用方面起着重要作用,能够降低用户对技术的焦虑感,是用户评估感知规避能力的重要参考[30]。因此,提出假设:

H7隐私保护自我效能对隐私交换意愿有正向显著影响。

1.2 基于TAM 相关变量界定

TAM 因其有用性、易用性被广泛应用于组织IT 管理、银行客户采纳、消费者网络购物意向以及图书馆信息系统满意度等领域。APP 使用中考虑最多的因素是功能的有用性和便捷性,因此,基于TAM 理论设置不同使用场景。由于APP 类型繁多,用户对APP的使用偏好也不相同,对实证研究中的使用场景设计有较大的影响。如果实证研究场景过于具体化,用户偏好会对实证研究的影响较大。因此,对于使用场景中与用户偏好有关的影响因素(如软件功能需求程度、使用时长等)应该进行有效控制。模型中感知有用性是指使用系统对于人们所带来的帮助和效率的提高,感知易用性是指用户对于系统使用的方便性和技术接受的程度高低。除此之外,TAM 的应用受到被调查者的个体特征、研究对象的特征以及文化环境差异等因素影响,随着技术的不断发展,使用环境也变得复杂,感知有用性和易用性已经无法满足对用户使用行为解释和预测的需求。因此,结合免费增值模式下用户在不同场景中交换隐私信息的不同提出信息敏感度这一使用场景属性。信息敏感度[22,31-34]是指用户对不用类型隐私信息披露所产生负面影响的感知程度。综上可知,基于TAM 提出有用性、易用性和信息敏感度3个使用场景属性,并根据使用场景属性的不同水平划分为4个使用场景。

2 MIMIC模型及结果

2.1 数据来源

(1)用户社会经济属性测量、以往APP使用中的隐私潜变量测项。其中,隐私潜变量量表依据CPM 各变量的问题项改编形成,相关变量题项及来源见表1。

表1 变量测量题项及来源

研究量表均采用Likert 5级量表,调查及后续研究中所用到的变量:

Sage——用户的年龄;

Sedu——用户受教育程度;

Sincome——用户月收入;

Semploy——用户受访者职业;

Zuse——功能有用性;

Zease——功能易用性;

Zsen——信息的敏感度。

(2)场景测试。选取有用性、易用性和信息敏感性3个使用场景属性分别划分为3个水平,理论上可产生3×3×3=27种使用场景。在免费增值模式的运营下产生了4 种使用场景,分别为免费游客(A)、免费注册(B)、隐私交换增值(C)和付费增值(D)。使用场景A 下,APP运营商提供基础服务(在有用性属性下用1 表示),用户需要提供使用信息(在信息敏感度属性下用1表示)进行交换,使用过程中受到广告植入等影响,使用不便捷(在易用性属性下用1表示);使用场景B下,APP运营商提供个性化服务(在有用性属性下用2 表示),用户需要提供基本信息(在信息敏感性属性下用2表示)进行交换,使用方便(在易用性属性下用2表示);使用场景C 和D 下,APP提供增值服务(在有用性属性下用3 表示),用户需要用敏感信息(在信息敏感度属性下用3表示)或者付费(在信息敏感度属性下用2 表示)获取,使用非常便捷(在易用性属性下用3表示)。各使用场景属性及其水平如表2所示。

表2 使用场景及其属性

将情景描述为:“您在接触一款新上市APP,您对该APP的使用需求强烈,在每个APP 使用场景下的需求都是理性的,且没有产生对APP在使用时间和技术上的依赖。”在问卷调查中要求用户根据日常使用偏好,对4个使用场景是否进行隐私交换依次做出选择。图1所示为使用场景选项卡样例。

通过线上发放问卷,共收回326 份有效问卷。被调查对象的年龄和学历基本符合正态分布,说明样本分层比较均匀。其中,本科学历用户最多(占总数的47.85%),且83.74%的调查对象年龄在18～45岁,这符合高学历用户与青年用户是互联网使用的主要人群特征。

信度采用组合信度(CR)来检验,并使用平均萃取变差(AVE)、Cronbach’sα系数检验问卷中量表的有效性。首先,大部分潜变量的CR均大于0.8,表示因子具有较好的指标信度。尽管两个潜变量的结果不是很满意,但是也大于0.7,也是可接受的。Cronbach’sα系数均大于0.7,说明该问卷的量表题具有较好的内部一致性;AVE 都大于0.5,表示该问卷的量表题具有较好的聚合效度。信度和效度分析如表3所示。

表3 信度效度分析表

2.2 MIMIC模型及拟合结果

MIMIC模型是结构方程的一种特殊形式,是一种探讨多个外生观测变量与多个内生潜在变量之间关系的模型。该模型可以将连续变量和类别变量同时纳入建立混合模型,以此来探讨混合变量与测量模型间的关系。该模型相比传统的多群组分析模型,不必根据类别变量把数据分为几个组分别估值,操作上更简单。MIMIC 模型在本质上是结构方程模型的一种形式,通常由结构方程和测量方程两部分组成,其关系为

式中:ηni是不可观测潜变量向量,具体为ηbenefits、ηrisks、ηpolicy、ηPE、ηPPIE、ηSE和ηWTE;xni是影响潜变量ηni的外生可观测变量向量,包括Sage、Sedu、Sincome和Semploy;yni是潜变量;ηni是可观测指标向量;ξni和εni为测量误差;Γ和Λ是公式中待估计函数的系数。模型拟合情况如表4所示,本文中的结构方程模型拟合度都在可接受的范围内。

表4 MIMIC模型拟合统计指标

2.3 潜变量间关系分析

从构建的MIMIC模型中可以得到外生可观测变量和潜变量之间的关系以及潜变量之间的因果关系,由于篇幅有限,这里仅给出后者的结果。MIMIC模型中潜变量之间的路径关系如图2所示。

在图2的MIMIC模型中,除假设H5、H6未得到证明之外,其余假设都得到显著支持。个性化需求对于隐私交换收益有显著影响,而对隐私交换风险没有显著影响,说明用户在对个性化需求的感知收益大过感知风险。隐私侵犯经历对隐私交换意愿有显著影响,说明用户在决定隐私交换意愿时会形成定性思维,受到之前相关经历的影响,增加隐私交换风险。隐私交换收益和隐私交换风险对交换意愿有显著影响。这说明,用户在体验APP时会进行隐私权衡,进而决定是否采取隐私交换行为。隐私保护能力对隐私交换意愿有显著影响,说明用户隐私交换意愿受到隐私知识和隐私保护习惯的影响。而隐私政策关注对隐私交换意愿没有显著影响,可能是由于现有商业模式不接受隐私政策不允许使用的规则而导致用户对隐私政策持流程化的态度,降低了对隐私政策的关注。

3 离散选择模型检验及结果分析

3.1 离散选择模型

根据MIMIC模型的结果,图3为ICLV 模型的全路径,具体由MIMIC模型和离散选择模型构成。

每一个使用场景下的效用函数的解释变量分为可直接测量的解释变量和不可直接测量的潜变量,并且假设效用函数是关于参数的线性函数。每一个使用场景下的效用函数为

式中:Uni为第n个APP用户选择第i个场景的效用;Vni是系统效应;νni是随机效应;β是待估计的效用函数的系数;βx是可直接观测影响因素的系数;βn是不可直接观测影响因素的系数。

每个使用场景被选择的概率为

式中:sni表示第n个用户选择第i个使用场景的状态,如果被调查的人选择i,则sni=1,否则为0;Cn为第n个APP 用户互斥的选项集;Pn为第n个APP用户的选择概率。

混合离散选择模型的似然函数为

式中:Σv、Σξ、Σε分别为残差和随机项的协方差矩阵;Rη为积分是有多少个潜在变量的多重积分。假设有n个用户,则ICLV 模型的似然函数为

3.2 模型检验

通过绘制calibration图来评估模型预测得到的预测值与实际的真实性的一致性,4个在使用场景下的calibration图如图4所示。

图4(a)～(d)中,X轴为模型预测得到的结局可能性,Y轴为实际观察得到的值,并重复计算1 000次,其中,Bias-corrected 为校正曲线,对角线Ideal为理想曲线。校正曲线与理想曲线之间越相近,说明模型的预测能力越好。因此,模型具有良好的校准能力。

3.3 离散选择择结果分析

由于要考虑用户个体特征对是否采取隐私交换行为的影响,在采用Logit模型计算时,将不同使用场景的有用性、易用性和信息敏感程度分别统一在1个变量下。每个场景下隐私交换行为的结果如表4所示。

由表4可以看出,使用场景对用户隐私交换行为具有显著影响,用户隐私交换行为会不同程度受到使用场景变量的影响。在不同使用场景下用户隐私交换行为的影响因素存在如下不同:

表4 离散选择模型结果分析

(1)在使用场景A 下会受到职业、隐私交换风险、隐私政策关注以及以往隐私侵犯经历的影响。在现有免费增值模式下,用户在此场景中处于不披露隐私就不能使用的被动状态,用户关注隐私政策的合法合理性,结合以往隐私侵犯经历来判明隐私风险,决定是否进行隐私交换。不同职业的人群对APP的需求,也会对隐私交换行为产生影响。

(2)在使用场景B下会受到年龄、教育水平、隐私交换风险、隐私政策关注、个性化需求、隐私侵犯经历以及隐私保护自我效能的影响。在该场景下,用户获得个性化功能,会考虑个性化功能带来的便捷性,并且在各种因素的影响下,会对自身隐私保护能力即自我效能做出判断,最终决定是否进行隐私交换。随着用户年龄增长以及受教育水平的提高,用户进行隐私交换的概率会降低。

(3)在使用场景C 下会受到教育水平、隐私交换收益、隐私交换风险、隐私侵犯经历以及隐私保护自我效能的影响。在该场景下,用户需要交换敏感个人信息来获得增值功能,更多是考虑隐私交换这一行为所带来的隐私收益和隐私风险,结合以往隐私侵犯经历和自我效能的评价决定是否进行隐私交换。与免费注册场景不同,在该场景下,用户受教育水平的提高反而会促进用户进行隐私交换,这可能是由于用户隐私保护自我效能的提高增加了隐私交换意愿。

(4)在使用场景D 下会受到职业、收入、隐私交换风险、个性化需求以及隐私侵犯经历的影响。在该场景下,用户需要付费来得到增值功能,更多是考虑APP增值功能的个性化程度,以此来决定是否进行交换。

3.4 聚类分析

采用R 语言进行K-Means算法实现聚类分析,确定最优k值为2。两类用户群分别标记为Ⅰ类和Ⅱ类,样本数分别为102个和224个。对两类用户群的潜变量进行均值分析,如图5所示。Ⅰ类和Ⅱ类用户群潜变量均值均呈一正一负分布在两侧,具有显著差异性。这表明,两类人群在隐私偏好导向上存在明显的不同。根据问卷潜变量定义,Ⅰ类用户具有较高的隐私保护意识和隐私保护能力,将其定义为隐私导向人群,则Ⅱ类为功能导向人群。

3.5 隐私交换行为的Nomogram 图分析

为进一步分析各自变量对隐私交换行为的影响,采用Nomogram 图进行可视化分析。首先,根据二元Logit回归模型中自变量回归系数大小制定评分标准(变量标尺),以回归系数最大的自变量为参考标尺;其次,依据各变量标尺对每个取值水平进行评分,将各变量评分相加得到总评分;最后,通过总评分与预测事件发生概率之间的转换函数,计算出该预测事件发生的概率。

以Ⅱ类月收入为5 000～8 000元1)用户在不同使用场景下会受到不同的社会属性的影响,选取各社会属性变量中选择最多的人群为样本的用户群为例,分析该群体在使用场景A 下隐私交换概率,用R 绘制Nomogram 图(见图6)。依据量表采集数据结果,ηbenefits和ηrisks的变量取值水平为5,分别对应评分(Points)的68和0,ηpolicy和ηPPIE的变量取值水平为1,分别对应Points的100和0;收入为5 000～8 000元标记为3,对应Points的48。将每个变量对应的Points相加得到Total points为216,在Total points上找到相应数值,对应于最下面概率轴(s1)的0.82,即该类用户群在该场景下隐私交换的概率为0.82。

由于Nomogram 图绘制的基本原理是以回归系数最大的自变量为基准,其他变量以此为参考标尺进行转换,使得各变量的标尺长度随回归系数的变化呈现显著差异,能够系统反映多变量组合下的作用效果,将复杂的回归方程转变为可视化的图形,方便对事件发生概率进行评估。

根据上述方法计算Ⅰ类和Ⅱ类用户在不同使用场景下的隐私交换概率,结果如图7所示。由图7可以发现,隐私导向用户在各个使用场景下隐私交换意愿偏低且平稳,功能导向的用户除了在使用场景B下隐私交换概率都比较大。

4 结论

基于CPM 理论提出潜变量,引入用户社会属性变量构建MIMIC 模型;再加上使用场景构成效用决策,进行离散选择分析,构建混合选择模型对用户在免费增值模式下不同使用场景的隐私交换行为进行实证分析。研究发现:

(1)使用场景对用户隐私交换行为产生显著影响,且影响程度随使用场景变量发生变化。考虑使用场景后,影响因素增加且组合不同。用户在获得免费功能时,随着个性化功能与隐私信息敏感度的提高,用户年龄、受教育水平以及隐私保护能力会显著影响隐私交换行为,而收入和隐私交换收益的影响并不明显;用户在获得增值功能时,由于在使用场景C要交换敏感度高的隐私而受教育水平、隐私保护能力以及隐私交换收益的显著影响,而在使用场景D 需要付费则受到职业和收入水平的影响,隐私保护能力对其影响不显著。

(2)APP用户类型不同,在不同的使用场景下是否进行隐私交换还会受到不同影响因素的影响。功能导向型用户在使用场景A 和D 下的交换概率偏低,说明这两个场景下的功能的个性化程度不能满足功能导向型人群需求。隐私导向型用户在4个使用场景下的隐私交换意愿都偏低。

(3)在进行APP用户类型聚类时可以看出,隐私导向型用户数量只占少数,所以APP用户在使用过程中要注意“免费”的假象,加强隐私保护意识,树立正确的隐私观。

(4)APP 运营商在实际运营中要注意使用场景变化对用户使用行为的影响,并可对用户数据进行分析,判定用户类型,对不同用户类型采取不同的策略。对于功能导向型用户,APP运营商可以增加功能的便捷程度和独特程度,提高对用户的吸引力,增加隐私交换概率,更好地建立用户资料库,提供精准服务,形成良性循环。对于隐私导向型用户,APP运营商在获取用户隐私时要注意保护用户隐私,在保护用户隐私的同时提供便捷的服务,促进商业模式的健康发展。

本文存在的不足:①本文是在免费增值模式下对APP用户隐私交换行为影响因素进行研究,并没有考虑APP种类。不同种类的APP功能和受众群体不同,所对应的影响因素也会有所差异,未来研究者可以划分APP种类进行研究或者对某一类APP进行研究。②用户在使用场景D 下可能会受到价格的影响,未来研究者可以设置不同的价格区间研究用户隐私交换意愿。