基于元分析的网络用户个人信息披露意愿影响因素研究
2022-11-28彭国超刘彩华
彭国超 程 晓 刘彩华
(1.中山大学信息管理学院,广东 广州 510006;2.桂林电子科技大学人工智能学院,广西 桂林 541004)
无线互联网技术的发展和移动设备的不断升级为人们提供了信息传播和交互式沟通的线上平台,社交媒体、虚拟社区、电子商务、在线医疗等各种互联网平台得到了广泛的应用,已逐渐融入人们的生活。据2021年《中国互联网络发展状况统计报告》第48次调查显示,我国网民规模已达10.11亿[1]。但随着网络用户数量的激增,用户在享受这些网络平台所提供的便利服务的同时,服务提供商为了更好地提供个性化精准服务,也利用各种技术手段来收集、分析和共享用户个人信息[2]。然而,个性化精准服务导致的用户隐私频繁泄露引起了用户高度的隐私关注,个人隐私披露问题逐渐成为大数据时代的一大挑战,成为社会关注和讨论的热门话题。
1 文献回顾
目前,国内外关于用户个人信息披露意愿的相关研究多以隐私计算理论、计划行为理论、效用理论、沟通隐私管理等为理论基础,通过构建理论模型研究各影响因素与信息披露意愿间的作用关系。如孙霄凌等将隐私计算理论与计划行为理论相结合,通过结构方程建模方法对社会化搜索平台上各影响因素与用户隐私披露意愿间的关系进行了研究[3];程慧平等以隐私计算理论和沟通隐私管理理论为基础,研究了微信用户的隐私披露意愿[4];张星等基于计划行为理论和隐私计算理论对健康信息服务平台用户的健康信息披露意愿进行了探讨[5]。虽然目前关于个人信息披露意愿影响因素的实证研究成果较为丰富,但涵盖的因素众多且存在相同影响因素与披露意愿间的相关关系出现相反研究结论的现象。如巫月娥认为,感知风险与披露意愿间为负相关关系[6],但Zhang X等却认为,感知风险与披露意愿间呈正相关关系[7]。各影响因素与披露意愿间究竟存在怎样的作用关系已成为目前亟待解决的问题。
因此,本研究拟采用元分析的研究方法,结合已有网络用户个人信息披露意愿的实证研究,对网络用户个人信息披露意愿的影响因素进行定量验证分析,通过探讨各影响因素与披露意愿的总体相关性和可能的调节效应,形成具有普适性的网络用户个人信息披露意愿影响因素模型,为网络用户个人信息披露的深入研究提供思路,为网络平台的运营提供理论指导。
2 研究设计
1976年,Glass G V在一次会议上首次提出了元分析的概念[8],起初其被应用于医学领域的相关研究,后被广泛应用于心理学、管理学等社会科学领域。元分析作为一种文献综合分析方法,其使用先进的统计技术,整合从特定主题下的不同实证研究中获得的效应值,对不同研究子类进行定量分析。它通过计算已有实证研究的平均效应来挖掘相同自变量与因变量在不同研究中的共同效应,已获得广泛的认可[9-11]。与定性分析的传统文献综述方法不同,元分析能够通过对以往研究数据的统计分析,以解决不同研究间研究问题相似但结果矛盾的问题,并能发现不同研究间结果存在异质性的原因,使得到的结论更具综合性和普适性。元分析的过程大致可概括为4个步骤,包括确定研究主题、检索并筛选文献、文献编码、数据处理和统计分析。
2.1 文献检索与筛选
本研究的第一步是进行文献检索。在2021年12月—2022年2月,笔者以“信息披露”“隐私披露”“自我表露”等关键词,通过布尔逻辑运算“或”在CNKI中国知网、万方、维普等数据库检索相关中文文献,并利用与之对应的英文检索词“Information Disclosure”“Privacy Disclosure”等对英文文献进行检索。为了提高查全率,本研究以Web of Science、Wiley Online Library、Google Scholar等作为外文检索途径。共检索到了中文文献4 977篇,英文文献3 000篇,为保证研究质量,本研究中文文献仅选取在CSSCI期刊上发表的论文以及未发表的学术论文,共2 361篇中文文献。在检索完成之后,由两位研究人员通过浏览文章的标题和摘要,排除了与信息披露意愿不相关以及重复的文献4 805篇,其中中文2 101篇,英文2704篇;然后,通过浏览全文剔除了纯理论和综述性的文献442篇,获得与个人信息披露相关的实证文献共119篇,其中中文27篇,英文92篇;最后从定量研究文献中选取在文中明确报告了信度、相关系数(或者能转换成相关系数的统计量,如T值)和样本量的文献46篇。值得注意的是,有一篇文献研究了用户的信息披露意愿,但由于其通过不披露行为来对披露意愿进行衡量,与本研究所需选取的测量结果相反,故本研究也将这一研究排除。另外,在文献整理的过程中,研究者通过对文中参考文献的阅读收录了一些相关文献。最后,本研究共有46篇文章被纳入元分析,共计57个独立样本对象。纳入元分析的文献中,中文文献20篇,英文文献26篇;期刊论文40篇,学位论文6篇。具体筛选流程如图1所示。本文纳入分析的文献主要涵盖社交媒体(19篇)、健康社区(9篇)、电商平台(5篇)、移动商务(4篇)、基于位置的服务(4篇)、移动阅读(1篇)、可穿戴设备(1篇)和社会化搜索平台(1篇)等情境,无具体情境(2篇)。
2.2 文献编码与处理
本研究共纳入46篇文献,57个独立样本实证研究,共纳入20 243个样本。编码过程中共识别了107个命名不同的影响因素作为自变量,但由于某些命名不同的影响因素具有相同的含义,故在对数据进行分析之前,通过对各变量在不同研究中的具体内涵以及数据收集量表中对应的题项进行比较分析,将具有相似含义的变量统一命名为出现频次最多的变量(如个性化服务、个性化、定制化合并为出现频次最高的个性化服务),本研究最终得到82个不同含义的自变量。由于篇幅限制,文中仅展示具有3个及以上效应值的变量信息,编码汇总信息如表1所示。
表1 个人信息披露意愿影响因素编码信息汇总
尽管有学者提出,当变量具有两个或以上的效应值时就能进行元分析[14],但由于部分变量研究未体现出平台差异,为方便后续进行调节效应分析对效应值数量的要求[15],以及探究网络用户信息披露意愿的主要影响因素,本研究将出现频次大于6次的自变量纳入后续的元分析,具体因素及其含义解释如下:
1)隐私关注,是指网络用户对在线信息披露可能导致的隐私安全问题的担忧[16],包括对平台隐私数据的收集、未经授权的二次使用、不恰当的访问等问题的关注度[17]。
2)感知控制,是指用户所感知到的对在网络上披露个人信息的控制能力[18]。
3)感知风险,是指用户对在网络上披露个人信息可能带来的风险的感知[19]。
4)感知收益,是指个体对在网络上披露个人信息可能获得的收益的一种预期[19]。
5)信任。Rotter将信任定义为基于现有关系的相互期望,这种期望要求双方遵守已经达成的口头或书面承诺[20]。在本研究中,信任是指用户相信网络平台会采取措施保护自己的个人信息以确保这些信息不会被滥用。
6)主观规范,是指个体的行为决策会受到来自周围其他人的压力以及他人对自身评价的影响[21]。
7)个性化服务,是指平台根据用户需求的不同而提供差异化服务的能力[22]。
2.3 模型选择
元分析方法计算效应大小的模型有两种,分别为固定效应模型和随机效应模型。固定效应模型假设各研究间具有相同的数据收集条件和真实效应的单一值,随机误差是导致不同研究结果存在差异的原因。但随机效应模型假设研究真实的效应大小因各研究而异,导致差异的原因除受随机误差的影响外,还可能会受到不同样本特征间差异的影响[23]。基于前期的文献梳理,本研究认为,网络平台类型等因素可能会影响各自变量与网络用户个人信息披露意愿间的关系,因此,本研究选取随机效应模型进行分析。
同时,本研究还将通过异质性检验对随机效应模型的适用性进行检验,通过Q检验和I2的值进行判断。Q统计量反映了总离散度,I2解释了效应总方差中异质性的比例[24],当Q显著性检验通过或I2值大于75%时则认为各效应值间存在异质性[25],此时选取随机效应模型进行分析更合适。
3 网络用户个人信息披露意愿影响因素的元分析
本研究使用元分析软件CMA 3.3进行异质性分析、主效应分析、调节效应检验和发表偏倚检验。调节效应检验根据数据类型分别采用亚组分析和元回归分析与极大似然值相结合进行显著性检验。本研究拟对平台类型和性别在各影响因素与披露意愿间的调节作用进行检验,调节变量涉及两种数据类型:网络平台类型为分类调节变量,通过亚组分析来检验其在各自变量与披露意愿间的调节作用;男性占总样本数的比例为连续调节变量,通过元回归分析与极大似然值相结合检验性别在各自变量与披露意愿间的调节作用。
3.1 信度分析
信度是用来反映测量结果一致性和稳健性的指标,通常通过克隆巴赫系数(即Cronbach’s α值)来进行衡量,当该值大于0.7时,则认为对这一变量的测量具有良好的信度,研究具有较高的可靠性[26]。本研究在编码过程中对各变量的Cronbach’s α值进行编码,对于文中未给出Cronbach’s α值的则利用组合信度(Composite Reliability,CR)值进行代替,各变量的信度分析值如表2所示。从表中结果可以看出,平均信度最小值为0.86,表明各变量具有较高的一致性和稳定性。
表2 信度分析
3.2 异质性检验
本研究通过对纳入的效应量进行异质性检验,结果如表3所示。由表中结果可以看出,所有变量的异质性检验均达到显著性水平,且I2最小值为86.348%(表明模型中的差异有86.348%来自于研究结果,仅有13.652%来自随机误差),远大于75%,表明各变量的研究结果间存在高度的异质性。异质性检验也再次验证了本研究选取随机效应模型进行分析的合理性,同时也证明后续进行调节效应分析找出导致研究结果间存在异质性的调节变量是有必要的。
表3 网络用户个人信息披露意愿影响因素异质性分析及主效应分析统计结果
3.3 主效应检验
本研究采用随机效应模型对各自变量进行元分析以检验各变量平均效应值的显著性水平,结果如表3所示。由表中结果可以看出,所有变量的平均效应值均达到显著性水平。Gignac G E等提出的判断标准认为,当平均效果量的绝对值小于0.3时为弱相关,0.3到0.5为中度相关,大于0.5时为强相关[27]。隐私关注和感知风险作为风险认知层面的变量,隐私关注与披露意愿间的相关系数为-0.210,效应值的95%置信区间为[-0.302,-0.115],不包含0;感知风险与披露意愿间的相关系数为-0.198,效应值的95%置信区间为[-0.296,-0.095],不包含0。隐私关注和感知风险与披露意愿间均为弱相关关系,隐私关注与披露意愿间的相关强度大于感知风险与披露意愿间的相关强度。感知收益与披露意愿间的相关系数为0.452,效应值的95%置信区间为[0.343,0.550],不包含0;个性化服务与披露意愿间的相关系数为0.401,效应值的95%置信区间为[0.326,0.470],不包含0;信任与披露意愿间的相关系数为0.368,效应值的95%置信区间为[0.229,0.432],不包含0;主观规范与披露意愿间的相关系数为0.340,效应值的95%置信区间为[0.164,0.496],不包含0;感知控制与披露意愿间的相关系数为0.321,效应值的95%置信区间为[0.229,0.407],不包含0。感知收益、个性化服务、信任、主观规范和感知控制与披露意愿间均为中度相关,其中感知收益与披露意愿间的相关性最强。
3.4 调节效应检验
情境、测量指标和测量工具等因素往往对不同研究间相同问题研究结果的差异起到调节作用[28],有研究表明,不同情境下相同影响因素对用户隐私披露意愿的作用存在差异[29]。不同性别人群,各因素与披露意愿间相关强度存在差异,Sun Y等指出,男女的披露意愿分别受到感知收益和隐私风险更大程度的影响[30];臧国全等也指出,性别对自我披露意愿存在显著影响[31]。本研究将平台类型和性别作为调节变量,分别利用亚组分析和元回归分析对各自变量与披露意愿间是否受到调节变量的显著影响进行检验,根据文献内容和各平台对个人信息收集的敏感程度将平台类型划分为综合类平台和健康类平台,其中综合类平台包括社交媒体、电商网站、学习社区等除健康社区以外以及在文中未明确表明功能类型的平台。利用亚组分析对平台类型的调节作用进行检验,结果如表4所示。从表中结果可以看出,平台类型对感知控制、感知风险、感知收益、主观规范等与披露意愿间的作用关系有显著影响,对隐私关注、信任和个性化服务与披露意愿间的作用关系影响则不显著。
表4 平台类型作为调节变量的分析结果
通过元回归分析对性别在各自变量与披露意愿间是否起到调节作用进行显著性检验,结果如表5所示。从表中结果可以看出,性别可以显著调节各变量与披露意愿间的关系。男性占比对各变量效应值的回归系数均显著(P<0.05),男性占比越高,隐私关注、感知风险与披露意愿间的相关系数越低,个性化服务、感知控制、感知收益、信任和主观规范等与披露意愿间的相关系数越高。
表5 性别作为调节变量的分析结果
3.5 发表偏倚检验
在进行元分析时,还需要对各变量效应值进行发表偏倚检验,以避免由于发表偏倚导致元分析结果的偏差。本研究先基于漏斗图对各变量是否存在发表偏倚进行主观视觉判断,后通过Egger线性回归、失效安全数及Trim&Fill检验相结合对变量是否存在发表偏倚进行客观定量判断,结果如表6所示。从Egger线性回归分析结果可以看出,隐私关注和主观规范回归结果显著(P<0.05),表明隐私关注和主观规范与披露意愿间的相关性研究存在发表偏倚,其漏斗图分别如图2和图3所示。失效安全数通常被用来判断发表偏倚对主效应检验结果的影响程度,失效安全系数与5k+10(其中k为某一变量纳入的独立样本数)间的比值越大,则表明发表偏倚对元分析结果的影响越有限[14]。由表6中数据计算可知,隐私关注和主观规范的失效安全系数远大于5k+10,表明虽然存在发表偏倚,但对元分析结果的影响程度十分有限,分析结果受到发表偏倚影响的可能性较低。利用Trim&Fill进行发表偏倚检验,对比剪补前后效应值的大小,如果剪补前后效应值大小差异较大,但最终结果未发生本质性改变,那么则可以认为发表偏倚误差仍在合理范围之内[32]。对隐私关注和主观规范进行Trim&Fill检验,隐私关注向右剪补7项后r值调整为-0.093;主观规范向左剪补1项后r值调整为0.261,表明发表偏倚可以接受。
图2 隐私关注效应值发表偏倚
图3 主观规范效应值发表偏倚
表6 发表偏倚分析结果
4 结果分析
4.1 影响因素及其影响强度
本研究对筛选后的46项研究进行了元分析,研究结果表明,在本研究所纳入的变量中,隐私关注和感知风险与网络用户个人信息披露意愿呈负相关,其余变量与披露意愿均呈正相关关系。其中感知收益、个性化服务和隐私关注与披露意愿间的相关性最强,其次为感知风险、信任和感知控制,主观规范对披露意愿的影响强度最弱。各因素与披露意愿间的相关系数如图4所示。
图4 个人信息披露意愿影响因素及关系强度
元分析结果表明,感知收益是影响网络用户个人信息披露意愿最为关键的因素,该结果符合隐私计算理论的观点,与李纲等的研究结果相符[33]。感知收益是指网络用户对信息披露的一种预期收益,如个人形象[34]、便利性[35]等。Forman C等[36]的研究发现,对平台的依恋是用户选择披露的重要原因,当用户感知披露个人信息能获得较高的收益时,大部分用户会为了信息披露带来的收益而选择披露部分个人信息。感知风险与披露意愿间的相关性最弱,这一结果虽出乎意料,但也可以解释。感知风险与用户个人信息披露意愿间关系强度可能受到用户披露信息的敏感程度及信任等因素的调节,以及用户可能无法预判隐私泄露所带来的危害,往往会为了享受更多的增值服务而选择披露信息[37]。后续研究应依据披露信息的敏感程度对信息进行分类,以加强对信息敏感程度在各影响因素与披露意愿间的调节作用的探究。
以往关于隐私披露意愿的研究多从用户感知角度出发,且采用的数据收集方法多以问卷调查为主。在后续研究中可结合情景实验或借助眼动仪等交互设备获取更为客观的实验数据,从心理学视角挖掘影响用户个人信息披露意愿的深层次原因。
4.2 调节作用分析
通过亚组分析和元回归分析发现,平台类型和性别差异可以解释不同研究间某些自变量与披露意愿间研究结果的异质性,平台类型作为调节变量会对某些自变量与披露意愿间的相关性强度产生影响。平台类型对感知风险、感知控制、感知收益和主观规范与用户信息披露意愿间的调节作用显著(P<0.05)。与综合类平台相比,健康类平台中感知风险对用户披露意愿的负向作用更强。用户在综合类平台上披露的往往为人口统计类等非敏感信息,用户不会对披露此类信息产生较强的风险感知。不同于社交媒体、办公网站以及电商平台等情境,健康类平台所披露的信息多为用户医疗记录等敏感信息[37],披露这一类信息可能会给用户造成尴尬的处境或为生活增加额外的风险,因此用户对披露这一类信息的风险感知会更强,从而降低其信息披露的意愿。健康类平台上用户的主观规范和感知控制与用户信息披露意愿的正向作用更强,表明相较于综合类平台,健康类平台上的用户信息披露意愿更容易受到他人的影响[38],当健康类平台上的用户感知其对个人信息的掌控权较强时,其更愿意披露个人信息。相较于健康类平台,综合类平台上用户感知收益与用户信息披露意愿间的相关性更强。综合类平台披露的信息往往为敏感性较弱的信息,用户通常会愿意为了交友或获得更好的服务而选择披露个人信息。隐私关注、信任和个性化服务在两类平台上对用户信息披露意愿间的作用效果不存在显著差异,即平台类型在这3类变量与披露意愿间的调节效应不显著。
对性别在各自变量与因变量间的调节效应检验结果表明,性别对各变量与披露意愿的调节作用均显著,男性用户对隐私的关注度和隐私披露风险的感知程度明显低于女性,且男性用户更愿意为了体验个性化的服务而选择披露个人信息。Külcü Ö等也表明,不同性别的用户对隐私关注的程度存在差异,本文的研究结果也再次从侧面印证了这一观点[39]。男性占比越高,感知控制、感知收益、信任和主观规范等与披露意愿间的相关系数越高,可以看出男性对于在网络上披露个人信息的风险意识明显低于女性,这一结果也验证了余建华等的结论[40]。
5 总结展望
本研究利用元分析对网络用户个人信息披露意愿影响因素进行了探究,探讨了隐私关注、感知控制、感知风险、感知收益、主观规范、信任和个性化服务7个变量与披露意愿间的关系强度和可能存在的调节效应,得到了各变量与个人信息披露意愿间的明确关系,为之前变量相似却结果各异的研究找出了统一的结论。研究结果发现,感知收益、个性化服务、信任、主观规范和感知控制与披露意愿间均呈中度正相关,其中感知收益对披露意愿的作用最强;隐私关注和感知风险与披露意愿间均为弱相关关系,且感知风险负向作用更低。本研究还发现,平台类型在感知控制、感知风险、感知收益、主观规范等因素与披露意愿间起到调节作用,而在隐私关注、信任和个性化服务与披露意愿间的调节作用不显著;性别在各变量与披露意愿间均起到调节作用,男性占比越高,隐私关注、感知风险与披露意愿间的相关系数越低,个性化服务、感知收益、感知控制、信任和主观规范与披露意愿间的相关系数越高。本文的研究结果为后续的量化分析提供了更进一步细致分析的参考,对普适性网络用户个人信息披露意愿影响因素模型的构建具有重要的理论参考意义,同时也为各网络平台的运营提供了理论支撑,对相关平台优化设计具有显著的实践参考价值。
然而,本研究也存在一定的局限性。由于样本文献研究内容限制,本研究暂时只对平台类型与性别在各变量间的调节效应进行了检验,且由于亚组分析时个别亚组之间效应值个数差异较大,这可能会对研究结果产生一定的影响,未来待资料丰富后可进一步确认本研究的亚组分析结果是否稳健。同时,通过元分析得到的结果仅能证明各自变量与披露意愿间的线性相关性,并不能揭示其与披露意愿间的因果关系,未来研究可进一步探究各变量与披露意愿间的动态规律。