双重感知视角下的社交媒体类APP隐私政策内容分析及优化策略研究
2022-10-08卞淑莹杨健清
朱 光 卞淑莹 杨健清
(1.南京信息工程大学管理工程学院,江苏 南京 210044; 2.南京信息工程大学自贸区研究院,江苏 南京 210044)
随着无线通信技术的发展以及移动终端设备的广泛应用,微博、抖音、Instagram、Twitter等社交媒体类APP为用户提供了网络交际和信息分享的渠道,成为大众日常生活中必不可少的一部分。然而,社交媒体APP为提供精准的个性化服务和广告营销,需获取用户手机的诸多权限(如录音、摄像、地理位置)并长期采集用户的使用行为,导致用户不知晓也未授权的个人数据被采集和使用等问题,增加了隐私泄露的风险[1]。
为防止APP过度索取无关权限、恶意访问用户隐私数据等行为,各国(地区)都出台了相关法律法规,对个人信息使用的途径、范围、目的进行了明确规定。2013年,我国发布的《电信和互联网用户个人信息保护规定》指出,电信业务经营者、互联网信息服务提供者应制定隐私政策,其内容应当包括收集、使用信息的目的、方式和范围,查询、更正信息的渠道以及拒绝提供信息的后果等事项[2]。2018年,欧盟出台的《通用数据保护条例》(General Data Protection Regulation,GDPR)在赋予用户处理自身数据更多权限的同时,也提升了企业对用户数据收集、存储和使用的标准[3]。2020年,网信办发布了《常见类型移动互联网应用程序(APP)必要个人信息范围(征求意见稿)》,对各类互联网平台和APP的个人信息收集范围做出界定,以保障公民个人信息安全[4]。在此背景下,众多社交媒体类APP纷纷制定了个人信息保护政策、个人信息使用说明、隐私保护协议、隐私保护指引等隐私政策[5-6]。
然而,现实情境下的隐私政策仍存在主题缺失、内容隐晦、结构混乱等问题,用户为了APP的正常使用通常不会仔细阅读隐私政策,并不真正了解哪些个人信息会被搜集与使用[7]。2021年5月,网信办发现有33款APP在出台隐私政策的同时,仍会违规收集个人隐私信息[8]。2022年1月,工信部指出30余款社交媒体类APP的隐私政策存在内容表述不清、晦涩难懂等问题[9]。因此,如何完善隐私政策的规范性、全面性和可读性成为业界和学界越发关注的问题。
基于上述背景,本文以社交媒体类APP隐私政策为研究对象,引入技术接受模型(Technology Acceptance Model,TAM)从感知易用性和感知有用性两个维度研究社交媒体类APP隐私政策的文本内容并提出优化建议。首先从感知易用性角度,对隐私政策的文本可读性进行测度,探寻其对用户阅读意愿的影响。进一步从感知有用性角度,运用LDA(Latent Dirichlet Allocation)模型识别隐私政策主题,归纳成类别条目与国内外相关法律对比,找出存在的问题,提出优化建议。
1 国内外研究现状
隐私政策是指互联网环境下各类网站、软件以及APP就如何收集和使用个人信息所做出的说明与解释,其制定与完善对规范个人信息利用有着重要的意义[10]。然而,皮尤研究中心的调查显示,只有约9%的用户表示在使用APP或软件之前会阅读隐私政策[11]。针对隐私政策的阅读意愿问题,Steinfeld N[12]发现,当隐私政策全文显示时,用户会选择花费较多时间阅读全文;而当政策以折叠选项的方式呈现时,用户并不倾向于点开链接自愿阅读。Singh R I等[13]从隐私政策的外观呈现方面,发现字体大小、排版格式、背景颜色等因素会影响用户阅读意愿。Vail M W等[14]从文本结构维度,发现层次化的隐私政策内容比其他表现形式更能提升用户的阅读意愿。朱侯等[15]从个人信息搜集、信息安全、用户权利、联系与申诉途径等方面对社交媒体隐私政策内容的可读性特征进行了统计,验证了可读性对用户阅读意愿会产生正向影响的结论。朱光等[16]基于技术接受模型和自我效能理论,从用户主观感知和隐私政策的内容特征两个维度分析主观规范、信息质量、信息过载、自我效能、感知易用性、感知有用性、经验等因素对社交媒体隐私政策阅读意愿的影响。张玥等[17]基于认知负荷理论,采用虚拟实验和多因素方差分析测评了用户在阅读不同类型隐私政策时的主观认知负荷以及客观成绩,从而进一步研究信息表征对移动医疗APP隐私政策阅读意愿和阅读效果的影响。
为提升用户的阅读意愿,研究学者运用内容分析法和比较分析法,分析不同类型隐私政策的文本特征,比较主题差异,提出优化方案。袁红等[18]以政务APP的隐私政策文本为研究对象,运用内容分析法从外部特征和文本内容两个维度分析其存在的问题。储节旺等[19]以美国政府开放数据的相关政策文本为数据来源,运用NVivo文本分析工具,对政策文本进行内容多层编码分析,梳理美国政府开放数据隐私保护框架。何培育等[20]以微信、淘宝等10款常用的APP为研究对象,对其隐私政策内容进行定性梳理与归纳,并提出完善建议。严炜炜等[21]以在线学术社区的隐私政策框架内容为研究对象,从信息管理、技术安全、用户权利、责任意识、基础功能和高级功能等维度提出了完善思路和优化路径。Martiny K等[22]运用文本挖掘技术分析上百个隐私政策的摘要内容,帮助用户了解其结构与主题。Kaur J等[23]收集2 000多例不同类型的网站、软件和APP的隐私政策,运用LDA模型对政策文本进行主题识别,结果显示,所在地的法律法规对隐私政策的术语和关键词具有显著影响。Strahilevitz L J等[24]从隐私政策的语言描述和句法结构层面,分析了法官和消费者在法律层面对于隐私政策理解的差异性。
针对隐私政策的规范性、友好性、全面性等测评指标,赵杨等[25]以医疗健康APP的隐私政策文本为研究对象,综合运用卷积神经网络、循环神经网络和长短期记忆人工神经网络进行隐私政策合规性的测评。张艳丰等[26]以10款短视频APP为研究对象,从政策表征、信息收集与存储、信息使用与分享、用户权利、隐私保护这5个维度构建隐私政策的评价指标体系,进一步利用灰色加权关联分析法对隐私政策的阅读感知性进行关联度计算。姚胜译等[27]以电子商务类APP的隐私政策文本为研究对象,运用层次分析法,从内容可读性和交互友好性两个维度构建了多层级的隐私政策的友好度评价指标体系。周林兴等[28]以我国78个档案网站为研究对象,对其是否设有隐私政策以及隐私政策的形式、内容进行调研。调研结果显示,我国档案网站的隐私政策规范性不足,内容有待进一步健全。Chang Y等[29]提出了隐私边界评价模型,从信息公平等5个维度评估用户对隐私政策的感知有用性和感知易用性。Aïmeur E等[30]从隐私政策的个性化结构和文本内容两个维度,分析了网站隐私政策与用户信任之间的关系。
整体来看,现有研究大多关注隐私政策的阅读行为、内容分析及评价指标等方面,少有研究结合呈现形式和主题类别两个层面对隐私政策进行内容分析,也缺少与国内外相关法律制度的对比分析。基于此,本文引入TAM模型综合考虑隐私政策的感知易用性和感知有用性,运用文本可读性分析和LDA主题识别,从呈现形式和内容主题两方面研究社交媒体隐私政策的优化问题。
2 研究设计
TAM模型用来研究用户接受信息系统或IT技术的影响因素,主要从感知有用性和感知易用性两个维度分析行为态度、使用意愿和实际行为三者之间的关系[31]。基于此,一方面,若社交媒体类APP的隐私政策内容全面、主题规范,可以满足用户的隐私保护、心理感知及社交匿名等需求,则用户的感知有用性较强,隐私政策发挥的效果更好;另一方面,若隐私政策内容逻辑清晰,简明易懂,则用户感知易用性较强,可以引导用户深入阅读,让其了解其个人信息采集和使用的准则。
基于上述分析,本文从感知有用性和感知易用性两个维度对隐私政策内容进行分析。一方面,利用LDA模型识别隐私政策主题,并与国内外知名法规进行对比以分析其感知有用性;另一方面,设计政策可读性指标对感知易用性进行测评。在此基础上,提出社交媒体类APP的隐私政策优化方案。
2.1 数据采集与预处理
本文基于小米应用商店排行榜(2022年2月28日),选择累计下载量在1亿次以上的33款社交媒体类APP(包括微博、微信、知乎、抖音等)作为研究样本,采用网络爬虫与人工下载相结合的方式获取隐私政策文本。剔除文本内容相似和未能正确采集的部分,最终得到30款社交媒体类APP隐私政策文本,如表1所示,文本总字数约46万字。
表1 30款社交媒体类APP隐私政策概况
图1 研究流程
为便于后续LDA主题识别和文本可读性分析,需要对采集文本进行预处理,步骤如下:
1)数据清洗。对隐私政策文本中的标点、无意义数字和符号进行清洗过滤,如标题序号“一”“(1)”“1.1”等。
2)文本分词。采用Jieba分词包对隐私政策文本进行分词处理,并依据《中华人民共和国个人信息保护法》《中华人民共和国网络安全法》以及《信息安全技术 个人信息安全规范》(GB/T35273-2020)中的术语解释构建词典,对分词结果进行停用词处理。
3)特征提取。对分词后的隐私政策文本进行TF和TF-IDF特征提取,选取相对较优的特征作为LDA主题模型的输入参数。
4)文本向量化处理。采用Gensim包中封装的Doc2bow方法进行文本向量化处理,过滤文本中出现频率过高或过低的词语,以保证LDA主题识别的效果。
2.2 隐私政策的可读性测度
在隐私政策文本中,突出重点的标题设置、条理清晰的段落划分以及便于阅读的整体排版都将大幅提升用户的阅读体验,从而提升用户对隐私政策的阅读意愿[32]。结合前人关于文本可读性的研究以及隐私政策文本结构的独特性[33],本文选取命名方式、小标题数量、导语、文本篇幅、术语密度、平均句长6个指标对社交媒体类APP隐私政策的可读性进行测评,以探究隐私政策的感知易用性情况。指标描述如表2所示。
表2 隐私政策文本可读性测评指标
表2(续)
其中,术语密度的计算公式如下:
(1)
平均句长的计算公式如下:
(2)
2.3 隐私政策主题识别
与传统文本分析方法相比,LDA主题模型克服了文本矩阵稀疏、语义缺失等诸多缺陷,常用来识别各类文本中隐含的主题状况[34]。基于此,本文利用LDA主题模型对社交媒体类APP的隐私政策文本进行主题识别,并将结果作为与国内外知名法规进行主题对比的依据,以探寻现有社交媒体隐私政策文本的感知有用性。
LDA模型认为文档到主题服从多项式分布,主题到关键词也服从多项式分布,其核心结构是由词、主题和文档组成的3层贝叶斯模型[35],如图2所示。
图2 LDA主题模型结构
其中,θ表示主题分布,φ表示关键词分布,α是主题分布θ的Dirichlet分布参数,β是关键词分布φ的先验分布参数,w表示模型最终生成的关键词,z表示模型生成的主题。LDA主题模型的联合概率分布如式(3)所示[36]:
(3)
3 结果与讨论
3.1 关键词统计
对30款社交媒体类APP的隐私政策文本进行分词,排序前20的关键词词频统计如表3所示,得到4 499个词汇共出现106 178次。“信息”“个人信息”“服务”“提供”“收集”等关键词出现的频率最高,反映出现有APP隐私政策大多针对用户个人信息的收集进行规定和解释。此外,“第三方”“设备”“授权”“设置”“权限”等高频词说明了APP对用户移动设备通话、录音、摄像、存储等权限的获取,若隐私政策含糊其词或用户没有仔细阅读,极有可能造成未经授权的隐私泄露。
表3 词频统计结果
3.2 可读性分析
为分析社交媒体类APP隐私政策的感知易用性,在关键词统计的基础上,对政策文本的可读性进行测评,部分结果如表4所示。具体分析如下:
表4 社交媒体类APP隐私政策可读性分析结果(部分)
1)命名方式。共有14款社交媒体类APP直接以“隐私政策”作为标题,占比达46.7%;7款社交媒体类APP的隐私政策标题为“隐私保护指引”,占比23.3%,主要为腾讯系应用;3款社交媒体类APP的隐私政策相关内容以“个人信息保护政策”为标题,占比10%;此外还有部分隐私政策的命名为“隐私权政策”(3款)、“个人信息保护指引”(1款)、“隐私权保护政策”(1款)、“用户隐私政策”(1款)。整体来看,有26款社交媒体类APP的隐私政策在标题表述中直接提及了“隐私”字样,占比超过86.7%。由于在标题中突出了“隐私保护”“隐私策略”“个人信息保护”等关键字样,用户能够较为直观地定位阅读入口,并初步了解隐私政策的作用。
2)小标题数量。小标题可以体现隐私政策文本的层次结构,但小标题数量过多也会增加用户的阅读负担,降低感知易用性[37]。从小标题数量上看,社交媒体类APP隐私政策的小标题数量均在10个左右,其中最少的是8个,包括“淘特”“京喜”“平安健康”“优酷”“抖音”“钉钉”6款应用,最多的应用是“哔哩哔哩”,共有13个小标题。
3)导语。导语的设置便于用户第一时间获得隐私政策的总体信息,本文选取的30款社交媒体类APP隐私政策均在开头设置了导语,但在导语的具体内容上存在很大差异,“微信”“QQ”等腾讯系应用在导语中对隐私政策的全文内容进行了概括,方便用户及时获取所关注的相关信息,而“秒拍”等APP只是简单地进行了目录和框架介绍。
4)文本篇幅。隐私政策的文本篇幅如果过短则难以传达完整的信息,过于冗长又会增加用户的阅读难度。不同社交媒体类APP隐私政策的篇幅差异较大,篇幅最短的是“QQ空间”,政策全文共6 560字;篇幅最长的是“芒果TV”,隐私政策全文达到26 755字。总体上看,大多数社交媒体类APP隐私政策的文本篇幅都超过1万字(93.3%),这与朱侯等关于社交媒体隐私政策篇幅集中在4 000~8 000字的结论差别较大[38]。该分析结果表明,随着个人信息保护法律法规的不断完善,以及公众隐私保护意识的提高,社交媒体运营商在制定隐私政策条款时内容更加具体,完整性较之前有了较大提升。
5)术语密度。30款社交媒体类APP隐私政策的术语密度均集中在4%~10%之间,其中密度较高的是“QQ空间”(9.596%)和“陌陌”(9.474%)。“QQ空间”由于文本篇幅较短,导致术语密度高,而“陌陌”的文本篇幅在1万字以上,专业术语密度明显偏多,会显著降低用户的感知易用性。“抖音”(4.024%)和“钉钉”(4.439%)的术语密度较低,而下载量和使用度最高的“微信”的术语密度为5.385%。
6)平均句长。相关研究表明,汉语单句的最佳长度应控制在12字以内,超过此长度则会带来阅读上的困难[39]。本文选取的30款社交媒体类APP隐私政策的平均句长在5~11字,没有出现明显长难句的情形。值得注意的是,“陌陌”的术语密度(9.474%)和平均句长(10.290)两项均较高,其隐私政策可读性较低。
整体来看,30款社交媒体类APP的隐私政策在命名方式上均做到直观明了,便于用户快速定位,也设置了导语和一定数量的小标题,使得隐私政策的重点突出、结构分明。然而,不同APP的隐私政策可读性还存在较大差异,部分隐私政策存在导语内容敷衍、文本篇幅不妥、术语占比较高等问题,导致了政策文本可读性和用户阅读意愿的下降。
3.3 主题识别
3.3.1 停用词去除
从表3看出,“信息”“个人信息”“服务”“提供”“收集”等高频词属于隐私政策文本中的常见词汇,广泛存在于隐私政策全文各处。若直接提取其向量特征作为LDA模型的输入参数,易导致出现大量的重复、无效词汇,影响主题识别效果。因此,为尽量减少常见高频词对LDA主题识别的干扰,本文首先采用去除局部停用词的方法,将隐私政策文本中的常见高频词去除。
3.3.2 向量特征提取与主题数确定
LDA主题模型是一种无监督学习模型,本文选用主题一致性(Coherence)得分作为衡量模型优劣和确定主题数的依据,主题一致性得分越高,表示该主题模型效果越好。设定模型迭代次数为200,分别基于TF和TF-IDF特征绘制的主题一致性得分分布图,结果如图3所示,其中横坐标表示主题数,纵坐标表示主题一致性得分。可以看出,将TF-IDF特征作为LDA模型的输入参数,其识别效果在不同主题数下均好于TF特征。因此,本文基于TF-IDF特征进行LDA主题识别,并根据主题一致性得分的极大值点设定最优主题数为13。
图3 TF/TF-IDF方法对LDA建模影响
3.3.3 可视化与结果分析
基于最优主题数,利用可视化工具包pyLDAvis对所构建的LDA主题模型进行可视化建模,结果如图4所示。图4左侧以二维坐标的形式展示了不
图4 LDA模型的可视化建模
同主题之间的相关程度,圆圈大小表示包含该主题的文本在整篇文档之中的占比。右侧条形图是展示当前主题下前30个关键词的频率分布情况,其中蓝色条块体现为整篇文档中的关键词频率,红色条块体现为当前主题中的关键词频率。主题识别及关键词分布结果如表5所示。结合图4的可视化结果,本文将13个政策主题进行归纳与合并,整理得到6个类别,分别是隐私政策概述、用户权利、运营商义务、运营商行为、数据存储与共享、法律保护和监管。
表5 社交媒体类APP隐私政策的主题识别结果及关键词分布
表5(续)
1)类别1——用户权利。在图4中,主题1与主题6、主题10之间存在一定的重叠。从关键词分布来看,主题1的主要内容是对用户权利主体进行界定,偏向于对用户权利的概述性说明。主题6的关键词包括“麦克风”“相册”“照片”等,主要是对APP所需权限的说明与解释,体现用户知情权。主题10的关键词体现了用户对APP的拒绝权利,如“注销”“取消”“拒绝”等词,对应用户拒绝权。因此,主题1、主题6和主题10可合并概括为用户权利。
2)类别2——隐私政策概述。从图4可以看出,主题2与主题3、主题11存在一定的重叠。从关键词分布来看,上述3个主题都属于隐私政策的概括性表述,但在具体内容上又各有侧重。主题2对要获取的数据进行了简单概述,关键词包括“请求”“业务功能”“手机号码”等。主题3侧重于争端出现与解决方面,关键词包括“违反”“争议”“地址”等。主题11对未来可能发生的变更与修改进行了概述性说明,关键词包括“修改”“发生变化”“通知”等。各主题虽然侧重点不同,但在具体内容上均呈现概述形式,较少涉及细节,因此,将主题2、主题3和主题11合并以隐私政策概述作为概括。
3)类别3——运营商行为。从可视化结果上看,主题5较独立,单独处于一个区间,关键词包括“人脸”“指纹”“身份证”“匿名化”等,均是指向性非常明确的细节词语,与用户敏感数据,尤其是生物特征数据紧密关联。从图4上看,主题7和主题12存在一定重叠,主题7的内容偏向于网络服务、Cookie、登录账号等,主题12的关键词偏向个性化服务(访问、视频、分享等),二者都属于运营商主体下的行为活动,而主题5对敏感数据的访问和使用处理同样也可以归至运营商行为。因此,将主题5、主题7和主题12合并概括为运营商行为。
4)类别4——数据存储与共享。从可视化结果来看,主题8和主题9同处于一个区间。主题8的关键词包括“境内”“备份”“跨境”等,属于数据共享的主题内容,偏向对数据跨境流动做出规定。主题9的关键词“第三方”“合作方”“保存”“存储”等,更多涉及数据在运营商与第三方之间的共享。因此,将主题8和主题9合并为数据存储与共享。
5)类别5——法律保护和监管。主题13的关键词多涉及法律和制度层面,包括“法律法规”“国家”“遵守”等,因此,将其归至法律保护和监管类别。
6)类别6——运营商义务。主题4的关键词包括“记录”“查询”“用途”等,与运营商应承担的义务相关,因此将其归至运营商义务类别。
3.4 主题对比分析
为分析社交媒体类APP隐私政策在主题上的全面性和规范性,本文将政策文本的主题识别结果与国内外知名法律法规进行对比,以期找出现有隐私政策的疏漏与不足之处。对比分析的对象选取《中华人民共和国个人信息保护法》(下称《个人信息保护法》)和欧盟颁布的《通用数据保护条例》(General Data Protection Regulation,GDPR)。
3.4.1 与《个人信息保护法》的对比结果
《个人信息保护法》于2021年11月1日正式施行,对处理个人信息主体的权责、信息跨境流动规则、个人信息保护与监管等方面都做出了顶层设计,具体内容主要包括信息处理规则、信息跨境流动规则、用户权利、运营商义务、部门监管和法律责任6个纲目。本文选取的30款社交媒体类APP的隐私政策主题与《个人信息保护法》内容纲目的对比结果如图5所示。可以看出,《个人信息保护法》所规定的相关内容在隐私政策中均有所涉及,但在内容完整性和规范性上还有所差异,具体分析如下:
图5 社交媒体类APP的隐私政策主题与《个人信息保护法》内容纲目的对比
1)从具体内容上来看,《个人信息保护法》对个人信息处理和使用的多个情境都进行了具体说明和规则限制,而本文识别的隐私政策主题关于这部分内容没有详细的阐述,部分政策文本也没有提及有关同意撤回、紧急情况下信息使用等方面的信息处理规则。
2)在信息跨境流动规则方面,《个人信息保护法》对个人隐私数据跨境流动的安全评估及信息保护均做出了明确的规定,并列举了不得提供信息的情境,而现有隐私政策主题中在信息跨境流动方面仍属于概述型描述,缺少详细说明。
3)在个人用户权利界定方面,现有隐私政策对用户权利的界定和描述大多还停留在概述性文字上,但《个人信息保护法》对用户知情权、拒绝权等众多权利都有着详细的定义和描述,并且就个人向信息使用者和信息处理者提出合理要求的各种情况也有详细阐述,上述内容在现有隐私政策中还处于严重欠缺状态,这也是导致社交媒体隐私泄露和监管不力的根本原因。
4)在信息处理者的义务方面,现有社交媒体类APP的隐私政策依然存在内容完整性不足的问题。比如《个人信息保护法》对个人信息保护评估的需求和内容均做出了明确的阐释,但大部分的隐私政策却鲜有体现。此外,《个人信息保护法》对个人信息泄露、篡改以及丢失时所需要采取的补救措施做出了明确要求,并规定必须落实到责任人或责任部门,而现有隐私政策在此方面大多为概述性文字,没有针对性的操作解释。
5)在法律责任与处罚方面,《个人信息保护法》的内容纲目与30款社交媒体类APP的隐私政策主题大体相同,考虑到法律法规和隐私政策的发布主体不同,这里不做详细对比分析。
3.4.2 与GDPR的对比结果
GDPR对用户数据收集、存储、保护和使用的标准进行了界定,赋予了用户对自身数据更大的操作权限,其内容纲目包括条例原则、数据处理权利、数据处理者、数据分享与跨境流动、监管机构体系、责任与处罚措施等内容。本文选取的30款社交媒体类APP的隐私政策主题与GDPR内容纲目的对比结果如图6所示,可以看出GDPR对生命周期视角下数据处理的全流程进行了清晰而详细的规定,对应主题上现有隐私政策虽有涉及,但在内容阐述和表现形式上仍有较大差异,具体分析如下:
图6 社交媒体类APP的隐私政策主题与GDPR内容纲目的对比
1)在数据主体权利方面,GDPR详细规定了如何行使数据主体权利的步骤和模式,并具体阐述了访问权、更正权、收集权、擦除权、限制处理权、数据携带权等各项权利的详细内容与适用情境。在隐私政策主题中,对用户权利的具体划分远不如GDPR清晰、详细,这也导致了用户社交数据的使用失控及隐私侵犯。
2)在数据处理者方面,GDPR规定数据处理者所“操作”的数据范围并非控制者所拥有的全部数据,而是其中为满足使用目的所必须的部分数据,需满足最小特权原则。因此,在数据控制者未明确授权处理全部数据的前提下,数据处理者不得对任何逾越使用目的的其他数据进行任何处理。然而,现有社交媒体类APP的隐私政策对数据使用范围与时限甚少涉及,即使有所介绍,但用户不同意该规则便无法正常使用APP,导致政策并无实际效果。
3)在数据分享与跨境流动方面,用户身份、地理位置、网络习惯等社交媒体数据的严格管控和合理利用对国家数据安全十分重要。GDPR对数据主权、数据本地化及数据出入境均做出了明确的规定,并对特殊情形进行了补充说明,而现有社交媒体类APP的隐私政策在这一部分几乎是空白。
4)在监管机构体系、责任与处罚措施方面,考虑到监管主体及适用法律的差异性,这里不做详细对比。
3.5 存在问题与优化策略
3.5.1 存在问题
通过对30款社交媒体类APP隐私政策的可读性分析与主题识别,可以发现当前隐私政策的制定总体上呈现不断完善的趋势,但仍存在诸如完整性不足、针对性不强、可读性不高等问题。
1)完整性不足。从LDA主题识别与相关法律法规的对比结果来看,现有社交媒体类APP隐私政策所涵盖的主题比较全面,但在具体的文字表述和内容解释上,仍存在完整性不足的情况。①用户权利沦为“查改删”。用户权利保障作为个人信息保护的重要组成部分,部分隐私政策只提及“查阅”“更正”“复制”“删除”的权利,而对用户知情权、决定权以及转移权等缺乏相关说明,在何种情形下可要求运营商删除个人信息也缺乏场景列举;②运营商的数据保护义务“空口无凭”。大多数社交媒体类APP隐私政策都会提及“保证用户的信息安全”,却鲜有提出针对性的解决方案和措施,内部管理制度和操作规程不透明,需要采用的安全技术措施也缺少详细说明,部分隐私政策甚至对可能发生的个人信息泄露等安全事件无预案说明;③信息存储和共享机制不够透明。信息存储的类型、地点、期限缺少详细说明,哪些用户数据会被第三方共享、哪些数据涉及跨境流动缺少具体列举,隐私政策中的信息存储共享相关内容总体还停留在文字性概述。
2)针对性不强。从主题识别结果来看,不同类型社交媒体类APP的隐私政策主题大同小异,缺乏针对性。比如聊天社交类APP(如“微信”)、社区社交类APP(如“豆瓣”)、自媒体平台类APP(如“哔哩哔哩”)缺乏基于自身平台特点的差异化表述,隐私政策的主题内容和文本表述相似度较高,部分段落、语句甚至出现明显雷同。
3)可读性不高。隐私政策可读性不高会导致其感知易用性大大降低,并影响用户的阅读意愿。部分社交媒体APP(如“芒果TV”“哔哩哔哩”)隐私政策的篇幅明显过长,需要耗费用户大量的阅读时间。此外,部分APP(如“秒拍”)隐私政策的导语部分流于形式,未能起到帮助用户快速掌握全文要点以及辅助阅读的效果。还有部分APP(如“陌陌”)隐私政策的专业术语过多,给用户理解政策内容带来较大难度。
3.5.2 优化策略
针对上述问题,本文从内容完整性、条款针对性和文本可读性3个方面提出优化建议。
1)对标法律法规,改进内容完整性。我国在个人信息保护方面已陆续制定了相关法律制度,立法层面的不断完善为社交媒体类APP的隐私政策改进提供了权威参照。①用户权利层面。结合《个人信息保护法》与GDPR的对比结果,现有隐私政策首先要在用户权利层面予以明确和充实,隐私政策中应将法律规定的用户在个人信息活动中所拥有的各项权利均予以明确说明,并同时给出情境列举,使用户通过阅读隐私政策,不仅能够全面了解自身有哪些权利,更能够清晰认识到自身在何种情况下可使用这些权利对个人信息进行保护;②运营商义务层面。运营商义务和用户权利应具有对等篇幅,需要在隐私政策文本中体现“权责对等”以及运营商履行义务的详细步骤,比如社交媒体运营方的内部管理制度和操作规程、发生信息安全问题时的应急方案、以及因个人信息保护出现问题时责任承担与处罚赔偿等方面的具体措施。同时考虑到文本可读性和逻辑结构的要求,在适当位置应用小标题突出标注;③数据共享与跨境流动层面。随着互联网、大数据、人工智能和实体经济的深度融合,数据作为基础性战略资源的重要性地位日益凸显,监管层对个人身份、地理位置、网络行为等信息的采集、利用以及跨境流动等方面已重点关注,相关法律和规定也在这方面做出了详细规定和要求,社交媒体类APP的隐私政策有必要对这一部分加以详细标注,在内容上明确阐述个人信息的存储和使用规则,以及有可能发生的信息共享和跨境流动情形,以保障用户对自身信息流动的知情权。
此外,考虑到社交媒体用户分布的全球性,隐私政策除了对标国内法律法规外,也需要借鉴多个国家(地区)的个人信息保护条款,进一步完善其内容的规范性和全面性。
2)立足应用特点,加强条款针对性。社交媒体类APP隐私政策的优化与完善要避免“泛泛而谈”的情形,参考国内外相关法律制度并不表示文本主题一定要趋同。社交媒体类APP根据其用途,可进一步划分为聊天类、博客类、问答社区类、社交电商类和短视频社交类等诸多领域,隐私政策应结合其应用领域加强条款针对性,力求重点突出。例如,针对聊天类APP,聊天记录的存储与信息安全有必要重点说明;针对短视频社交APP,隐私条款需要对人物图像等生物信息的安全保护进行针对性说明。社交电商类APP对支付账户、用户资产等隐私数据的利用与保护应着重阐述。
3)创新外在形式,提高文本可读性。隐私政策文本可读性的提升涉及多方面内容,主要包括:①隐私政策在篇幅上要做到合理控制,对无关内容(如产品介绍、功能特点等)应做到应减尽减,将篇幅留给隐私政策的主体内容,尽可能减少文字冗余;②避免导语内容流于形式。导语设置应立足于帮助用户快速领悟全文要点,并辅助用户快速查找自身关注信息,因此导语长度不宜过长,应做到简洁明确、重点突出;③尽量减少专业术语的使用,对确实有必要使用术语的段落,应在易于查找的部分标注,并予以详细的名词解释,最大程度降低用户的阅读难度。
4 结 语
本文基于TAM模型,从感知易用性和感知有用性两个维度对30款社交媒体类APP的隐私政策进行文本分析。针对隐私政策的感知易用性,从命名方式、小标题数量、文本篇幅等方面对隐私政策文本的可读性进行测评。针对隐私政策的感知有用性,运用LDA主题模型识别出用户权利、隐私政策概述、运营商行为、数据存储与共享、法律保护、监管与运营商义务6个类别的主题,并与国内外法律法规进行对比。研究结果发现,现有社交媒体类APP隐私政策存在完整性不足、针对性不强、可读性不高等问题,需要在用户权利、运营商业务、数据流动与跨境共享层面进一步完善内容,创新外在呈现形式,并根据APP类型的细分定位制定差异化的隐私政策。
本文选取下载量靠前的30款社交媒体类APP隐私政策文本作为研究对象,并没有涵盖使用人数较少的冷门社交媒体平台,在未来的研究中可以扩大样本范围。在研究方法层面,未来可以结合情境实验法、实证分析法对隐私政策的阅读意愿及规范性评价进行交叉比较研究。