大数据背景下图书馆用户个人信息及隐私保护对策
2019-01-20郭爽
郭 爽
(四川音乐学院图书馆,四川 成都 610021)
大数据时代,随着信息技术的高速发展,数据已成为社会生产和经济发展的关键要素,信息控制者可以充分利用数据,分析信息主体的行为习惯,成功预测其需求,并为之提供精准的定制化服务和产品;政府管理部门则可借助大数据技术以及对个人信息的统计分析,高效地制定公共政策。[1]
就图书馆而言,大数据技术作为推动图书馆服务模式和服务内容变革、提升自身核心竞争力和用户满意度的重要手段,被积极运用到图书馆的多项服务中。[2]图书馆通过监控、传感及移动设备、智能终端以及无线射频识别技术(RFID)、语义网、社交平台[3]等对用户的身份信息、社会关系、借阅记录、浏览及操作信息等加以追踪、记录、采集、整合,进而分析并挖掘出用户的行为习惯、阅读偏好、科研动向、服务需求甚至思想状况,实现对用户个人信息获取及服务需求的精准定位,为图书馆进一步开展个性化、精准化服务提供技术保障。
然而,大数据环境本身所具备的信息开放共享、传播迅速、反复利用等特征,也会不可避免地加大了信息泄露的风险。此外,大数据挖掘技术对用户个人信息的过度识别与分析,也给用户个人信息安全带来了新的威胁。因此在大数据背景下,理清图书馆用户个人信息的内涵,找出图书馆可能存在的用户个人信息泄露的风险点,并采取相应的措施保护用户隐私和合法权益,让用户在享受优质便捷服务的同时,既无须过度让渡自身的隐私权,也不必担忧隐私泄露问题,是图书馆亟待研究和解决的重要课题。
1 大数据背景下图书馆用户个人信息界定
由于我国目前尚无专门的个人信息保护法出台,因此可依据已有的与个人信息保护相关的法规、标准等对个人信息的概念有一个基本的了解。2012年工信部发布的被视为我国首部个人信息保护国家标准的《信息安全技术个人信息保护指南》认为,个人信息是“为信息系统所处理、与特定该自然人相关、能够单独或通过与其他信息结合识别该特定自然人的计算机数据”,同时将个人信息分为个人敏感信息和个人信息。由中国科学技术法学会、北京大学互联网法律中心于2014年3月15日发布的《互联网企业个人信息保护测评标准》对个人信息的界定是:“能够切实可行地单独或通过与其他信息结合识别特定用户身份的信息或信息集合,如姓名、出生日期、身份证号码、住址、电话号码、账号、密码等”。于2017年6月颁布实施的《网络安全法》第76条认为,个人信息即“以电子或其他方式记录的能够单独或者与其他信息结合识别自然人个人身份的各种信息,包括但不限于自然人的姓名、出生日期、身份证号码、个人生物识别信息、住址、电话号码等”。[1]由此可见,目前我国主要对个人信息给出定义的规范性文件和标准都将“可单独或通过与其他信息整合而识别出特定用户”作为了个人信息的核心要素。
基于此,在大数据背景下,图书馆用户所涉及到的个人信息不再限于传统意义上的个人信息,即姓名、出生日期、住址、手机号码、社交账号、密码、身份证号码等,还包括用户在访问和使用图书馆服务中被大数据挖掘和整合技术所识别和记录到的用户网页访问记录、访问时长、浏览内容、浏览设备、地理位置、聊天记录、通信内容等信息,以及通过数据分析管理平台进一步整合出来的用户知识背景、兴趣爱好、阅读偏好、消费习惯、行为习惯、信息需求、科研动态、位置变动、政治见解、思想状况等动态关联性数据。[4]
2 大数据背景下图书馆用户可能面临的个人信息泄露问题
由于图书馆拥有数量庞大、类型多样的用户信息数据,因此难免会涉及到因服务器遭受攻击、用户数据管理失当、信息防护措施不到位等而导致用户信息泄露并被非法利用的问题;也可能会发生图书馆购买服务或平台的第三方服务商在未经同意或授权的情况下,擅自开发使用图书馆用户数据的情况;可能会涉及到图书馆出于研究用户行为特征和服务习惯的目的,而过度采集、监控、挖掘用户行为数据,过分预测用户信息需求和行为模式,进而侵犯到用户隐私与合法权益的问题。上述情况一旦发生,就会对图书馆用户造成无法挽回的经济或精神损失,降低其对图书馆服务的满意度和信任度,导致图书馆信誉受损,不仅会引发用户流失,还可能会给图书馆带来法律风险。
3 大数据背景下图书馆用户个人信息保护策略
图书馆面对如此多的用户隐私泄露风险点,必须有所警觉。笔者认为可从制定用户个人隐私保护政策、完善个人信息监管体系,从技术层面加强保护以及培养图书馆员和用户数字素养能力等方面着手,堵住风险漏洞,防患于未然。
3.1 制定隐私政策,履行告知义务
《全国人大关于加强网络信息保护的决定》和《电信和物联网用户个人信息保护决定》中均要求网络服务提供者在收集用户个人信息前遵循知情同意原则,履行充分的告知义务。该原则在实践中最重要的体现形式之一就是制定隐私政策。图书馆为向用户提供更精准的服务,会利用大数据技术搜集用户的个人数据,在此背景下,图书馆遵守法律和行业规定制订相应的隐私指南,不仅有助于图书馆员自身明确用户个人信息收集、保存、使用等各个环节的运作情况和自身职责,彰显图书馆对用户隐私权的尊重,也能从一定程度上起到打消用户隐私泄露疑虑的作用,提升用户对图书馆的信任感。
据此,图书馆应在网站主页显著位置设置隐私政策(Privacy Policy)链接,采用逻辑清晰、表述简明、通俗易懂的方式罗列隐私条款,明确告知用户在使用图书馆服务或与图书馆产生交互行为时,图书馆会采取多种途径收集用户个人信息,但图书馆对搜集到的用户信息有责任和义务加以保护,防止个人信息遭受不当披露。其次,明确告知用户个人信息的搜集原则(即不会利用图书馆网站非法搜集或搜集与提升用户服务无关的用户个人信息)、搜集目的(用于改善服务质量,并为用户提供个性化服务)、搜集条件(图书馆网站注册、接受图书馆服务、与图书馆进行通信往来、费用支付或参与图书馆活动等)、搜集方式(包括Cookie、网络信标、链接、唯一标识符在内的各种追踪技术)、搜集内容(登录账号、密码、IP 地址、网页访问日期、浏览器类型等)。再者,告知图书馆用户对自身的个人信息也拥有自主控制权:用户有权要求图书馆提供可机读格式的个人信息复本、有权对自身注册信息中不准确、不完整的地方予以纠正、更新和完善,同时也有权删除或移除个人信息、撤销之前对图书馆个人信息使用的授权以及有权拒绝图书馆使用、保存和分享个人信息。图书馆用户有权通过删除网页浏览器上的Cookie 等手段防止图书馆对用户信息进行追踪。但同时也需注明如用户不允许或部分允许图书馆获取自身信息,或可能影响到图书馆的服务品质。此外,对用户个人信息的使用场合、目的,信息保存的期限、位置,个人信息披露的限制条件、信息保护的技术手段、特殊情况下的免责声明、信息指南的修订周期等加以明确规定和说明。最后,提供图书馆隐私专员的联系方式,图书馆用户可通过与隐私专员联系,提出个人信息及隐私保护的相关意见和建议,提交自身对个人信息加以删除、增加、更新等诉求,受理个人信息使用请求和个人隐私投诉。[5]以此有效提升图书馆隐私保护的可信赖度。
3.2 加强图书馆用户个人信息监管
3.2.1 完善个人信息保护管理体系
个人信息的管理与保护是个系统工程,不仅涉及到图书馆内部,也涉及到图书馆与包括数据库商在内的第三方服务商之间的数据交互。总体而言,涵盖数据收集、储存、传输、清理等各个环节,其中任何一环出现问题,都可能会导致用户个人信息泄露的发生。因此,图书馆必须引起重视。一方面,按照国家标准委员会发布的《信息安全技术数据交易服务安全要求》意见稿,从技术层面对用户个人信息实施去标识化处理等保护手段;另一方面针对用户个人信息从收集到最终销毁的各个环节,制定出具备可操作性的数据管理规范与细则、个人信息管理规定和保护政策、隐私专员岗位管理条例、用户个人信息安全检测机制、用户隐私保护测评机制,个人信息储存、传输及销毁流程,同时还需要对大数据环境下的技术标准和运营标准加以制定和规范,构建起大数据技术应用层面的安全管理体系。
3.2.2 明确监管部门,设置隐私专员
图书馆需要设立明确的用户个人信息监管部门,指定隐私专员负责用户个人信息的管理、保护,负责有关个人隐私泄露的投诉和意见。信息监管部门对图书馆履行个人信息保护的全过程实施实时监管,对信息披露请求进行审核、授权,同时对图书馆的个人信息政策和隐私指南加以拟定、修订和更新。负责个人信息及隐私保护相关问题的咨询和受理,处理用户申请查询、修改、删除个人信息等具体事宜,并及时对用户提出的要求和意见加以反馈和解决。
3.2.3 推行个人信息泄露风险评估与突发应急预案
目前很多个人信息泄露事件的发生和扩大,往往都是因为在开展新业务和开发新技术时,管理与决策层没能充分对新业务和技术推行过程中可能出现的个人信息泄露风险进行全面评估,导致新服务从推行之初就存在巨大的安全隐患。所以图书馆必须在引入新的技术如云技术、传感技术、RFID、虚拟社区等时,实施用户个人信息泄露风险评估,并针对可能存在的风险点制定相应的防护措施。另一方面,图书馆一定要设置突发事件应急处理小组,并制定好个人信息泄露突发应急预案。一旦个人信息泄露事件发生,图书馆的突发事件应急处理小组成员和隐私专员就能依据此预案快速做出反应,在对突发事件向上级领导报备的同时,排查泄露源头,找出泄露原因,合理、有序、高效地实施应急处理,防止个人信息泄露的进一步扩大,力求把损失和危害降至最低。
3.2.4 加强对第三方的监管力度
目前图书馆普遍通过与第三方服务商展开合作,购买第三方的技术平台或服务,保障图书馆用户拥有更加优质的服务体验。据此,第三方也普遍拥有共享和使用图书馆用户信息数据的权利,有权对用户个人信息进行深度挖掘、监控,并分析和预测用户行为,但这也导致了个人信息泄露渠道的增加。图书馆首先应对第三方服务商严加甄别,选择与管理水平、技术实力、售后服务均优良的第三方合作,并加强定期考核和日常监管力度,通过与之签订用户个人信息及隐私保护协议,明确第三方服务商必须履行的隐私保护义务、职责以及侵权、违约责任,通过详细列举禁止行为,限制第三方对用户信息的过度挖掘、再识别和披露;当第三方发生重大隐私侵权行为时,图书馆有权依据造成的损失程度采取相应的惩戒举措,以此确保第三方合理合规地使用图书馆用户个人信息,履行承诺,切实维护用户隐私安全。
3.3 从技术层面保护用户个人信息安全
大数据背景下,图书馆会采用诸如移动终端、定位系统、监控设备、RFID 技术、社交媒体、云平台等途径对图书馆用户的个人信息加以收集和利用。为保护图书馆用户的账号、密码、位置、社会关系、交流记录、借阅浏览记录等各种信息,图书馆可聘请隐私保护相关的专业技术团队对图书馆的个人信息保护系统进行全面检测,对图书馆用户的个人信息及隐私保护方面存在的风险点进行逐一排查,找出隐私保护技术漏洞,提前采取有效的防范措施防止图书馆用户个人信息的泄露、损毁或丢失。
3.3.1 非法入侵防控技术
图书馆掌握着大量用户个人信息,一旦遭受非法入侵,将会导致难以预估的不良后果。因此,一方面图书馆必须通过安装防火墙、杀毒软件,设置非法入侵监测与报警系统、采用网络隔离技术、差分隐私保护技术、防推演控制技术等,[6]严防图书馆用户的个人信息遭受非法攻击和窃取;另一方面图书馆可采用静态密码认证、动态密码认证(短信密码、动态口令牌)以及双因素认证等手段加强用户身份认证,[7]防止未授权用户进入图书馆系统,并针对不同用户群体设置不同的资源访问、下载、利用权限,以达到对用户访问进行控制的目的,有效降低用户隐私遭受侵犯的几率。
3.3.2 数据脱敏与加密处理技术
图书馆需对用户的个人敏感信息,如读者姓名、身份证号、借阅证号、IP 地址、联系方式、邮箱、账号和密码信息等加以识别、认定,通过数据脱敏技术处理使数据变形,[8]或采取包括数据泛化、压缩、分解、置换和干扰等方式将用户数据进行匿名化处理,随机改变或隐藏原始数据中的部分数据,使这部分数据无法再与其他信息相结合,确保用户真实的个人信息难以被推断出来,还可使用对称加密算法(如DES 算法、IDEA 算法等)、非对称加密算法(RSA 算法、Elgama 算法等)、基于身份的加密算法、基于属性加密算法、公钥加密技术、信息签名及识别技术等对用户数据进行加密,防止用户信息被轻易读取和识别,从而实现用户隐私安全保护。
3.3.3 针对RFID及虚拟社区的技术
近年来,无线射频识别技术(Radio Frequency Identification,RFID)也被广泛应用到图书馆自助借还系统、门禁系统、馆藏图书分检传输系统。但因RFID 这一非接触式的自动识别技术具有储存个人信息、个人特征关联分析以及个人信息跟踪定位等功能,[9]能在不经用户本人允许的情况下被自动识别与读取,一旦不法分子利用置于借阅证中的RFID标签读取图书馆用户个人信息并进行关联识别,就会对图书馆用户的隐私造成侵害。因此图书馆应通过对RFID 标签进行匿名化处理、加密处理以及使用差分个人信息保护技术等有效解决由RFID 技术带来的用户个人信息泄露问题。此外,为适应网络环境下读者知识共享需求,众多图书馆尤其是高校图书馆纷纷建立起依托自身资源的各种虚拟社区,为用户提供知识交流、共享、探讨与传播的平台。虚拟社区作为网络用户信息交互的重要平台,汇聚了图书馆用户的各类个人信息、行为信息、交互信息,这些信息也极易被不法者通过技术手段获取。据此,图书馆应使用匿名化手段来隐藏用户的IP 地址,采用设置“黑名单”“白名单”过滤器、贝叶斯三元模型过滤器在内的技术手段对垃圾邮件进行过滤,防止特洛伊木马、蠕虫病毒等以及欺诈性邮件带给图书馆用户的威胁,充分保障图书馆用户的隐私安全。
3.4 培养图书馆馆员及用户的数字素养
随着信息技术的发展和数字技术在人们日常生活中所占的比重越来越大,图书馆用户所面对的数字环境已经发生了翻天覆地的变化,大数据时代要求用户能够熟练运用数字工具进行有效互动,实现资源共享。但是数据呈几何级数增长的同时,也带来了大量虚假信息、数据冗余,网络所具备的开放性又使得个人信息外泄的渠道不断增加,给隐私保护带来威胁。目前,图书馆尤其是高校图书馆普遍开设帮助用户实现资源检索与获取的各类数字技能的应用实践课程,但是较少或从未开设有关网络安全、个人信息及隐私保护方面的相关课程。大数据背景下,用户个人信息及隐私保护不仅需要图书馆的努力,更需要用户自身信息安全意识的提升。有效提升用户数字信息安全意识和能力也应该成为高校图书馆数字素养教育中的重要内容之一。
就图书馆员而言,必须养成终身学习的习惯,以应对不断变化的数字环境。一方面在对自身数字素养水平进行全面评估的基础上,图书馆需制定合理的培训计划,邀请网络与计算机专业技术人员给予馆员个人信息安全培训和指导,积极开展丰富的数字素养实践活动,将数字素养教育嵌入到馆员职业发展规划和个人绩效考核中,以有效敦促馆员熟练掌握数字技术和工具;另一方面加强对图书馆职业道德规范和标准的学习,养成用户个人信息保护的职业素养,积极主动承担起保护用户个人信息的职责,切实履行保护用户个人信息安全的义务。
就图书馆用户而言,图书馆应首先采取文献研究、案例分析、专家评估、问卷调查、深度访谈相结合的方式,定期针对图书馆用户开展个人信息及隐私保护相关问题的调研,广泛收集并了解用户在此方面存在的问题及实际需求,通过对用户知识背景、数字工具运用能力、数字素养水平做出科学评估,形成调查报告,为后期图书馆制定兼具普适性、实用性、可操作性的数字素养培训方案提供切实依据和参考。拟定数字素养培训框架,拟定培训内容和步骤,最终形成科学系统的培训体系,帮助用户提升个人信息保护方面的基础知识,以有效应对大数据背景下的个人信息及隐私泄露问题,做好安全防护。其次,加大对大数据背景下个人信息安全教育的宣传力度,普及隐私安全常识,通过培训让用户熟悉我国目前已出台的《关于信息安全等级保护工作的实施意见》《信息安全等级保护管理办法》《全国人民代表大会常务委员会关于加强网络信息保护的决定》《信息网络传播保护条例》《个人信息保护法(草案)》等相关法律法规和管理办法,让用户知晓任何组织和个人不得窃取或者以其他非法方式获取公民个人电子信息,不得出售或者非法向他人提供公民个人电子信息[10]。了解个人对隐私数据享有控制和自我保护的权利,以及当遇到隐私泄露和个人信息侵害行为时,能够采取相应的法律法规依据,要求侵害者停止侵害并要求精神及经济赔偿,采取有效手段维护自身隐私权和切身利益,增强用户个人隐私保护意识。再者,通过开设“个人信息及隐私保护”相关课程、举办个人信息安全专题研讨会、讲座,并通过图书馆主页提供相关课程视频和在线资源,教导用户学习如何有效地对自身的网络身份加以管理、如何识别钓鱼网站和虚假信息、如何利用数字工具获取正规资源,如何利用数字技术手段清理网页浏览痕迹、缓存、临时文件,可以采取何种途径防止Cookie、网站信标、链接等其他类似设备识别技术追踪用户行为,记录并获取用户访问信息。使用第三方授权时需要懂得权衡利弊,在享受便利和减少隐私泄露渠道之间达成平衡。培养用户主动认真阅读隐私服务条款,妥善保管好个人账号、密码等个人信息,增强用户个人信息保护能力,学会采取不同方式维护自身的大数据隐私权,对自身信息安全负责。
4 结语
大数据背景下图书馆用户个人信息及隐私保护工作任重而道远,这项工作不仅需要图书馆作出积极而有益的尝试,同时也离不开政府、法律、行业层面等的有力支持。在此呼吁我国个人信息保护法尽快出台,呼吁政府和相关部门加强监管,唯有如此,才能形成合力,推动用户个人信息保障体系的日臻完善。