大数据时代个人隐私风险及对策分析
2019-11-30张建沼
张建沼
1 大数据发展概况
《中国互联网络发展状况统计报告》数据显示,截至2018 年6 月,中国网民规模达到8.02 亿,2018 年上半年新增网民数量2 968 万人,较2017年12 月增加3.8%,互联网普及率达到57.7%,其中手机网民规模高达7.88 亿,在网民人群中的占比达到98.3%。
伴随着互联网和移动终端的普及,基于高速移动网络的发展,互联网企业、网民的日常网络活动越来越多。尤其是Web2.0 技术的发展,网络用户从网络的阅读者成长为网络的建设者。音视频网站不断累积的音视频资料、电子商务网站不断增加的商品以及交易记录、个人在社交平台发布的文本音视频资料等等,形成了互联网时代的海量数据,大数据产业应运而生。分析报告显示,2016 年我国大数据产业市场规模达到1 403 亿美元,到2020 年,市场规模预计将达到13 626 亿元。大数据时代的来临,对人类社会来说既是机遇,也是挑战。机遇在于对大数据分析处理,可为企业、政府提供服务导向和智慧支持,是宝贵的财富,被称为新时代的“石油”。挑战在于大数据时代,很多网民的日常活动被曝光在网络中,这些曝光的信息容易被不法分子利用,造成个人的财产及其他损失。
数据泛滥、缺乏保障机制,是当前大数据面临的重要问题。数据活动的参与者需要在有效使用数据和保护个人隐私之间建立一种平衡,以促进大数据产业健康发展,同时保护广大用户的切身利益。
2 大数据时代个人信息隐私的分类和个人隐私数据的来源
目前我国的网民主要是手机(移动终端)和电脑用户,这些用户的日常网络行为每天产生大量的数据。这些数据包括用户主动操作产生的数据,如个人网购记录、个人网上银行交易记录、个人搜索引擎查询记录等,也有间接由用户差生的数据,如导航留下的数据、城市摄像头留下的数据、小区门禁留下的数据、办公定位系统留下的数据等等。
根据个人信息隐私的特点,可以将个人隐私分为以下几类:
1)通讯隐私:电话(手提电话、固定电话)、电子邮件、短信、微信、QQ 等通讯工具都具有私密性。
2)个人人身行为隐私:包括刷脸开门、自助机人脸识别、乘飞机火车实名认证、汽车号牌自动识别、住酒店实名登记等记录个人行踪的信息。伴随着物联网的普及使用,物联网产生了大量的数据,如刷卡门禁系统、自动识别车辆出入系统、家庭监控、智能家电控制等。
3)个人网络行为隐私:包括个人在网络社交平台发布的信息、个人浏览网页记录、搜索引擎搜索记录、电子商务网站浏览及购物记录、网上银行(手机银行)操作记录等。
伴随着互联网和移动终端的是各种社交平台的蓬勃发展,大家耳熟能详的微信、QQ、微博等社交平台每天都在产生大量的数据。专注于视频的抖音、快手等平台更是累积了大量的视频数据。电子邮箱、网络云盘也在不断累积数据。
目前网民在网上搜索信息的行为非常普遍,这些搜索行为产生了大量的数据。另外网络法律咨询、医学咨询等也会产生数据。还有就是个人手机定位、导航等也会产生相应的数据。
伴随着移动支付的普及,电子商务平台记录了个人大量的操作信息,包括商品浏览记录、商品咨询记录、商品购买记录。
移动互联网时代,银行柜台越来越少,自助设备越来越多。个人网上银行、手机银行、ATM 机上的操作越来越多,留下来大量的查询、转账、取款记录。
以上网络行为越来越普及,而且这些行为都会被各种平台收集。当对这些行为进行汇集分析,就会暴露出个人的各种信息。
3 大数据时代个人隐私风险分析
个人用户每天都在为大量数据的产生做出贡献,而这些贡献大部分来自于移动终端和监控设备等。对于个人用户而言,有些风险是可以预计的,即使用户知道有风险,也会抱有侥幸的心理,甚至是“主动为之”。有些风险是潜在的,用户本身没有更多的选择,属于“不得已而为之”。
以下仅从个人用户的角度分析个人各种网络行为存在的风险。
1)可以预计的隐私风险:有些涉及个人隐私的行为是可以预计其风险的,比如ATM 机上输入密码、蹭不明WIFI 上网、在朋友圈或QQ 空间发布个人及家人行踪信息及照片、语音通话和视频通话等都可能泄露个人隐私,这些都是可以预计的隐私风险。但是,这些带有风险的日常行为是生活的一部分,不可能因为有风险而因噎废食。
2)不可预计的隐私风险:有些则是不可预计的隐私风险,或是说是“潜在的隐私风险”。日常生活中一些行为,不经意间就暴露出自己的隐私,而这种隐私的暴露,个人甚至没有觉察到。
各种监控、门禁、车牌识别、恶意偷拍、酒店住宿、乘飞机火车等都能暴露自己的个人行踪及私密信息,而这些日常行为是避免不了的,有时在不经意间暴露了个人隐私可能个人都不知道。
另外,根据具体的网络行为,均存在不同的风险,现分析如下:
1)网络通讯是目前网络活动的重要组成部分,如果网络通讯数据包为原码发送,则存在数据直接暴露的风险。
2)个人在社交平台发布的数据,可能暴露个人、家庭成员的隐私。微博、微信、Facebook 等社交平台给我们的生活带来了极大的方便,但同时也大肆暴露个人及家庭成员的隐私,特别是喜欢在社交平台“晒”照片和行踪的网友。比如可以通过微信朋友圈分析出家庭成员、性别、家庭大致住址、家庭成员年龄、家庭经济状况等信息,而这些信息为不法分子提供了参考。
3)在物联网大量普及的今天,我们个人出行的行踪暴露无疑。从我们早上下楼开始,到进入车库开车,然后过汽车道闸,经过城市及郊区马路,进入单位停车场,然后进电梯,个人整天的行踪会被无数的摄像头及智能设备记录,这些记录数据可能会被不法分子利用。
4)个人网络的行为隐私可以暴露自己的近况,如在百度上搜索某种症状,可以分析可能是生了什么病;在淘宝上购买婴儿用品,可能是做了父母;个人帐号的支出收入记录能反映出个人的经济情况。这些暴露的信息也可能被不法分子利用。
4 大数据时代个人隐私暴露对策分析
大数据时代个人隐私暴露风险时时存在。大数据的生命周期可分为数据生产(采集)、数据集成(存储)、数据分析挖掘、数据使用4 个阶段,对应的人员及机构有数据生产(采集)者、数据汇集及存储平台、数据分析挖掘者、数据使用者,另外还要有对隐私问题进行监督的机构或组织,充当数据监督者的角色。
保护数据安全,就是要在数据的生命周期4 个阶段进行处理,对生命周期的4 个阶段的参与人员及机构进行约束和监督。
大数据的参与者主要包括用户、企业、政府或行业组织,另外还有一个隐藏的角色,那就是隐私保护技术。保护个人隐私,就是要建立四位一体的防范机制。政府部门或行业组织通过制定法律法规规范企业使用数据的行为,对企业行为进行监管,限制不法分子的行为;个人应该增强隐私保护措施;企业应该提高服务意识,坚守法律底线。另外,政府和企业(包括专业的信息安全企业)应该致力于隐私技术的研究,为个人的隐私保护提供技术支持。
4.1 增强用户个人隐私保护意识
个人隐私泄露,首先是自己的日常行为产生了隐私数据。不管是可以预计的风险,还是不可预计的风险,只要用户贡献数据,就有风险的可能。对于可以预计的风险,一般是有意识的日常网络行为,用户需要这些行为来解决工作生活中的问题,我们需从规范网络行为做起。而对于不可预计的风险,我们需从规范日常行为做起。
总之,个人隐私来源于个人的活动和暴露,个人对自我的隐私保护要从自身出发,守住隐私出口,守好第一道防线。目前很多人对个人隐私的保护意识不强。好的习惯是防范隐私泄露的重要途径。快递单上信息处理后再丢垃圾桶、停用手机号时解绑所有该手机的应用、不随意连接WIFI、不安装不明App、不随意扫二维码、不轻易同意应用程序的权限请求、认真阅读隐私条款、不点不明链接、不轻易参加抽奖砍价活动、不在朋友圈及微博等平台暴露自己及家人的信息和行踪,这些都能保障自己的隐私不被轻易泄露。另外,保护好自己的密码,特别是涉及到资金安全的密码。设置较安全的密码、用户名不与密码相同、不用自己和亲人的基本信息作为密码、不串用密码、密码定期变更等。另外个人日常行为中,我们的一举一动都可能被各种摄像头拍摄,因此个人平时要注意自己的言行举止,不违反交通规则,杜绝不文明举止,不做违法犯罪的事。
4.2 企业合法经营,坚持法律底线
大数据的处理能力是衡量一个企业实力的依据。电子商务平台收集的客户基本信息和浏览购买记录、网络云盘存储的海量用户数据、监控摄像头服务企业提供的视频云存储都需要企业有很强的海量数据存储和处理能力。企业在采集到这些用户数据后能够通过数据分析给用户提供更贴心的服务,但也存在企业泄露、滥用用户隐私的行为。企业无论大小,只要是采集到的用户的数据,就应该保护用户的数据安全,更不能把销售用户的数据作为盈利的手段。
用户在安装企业的App 时,总是被询问是否使用某种权限,如摄像头权限、存储权限、访问通讯录权限、使用位置权限等,用户有时图方便直接选同意,造成企业肆意收集用户信息。企业在收集用户信息时应合理采集,按需采集,坚持“最少采集”原则。
企业要完善内部管理制度,杜绝内部员工无意或是因私利有意泄露用户信息。对采集到的数据制定数据调取制度,进行操作权限设置,在大数据生命周期内保障数据安全。
4.3 政府制定相关的法律法规
大数据下个人隐私的保护,依靠个人保护和企业自律远远不够,还需要政府部门出台法律法规约束数据管理人员和数据收集企业的行为。
目前,大数据是新鲜产业,法律法规的制定相对滞后,加快法律法规建设刻不容缓。法律应对企业过度采集数据、钓鱼诱骗收集数据、霸王条款收集数据等非法采集数据行为进行约束,对于泄露个人隐私数据的企业和个人依法追究责任,对于造成个人和单位经济损失的泄密行为,依法进行严惩。只有制定完善的法律体系,树立法律权威,才能减少因为隐私泄露造成的诈骗、勒索、非法侵占等事件的发生。
4.4 数据企业提高隐私保护技术
信息安全方面,有一句关于安全的名言:三分技术,七分管理。大数据时代的信息安全和隐私保护,同样遵循这个原则。
既然技术能占到三分,说明了技术在隐私保护上的重要性。
常用的隐私保护技术主要包括:
1)数据加密技术。数据加密,是一门历史悠久的技术,指通过加密算法和加密密钥将明文转变为密文,而解密则是通过解密算法和解密密钥将密文恢复为明文。数据加密仍是计算机系统对信息进行保护的一种最可靠的办法。它利用密码技术对信息进行加密,实现信息隐蔽,从而起到保护信息的安全的作用。
2)数据溯源技术。数据集成是大数据前期处理的步骤之一。大数据的来源多样化,记录数据的来源及传播、计算、演化过程,将为后期的数据挖掘和系统决策提供支持。数据溯源能为数据的使用提供重要参考。
3)数据匿名发布技术。就是通过匿名的方式发布信息。企业在收集到原始数据后,对数据进行初步处理,隐藏敏感数据,如隐藏姓名、身份证号、手机号、用户名、密码等关键信息,以此来保护大数据信息安全与隐私安全。匿名发布能够有效防止隐私泄露,但会增加企业开销,需要企业主动承担保密责任。
4)角色挖掘技术。对于数据收集、处理、使用企业,应该实现用户相关权限的科学管理。对于不同层次的用户,设定不同角色,给不同的角色分配不同的权限,每个角色只拥有完成相应岗位职责的最低操作权限,以此最大程度保护隐私数据。
5 结语
大数据时代个人不再是单独的个体,而是大数据的参与者。个人隐私的保护,也是对个人人身及财产的保护。个人隐私的保护,首先需要个人有很强的保护意识,不轻易向外发布自己的个人隐私。其次,数据管理者、监督者要承担起保护用户隐私数据的任务。再次,科技企业要提高数据保护的技术手段。只有做好这3 点,才能确保用户的隐私数据不被泄露。