浅析位置大数据隐私保护
2016-03-16朱孟杰
朱孟杰
摘要:随着移动定位技术和无线通信技术的发展,位置大数据已成为社会各界关注的热点问题,它给人们的生产、生活等方面带来了积极的影响,但也带来了信息泄露的风险。如何在享受其带来便利的同时做好隐私保护是值得研究的内容。文章简要介绍了位置大数据,指出了其在隐私保护中面临的挑战,并给出了位置大数据隐私保护的对策。
关键词:大数据;位置大数据;隐私保护
在大数据时代,随着移动定位技术和无线通信技术的发展,利用这些技术进行相关的位置服务,产生了极为惊人的包含空间和时间信息的数据。这些包含了位置信息且规模宏大、产生速度快、蕴含价值高等满足了被普遍认可的大数据的特点的数据被称为位置大数据。位置大数据在车联网、移动社交网络等方面有广泛的应用,为企业的商业化运作提供了科学的研究方法,为人们提供了各种便捷的服务。其在给人们带来具有诱惑力服务的同时,也带来了个人信息泄露的危险。这类既直接包含用户的隐私信息,又隐含了个人的生活习惯、健康状况、社会关系等其他敏感信息的位置大数据。如果应用不当,会给用户的隐私带来严重的挑战。例如,从匿名的GPS数据中能推断出个人的家庭地址、工作单位和社会关系,预测出用户过去、现在和将来的位置,推断出个人的行踪。甚至可以利用室内位置信息推断出个人的工作角色、年龄、爱好等。因此,对于位置大数据,如何在享受服务的同时做好隐私保护是值得研究的方向。
1 位置大数据分类与特征
位置大数据包含了空间位置和时间标识的地理和人类社会信息的数据。位置大数据具有大量性(volume)、高速性(velocity)、多样性(variety)、价值(value)和真实性(veracity)的特征。根据来源的不同可以分为地理数据、轨迹数据和空间媒体数据。
地理数据,是表示地理位置、分布特点的自然现象和社会现象的要素文件,包括自然地理数据和社会经济数据。自然地理数据,包括地覆盖类型、地貌、土壤、水文、植被、居民地、河流、行政境界及社会经济方面的数据等,一般按矢量数据结构或网格数据结构进行存储。社会经济数据一般在计算机按统计图表形式,是地理分析的基础数据。地理数据具有数据量大、数据存储相对较为规则、数据变化相对较慢的特点。
轨迹数据,是指一个或多个移动对象运动过程的采样所获得的数据信息,包括采样点位置、采样时间、速度等,这些采样点数据信息根据采样先后顺序构成了轨迹数据。如具有定位功能的手机,轨迹数据反映了设备持有者某段时间内的行动状况。轨迹数据包括轨道交通数据,车联网数据,出租车,微博签到数据等。其特点是数据量大,信息呈现碎片化,准确性较低,存贮半结构化。
空间媒体数据,是指文字、图形、图像、声音、视频及动画等包含位置信息的数据。其主要有移动社交网络、微信、微博、在线电子商务数据等新型互联网应用。Facebook每天生成300TB以上与位置有关的日志数据,淘宝网每天千万笔均包含物流位置信息的交易数据,均可称空间媒体数据,具有数据来源多样、数据差异性大、数据有较低的价值密度、有较强实时性和时空标识定义欠严格或欠精确的特点。
位置大数据根据来源不同虽具有不同的分类,但其具有的共同特征是具有时空标识,使用坐标、语言文本等来描述。这节简单的论述了位置大数据的分类及特点,下面将对位置大数据的隐私保护方面的内容进行论述。
2 位置大数据隐私保护的挑战
隐私,又称私人生活秘密或生活秘密,是指私人生活安宁不受到他人非法干扰私人信息保密不受到他人非法搜集、刺探和公开。个人隐私一般是指数据拥有者不愿意披露的私人敏感信息。一般来说,个人不愿意披露的信息都可以认为是个人隐私。随着技术的进步,人们的日常生活被记录、被跟踪、被传播、被数字化的进程不断加快,海量的数据在被重新整合、分析和挖掘之后迸发出了巨大的经济效益和社会效益,但是数据在给社会带来巨大的效益的同时也暴露出许多关于数据安全和隐私的问题。
对于位置大数据来说,访问控制策略、位置匿名化方法、轨迹匿名化等经典的位置隐私保护技术已不能有效地保护用户隐私。因为在大数据时代,隐私已经被数据化的特点,使得用户的位置数据或非位置数据相互交叉、排列、组合,这些数据可以直接或者间接地挖掘出个人的隐私。包含了大量用户位置信息的数据被二次使用,或被私下买卖,转变为直接的经济利益,从而使得隐私变成了买卖的商品,位置大数据隐私也就具有了价值的特点。位置大数据可以提供精准营销,如在淘宝网的个人账号中的商品推荐,亚马逊中的专利“预判发货”。这些个性化的服务能给人们的生活带来方便与快捷,但是人们的购物习惯、浏览习惯、商品喜好等等隐私因大数据分析而完全被暴露出来。因此位置大数据隐私保护中面临着,如何准确地度量用户隐私的披露风险,如何选择有效的隐私保护机制全面保护用户的隐私,如何兼顾隐私保护的程度和基于位置服务的可用性的问题。
对于位置大数据来说,对隐私的侵犯主要表现在以下几个方面:在采集过程中对隐私的侵犯。《2013移动应用隐私安全测评》报告显示,超半数手机应用存在“隐私越轨”行为,未经使用者同意,获取本机号码的比例为60.5%,访问个人通信的比例则为38%。商家为了提供优质的服务,私自采集没有经过用户许可的数据,是一种纯粹的商业行为,也是对用户隐私的侵犯。在存贮过程中对隐私的侵犯。2014年的苹果“隐私泄露门”事件引发了人们对个人信息被储存的担忧,其泄露的位置信息,通过挖掘分析可以确定个人的身份,工作地点等隐私,其泄露给个人和国家带来了严重影响。在使用过程中对隐私的侵犯。在现实中商业公司在使用个人数据时侵犯用户隐私,如出卖个人隐私信息等。政府由于手中掌握着最大的与个人有关的数据,在开展各种日常事务时也往往忽略用户隐私安全。
3 位置大数据隐私保护对策
对于位置大数据,曾在全世界范围内达成共识的“告知与许可”隐私保护政策正面临失效。此外各种侵犯隐私的手段层出不穷,对位置大数据的进一步挖掘与应用加深了人们的担忧。各国政府也开始制定专门的法律法规来应对位置大数据下的个人隐私泄露问题,企业通过研发新的大数据隐私保护技术和提高行业自律标准来确保个人隐私安全。
通过新技术的研发,完善位置大数据隐私的保护。现己研究出了多项隐私保护技术:基于政策法的隐私保护技术,其具有实现简单,服务质量高,其隐私保护程度不高的特点。基于扭曲法隐私保护技术,其具有实现简单,能较好的平衡隐私保护和服务质量,位置数据失真,容易受特征推测攻击的特点。基于加密法的隐私保护技术,其具有服务质量高,隐私保护好,服务开销大的特点。隐私保护不仅仅是一个技术问题,而是一个复杂的社会问题,隐私保护技术仅仅解决了问题的一个方面,识别和克服在部署隐私保护技术时面临的非技术问题,如平衡服务质量、计算开销、通信开销、有价值信息等方面的问题也同样重要。因此,跨学科研究是解决这一问题的关键,迫切需要隐私保护领域的计算机科学家与心理学、社会学、公共政策研究等方面的社会科学家一起进行跨学科研究。
法规是隐私保护技术之外的隐私保障手段。在隐私保护过程中,仅依靠技术是不够的,纯技术代替不了法律和社会道德对侵害隐私的制裁和约束。全世界有许多国家制定了专门保护个人隐私的法律。美国、欧盟等还专门针对大数据时代特征完善了隐私方面的法规来规范个人数据在收集、使用与传播等方面的行为。而中国这方面的法律相对薄弱,因此中国应加快完善相应的法律法规。另外位置大数据从业者应加强行业自律。行业自律的及时性和效益性以行业自律的形式预防侵犯隐私的行为发生。对个人而言,加强正确的隐私观,消除狭隘的隐私保护意识,科学合理的分享个人数据。根据不同的情况,选择数据公开的范围及数据的敏感度,使用户既能享受到大数据带来的便利,又能维护个人信息的安全。
4 结语
大数据时代,位置大数据给个人带来便利的同时也带来隐私泄露的威胁,许多研究者在位置大数据的隐私保护方面做了大量的工作。本文简单的介绍了位置大数据,并讨论了位置大数据隐私所具备的特点及隐私保护面临的挑战,最后给出了位置大数据保护隐私的对策,以期对位置大数据的发展及个人隐私保护尽个人的微薄之力。位置大数据隐私保护属于大数据的新兴研究领域,有许多关键问题需要深入而细致的研究。