基于位置大数据的移动社交网络服务轨迹隐私保护研究
2017-05-08段谟意
段谟意
摘要:为了更有效地保护用户的轨迹隐私,提出综合位置大数据、移动社交网络服务各自的特点,从网络技术、心理学、社会学、信息学等多角度,对用户位置与行为模式之间映射后的个性向量模糊化,全方位量化分析影响位置大数据的移动社交网络服务(Mobile social network service based on location big data,MSNSLBD)的属性,重新给出了轨迹隐私的定义,最后对MSNSLBD的研究方向及需要解决的关键技术问题进行了展望。
关键词:位置大数据; 移动社交网络服务; 轨迹隐私; 行为模式
中图分类号: TP393
文献标志码: A
文章编号: 2095-2163(2016)06-0098-03
0引言
随着移动互联网和智能移动设备的应用拓展与普及,基于位置大数据的移动社交网络服务(Mobile Social Network Service based on Location Big Data,MSNSLBD)得到了快速发展,但与此同时,MSNSLBD也随即伴生了众多新的问题,其中显著突出的一类内容展现就是用户轨迹隐私将更加容易泄露。尤其是在大数据时代,移动社交网络服务轨迹隐私保护问题已日趋精深复杂,而且又牵涉到诸多领域的时新高效技术,因而如何让用户在充分享受大数据时代移动社交带来重大优势便利的同时,能够更好地保护用户的轨迹隐私,为用户的信息安全保驾护航,进而提供绿色网络环境即已成为社会与学界吸引关注、加大投入的热点与焦点。本文则针对这一课题范畴展开研究论述。
[BT4]1研究进展与研究现状分析
[BT5]1.1研究工作综论
文献[1]提出了一种空间泛化和延迟发布相结合的方法,保护用户的轨迹隐私和缺席隐私。文献[2-3]针对轨迹数据挖掘中可能频繁访问模式的应用,提出了一种保护频繁访问模式的轨迹隐私保护方法BF-P2kA。具体地,该方法就是以前缀树为基础实现构建轨迹k-匿名集。文献[4]则设计了一种在移动社交网络中推导用户位置的方法,该方法通过用户n个朋友提供的推理攻击方法已可达到80%的精确度。文献[5-6]还针对在近邻服务中,当用户在某个朋友的附近时,系统就会自动将用户的位置告知其朋友,从而可能导致用户轨迹隐私泄露给不可信的朋友或者服务提供商的情况,而相应研发了一种近邻服务中的轨迹隐私保护方法。在此基础上,更有文献[7-8]针对当前社交网络隐私属性匿名算法中存在的合理模型匮乏、属性分布特征扰动大、忽视社交结构和非敏感属性对敏感属性分布的影响等现实缺点,发展性地推出了一种基于节点分割的隐私属性匿名算法。另外,文献[9]继而又提出了一种基于GSNPP算法的隐私保护方法。方法通过对社交网络中节点进行聚类,再对生成的簇通过簇内泛化及簇间泛化,来对社交网络引入匿名化处理,拟达到隐私保护的目的。此外,文献[10]也研究了基于隐私信息检索的位置大数据隐私保护技术。
[BT5]1.2研究成果解析
[JP2]综上探讨可知,这些文献虽然针对MSNSLBD中轨迹隐私保护获得了可观技术进展,但仍存在一定不足,具体剖析如下。[JP]
1.2.1[ZK(]缺乏合理有效的MSNSLBD轨迹隐私保护算法[ZK)]
大数据时代,黑客可以从多种渠道获得用户公开信息和位置数据,然后结合位置数据推测出用户的隐私信息[5]。近年来,对这方面的研究都僅仅从单一网络的角度来分析影响MSNSLBD的属性,而未能综合网络技术、心理学、社会学、信息学等来全面研究针对MSNSLBD属性的关联作用,也未能灵活引入如下新情况所带来的发展新因素:在位置大数据时代,随着位置感知技术(传感设备、移动通信等)的进步,将导致事物和人的地理位置呈现出数据化[9]等情形。如此片面的研究后果,即会使得现有轨迹隐私保护算法必然缺乏必要的合理性及有效性。
1.2.2[ZK(]对用户位置与行为模式之间映射关系方面的研究,尚处于起步阶段[ZK)]
针对位置大数据的移动社交网络服务轨迹隐私保护,即应围绕用户位置与行为模式之间的映射关系而着重展开研究,力争减弱攻击者收集到的从匿名用户位置推测可得的个性向量与不同用户之间的个性向量上的性能匹配,从而弱化两者之间的相关度。
同时研究可知,保护用户位置大数据隐私的关键问题是:在确保服务可用的前提下,通过对映射后的个性向量设计执行非数据化,尽量使得个性向量实现模糊化。因而针对不同的应用特点,既要获得位置数据个性向量的模糊化结果,又要保持位置服务的准确性,亟需相关人员进一步的研究投入。
[JP3]1.2.3[ZK(]对MSNSLBD轨迹隐私问题的理解尚处于比较浅的层面[ZK)][JP]
分享位置为用户提供方便的同时,也成为泄露用户隐私的根源,用户将不得不面对由此带来的潜在风险。如何在保护轨迹隐私、提高服务质量、增强MSNSLBD应用的吸引力之间维系最佳平衡则是时下MSNSLBD面临的严峻挑战[1]。
MSNSLBD服务的核心表述即是位置分享,因而既要考虑位置分享形成的实用优势,又要关注对轨迹隐私的周到保护。但是如果偏重于保护轨迹隐私、从而削弱了位置分享这项核心功能,MSNSLBD的吸引力就必将出现急剧下降。
特别是在大数据时代,强力提倡绿色网络的大环境下,MSNSLBD陆续涌现的一些新问题,则需要结合社会学、地理学、经济学、信息学等多个学科,并同时展开全方位、多角度的梳理分析,而现有对这些问题的研究却仍未臻至客观、全面。
[HS(3][HT5H][ST5HZ]2[ZK(]位置大数据的移动社交网络服务轨迹隐私保护的研究方向[ZK)][HS)]
[BT5]2.1重新定义MSNSLBD的轨迹隐私δ
[HT5”SS][ST5”BZ]
通过对基于启发式隐私度量、概率推测、隐私信息检索的大数据时代MSNSLBD隐私保护技术的探讨分析;并立足于网络技术、心理学、社会学、信息学等多维角度,而非仅是从网络技术单一角度,针对影响MSNSLBD的属性展开全方位量化分析,同时改进调用如上技术,由此可得位置大数据的移动社交网络服务轨迹隐私δ的数学定义为:
δ=[SX(](P(t, i, Lt)-p(t, i))*P(t, i+1)*dan(xi, xj)min[]p(i)[SX)][JY](1)
其中,p(i)表示用户处于敏感位置的后验概率;danmin表示最相近的2个向量的差异程度,代表不同用户的位置数据映射到用户个性向量xi和xj的不同元素个数的最小值; p(t,i)表示用户在t时刻处于位置s(i)的概率,P(t,i+1) 表示用户在t时刻处于位置s(i)下一步移动的概率;Lt则表示攻击者收集到的用户在时刻t之前发布的位置数据。
2.2[ZK(]为了降低轨迹隐私泄露的风险,对用户位置与行为模式之间映射后的个性向量模糊化考虑移动社交网络中用户相关的位置数据与非位置数据之间的关系,防止攻击者利用该关系推测用户的敏感信息。因而需要减少用户发布的位置数据数量,降低用户位置数据中的元素映射为个性向量中有效元素的能力。研究用户位置与行为模式之间的映射关系,以设法降低攻擊者根据从匿名用户位置推测出的个性向量与攻击者收集到的不同用户之间的个性向量的匹配程度。在确保服务可用的前提下,尽量使映射后的个性向量显得模糊,如此才能最大限度地降低轨迹隐私泄露的风险。
2.3[建立MSNSLBD轨迹隐私保护模型,构建MSNSLBD轨迹隐私保护框架在大数据时代,MSNSLBD的研究中,既要考虑位置大数据的特点,又要保护移动社交网络服务,这就使得大范围、多角度分析、研究造成轨迹隐私泄露风险的原因已然成为研究必须。综合时下各类学术成果可知,最佳技术方案可描述为:要尽快建立合理有效的MSNSLBD轨迹隐私保护模型,同时科学构建MSNSLBD轨迹隐私保护框架。
[BT4]3拟解决的关键科学问题
[BT5]3.1多角度、全方位量化分析影响MSNSLBD的属性
从网络技术、心理学、社会学、信息学等多个角度,而不是从网络技术单一角度,全方位量化分析影响MSNSLBD的属性。但由于用户心理的不确定性,不同用户之间关系的复杂性,信息的海量性,等等这些,都给科学有效定义MSNSLBD轨迹隐私增加难度。
建立合理有效的MSNSLBD轨迹隐私保护模型,给出轨迹隐私保护算法,并验证其先进性研究需要重点构建位置大数据的移动社交网络服务轨迹隐私保护的模型,并在优化改进MSNSLBD轨迹隐私定义的前提下,给出更加合理的MSNSLBD轨迹隐私保护算法,在此基础上还需进一步加入仿真验证,由此证明轨迹隐私保护算法的先进性。
[BT4]4结束语
大数据是指一种包含大量信息、具有高新价值的数据集合。在大数据时代,由于传感设备、移动通信等位置感知技术的发展,从而形成了位置大数据。人们在充分享用位置大数据挖掘出各种各样的信息、使用位置大数据带来便利的同时,用户自身的隐私也不可避免地受到位置大数据的严重威胁[7-13]。因此,如何在充分利用位置大数据的同时,更好地保护用户的行为模式、行为习惯、地理位置等敏感信息,如何构建一个MSNSLBD轨迹隐私保护框架?如何在确保MSNSLBD可用的前提下,尽量让用户位置与行为模式之间映射后的个性向量变得模糊?如何建立一个更加合理的MSNSLBD轨迹隐私保护算法?使得用户在充分享受大数据时代移动社交的效益优势的同时能够更趋安全地使用MSNSLBD,即已成为一个现实重要的研究问题。本文在MSNSLBD轨迹隐私保护方面提出了一些新的思路,同时还对拟解决的关键科学问题进行了前景展望。
参考文献:
SADILEK A, KAUTZ H, BIGHAM J P, Finding your friends and following them to where you are[C]//Proceedings of the 5th International Conference on Web Search and Data Mining (WSDM12). Seattle, USA:ACM, 2012:723-732.
[2] MASCETTI S, FRENI D, BETTINI C,et al. Privacy in geosocial networks: Proximity notification with untrusted service providers and curious buddies[J]. The VLDB Journal,2011,20(4):541-566.
[3] MASCETTI S, BETTINI C,FRENI D, et al. Privacyaware proximity based services[C]//Proceedings of the 10th International Conference on Mobile Data Management (MDM '09). Taipei, China:IEEE, 2009:31-40.
[4] FRENI D, VICENTE C R, MASCETTI S,et al. Preserving location and absence privacy in geosocial networks[C]//Proceedings of the 19th ACM International Conference on Information and Knowledge Management (CIKM10). Toronto, Canada:ACM,2010:309-318.
[5] PENSA U R, MONREALE A, PINELLI F,et al. Patternpreserving k-anonymization of sequences and its application to mobility data mining[C]//Proceedings of the 1st International Workshop on Privacy in LocationBased Applications (PiLBA11). Malaga, Spain:CEURWS, 2008:1-17.
[6] GUNTER C A, MAY M J, STUBBLEBINE S G. A formal privacy system and its application to location based services[M]//MARTIN D, SERJANTOV A. Privacy Enhancing Technologies. Berlin Heidelberg: Springer, 2004,3424: 256-282.
[7] 付艷艳,张敏,冯登国,等. 基于节点分割的社交网络属性隐私保护[J]. 软件学报,2014,25(4):768-780.
[8] 杨秋伟,刘玲,李肯立,等. 一种支持隐私保护的角色访问控制模型[J]. 计算机科学,2010,37(6):46-50,121.
[9] 韦伟,李杨,张为群. 一种基于GSNPP算法的社交网络隐私保护方法研究[J]. 计算机科学,2012,39(3):104-106.
[10]王璐, 孟小峰. 位置大数据隐私保护研究综述[J]. 软件学报,2014,25(4):693-712.
[11]谈嵘. 轨迹隐私保护及其在基于位置的社交网络服务中的应用研究[D]. 上海:华东师范大学,2013.
[12]刘向宇,王斌,杨晓春. 社会网络数据发布隐私保护技术综述[J]. 软件学报,2014,25(3):576-590.
[13]王敏君,李千目. 移动定位社交服务下的位置隐私保护方法[J]. 南京理工大学学报,2016,40(1) :17-23.[ZK)]