面向数据库应用的隐私保护研究综述
2019-12-13刘林周裕红
刘林 周裕红
摘要:本文将就隐私这个概念进行简要的阐述,了解当前的形势,进而针对面向数据库应用的隐私保护技术研究现状做初步的了解,指出数据失真、数据加密、限制发布等隐私保护技术对于隐私保护的重要性,进而为当前的相关人员对于隐私数据保护的研究提供一定的借鉴意义。
关键词:数据库应用;隐私保护;研究
中图分类号:TP309 文献标识码:A 文章编号:1007-9416(2019)09-0194-02
1 隐私的概念及当前形势简介
所谓隐私,指的是个人或者是相应的机构不愿意让其他人所知道的一些信息。在实际的生活中,隐私指的是我们自己不愿意告诉其他人的一些内容,以及这些内容所透露出来的信息特征。在一般的情况下,我们所谈到的隐私都是指的是对于我们自己较为敏感的内容。但是对于不同的人来说,隐私有不同的含义与概念,在每个人心中对于隐私的定位会有一定的差异。从隐私所有者的角度而言,我们可以将隐私分成两大类,一方面是个人的隐私。个人的隐私也就是指的是一些可以被认定为与某一个人相关的,但是那个人不愿意告诉大众的信息叫做个人隐私,比如身份证号,学籍号等等。另一方面是共同隐私。共同隐私指的是自身与社会上其他的人一起所表露出来的,威胁到双方利益的内容,比如个人的工资情况、考试成绩等等这些都属于共同隐私。
当前应用到社会上面的数据库主要有两种,一方面是数据挖掘,一方面是数据分布。在当前的时代,数据挖掘与数据发布对于人们的生活都有着十分重要的作用,数据挖掘和数据发布有助于帮助人们挖掘出潜在的具有价值的信息,我们在利用以前的数据挖掘和数据分布找寻更多的资料,同时我们也可以利用数据库带来的便利快速定位自己,但是我们不能忽略的是数据挖掘和数据分布也会使得我们的个人隐私遭到泄露。而在这个过程中传统数据挖掘技术与数据发布技术对于个人隐私的泄露使得人们的生活带来了很多问题。数据发布会直接地将数据库中的数据展现给用户,但是如果不采取相应的保护措施可能会造成个人的敏感数据泄露,从而为相关的人员带来一定的危害,比如某公司的盈利状况报表、病患的个人资料等等,需要通过严格的监督才能够有效保护这些人格机构的隐私。所以在当前的形势下相关的人员必须要充分的利用隐私防护技术来对个人的隐私进行相应的保护才能够有效的促进数据库在在新时代的使用。所谓隐私保护技术指的就是一方面要保护在数据应用的过程中,不仅仅能够在实际的生活中保护我们的隐私不被泄露,同时又能够将我们的信息用于相关的人员分析。当前隐私保护技术的主要研究工作主要是通过对隐私保护的原则以及算法如何使得这两个方面能够达到平衡。
2 隐私保护主要研究方向和国内研究现状分析
当前不少的专家学者都针对隐私保护技术做出了相应的研究,而通过阅读相关文献我们了解到当前对于隐私保护的主要研究方向主要有四个方向,通用的隐私保护技术应用,数据挖掘的隐私保护技术,基于隐私保护的数据发布原则以及隐私保护算法。这四个方向都是根据实际的需求来进行研究的。第一种通用的隐私保护技术,它主要是通过在较低层次方面来保护个人的数据,这种技术主要是通过构建模型然后了解大众的数据。面向数据挖掘的隐私保护技术则主要是解决在高层数据的应用过程中,这种技术能够在一定程度上保护个人的隐私。基于隐私保护的数据发布原则,则是能够通过对这些原则的研究使得在各种平台上都能够对个人的隐私进行相应的保护。隐私保护算法在一定程度上也具有通用性,是相关的专家学者通过科学合理的计算来制定出的一些算法。
而目前国内等对于隐私保护技术既有理论研究,也有实际的研究,在国内很多的知名大学以及学术界的专家学者都开始进行隐私保护技术的研究。目前国内关于这方面的研究,主要是通过在数据失真和数据加密技术两方面的研究,当前我国的隐私保护技术研究还处在刚刚发展的阶段。
3 面向数据库应用的隐私保护研究综述
3.1 基于数据失真的技术
首先,基于数据失真的隐私保护技术。这种技术能够通过对个人最初的数据进行一定的扰乱再进行发布,有助于保护个人的隐私,不让其他的人了解到个人的真实情况。但是这种技术在使用的过程中必须要让其他的人能够通过受到干扰的数据了解到数据背后的本质特征,使得这些受到扰乱的数据能够对相关的人员提供一定的参考价值。当前基于数据失真的隐私保护技术,包括随机化,阻塞,交换,凝聚等等,一般来说,很多人都希望能够在扰乱自己的原始数据之后再发布失真的数据,从而能够使得自己的数据得到有效的保护,在扰乱的过程中,其操作具有一定的随机性,通过不暴露原始数据的情况下,能够对多种数据进行扰乱。
3.2 基于数据加密的技术
其次是基于数据加密的隐私保护技术。这种技术有助于保护相关的人员在网路平台上交流聊天的隐私不会轻易被泄露。在当前很多的人都会利用网络平台来与其他人进行交流,在交流的过程中如何能够保证自己的通信安全使得自己的隐私不被泄露,就成为了当前的相关人员必须要思考的问题,而基于数据加密的隐私保护技术正好就是对于用户的实际需求做出了相应的研究。在分布式的环境下,基于数据加密的隐私保护技术可以通过分布式的数据挖掘、安全查询、几何计算等等方面来对数据进行存储,同时又无法使得别人了解到原始的数据,在发布数据的过程中采取匿名的方式,进而能够对其进行保护,在相关的人员得到自己需要的内容的时候能够使得隐私所有者的信息不被泄露。
3.3 基于限制发布的技术
最后基于限制发布的隐私保护技术。这种技术指的是对隐私所有者的信息进行选择性的发布,或者是对于一些过于精准的信息选择不发布,从而保护好隐私所有者的权益。这种方式我们可以在一定程度上称之为数据匿名化。这种匿名的方式能够在一定程度上保护好隐私所有者的权益,同时能够使得发布出来的数据得到有效的利用,对于相关的研究人员有一定的參考价值。所以相关的人员需要在使用数据和个人隐私的时候遵循数据匿名化的原则,进而使得个人的隐私不被泄露,保护好个人的合法权益。
4 结语
当前不少的人都会利用网络平台来发表自己的生活、学习、工作动态,这样一方面能够加强与朋友之间的交流,但同时也使得自己的数据容易被泄露。各种平台都需要通过相关人员的注册,甚至会涉及到相关身份的验证,使得个人的隐私信息存在被泄露的风险。同时很多的机构都会通过网络来进行数据存储,但是这样一来也给了很多不法分子盗窃数据信息的机会,所以在当前的时代,相关的人员必须要了解隐私保护技术的重要性,尤其是针对相关的使用提出合理的隐私保护对于用户有着十分重要的意义,在当前很多平台需要利用大数据来进行相应的分析实验,但同时也要注重保护好用户的隐私,一方面要保护好社会上所有人的个人隐私,一方面要能够使得这些数据对相关的人员有一定的参考价值,这成为了隐私保护技术必须要面临的问题。
参考文献
[1] 周水庚,李丰,陶宇飞,等.面向数据库应用的隐私保护研究綜述[J].计算机学报,2009,32(05):847-861.
[2] 孙崇敬.面向属性与关系的隐私保护数据挖掘理论研究[D].电子科技大学,2014.
[3] 生飞.浅谈面向数据库应用的隐私保护[J].企业技术开发,2018,37(08):71-73.
Abstract:This paper will briefly describe the concept of privacy, understand the current situation, and then make a preliminary understanding of the current situation of privacy protection technology for database applications, pointing out the importance of privacy protection technology for privacy protection, such as data distortion, data encryption, restrictions on publishing, and so on, so as to provide a certain degree for the current research on privacy data protection for relevant personnel. The significance of reference.
Key words:database application; privacy protection; research