网络信息资源个性化推荐中隐私保护的研究
2015-06-19张小波付达杰
张小波 付达杰
摘要:为了更好的帮助用户在网络获得个人所需的信息资源,搜索引擎、推荐系统需要搜集和使用大量用户的个人信息,而这些个人信息中大都包含了一些隐私数据,因此用户隐私安全的问题就随之而出。首先就网络信息资源个性化推荐中隐私保护进行了综述,然后分析比较了目前使用的相关保护措施,最后提出隐私保护措施的几点改进。
关键词:个性化搜索;个性化推荐系统;隐私保护;信息安全;网络安全
中图分类号:TP315 文献标识码:A DOI:10.3969/j.issn.1003-6970.2015.04.014
0.引言
随着互联网的飞速发展,大数据时代也接踵而至,大幅增长的数据使得以此为基础使用搜索引擎进行搜索的结果也相应增加,从而用户需找其所需的网络信息资源也变得越来越困难。早先当用户分别在Google、Yahoo或者百度上使用同一关键字进行搜索的时候,虽然有几十页甚至上百页的结果,但是大部分是重复的或者不相关的,很明显,这并不是用户所需要的理想的结果。在此需求之下,个性化推荐系统相应而生。个性化推荐系统是根据用户的个性化信息,例如兴趣、爱好、搜索习惯等进行统计建模,然后将相关联的网络信息资源(网页、产品等)在用户进行搜索的时候推荐给用户,以满足用户多元化个性化的需求。
1995年3月斯坦福大学的Mark Balabanovic等人在美国人工智能协会上率先推出了个性化推荐系统LIRA。从此之后,个性化推荐技术开始迅猛地发展,2004年3月Google第一个beta版Personalized Search从Google Labs Proiect诞生,得到了用户的好评。紧随其后,国内外大量的研究院和公司开始投入巨资进行个性化推荐系统与个性化搜索技术的研发。在个性化推荐系统与个性化搜索技术当中核心就是获取用户个人信息数据,这些数据包含了大量用户的隐私,隐私安全这一敏感问题渐渐浮现出来。虽然一些国家拟定了相关的法律法规来保护隐私数据,但是在隐私保护技术上仍然处于起步阶段,以致正当个性化推荐系统发展的如火如荼之时,AOL、Yahoo、Apple、Faeebook等知名大型企业曝出用户搜索数据、注册信息泄露问题。其中国内所熟知的中国开发者技术在线社区CSDN更是有600万注册用户数据被泄露。这些数据包含了用户的兴趣、爱好、联系方式等,使得用户对于网络信息安全信任度降低和对个性化推荐的反感。从而导致需要大量用户信息的个性化推荐系统与个人隐私保护之间产生了一定的矛盾。本文对现有隐私保护的措施进行了相关的研究,并指出其中的不足,提出相关改进建议,使之能在一定程度上平衡矛盾。