浅谈大数据时代的用户个人信息保护
2015-02-22许青北京卓易讯畅科技有限公司豌豆荚
许青 北京卓易讯畅科技有限公司(豌豆荚)
浅谈大数据时代的用户个人信息保护
许青 北京卓易讯畅科技有限公司(豌豆荚)
伴随着科技的发展,用户个人信息保护必将是一个长期和持续发展的过程。本文从移动互联网时代用户个人信息保护的技术研发和产业发展两个方面内容入手,结合北京卓易讯畅科技有限公司的实践经验,总结了用户个人信息保护的相关方法。
移动互联网 大数据 用户个人信息保护
1 引言
近年来,互联网行业的发展,特别是移动互联网的快速发展,极大方便了人们的工作和生活,截至2015年第1季度,国内活跃移动设备数量已经达到10亿,移动网民规模已经超5亿,智能手机、平板电脑等便携智能终端与人们的生活紧密相连,智能手机逐渐从海量应用的初级智能阶段,向即时通讯、生活服务、在线支付、新闻阅读等多种技术融合创新的高级智能阶段过渡。
屏幕交互元器件的创新发展将使得多模态交互技术成为未来应用的基础形式,智能手机将成为可以听懂、读取信息,并可迅速反馈的智能信息传输平台。与此同时,伴随着4G时代的到来,Wi-Fi的广泛铺设,应用产品不断创新,应用服务不断完善,移动互联网已经深入信息服务、电子商务、媒体传播、生活娱乐等几乎所有社会生活领域。
移动互联网的快速发展给人们的生活带来了诸多便利,海量用户个人信息的商业价值不断凸显,地下产业链利用各种渠道收集用户信息非法牟利,由此引发对于用户个人信息过度使用的现象,再加上智能终端设备型号众多,以及各种应用快速迭代,进一步增加了用户个人信息保护的难度。
2 用户个人信息保护原则
伴随着互联网业务的不断创新,互联网服务提供者希望能够获得更多权限的用户个人信息,而用户对于其个人信息保护意识不断加强,希望尽量减少公开个人信息,如何平衡业务创新与用户个人信息保护,成为互联网服务商急需解决的问题。
2012年底通过的《全国人大常委会关于加强网络信息保护的决定》明确提出了保护能够识别个人身份和涉及隐私的电子信息,并确定了三大原则,即合法性、必要性和正当性;2013年,工业和信息化部通过的《电信和互联网用户个人信息保护规定》也进一步明确了相关细则。然而,在大数据背景下的互联网业务模式不断创新,用户个人信息不仅用于收集,其更多价值还来源于转移以及后续产品的开发利用。用户个人信息的转移、再开发现象更加频繁,“合法性、必要性和正当性”原则更多体现在用户个人信息的初次收集之时,互联网服务者对于其转移、后续使用的责任感有待加强。
3 用户个人信息保护现状
本文结合北京卓易讯畅科技有限公司(豌豆荚)近年的发展过程,从技术研发和产业发展两个方面,分享用户个人信息保护的相关经验。
3.1 面向公众的应用分发及内容搜索服务
豌豆荚是中国最具人气、活跃度最高的“应用搜索及发现平台”,也是中国移动互联网领域的创新企业。豌豆荚诞生于2009年,迄今安装量已超过5亿,不仅能让用户搜索到超过230万不重复的应用和游戏,凭借享有声誉的“豌豆荚设计奖”等栏目帮助用户发现高质量的长尾应用;还能通过“应用内搜索”技术聚合应用内的内容,整合应用的能力,帮用户找到应用中的视频、音乐、壁纸等内容。自创业以来,豌豆荚积累着深厚的移动互联网技术和海量的用户数据,结合公司对当前互联网大数据、云服务等前沿技术的研究,努力为用户提供最便捷、安全的应用产品以及内容搜索平台。
3.2 用户个人信息保护技术研发方案
豌豆荚通过不断的技术创新,力争为用户提供最安全、便捷的服务,涉及的技术创新内容包括大数据存储、大数据计算和商务智能等。
(1)大数据存储
随着公司业务的不断增长,结构化的数据库早已满足不了与日俱增的大量数据的存储和计算需求,豌豆荚自行研发分布式存储系统,以提高海量数据存储的安全性和稳定性。
(2)大数据计算
仅仅在几年之前,一个大型应用只有数十台服务器,拥有秒级的响应时间,需要数小时的离线维护时间。如今的许多应用在移动设备端,部署着成千上万个多核处理器的云端,用户预期的是毫秒级的响应时间和永不中断的服务,如今的发展需求已不能靠过去传统的软件架构来实现。
豌豆荚自主研发的大数据实时计算框架,用于大量业务并实时计算和响应,可以接入千万乃至亿级的长连接、每天可以处理上亿实时消息及事件,做出毫秒级的响应,确保海量数据的精准度。
在大数据时代,现在很多网民喜欢用相同的账号密码注册多个网站,甚至作为支付平台账号,黑客开始大量通过直接入侵网站服务器窃取用户数据(黑客术语“刷库”),并用所窃取的账号密码通刷大量网站,其所造成的危害已经超过了普通的木马攻击。豌豆荚大数据计算系统的实时监控,可以有效预防入侵平台的刷库行为,保护用户的数据安全。
(3)商务智能
商务智能是对商业信息的收集、管理和分析过程,主要是通过对海量数据进行抽取、清洗、聚类、挖掘等分析处理来产生可透析的各种数据,直观显示市场规律。豌豆荚通过对于现有的数据进行分析,结合市场规律、预测未来的行业发展趋势,同时防范和监控风险,做出更好的商业决策,优化内部资源,从而帮助企业更加稳健地实现经营和管理的目标,提高大数据带来的商业价值。
3.3 用户个人信息保护产业发展布局
技术研发创新的同时,豌豆荚也不断通过产业发展布局的创新、内部制度的完善和对外合作交流,建立健全公司的用户个人信息保护体系。
(1)用户个人信息分类保护体系
在大数据时代,保护用户个人信息的重要性不言而喻,也是各互联网企业必须承担的企业责任。但是技术的创新需要信息分享,过度的保护也会影响创新发展,降低用户体验。结合自身发展的实践经验,豌豆荚建立了用户个人信息分类保护体系,实现创新发展与保护公共隐私的动态平衡。
在分类的基础上,豌豆荚依据保护程度对用户个人信息进行分级,按照级别对应不同的管理要求。保护程度的划分主要考虑以下因素:
●用户的身份信息,指能够单独或相互结合识别特定用户身份的信息。主要包括用户基本资料、身份鉴权信息、通讯录信息等。
●用户的支付信息,指用户使用互联网服务过程中的支付信息。主要包括用户的账号、密码等。
●用户的日志信息,指用户使用互联网服务过程中产生的日志信息。主要包括用户终端信息、访问信息、及网络行为记录等。
公司数据安全团队结合上述分类进行用户信息保护分级,对于用户身份信息、支付信息的保护级别最高,日志信息次之、虚拟信息最低。用户个人信息从用户流向互联网服务者,需要经过收集、存储、使用、转移、删除5个环节。在信息转移环节,公司还会采取必要的加密措施,以确保用户信息不被泄露。
在大数据时代,豌豆荚非常重视用户个人信息的分类管理工作,将科技创新与公共信息保护紧密结合起来,实现商业价值最大化,同时履行互联网企业应该承担的社会责任。
(2)完善数据安全及权限管理制度
自创业初始,豌豆荚就意识到数据安全对于科技企业的重要性,建立了严格的数据安全管理制度、数据库权限管理制度、保障各应用系统、数据库系统以及操作系统的安全,保证各类数据的正常访问,防止对信息数据和资源的非法使用和滥用,并成立专门的安全团队,确保数据系统的安全、稳定运行。
(3)加强产学研合作,探索新兴技术
科技的发展是永不停歇的,科技企业的生命力来源于不断创新。豌豆荚自筹资金与国内外知名高校开展合作,共同在前沿技术上进行研究,获得自主创新并具有行业影响力的前沿性科研成果,如App安全、App优化、推荐系统、大数据处理技术与分析平台,并在应用内搜索等领域进行了深入的技术研发,取得了一系列的学术成果:进行了迄今为止学术界最大规模的移动互联网用户(逾千万级)行为模式分析,发现并总结了用户安装、更新、卸载应用的偏好和用户经济背景对于应用选择和流量使用的影响;探索了现有Web缓存机制设计的不足,提出新的协作式缓存机制;基于应用内容的深度挖掘,提出了数据驱动的应用混合组装模式,从而使得“孤岛式”的移动应用之间通过组合形成更多增值服务,推动了我国在移动互联网应用及其大数据分析方面的技术积累和应用模式创新。
4 结束语
本文从移动互联网时代用户个人信息保护的技术研发和产业发展两个方面内容入手,结合公司发展的实践经验,总结了用户个人信息保护的相关方法。然而,伴随着科技的发展,用户个人信息保护必将是一个长期且持续发展的过程,就如同现代化建设一样,并没有一个可以明确的终点,过程中需要不断提高企业的技术创新能力、不断接受新的挑战。
Personal Information Protection Using Big DataTechnologies
With the development of new technologies, personal information protection will certainly be a lont- term andsustainable development process. In this paper, we analyse the useful methods for personal information protection fromtechnology view and industry view,combining with the experiences of Beijing zhuo yi chang technology co., LTD. Then, wepropose the suggestions for personal information protection.
Mobile Internet,BigData,personal information protection
2015-09-19)