我国大数据面临的网络安全挑战
2020-12-30赛迪智库
■ 赛迪智库
大数据自身面临的安全挑战
随着大数据技术的不断发展,个人数据、工业数据等快速汇聚成为常态,数据泄露、数据窃取呈现出高发态势,大数据自身面临的安全风险不断加大。目前,数据泄露频发,个人大数据成为数据泄露的重灾区。2018年6月,AcFun弹幕视频网发公告称,平台有800万-1000万左右的用户数据被黑客窃取。随后,该网站用户数据在暗网中被销售,共计泄露900万条用户数据。2019年2月,深网视界科技有限公司的MongoDB数据库被发现未做访问限制,导致超过250万人的数据可被获取,数据类型包括人脸识别图像及图像拍摄地点等。据统计,2019年第一季度我国累计泄露简历数据5.9亿份,多是我国企业的MongoDB数据库和ElasticSearch服务器没有做访问限制,或者是防火墙出现错误所导致的。
大数据平台安全面临架构和软件的安全风险
大数据清洗、存储、分析、挖掘相关的平台和软件近年来漏洞频出,引发安全风险。Hadoop框架核心组件之一YARN曾被发现存在信息泄露漏洞,黑客能够利用该漏洞获取用户密码。我国研究人员发现,一些黑客曾利用Hadoop Yarn资源管理系统REST API未授权访问漏洞开展网络攻击。2018年11月,研究人员发现Apache Spark中存在安全漏洞,攻击者可通过发送特制的请求利用该漏洞在服务器上执行恶意代码。
大数据挖掘技术带来的安全挑战
一是传统安全防护技术难以满足大数据时代隐私保护需求。传统隐私安全保护技术以匿名化技术为主,如K匿名、L多样性等,但相关技术在大数据挖掘技术下可能失效,大数据挖掘和分析能够对匿名数据进行重新识别,引发隐私安全担忧。例如,2019年8月,澳大利亚某政府部门将部分匿名化交通数据向社会开放,但由于安全风险未做到位,导致交通数据经分析和挖掘后被重新识别,个人交通出行隐私因此被泄露,给政府部门敲响了开放数据风险的警钟。
二是大数据挖掘技术带来数据滥用风险,如大数据杀熟、价格歧视等。携程等互联网公司被质疑利用用户的行为、喜好等数据,在同一产品上对不同用户区别定价,由此引来网友一片声讨;滴滴则被网友发现存在同一出发点和目的地,不同账户面对的估价不同的现象,因此怀疑滴滴在定价方面存在大数据杀熟和价格歧视,滴滴对此回应称估价是实时变化,因此出现该现象。