大数据平台安全体系探讨
2021-07-02张晓梅
张晓梅
(华信咨询设计研究院有限公司,浙江 杭州 310051)
0 引 言
在我国当下的现代化建设过程中,信息技术已经应用到各个领域,并成为当下各个行业发展的重要工具。各个行业在发展过程中,面对市场变革,格外重视数据分析,不断挖掘信息的内在价值,以期帮助企业实现进一步的发展。然而,海量数据的安全问题越来越受到人们的关注。
1 大数据平台下的安全隐患
相较于传统形式下的安全问题,大数据平台安全包含物理层面的安全、设备安全、网络安全以及数据库安全等内容[1]。大数据平台如图1所示。
图1 大数据平台
1.1 数据采集
当下,大数据的数据来源较为复杂多变,海量数据既存在结构化的数据信息,同时也存在一些非结构化的数据信息,这对数据的合规性以及真实性提出了更高的要求。数据的准确性与质量会直接对数据使用造成影响[2]。
1.2 数据传输
受到当下网络攻击技术发展的影响,数据传输过程对网络防御体系提出了更高的要求[3]。大数据信息传输过程往往会受到诸多不法分子的关注。一旦攻击成功,不法分子便可以窃取到大量数据信息。这会造成严重的信息数据损失。
1.3 数据存储
当下,大数据自身的庞大规模对于数据的存储构架提出了全新的要求。大数据来源呈现出多样化的特征,不同来源的数据结构也较为多样化,使得传统形式下的结构化存储系统无法满足大数据存储的实际需求[4]。
1.4 数据处理
由于大数据体量庞大,一些重要数据信息的泄露风险随之增加。大数据往往包含大量个人信息、属性信息以及行为信息。在实际的大数据传输过程中,如果无法保障这些数据的安全,就会使一些个人隐私信息出现外泄的风险,由此造成个人经济损失[5]。使用数据时,可以基于交叉检验的方式实现简单脱敏的数据处理。
1.5 数据应用
大数据平台的设计主要是基于各种类型的数据应用构建出相应的应用平台,同时也需要对这些应用进行细粒度的访问控制,并对每一个数据信息采用基于生命周期的方式进行管理。然而,这样的管理模式无法很好地预置每一个单位的权限[6]。另外,不同用户对数据的实际使用需求不同,不同的场景也会对权限造成一定的影响,进一步提升了当下数据管理的难度。
1.6 审计管理
在当下的审计管理工作中,多组件、多维度及多用户的审计信息方式,直接增加了审计信息的关联分析难度系数,导致实际的数据关联性分析出现一定程度的短板效应,同时,也会对之后的信息处理工作造成一定的问题[7]。
2 传统网络安全与大数据平台的安全比较分析
传统网络的安全性以网络安全为主,涉及基础设施、网络及系统等方面的安全。大数据平台的安全性主要涉及信息安全,在传统安全内容的基础上,添加了数据信息方面的安全考量。因此,当下的安全分析需要进行安全思维的转变,从原本的网络安全有效地转变为信息方面的安全考量[8]。
3 大数据平台的安全框架
大数据平台的安全管理体系由数据采集安全、数据存储处理安全、数据应用安全以及基础设施安全4个方面构成。在实际的设计过程中,数据采集安全模块主要负责一些接入和权限管理以及数据校验等;数据存储处理安全模块是对数据保密、数据可用以及多租户的管理服务;数据应用安全模块也是对接入安全、操作控制以及数据保密等进行处理[9,10]。
4 基础设施安全
4.1 网络防火墙
大数据平台网络的边界位置需要构建网络防火墙,这样既可以很好地利用防火墙实现网络层的隔离,并对访问行为进行针对性地控制。网络防火墙需要基于默认拒绝配置的方式,通过源地址、服务协议以及目的地址的方式,实施较为严格的访问控制。网络防火墙应用如图2所示。
图2 防火墙示意图
4.2 入侵检测
在大数据平台构建过程中,在一些关键性的节点,如网络边界出口,需要部署入侵检测系统,以此对每一个入侵行为进行监控。一旦发现入侵行为,如发现端口扫描、强力供给、木马后门供给以及缓冲区溢出的攻击行为,就要对行为进行告警,明确具体的攻击行为信息并全程记录。入侵检测系统需要具有特征匹配的功能,同时可以实现协议分析,在出现严重入侵行为时,可以马上发出预警信息。
5 数据采集安全设计
5.1 接入安全
数据采集过程往往需要对网络侧进行相应的配置采集,同时明确采集源端以及目标端的路由,对访问连接的范畴进行有效控制。
5.2 权限管理
权限管理过程涉及到数据采集工作。在实际的管理过程中,首先需要对文件服务器进行设置,其次要在构建的数据库中,实现账号密码的验证,以此保障信息采集的合法性。同时,不同的系统需要配置独立的账号,避免出现不同系统共用账号的问题。数据采集的账号还需定期进行更新处理。
账号权限管理过程是在数据采集流程设置合理的文件服务器、数据库服务器等服务器类型,以此形成不同的账号权限。对于不同的账号而言,账号分配要具备相对独立的数据存放空间,保证不同账号都能隔离保存。
用户采集到数据后,要有效管理数据,不能处理操作权限之外的数据信息。
5.3 数据校验
数据校验是基于系统数据与采集层数据的一致性检测。在数据校验过程中,要保证实际内容与接口协议一致。数据检验过程也要对操作合法性进行检验,以此保障数据传输过程具有较高的安全性。例如,在为一些源端提供数据信息的过程中,要对文件进行检验,对于数据进行安全检验后,让数据优先进入隔离区。只有通过了较为严格的检测,数据才能进入大数据平台。
6 结 论
随着生活生产中大量数据信息的形成,人们越发重视大数据的使用安全。因此,大数据平台需要利用高效率的大数据安全系统实现对大数据的安全防护,从而有效构建并完善大数据安全体系。