APP下载

大数据应用中数据安全治理技术研究

2023-03-05贾若飞

中国设备工程 2023年2期
关键词:数据安全生命周期环节

贾若飞

(中海油东方石化有限责任公司,海南 东方 572600)

现阶段,大数据领域内的数据分析与存储能力显著强化,且数据的使用价值不断提升,保证数据安全,实施对数据的安全治理,不仅是保护数据自身安全以及使用期间的安全,同时,也是保护应用数据的实体安全。大数据在各个领域内的逐渐渗透,使其商业价值日益显现,信息安全技术面临着发展机遇,基于大数据生命周期展开各类安全治理技术,转变安全思维模式,实现数据安全治理。

1 数据生命周期

从某种程度来讲,数据的生命周期可以反映出数据在不同阶段的变化以及发展规律,因使用目的不同,数据生命周期也会不一样,比如,云数据生命周期。数据生命周期一般以“全过程监管”为主,将接下来的数据流转阶段详细划分为准备、存储、使用以及销毁几个不同的阶段。

数据的准备阶段,这是数据应用的重要前提,其中主要涵盖了数据的生成、筛选以及汇集等部分,该阶段可有效解决数据来源过于分散的问题,满足数据使用的多样化要求。数据生成主要是指新数据的生产,不管是以软件服务为基础生成了原始数据,还是以现有数据为基础生成了新数据,都可以作为数据的生成过程;关于数据的筛选,主要是对数据进行可用性选择,未通过筛选的数据就是无用数据,需要进一步被销毁;数据的汇集指的是更换数据存储位置,比如,个体用户将计算机内的本地数据上传至云端。

在数据的使用阶段,其中主要包含数据分析、数据大规模计算以及数据合作等部分,这是发挥数据使用价值的重要时期。数据的分析旨在掌握数据信息,挖掘其中价值,采取自动化分析方法,依靠大数据模型完成分析;数据大规模计算主要是对数据的分析成果进行部署;数据合作就是利用不同主体进行单独的数据任务。

在数据的存储阶段,需要将数据保存在一定存储容器内,做好数据的随时调用准备,该时期应加大对数据的安全保护,谨防数据泄露。

在数据的销毁阶段,任何阶段的数据都有可能被销毁,销毁后的数据无法再使用,如果拥有者想使用销毁数据,使用者就要给出已经销毁的证明。

2 数据安全治理现状

大数据不仅数据量大且数据源众多,且涉及的用户和系统接口较多,所以大数据在应用期间会存在较多安全问题,具体体现在以下几方面:(1)敏感信息和个人隐私发生泄漏问题。由于信息管理不善,或者对数据的技术防护能力不足,系统受到网络攻击,导致信息被不法分子以非正式渠道对外披露。(2)非授权访问与数据滥用,高级别的数据被没有相应访问权限的用户获取。(3)数据篡改与伪造,导致数据的完整性遭到破坏,内容与格式被改变,数据原有价值受到影响,甚至被用来制造虚假数据,从而引发系统运行异常问题。(4)数据污染,高质量与低质量数据被混合甚至其中混入了垃圾数据,数据分析结果受到影响,特别是在人工智能与机器学习等领域内,数据污染将会引发系统形成极端分析结果。

3 大数据中数据安全治理技术研究

3.1 数据安全治理原则

基于大数据的数据安全治理本身就是一项长期且复杂的项目,为保证数据安全治理技术的高效落实,在高效应用相应技术的同时,有必要遵循以下基本原则:(1)合规性治理原则,即充分考虑法律法规对于数据安全保护提出的要求,开展数据安全治理活动时必须依法合规。(2)经济性治理原则,安全治理虽然以确保数据使用安全为目标,所采取的措施必须考虑到业务实际情况,以最经济的手段达到预期防护效果。(3)完备性治理原则,数据系统、系统用户与权限、安全事件都有着一定的生命周期,数据安全治理可以形成闭环。(4)可追溯性治理原则,依靠技术手段完成数据追溯,其中有人员操作的追溯行为和数据流转的追溯行为,同时,也包含对安全事件的追溯行为。

3.2 数据安全治理技术架构

遵循上述治理原则,梳理其中要点,得知数据安全治理技术的应用涵盖了数据、人员以及事件等各个环节,各环节都要采取必要的管控措施。大数据应用下的数据安全治理技术整体架构如下:

(1)人员安全管控。这部分主要针对用户即人员展开统一授权认证处理,对用户可以访问的系统文件与数据库提供安全级别,完成访问关系映射,再对用户的操作行为做好记录审计,对其中存在的任何异地登录或者非授权访问等行为予以告警。

(2)数据全生命周期安全治理。根据上文对数据生命周期的研究,其中涵盖数据采集、传输、存储、处理、使用以及销毁等环节,各环节采取的措施各不相同。在数据采集环节,有必要加强对数据来源的验证,判断数据的合法性,核对数据质量问题,分析数据是否合规,对于采集到的数据项完成级别判定与标签设置等工作;数据传输环节,应保证所有数据不会被恶意篡改或者被不法分子窃取,一般会使用SFTP以及Https等合理的加密协议,避免信息被泄露,或者应用摘要算法保证数据在传输期间的完整。如果数据需要进行导入或者导出操作,此时,还应对数据的提供与接收者、数据来源与去向做好溯源管理;数据存储环节,有必要做好数据的分离存储,特别是对于敏感与非敏感性数据,以及不同等级的数据,需要及时被存储于不同的区域,再使用类似SM4的密码技术完成数据加密存储,最后,定期对数据进行备份测试即可;数据处理环节,应对于数据加工等操作合理授权,只允许特定人员完成以上操作,处理时保证所有数据都能完成脱敏与去标识化处理,防止信息被泄露。如果处理后的数据存在敏感性变化,此时应重置标签;数据使用环节,对于数据的使用需提前完成授权管理,只有符合要求的用户进行数据访问操作,数据共享或者数据开放前应完成脱敏处理,或者依靠隐私计算技术对数据完成不可见的共享;数据销毁环节,如果数据不再使用,此时应及时销毁,但必须要用正规的销毁工具将数据和副本全部销毁,最大程度上保证数据的安全。

(3)系统安全防护。依据网络安全等级提出的保护要求,对用户身份加以鉴别,再完成访问控制,随后利用接口工具进行外联接口的统一管理。依靠集中审计平台对所有日志加以审计,最后实施对安全漏洞的专项治理。

(4)事件分析和处置。按照事件的具体分析规则,确立预警机制,创建监测预警平台,负责对网络流量、访问与操作日志进行监测预警分析。与此同时,还应创建统一风险管控与安全态势分析平台,以便及时做好应急处置工作。

3.3 数据安全治理技术分类

(1)全过程监管安全技术。这一技术的应用主要是对数据生命周期内的各个过程加以监控和管理,再完成数据流转过程的高效溯源,验证参与者的行为,及时做好数据安全治理形式的全局管理。在数据溯源过程中,不仅要对系统与应用层的数据操作历史全面掌握,还要了解数据的演变过程,经过零知识证明向监管方证明系统已获得用户许可拥有数据保护等操作,谨防数据隐私泄露。采用区块链技术,以此作为去中心化特征下的分布式账本,完成数据存储与传输,发挥区块链技术的防篡改性特征,确保所有记录内容的可信度,再依靠态势感知分析数据流动的实际情况,完成数据预警,判断在接下来一段时间内的数据使用安全大致情况。

(2)数据使用安全技术。在数据的使用阶段,此时是数据安全的最薄弱环节,为发挥数据价值,需采取有效的方法,如联邦学习与同态加密方法,使用者不会与原始数据产生直接接触即可使用数据,联邦学习方法能够解决数据孤岛的问题,在节点不用上传数据的情况下学习节点数据;同态加密就是基于密文的基础上完成加法与乘法运算,解密后直接在原文处计算结果即可。采用数据分类分级操作,完成数据类别与密级的有效划分,以便高效采取差异化操作。

(3)数据存储与销毁安全技术。首先,数据存储技术的应用旨在保护数据不被篡改与窃取,一般会防止非常规访问,同时,通过密态操作方法与存储过程审计来强化数据的安全性。其次,数据分类分级与安全隔离、访问控制等技术,可指导数据完成差异化存储,提高数据访问门槛。最后,密态操作,即采用密文的形式存储数据,避免越权访问,保证明文数据使用安全。

3.4 大数据中数据安全技术的应用

(1)用于隐私保护的数据安全治理。隐私保护是数据使用期间的重点要求,应根据法律要求进行数据安全治理,及时去除隐私信息,基于数据生命周期应用数据安全技术。从去除隐私信息角度入手,通过数据匿名化与数据脱敏等操作,应用数据掩蔽工具的脱敏模块达到脱敏需要,国内可使用SIMP-SDM进行脱敏处理。

(2)用于数据采集与存储环节的数据安全治理。使用VPN技术解决数据在传输方面的安全问题,确保数据的机密性与真实性,联合密码技术与隧道技术,从源头端与目的端入手,以虚拟化数据传输专用通道,对源头数据加密封装,再将其嵌入另一协议数据报文内,使其被伪装为普通的数据报文。目前市场上常见的VPN技术使用的协议主要有Ipsec协议与SSL协议两种。利用VPN通道将数据传输到目的端,相应的存储系统先解密数据才能存储数据,采用明文的存储形式时容易受到攻击,因此,这部分数据也要做好加密处理,如应用存储加密技术,按照数据的类型和加密机制,选择静态或动态加密方式。为避免遇到事故,数据存储系统应做好备份和恢复工作,对存储好的数据建立备份机制,避免数据意外丢失,启用恢复装置即可完善数据。支持异地备份、数据镜像以及Raid备份等措施,可使用Hadoop下的HDFS备份与恢复工作机制,为数据确立容灾备份。

(3)用于数据分析的数据安全治理。做好身份认证,及时确认用户身份,辨别其真实身份,再根据用户认证信息完成机密数据、特定信息以及人体生物特征信息的认证。完成访问控制,这是数据安全保护的关键,对不同的用户指定特定的控制策略,为用户授予相应的访问级别,在访问重要资源时,必须制定严格的访问控制策略,同时综合自主访问、强制访问、基于角色的访问控制等方式。

(4)用于数据发布的数据安全治理。大数据在经过数据分析与处理后将会进入发布环节,这是指数据公开使用的阶段,数据的安全性至关重要,有必要在数据正式发布前做好数据的审核分析,保证所有输出数据的保密性。整个数据发布环节,需要采取以下数据安全治理工作:①数据安全审计,这是指按照采集的安全大数据,经过评估与审查后寻找其中的安全隐患,再通过审核稽查,找出事故发生的原因,以此做出有效处理。数据发布时,应选择相应的安全审计方案,比如,采用日志审计技术、网络监听审计技术或者网关审计技术,确保数据发布的安全性。②数据溯源,即对大数据的应用周期做出标记定位,一旦遇到数据故障问题,应及时定位责任人员,采取标注法或者反向查询法进行数据溯源。③防范APT攻击,这种数据攻击主要是攻击者采用物联网等途径实施攻击行为,从而窃取目标信息,或者选择驻留在内部网络后寻找进一步的攻击机会。在APT攻击检测时,可选择沙箱方案完成异常检测,再经过全流量审计,基于深层协议进行异常情况的有效识别,为接下来的攻击溯源创造有利条件。

4 结语

总而言之,现阶段各个领域加大了对大数据应用的重视程度,大数据的使用与安全治理问题日益突出。根据数据的生命周期情况,了解数据质量现状,遵循相应治理原则,完善数据安全治理技术架构,加强隐私保护,实现用户身份认证,对不同的数据采取适当的存储与备份、恢复方式,全方位保护数据应用安全。

猜你喜欢

数据安全生命周期环节
全生命周期下呼吸机质量控制
必要的环节要写清
从生命周期视角看并购保险
在农民需求迫切的环节上『深耕』
云计算中基于用户隐私的数据安全保护方法
民用飞机全生命周期KPI的研究与应用
建立激励相容机制保护数据安全
企业生命周期及其管理
大数据云计算环境下的数据安全
现代学徒制管理模式及其顶岗实习环节