APP下载

基于云存储架构的分布式大数据安全容错存储算法

2019-01-17吴晓玲邱珍珍

中国电子科学研究院学报 2018年6期
关键词:加密算法数据安全粒度

吴晓玲,邱珍珍

(广州商学院,广东 广州 511363)

0 引 言

计算机网络日益发展,大众步入了信息化时代。分布式数据与信息的高效存储和利用早已成为大众生活和工作中十分关键的部分,无论企业还是个人,对数据的关注度都越来越高,由此,数据的存储数量在大量增加[1-2]。但现实情况中,大多数据存储算法和方法均不具备较为全面的性能[3]。当前分布式大数据存储方法借助网络信息技术将用户的数据储存在网络云端当中,并借助加密算法的方式对数据信息给予密码保护,由于数据处理的效率比较高,传送速度快,集成化程度比较高以及服务器的覆盖范围广泛等特征,近些年的发展与普及速度非常快。大数据的储存是云计算当中的主要环节,是计算机网络技术中有些储存功能借助联合与改进而形成的一种高实用性、低成本的储存方法,其可以将用户信息以储存并加密的方式进行处理,并借助网络回传给用户。以下为相关学者提出的数据存储算法和方法,以此为例对目前相关研究进行探讨。

林志贵[4]等人提出基于存储阈值的数据存储算法。过程中,将事件的优先级作为判断数据存储位置至查询节点间距离的依据,并以此减少数据存储以及查询时对网络的消耗,依据对节点数据存储阈值的定义判断进入下轮时隙分配与否。当网格范围内节点均达到数据存储阈值,将数据保存至同一优先级的网格中。当同一个优先级中所有网络节点均达到某存储阈值,将工作时隙重新分配。实验结果表明,所提算法运行下网络生命周期较长,但数据存储的安全性较差。侯昉[5]等人提出基于Z-Ordering的数据存储算法。过程中,利用空间填充曲线Z-Ordering自身具备的存储映射方式和其访问距离衡量因素,将网络中的高维相邻数据簇结合至一维存储位置,以此加强数据存储局部性。实验结果表明,该算法存储耗时短,但空间占用情况严重。杜瑞忠[6]等人提出基于封闭加密的数据存储方法。利用虚拟机的隔离技术构建封闭计算空间,对R-SA公钥加密法进行改进,使其无需重新生成大素数即可完成密钥变化,同时利用SSL安全链对数据和密钥进行传输,将数据于封闭计算空间中进行加密之后再保存到分布式系统。其中,封闭式的计算空间可以阻止网络中不良应用和云管理员各种攻击,高效防范数据的泄露。实验表明,该方法安全性较强,但存在容错性差的问题。

根据上述对当前数据存储算法和方法的研究可知,相关研究存在安全性和容错性差、数据存储占用空间大的问题,为此,本文展开研究,试图提供新思路。

1 分布式大数据存储

1.1 分布式大数据存储约束条件

因为分布式大数据存储的过程中,数据会以一种离散形式进行存储,由此需要在分布式大数据存储前做以下约束:

(1)整个分布式大数据存储的过程中,数据的流动性为透明的状态,也就是最终的数据存储节点对中间的数据传输链路并不关注,且整个中间链路为云特性;

(2)分布式大数据网络不存在固定控制中心,随机分布式数据传输和存储时都需要经过该数据库的检索完成数据调度;

(3)随机一个数据存储的中继节点出现失效情况,都能够利用其他中继节点完成数据存储的接力。

因为对随机中继节点来说,进行数据传输就是对网络中一定带宽转存的一个过程,由此分布式数据存储容错性能够利用式(1)的模型确定:

(1)

式中,Esent(c)为分布式大数据存储容错程度;c为数据存储数量;fsent(t)为数据传输时的映射函数。

依据式(1)可知,针对随机分布式数据的传输链路来说,整体数据存储容错系数影响因素很多,其中包含当前节点数据的存储数量等[7-8]。分布式数据在传输的过程中,要依据各条分布式数据存储链路完成数据存储,由此其容错系数会随着数据存储链路数量的增加而变大。

1.2 基于云存储架构的分布式大数据安全容错存储算法

在基于云存储架构的分布式大数据安全容错存储算法运行前,将分布式数据弹性和数据的利用概率以及数据的粒度确定为已知值。其中,数据粒度是指数据库中数据的细化和综合程度,细化程度越高,粒度越小;细化程度越低,粒度越大。弹性数据集是一个容错且可以执行并行操作的元素的集合,控制数据的弹性需要控制数据的收敛性来实现。

当数据存储节点收到数据存储请求之后,分布式数据存储为连续请求状态,依据式(2)至式(8)所示的数据存储梯度和存储强度指数计算模型,当计算结果满足式(8)时,将数据存储起来,假设不满足,则反复执行式(2)至式(8)。其中,一般数据储存系统会划分为三个梯度,第一梯度实现数据的高度访问,第二梯度起到了对第一梯度和第三梯度的缓冲作用,第三梯度用于数据归档。下文式(2)至式(8)所体现的是数据储存的第一梯度。

假设分布式数据的利用概率为P(x),分布式数据的利用概率期望值EP(x)和分布式数据弹性期望值E[T(x)]为倒数关系,则有:

(2)

式中,λ代表分布式数据服从指数。

当式(2)模型计算期望值为负数时,则表明数据存储过程中的存储流畅程度和拥塞程度为反比,分布式数据存储继续进行。假设式(2)计算期望值为正数,需要对数据存储的服务质量进行控制,利用调控数据的粒度完成存储过程的继续。

因分布式数据存储的流畅度和式(2)计算出的期望值为负相关,尤其是当数据粒度比较细时会使该期望值持续上升,还可能会变为正数,由此利用粒度率p对分布式数据弹性T(x)进行控制,进而降低数据存储空间占用率,使数据存储流程更加顺畅[9]。

综上分析可知,T(x)和p之间满足负相关关系,由此能够通过该关系保证T(x)数值不变,则有:

T(x)⟹p

(3)

式中,T(x)⟹p的期望值E[T(x)⟹p]满足时间函数,E[T(x)⟹p]数学表达式为:

(4)

根据式(4),将当前数据存储接入粒度率还设定为p,那么下一个时刻T(x)满足的关系式如下

(5)

因为分布式数据存储点带宽是有限的,而且存储梯度Δ可以高效覆盖T(x),由此对于随机时刻Δt,与之对应的保证覆盖关系ΔT(x)满足式(6):

(6)

依据式(6)的计算,得到的分布式数据存储强度指数Δλ满足式(7)所示的数学表达式:

(7)

基于式(7)的计算结果,分布式大数据存储梯度Δ和数据弹性T(x)满足式(8),以此实现数据存储:

(8)

根据式(8)的计算可知数据存储梯度Δ和数据弹性T(x)的最佳关系,此时将分布式大数据进行存储,式(9)为最终存储结果Δ(X):

Δ(X)=Esent(c)·c·P(x)·Δλ·T(x)

(9)

式(9)即为基于云存储架构的分布式大数据安全容错存储结果。

1.3 分布式大数据存储结果加密

基于分布式大数据存储结果,利用CP-ABE加密算法对数据存储结果进行加密,以提升数据存储的安全性。

ABE加密算法为公钥加密,与其对应的解密对象不是个体,而是整个基于云存储架构的分布式大数据安全容错存储群体。由于ABE融入了数据属性理念,使ABE算法于云计算下应用较为广泛[10]。其将访问控制权交给用户,数据访问用户能够自主选取要查询检索的数据信息,此为CP-ABE加密算法于云计算下最大优势。以下是将CP-ABE加密算法应用于本文分布式大数据安全容错存储算法的具体步骤:

(1)输入设定安全参数,获取主密钥MK,公开参数PK。

(2)输入主密钥MK和公开参数PK,结合2.2步骤得到的分布式大数据存储结果,在明文Δ(X)的基础上获取密文C[Δ(X)]。

(3)输入分布式大数据属性集合(包括大数据分布弹性T(x)、粒度率p以及储存梯度Δ)、主密钥MK,获取私钥SK。

(4)输入密文C[Δ(X)]、私钥SK,对密文C[Δ(X)]进行解密,最终获取明文Δ(X)。

根据CP-ABE加密算法对分布式大数据存储结果进行进一步加密,可高效解决当前数据存储方法中存在的安全度差的问题,确保数据储存的安全性。

2 实验结果与分析

为验证本文提出算法的整体性能进行实验。实验环境为:CPU是Intel Pentium CPU G3260 @ 3.30 GHz,实验内存为8.00 GB,实验操作系统为Windows 764位操作体系,实验软件为Matlab 2017a。实验参数如表1所示:

表1 实验参数

根据上述实验环境和实验参数的设定,分别在以下方面对本文提出的算法进行验证:

(1)数据存储安全性

(2)数据存储空间占用率

(3)数据存储容错性

实验结果如下:

图1 不同数据存储法安全性对比

分析图1可知,相比基于存储阈值的数据存储算法和基于Z-Ordering的数据存储算法,本文提出的算法安全系数更大。该算法利用ABE加密算法对应的解密对象不是个体,而是整个本文算法群体这一特性,有效提升了分布式大数据存储的安全性。与当前算法相比,该算法表现出了较强的可行性。

图2 不同数据存储法空间占用情况对比

由图2可知,基于Z-Ordering的数据存储算法数据存储空间占用率最高,基于封闭加密的数据存储方法数据存储空间占用率次之,本文提出的算法数据存储空间占用率最低。该算法利用粒度率对分布式数据弹性进行控制,有效降低了数据存储空间占用率,缓解了当前数据存储算法和方法中存在的空间占用情况严重的问题。

表2中。U0代表实验次数,U1代表基于封闭加密的数据存储方法容错系数,U2代表基于存储阈值的数据存储算法容错系数,U3代表本文提出算法容错系数。

由表2可知,本文所提算法在不同实验次数下,数据存储容错系数均值较大,最大为1.0,最小为0.8,与当前算法和方法相比,鲁棒性更强。该算法在分布式数据在传输的过程中,要依据各条分布式数据存储链路完成数据存储,进而使所提算法容错系数随着数据存储链路数量的增加而提升,有效增强了数据存储算法的容错性。

综合上述实验结果,本文所提算法与当前数据存储算法和方法相比,呈现出了较强的存储性能。该算法在数据存储安全性、容错性和存储空间占用方面均较为优越,是一种切实可行的分布式大数据存储算法。

表2 不同数据存储法容错性对比

3 结 语

数据存储在大众日常中占据着十分重要的地位,一个性能良好的数据库必须具备数据缓存单元,可见数据存储对于社会各界产生的大数据重要意义不言而喻。以解决当前数据存储方法和算法中存在的问题为目的,提出基于云存储架构的分布式大数据安全容错存储算法。通过分布式大数据存储约束条件的构建为数据存储奠定基础,利用云架构实现数据存储,同时通过CP-ABE加密算法对云架构下数据存储结果进行加密。实验结果表明,所提算法可实现低占用内存、安全、高容错的数据存储。根据实验可知,基于云存储架构的分布式大数据安全容错存储算法可为该领域发展提供借鉴。

猜你喜欢

加密算法数据安全粒度
我国5G数据安全保护供给不足,“四步”拉动产业发展
基于DES加密算法的改进研究
粉末粒度对纯Re坯显微组织与力学性能的影响
动态更新属性值变化时的最优粒度
云计算中基于用户隐私的数据安全保护方法
DES加密算法的实现
基于整数矩阵乘法的图像加密算法
建立激励相容机制保护数据安全
大数据云计算环境下的数据安全
双粒度混合烧结矿颗粒填充床压降实验