基于元数据管理的半结构化数据安全转换方法
2022-03-23赵小凡
赵小凡,李 情
(广东电网广州供电局,广东 广州 510000)
0 引言
随着云存储技术的发展,在云存储环境中需要对半结构化数据进行优化编码转换和访问控制[1]。对云存储动态半结构化数据的转换设计建立在对半结构化数据动态特征分析和融合处理的基础上[2-3]。目前,关于数据安全转换方法的研究受到了人们的极大关注。
文献[4]提出面向大数据的非结构化数据安全保障技术,针对大数据的半结构化数据安全问题,依据数据类型和数据敏感度级别,形成了保障半结构化数据安全的研究成果。首先,通过数据分析获取所需数据类型和敏感度级别,构建数据库的数据节点。其次,为数据节点提供安全算法,与数据节点交互形成安全套件。再次,通过接口的调度算法为半结构化数据提供足够的安全性。但该方法进行云存储动态半结构化数据转换时的自适应性欠佳,统计分析能力不强。文献[5]提出基于模式未知的半结构化数据分析方法,利用多源适应多标签分类框架,根据基于字符串相似度的实体解析算法,将记录分成多个子字符串,从而编辑相似度、计算子字符串之间的关联度。在此基础上,引入二分图最大加权匹配算法度量记录之间的关联度。该方法进行半结构化数据转换时的解密性能欠佳,数据转换输出误码率较高。
针对上述问题,本文提出基于元数据管理的半结构化数据安全转换方法。首先,构建云存储动态半结构化数据的Hash编码模型,通过动态随机码元调制方法、元数据管理以及参数模糊度辨识方法,实现半结构化数据安全转换和多属性群决策。然后,提取数据元特征,结合信息聚类和自适应学习方法,实现半结构化数据安全转换和编码控制。最后,通过仿真测试分析,展示了该方法在提高半结构化数据安全转换能力方面的优越性能。
1 半结构化数据编码设计和码元调制
1.1 半结构化数据编码设计
为了实现基于元数据管理的半结构化数据安全转换,构建云存储动态半结构化数据的Hash编码模型,采用动态随机码元调制方法进行数据编码和输出转换控制设计[6]。假设云存储动态半结构化数据的时间分布序列为Xn,n为原始待分区的云存储动态半结构化数据特征分布集。在模糊时间序列分析处理下,得到云存储动态半结构化数据传输的动态模糊特征分布序列,表示为XN=Xn+η。其中,η为云存储动态半结构数据空间的分布噪声相关融合调度结果。采用相位偏移转换控制和离散调度的方法,构建云存储动态半结构化数据的模糊时间分布模型,得到非隶属度特征匹配参数输出:
(1)
根据动态随机码元调制方法,在固定的融合空间分布模型中,得到云存储动态半结构化数据分布的平均互信息熵:
(2)
式中:R1为平均互信息熵;T为线性编码;U1、U2、U3为结合统计时间的大数据序列。
根据线性控制方法,得到云存储动态半结构化数据的演化特征参数:
(3)
根据动态随机码元的转换控制,得到云存储动态半结构化数据自适应编码的算术密钥协议:
(4)
式中:X为云存储动态半结构化数据自适应编码的算术密钥协议。
在上述模糊调度集中,通过元数据管理,得到云存储动态半结构化数据设计重构的特征值:
(5)
式中:Er为重构特征值;σ1为半结构数据分布的文件的第1个数据块;σ2为半结构数据分布的文件的第2个数据块;σr为半结构数据分布的文件的第r个数据块。
在更新策略下,得到数据组密钥,采用分组交换的方法实现云存储动态半结构化数据动态分析和聚类。
1.2 半结构化数据码元调制设计
根据半结构化数据动态分析和聚类结果,采用模糊自相关融合调度方法,建立云存储动态半结构化数据的直觉模糊度对偶集;采用元数据管理和参数模糊度辨识方法,结合密钥动态重组[8],构建云存储动态半结构化数据的模糊属性分区交换模型。表达式为:
p0,0=t(σz+y)
(6)
式中:p0,0为模糊属性分区交换模型;t为数据采样的时间间隔;σz为数据码元分布;y为Hash函数动态分配。
根据云存储动态半结构数据样本的密度取值[9-11],得到非边缘点融合区域内的动态码元调制密度特征量:
I(Q,S)=H(S)-H(Q|S)
(7)
(8)
式中:I(Q,S)为动态码元调制密度特征量,Q为码元瞬时特性特征参数,S为码元瞬时延续性特征参数;H(S)为动态码元调制密度估计值;H(Q|S)为数据调制中产生的同相数据输出;H(Q|si)为数据调制中产生的正交数据输出;psq(si,qi)为满足条件的分类属性集合;η为模糊自相关融合调度结果。
云存储动态半结构化数据的码元调制输出为:
(9)
式中:ti为码元调制结果输出的时间间隔;gs(ti)为云存储动态半结构化数据的语义概念集出现在模糊概念集S中的概率;p1,n-1为离散化的数据序列。
采用先验样本分析,得到云存储动态半结构化数据码元调制的递归分析模型:
(10)
式中:λ为相邻码元之间的跃变;μ为云存储动态半结构化数据边缘节点分布情况;r为码元分割点。
在模糊时间序列分析训练下,构建云存储动态半结构化数据的直觉模糊度对偶集,采用元数据管理和参数模糊度辨识方法实现对数据的调制和融合[12]。
2 数据安全转换优化设计
2.1 半结构化数据的元数据管理设计
本文以云存储动态半结构化数据码元调制结果为基础,采用统计分析和概率密度特征采样方法,构建云存储动态半结构化数据分簇聚类融合模型[13-14],得到数据融合参数匹配集:
Kwpg=H(Q|si)+d(ωi,k)
(11)
式中:Kwpg(x,y,wi)为数据融合参数匹配集;d(ωi,k)为云存储动态半结构化数据动态融合的适应度算子。
根据半结构化数据安全转换,得到云存储动态半结构化数据的粗糙集特征量,为:
Wx=X(v+k)X×Kwpg
(12)
式中:Wx为粗糙集特征量;X(v+k)为云存储动态半结构化数据存储中心衰减特征量,v为衰减特征累加值,k为衰减系数。
根据云存储动态半结构化数据中的用户行为分布时频特征提取复共轭,实现半结构化数据安全转换和多属性群决策;建立云存储动态半结构化数据对偶模糊信息之间相关关系实现数据元特征提取,得到元数据管理的动态参数元数据管理模型。
2.2 数据安全转换自适应控制
在上述对云存储动态半结构化数据安全编码设计的基础上,采用随机线性加密和Hash结构重组方法,实现云存储动态半结构化数据的加密转换,以提高数据转换的安全性。设云存储动态半结构化数据加密密钥协议的分布幅值为A、数据联合特征分解的离散序列分布为x(t),采用时频特征分解,得到云存储动态半结构化数据加密安全转换输出,为:
(13)
式中:x(y+gi)为前期数据存储结构数据实现分组检测结果,y为数据组数量,gi为数据项;x*(ui)为元数据分布序列,ui为数据结构;e为数据安全系数。
基于混沌稀疏性重排,得到云存储动态半结构化数据加密的密钥传输控制协议,为:
W(X)=[s1,s2,sK]n×Wx
(14)
式中:W(X)为密钥传输控制协议;s1为用户行为属性数据时间序列的第1个正交特征;s2为用户行为属性数据时间序列的第2个正交特征;sK为用户行为属性数据时间序列的第K个正交特征。
根据云存储动态半结构化数据用户行为属性数据采样的时间延迟,构建相空间的嵌入维数,得到云存储动态半结构化数据的稀疏性散乱特征点。在此基础上,建立云存储动态半结构化数据对偶模糊信息之间的相关关系,实现数据元特征提取,表示为:
(15)
式中:μik为数据元特征种类;Kψ为元数据特征。
根据元特征提取结果,得到数据分布的联合空间指向性特征分布,为:
(16)
式中:xn,G为数据分布的联合空间指向性特征分布;G为数据特征分布采样频率;Δxi为数据梯度分布特征量。
结合信息聚类和自适应学习方法,进行半结构化数据安全转换和编码控制[15],得到元数据转换输出的统计时间序列分量:
xn+1=(Xn-2τ)n×xn,G
(17)
式中:xn+1为元数据转换输出的统计时间序列分量;Xn-2τ为时间序列聚类。
根据上述处理,通过网格融合聚类分析方法[16],实现云存储动态半结构化数据的安全转换和加密设计。
3 仿真试验与性能分析
为了验证所提方法在实现云存储动态半结构化数据安全转换中的应用性能,以文献[4]方法和文献[5]方法作为对照,进行仿真测试分析。
3.1 试验参数设置
设置云存储动态半结构化数据存储的网格数量为14×24,网格对象的密度值为0.35,云存储动态半结构化数据采样的长度为1 024,样本数据为700个,测试集规模为120,规范化残差特征分布系数为1.26。在此基础上,进行仿真试验。
3.2 试验结果分析
云存储动态半结构化数据分布如图1所示。
图1 云存储动态半结构化数据分布Fig.1 Cloud storage dynamic semi-structured data distribution
以图1所示数据为研究对象,对云存储动态半结构化数据进行加密安全转换。云存储动态半结构化数据安全转换输出结果如图2所示。
图2 云存储动态半结构化数据安全转换输出结果Fig.2 Secure conversion output of cloud storage dynamic semi-structured data
由图2可知,运用本文方法进行云存储动态半结构化数据转换的输出安全性较好,抗攻击能力和隐私性明显优于其他两种方法。由于本文方法采用时频特征分解方法,得到云存储动态半结构化数据加密安全转换输出,在此基础上结合信息聚类和自适应学习方法,实现了半结构化数据安全转换和编码控制,从而提升了半结构化数据安全转换输出的安全系数。
测试数据转换的收敛曲线如图3所示。
图3 测试数据转换的收敛曲线Fig.3 Convergences curves of test data conversion
由图3可知,本文方法进行数据安全转换时的收敛稳态性较好,比另外两种方法更具有安全性与真实性。云存储动态半结构化数据转换输出的误码率如表1所示。
表1 云存储动态半结构化数据转换输出的误码率Tab.1 BER of dynamic semi-structured dataconversion output of cloud storage
由表1中的数据可知,随着迭代次数的增加,不同方法的数据转换输出误码率均呈现出不断降低的趋势。相比较之下,采用本文方法进行云存储动态半结构化数据转换时输出误码率更低,说明本文方法的数据传输结果更可靠、安全性能更好。
4 结论
针对传统方法的半结构化数据安全转换能力较差、数据转换输出误码率较高的问题,本文提出基于元数据管理的半结构化数据安全转换方法:构建云存储动态半结构化数据的Hash编码模型;采用动态随机码元调制方法,进行数据编码和输出转换控制设计;采用元数据管理和参数模糊度辨识的方法,实现数据调制和融合。根据空间特征匹配的方法构建数据安全转换,得到云存储动态半结构化数据的粗糙集特征量。建立云存储动态半结构化数据对偶模糊信息之间的相关关系,实现数据元特征的提取实现半结构化数据的安全转化和加密。分析试验结果可知,采用本文方法的半结构化数据安全转换的稳定性较高、输出误码率较低。该结果充分验证了本文方法的有效性与实际应用价值。