基于信息浓缩粒子滤波的分布式网络数据库优化索引
2016-05-14王春杰朱保锋
王春杰 朱保锋
摘要:分布式网络数据库优化索引可提高数据库的访问和数据管理能力。传统方法采用Web数据库临界级联差分耦合方法进行数据库索引,随着干扰数据和数据库规模的增大,数据库索引准确度不高,语义指向性不好。提出一种基于信息浓缩粒子滤波的分布式网络数据库优化索引算法,首先进行分布式网络数据库的数据结构分析和特征融合处理,采用信息浓缩粒子滤波方法对干扰数据进行滤除抑制,并采用语义特征波束形成方法进行目标数据的波束聚焦和特征提取,实现数据库的优化检索。仿真结果表明,利用该算法进行数据库索引的准确度较高,收敛性好,执行时间短,展示了较好的应用性能。
关键词关键词:数据库索引;粒子滤波;分布式网络
DOIDOI:10.11907/rjdk.161369
中图分类号:TP391文献标识码:A文章编号文章编号:16727800(2016)007015503
0引言
在数据库访问中,对数据库中的语义信息特征索引成为数据库检索的基础技术,通过数据库优化索引算法设计,可提高数据库的检索和访问能力,相关算法研究也受到了人们的极大重视[1]。传统方法采用Web数据库临界级联差分耦合方法进行数据库索引,随着干扰数据和数据库规模的增大,数据库索引的准确度不高,语义指向性不好[2]。对此,相关文献进行了改进设计,随着智能算法的应用,采用粒子群算法进行数据库访问和索引成为发展趋势。采用粒子群算法进行数据库访问的控制和语义索引过程中,由于粒子群的迭代系数对初始权值的选择较为敏感,容易陷入局部极值,因而对数据库的索引性能不好。
近年来,在粒子群控制算法基础上,许多学者提出了蚁群、粒子群优化算法等人工智能方法进行数据库访问过程训练,取得了一定效果。传统方法中,对分布式网络数据库的实体建模和决策控制算法主要采用小样本、非线性及高维模式识别方法,如模糊神经网络决策算法、蚁群算法(ACO)和粒子群算法(PSO)等[35]。在上述算法进行分布式网络数据库分析和实体建模过程中,需要进行参数寻优和自适应建模,达到对分布式网络数据库预测和控制决策的目的。为了提高数据库索引精度,本文提出一种基于信息浓缩粒子滤波的分布式网络数据库优化索引算法,首先进行分布式网络数据库的数据结构分析和特征融合处理,采用信息浓缩粒子滤波方法对干扰数据进行滤除抑制,并采用语义特征波束形成方法进行目标数据的波束聚焦和特征提取,实现数据库的优化检索。最后通过仿真实验进行了性能测试,展示了本文算法的优越性能。
1分布式网络数据库数据结构分析与特征融合处理 1.1分布式网络数据库数据结构分析
为了进行分布式网络数据库的优化索引,需要首先构建分布式网络数据库的数据结构模型,进行数据结构的特征分析和数据信息融合处理。本文研究的分布式网络数据库的数据存储节点均匀分布在有向图G1、G2中,在分布式网格的覆盖度目标区域A内,有向图G1和G2的语义节点是均匀线列阵分布的,簇头节点采用随机部署方法。数据库语义相似度节点采用最常用的布尔模型(0/1模型)。网络级联分布式数据库的数据存储深度空间坐标为(xs,ys),用一个二元有向图G=(V,E)表示数据分布的编队系统,网络数据库相邻网格M与节点s的数据索引有效性覆盖范围为:SCMN={(si,sj)|d(si,sj)≤Rc,si∈M,sj∈N}(1)其中,M、N为关键词节点间的规模数,设数据库访问过程中的语义特征优先级调度向量为Pc,位于(xp,yp)的任意点p的矢量场和sink节点的关联维数为d(s,p)。分布式网络数据库的数据特征空间矢量场分布在区域A,半径为W×L个22Rc×22Rc的矩形网格。设数据流样本S=X1,X2,…,Xk,…,每个网格的网络是一个无向图 ,关键词索引的语义指向性信息特征表示为EH(s,t)=(V,E)(s≥1,t≥1),在数据库的有效访问范围内计算关键词G1和G2的连接度,计算公式为:a=2n(GC)2n(GC)+mGC(G1)+mGC(G2)(2)每个网格有4个邻居网格,假设G1=(V,E)和G2=(V′,E′)都为重连通图,节点对之间的距离由超立方网EH(s,t)的网络拓扑结构决定。在均匀线列阵区域内,非边界(边界网格至少有2个邻居网格)G1和G2之间的顶点集为:Vt(k)={as+t...at+1at...a11|as+t...at+1=k,
ai∈{0,1},0≤k<2s}(3)假设a1,a2∈V,b1,b2∈V′,对于数据库索引的语义指向信息EHs(j)和关联位置EHt(k),添加两条边
1.2数据库的大数据信息特征融合处理
通过对数据库的大数据信息特征融合处理,为分布式网络数据库的优化索引提供准确的数据基础。假设分布式网络数据库路径优化结果中关键词节点为{v1,v2,…,vn},结合粒子群算法进行大数据融合,得到数据库调度的加权向量结构权重计算为:weight=∑ni=1∑nj=i+1dist(vi,vj)(8)本文通过模糊C均值聚类得到数据库的关键节点与数据流微簇结构权重,采用dist(vi,vj)表示分布式网络数据库访问中关键词节点vi到vj的最短路径距离。采用信息度浓缩聚焦方法进行特征融合,在相空间S中,进行关联维特征匹配。定义数据聚类多波束数据库矢量场中tf(k,N)的索引信道,数据库索引过程中信道均衡的运算表达式为:φ(y)=f(yR)+jf(yI)(9)式中,yR和yI分别是y的实部和虚部,建立初始种群,设计一个粒子群滤波的种群适应度函数:数据库的大数据信息特征融合内容与关键词的差异性特征为一个线性调频时间序列,采用非线性时间序列分析方法,根据融合参数和φ,得到数据融合时间序列y(k)为:y(k)=a(k)h(k)+n(k) (12)假设用户输入了3个关键词,Q={q1,q2,q3},通过大数据信息融合进行数据库优化索引。
2算法改进设计与实现
在上述分布式网络数据库的数据结构分析和特征融合处理的基础上,进行数据库优化索引。分析当前算法可知,传统方法采用Web数据库临界级联差分耦合方法进行数据库索引,随着干扰数据和数据库规模的增大,数据库索引准确度不高,语义指向性不好。为了克服传统方法的弊端,本文提出一种基于信息浓缩粒子滤波的分布式网络数据库优化索引算法,在进行分布式网络数据库的数据结构分析和特征融合处理基础上,采用信息浓缩粒子滤波方法对干扰数据进行滤除抑制。数据库分布式状态下的信息浓缩权重可以采用Z变换求得,根据Z变换的定义,得到数据库索引语义关键信息的输出变量耦合值R3为:R3 = μo 2πKhlnrw rw ′(13)假设数据库访问中信息流的采样时间间隔区间为s∈[tk,tk+1],则采用粒子滤波方法,进行干扰抑制后的数据库输出信息流二阶矩特征为:R=μw 2πKh[1mlnReh 2(i + 1)rw + 1.7lnReh rf +
12Zf + 25Z2f + μo μw lnrw rw ′] (14)对分布式数据库的索引有效性进行信息浓缩聚焦,缩减索引深度。在粒子滤波下,数据库优化索引的自适应波束形成输出的关联匹配量可以表示为:QH=ΔpR=Δpμw2πKhRp(15)其中:Rp = 1mlnReh 2(i + 1)rw + 1.7lnReh rf +
12Zf + 25Z2f + μo μw lnrw rw ′(16)定义Ci为数据库索引起始时间图G,其中包括了关键词语义信息x0(tk),采用语义特征波束形成方法进行目标数据的波束聚焦和特征提取,得到数据库索引的优化输出z(k)为:z(k)=fTF(k)y(k)-fTB(k)(k)(17)根据波束形成结果进行自适应语义信息素浓度聚焦,通过粒子滤波得到相对状态序列模型,由此实现算法改进,达到对分布式网络数据库优化索引和数据库访问的路径优选目的,算法实现流程如图2所示。
3仿真实验与结果分析
为了测试本文提出的方法在实现分布式网络数据库优化访问和信息索引中的性能,进行仿真实验。实验采用在Matlab R2012a环境下反复调试程序实现数据挖掘和实体建模,通对数据集进行特征融合处理,采用信息浓缩粒子滤波方法对干扰数据进行滤除抑制,采用语义特征波束形成方法进行目标数据的波束聚焦和特征提取,得到数据库访问中数据采样特征融合及语义特征波束形成结果如图2所示。
由图2可见,采用本文算法进行分布式网络数据库索引,通过信息浓缩粒子滤波处理,可提高数据库访问中的抗干扰能力。为了对比算法性能,采用本文方法和传统方法进行数据库索引的精度测试,对比结果如图3所示。由图可见,采用该算法进行数据库索引的准确度较高,收敛性好,执行时间短,展示了较好的应用性能。
参考文献:
[1]陆科达,万励,吴洁明.基于数据挖掘技术的网络安全事件预测研究[J].科技通报,2012,28(6):3740.
[2]凌妍妍,孟小峰,刘 伟.基于属性相关度的Web数据库大小估算方法[J].软件学报,2008,19(2):224236.
[3]魏利峰,纪建伟,王晓斌.云环境中Web信息抓取技术的研究及应用[J].电子设计工程,2016(4):2931.
[4]陆兴华,陈平华.基于定量递归联合熵特征重构的缓冲区流量预测算法[J].计算机科学,2015,42(4):6871.
[5]杨俊,周丙寅,张毅,等.基于递归图分析的压缩机故障诊断方法研究[J].计算机与数字工程,2013,41(6): 984986.责任编辑(责任编辑:黄健)
第7期 邵桐,朱明东:基于元数据的数据交换系统研究软 件 导 刊2016年标题