APP下载

分布式数据库分片关系变换自适应查询技术研究

2020-01-07李淑兰王景珊

科学咨询 2020年32期
关键词:分片分布式聚类

李淑兰 王景珊

(景德镇学院 江西景德镇 335100)

引 言

分布式数据库是一种运用物理存储介质的分散单元存储方式进行数据的存储及耦合性融合的数据库,具有储存空间大、数据整合能力强等特征,能够满足规模较大及云数据的存储需求。在云计算等技术不断发展的情况下,分布式数据可能够发挥出更大的优势。但随着储存量的不断增加,分布式数据在数据查询上可能会受数据耦合关系的影响而出现误差问题。因此,为了有效保障分布式数据库在查询数据上的准确性,必须要对其查询技术进行优化。本文将对分片关系变化为基础的自适应查询技术在分布式数据库中的实现进行简单探讨,通过建立模型、数据提取、仿真测试等方式检验自适应查询技术的运用效果。

一、分簇聚类模型

(一)分布式数据库的存储结构

要做到分布式数据可分片关系变化自适应查询,首先需要对分布式数据库在数据存储方面的结构展开分析,分析方式主要以数据分段属性辨识与特征分解两种为主。此时需要对分布式数据库的存储样本集及数据库中存储数据的种类进行定义,同时对分布式数据库中需要查询的样本和分簇聚类模型进行定义,并列出定义式。之后将定义式中分布式数据库存储数据样本采样幅值和样本集维数利用分段融合方法进行模糊聚类,得出数据库的存储向量空间,并得出几何矩。将几何矩中的分片中心点用自适应特征分解法进行信息整合,得出数据库样本查询的聚类中心式。运用领域搜索法对分布式数据库中所存储信息的词语、节点等特加以分解,得出特征分解的目标函数式。在该目标函数中设定一个数据图和一组查询关键词,利用查询节点权重自适应法得出模糊度点集以及数据库查询的聚类交叉项。由此构建出数据库结构模型,结合数据库结构及查询节点对其查询方法进行设计。

(二)数据关系集的特征融合

在分簇聚类模型构建的前提下,利用数据关系集特征融合方式完成数据库的状态向量空间组合,并得出本体特征分布式。利用向量量化分解法进行分片处理,得出分片变换输出式。利用自适应融合对数据集的分片结果进行处理,得出数据融合聚类结果。结合数据库中关系元组的梳理得出数据查询的模糊聚类中心向量,结合分片属性分解自适应特征和改进型耦合关系的变换,得出两个聚类簇,用数据关系集的本体特征分量提取出二阶、三阶以及中心距,最终实现通分布式数据库自适应查询效果。

二、数据库自适应查询技术的实现

在完成分簇聚类模型构建以及状态向量空间组合、特征提取之后,需要对数据库查询技术进行优化。首先列出数据特征分部向量集的分片关系变换式,并根据分片属性对自适应特征进行分解,得出分布式,在该式中,具有绝不是数据库查询数据集的规范正交基,提取出互信息熵特征量。在进行分片属性、门限值设置时,需要通过对提出的信息熵进行自适应配置,自聚类中心就能得出数据库查询输出式。可利用自适应全局概率搜索法对其中的最优迭代步长进行数据集搜索,搜索后得出查询数据集的中心分量。在输出查询的样本值中选择适应度最高的作为训练集。结合数据的指向性聚类结果得出数据库查询的输出特征融合向量集,迭代步长增量出现。由此实现分布式数据库的优化查询。

三、仿真实验

要确保查询技术的应用效果,需要通过仿真实验加以验证。首先,确定实验所用的查询数据库类型、分布式数据库中待查询的数据样本集数量、数据的规模长度、数据集采样带宽、数据库查询节点连接关系数量,进行多次查询实验后得出查询数据集的时域波形图。将时域波形图的数据集作为样本,进行数据分片变换处理及信息融合处理,得出特征分布图。最后,根据特征分布图的数据分布情况对融合聚类、特征进行提取,完成对数据库查询的优化,利用多种方式对其查询准确率进行检测,得出检测结果。从检测结果中可以看出,利用分片关系变换自适应查询技术进行数据库查询,准确率会随着分片尺度的增加而增加,同时可以看出其准确率在特定分片尺度情况下可以达到100%,这比传统查询技术要高出很多。由此可见,在分布式数据库查询中利用分片关系变换自适应查询技术进行数据查询,能够有效提高查询结果的准确性,同时也说明了现有的数据库查询技术有待完善。[1-3]

四、结束语

随着互联网与计算机技术的飞速发展,信息数据的储存需求越来越大,数据库的应用需求也随之不断增加。分布式数据库具有存储量大等优点,在很多具有大规模存储需求中得到了广泛运用,但因为其存储数据量巨大,在数据查询上会存在效率及准确率问题。加强对分布式数据库数据查询技术的进一步研究,是保障数据查询准确性的重要途径,同时也是提高分布式数据库运用效果的重要方式。通过研究,分片关系变换自适应查询技术能够有效改善分布式数据库在查询准确率方面的问题,在分布式数据库查询中开应该加强对此查询技术的运用。

猜你喜欢

分片分布式聚类
上下分片與詞的時空佈局
基于RTDS的分布式光伏并网建模研究
利用状态归约处理跨分片交易的多轮验证方案①
基于模糊二分查找的帧分片算法设计与实现
面向WSN的聚类头选举与维护协议的研究综述
基于预处理MUSIC算法的分布式阵列DOA估计
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法
通用导弹雷达罩曲面分片展开系统的开发