网络数据库特定数据检索算法研究
2018-09-14文世敏
文世敏
摘要:在挖掘海量数据信息的过程中,传统的数据检索方法不再适应海量题库中数据快速增加的趋势,数据信息获取和处理效率较为低下。对网络数据库特定数据信息进行检索能提升数据访问和查询能力,提升数据信息利用率。为此,文章在阐述网络数据库特定数据检索原理的基础上,打造网络数据库特定数据检索体系结构,进行网络数据库特定数据检索模块的设计和仿真实验,旨在有效提升数据库特定数据的检索效率。
关键词:网络数据库;特定数据;检索算法;应用
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2018)16-0007-03
在云计算技术的快速发展下,不同类型服务器数据信息得到了快速发展,社会主义市场数据处理需要先进的大规模云计算数据存储和检索技术,通过这些检索技术和算法的应用提升数据信息的使用效率。在信息数量的快速增长下,面向多用户的网络拓扑结构也发生了相应的变化。在这样的情况下怎样找到一个高速、有用的算法提升数据信息检索效率成为相关人员需要思考和解决的问题。网络数据库特定数据检索算法在考虑用户需求的情况下,能够应用相应的技术形式和科学算法来提升网络数据库服务检索效率。为此,文章结合实际就网络数据库特定数据检索算法应用问题展开探究。
1 网络数据库特定数据检索原理
在检索网络数据库特定数据内容的時候需要对数据库中的全部数据进行聚类分析处理,在对这些数据信息处理分析的过程中发现具有应用价值的特定数据信息,之后应用一个统一的划分标准来对这些数据信息初始地表述为一个簇的平均值和中心。对于其中多余的数据信息,结合这些数据信息和簇中心的距离,将他们归类到相邻的簇中,在簇归类的基础上重新计算每个簇的平均值,反复迭代操作获取一个稳定的特定数据信息准则函数,完善网络数据库特定数据信息的检索操作。在对网络特定数据信息进行检索操作的时候,如果A代表从不同类型数据集合中发现一个有价值的数据信,n则是代表划分准则,B1、B2......Bm代表数据库中不同类型数据信息的聚类集合,公式如(1)所示。
H=[Axn(B1,B2,....Bm)xpB] (1)
(m是多类数据信息的集合,p是最初数据信息的初始地,B是所有数据库类型信息)
2 网络数据库特定数据检索体系结构和关键模块设计
2.1 体系结构
结合人们的使用需求,应用分布式架构技术打造拥有大规模、大数量的数据信息的特定数据搜索系统,系统具体构造如图1所示。结合图一的构造发现,在特定数据搜索系统中主要包含用户界面、信息拦截器、数据库连接模块、数据抽取模块、数据索引塑造检索和索引数据模块等。用户界面可以借助科学的技术形式来向用户展现他们所需要的数据信息检索结果。在得到数据信息检索结果之后可以应用JDBC访问数据库来进行数据库数据读写数据信息的录入和用户操作管理。在具体操作中获取相应的文本信息之后,需要应用这些信息打造索引数据模块。在索引数据模块的作用下将应用程序和分布式存储服务系统连接在一起。
2.2 模块设计
2.2.1 从海量题库中的特定数据搜索系统中获取大量文本信息
定时器在使用的时候能够从数据库模块中抽取相应的文本信息,在应用数据抽取模块的时候能够应用定时器来完成相应文本信息的采集、整理,并将抽取出的海量题库文本信息结果当作索引塑造模块的输入信息,按照功能分区塑造索引。
2.2.2 通过设计塑造模块打造海量题库为本索引
索引控制器在应用的过程中控制运行索引模块,应用分布式连接器来采集相应信息,之后塑造海量题库文本索引,将文本索引保存到相应的索引库中。在塑造一次索引之后需要返回到之前的状态码,同时将没有塑造的文本索引分区保存到索引状态表中。
3 基于模糊约束的网络数据库特定数据检索模型的塑造
3.1 网络数据库特定数据矩阵模糊化处理
在网络数据库特定数据信息优化检索操作中需要引入模糊理论来对整个网络数据库散度度量样本之间的相似数据进行模拟化操作,通过这种模拟化操作来使得样本类内散度最小化发展,具体描述如下所示:
在网络数据库特定数据检索优化过程中,将由w代表网络数据投影空间法向量,yk=wTxk代表的是特定数据样本xk的投影,网络数据库特定数据投影空间的聚类中心表示如(2)所示。
[mi-=1Nk=1Niyk·wTmiw] (2)
(WTmi代表的是特定数据样本的总体误差,Ni代表的是在特定样本数据信息基础上建立的聚类中心,n=1,k=1,代表的是样本xk可能的最近邻聚类)
在网络数据库特定数据优化检索操作中可以通过引入模糊理论来对网络数据库的特定数据散度度量样本之间的相似性进行模糊化处理。在网络数据库特定数据信息优化检索操作过程中可以利用公式组成定义网络数据库特定数据散度度量目标函数。在多个公式的作用下能够将特定数据样本类内的散度最小化和类间散度最大化问题转变为最大化目标函数,之后经过求解得到数据库中特定数据最优化投影方向,具体如(3)所示。
[ω?=i=1cμik×SBω-η×JE(ω)] (3)
([η]代表是是网络数据库中任何一点数据的正实数,作用是能够有效衡量最大化类间散度和最小化类内散度不同目标,在选择数值之后,需要在特定数据矢量上的投影实现特殊数据类内散度的最小化,类之间散度的最大化处理。)
3.2 网络数据库特定数据减缩模型的构建
在对网络数据库特定数据优化检索操作中,通过公式的应用能够得到网络数据库中特定数据信息的最优投影方向,在应用模糊约束算法的情况下能够借助网络数据库中的特定数据模糊集间的贴近度,能够有效描述特定义数据空间的一致度,有效把握网络数据库原始性特定数据信息的动态化特点,并通过计算实现对特定动态数据的约束操作。
4 基于模糊约束的网络数据库特定数据检索模型仿真分析
在基于模糊约束的网络数据库特定数据检索模型打造之后,为了能够进一步验证基于模糊约束的网络数据库特定数据检索方法性能,需要对基于模糊约束的网络数据库特定数据检索模型进行仿真验证分析。在基于模糊约束的网络数据库特定数据检索模型仿真验证的时候会使用到两个数据集,分别是稀疏数据集以及稀疏数据集对应的密集数据集。通过这两个数据集能够获取相应的资料信息,通过应用这两个数据信息能够评估出不同算法表数据库特定数据检索性能的基本测试。实验一:应用专业的数据库分析数据,其中一个稀疏的数集是在较小支持因素下应用不一样的算法来检索出具备一个形式的特定数据信息。在这个数据库中包含上千万个数列,这些数列中的数据信息可以采用传统算法和改进算法来对数据信息集处理。不同算法稀疏数据集检索时间对比情况如图2所示。根据图2发现,应用改进算法进行稀疏数集进行检索的效率要比一般算法的检索效率高,且能够在较短的时间内检索得到支持度较低的数据序列,最终证明改进算法来检索网络数据库最终获得的数据时间效率较高。实验二:验证改进算法进行网络数据库特定数据检索操作有效性,在具体实验操作中应用生物数据集的算法对整个数据集进行检索操作。实验3:应用传统算法和改进算法来检索整个网络数据库的特定数据信息,在多次实验检验操作处理之后,将基于网络数据模块得到的数据信息精准度、误差率、稳定性等进行综合比对分析,之后对这些分析结果比对分析,提取相应数据信息,从而验证网络数据库特定数据的有效性。最终证明,应用改进算法获取的网络数据库有效性要比一般传统算法获取的数据信息有效性高。
应用改进算法提取的网络数据库特定数据特点有效性要比一般传统算法获取数据信息的有效性高。出现这种现象的原因是改进之后算法利用特定数据模糊数集贴近特定数据信息的描述需要,提升了特定数据细信息获取和分析准确性。改进算法提取數据特征有效性和传统算法提取数据特征有效性分析如表1所示。
5 结束语
综上所述,文章提出了一种基于模糊约束的网络数据库特定数据检索操作方法,并对这种模糊处理实验方法进行仿真证明,经过证明发现这种方法能够有效提升数据库特定数据的检索效率和检索精确度,从而更好地发挥出网络数据库的作用。
参考文献:
[1] 冯亚洲. 基于Hadoop的电力视频大数据分布式检索系统设计与实现[D].南京邮电大学,2017.
[2] 董海兰. 基于Python的非结构化数据检索系统的设计与实现[D].南京邮电大学,2017.
[3] 赵龙文,莫荔媛,黄跃萍.基于结构和属性特征的政府开放数据检索方法研究[J].情报杂志,2017,36(05):148-152+123.
[4] 郝行军. 物联网大数据存储与管理技术研究[D].中国科学技术大学,2017.
[5] 王广钰. 基于Hadoop的时空大数据的分布式检索方法[D].中国科学院大学(中国科学院国家空间科学中心),2017.
[6] 王剑锋. 云环境下外包数据的高效检索及安全审计技术研究[D].西安电子科技大学,2016.