浅谈关系数据库中的关键词查询结果动态优化
2017-06-05丁华
丁华
摘要:关键词查询可以让用户在使用数据库的过程中更好地对自己所感兴趣的内容进行查询。该文主要从关系数据库中
关键词查询技术的有关概念入手,以蚁群优化算法和基于概念漂移的查询结果动态优化机制为例,对查询结果的动态优化措施进行了探究。
关键词:关系数据库;关键词查询结果;动态优化
中图分类号:TP311
文献标识码:A
文章编号:1009-3044(2017)10-0002-02
信息化社会的发展,让关系数据库中的数据存储量表现出了逐步增长的特点。搜索引擎的产生与发展,对用户的信息检索需求的满足起到了一定的促进作用。关系数据库已经成为了目前使用较为广泛的一种数据库类型。在结构化数据模式在关系数据库中发挥出重要的作用以后,用户除了需要对数据库模式进行充分认识以外,还需要在对结构化查询语言进行应用的基础上,对自己所要收集的信息进行检索。SQL语句查询就是一种符合上述特点的查询方式,但是对于普通人而言,这一查询模式还存在着一定的技术难度。关键词查询方式是数据库检索领域的一种简单可行的操作方式,用户即使在对SQL语言和相关的数据库模式缺乏了解的前提下,也可以通过对所查询信息的相关度进行排序的方式来进行数据库的查询。
1.关系数据库中关键词查询技术的相关概念
1.1关系数据库关键词查询的基本概念
关系数据库中的关键词查询,主要指的是将一些存储于数据库中的结构化数据转变为结构的操作过程。它是通过对图数据子图的作用进行发挥的方式来对关键词查询方式进行建构的。与关系数据库有关的子图包含了已经输人的所有关键词信息,同时也涉及一些与这些关键词有关的关联信息。以关键词节点为初始节点的查询方式已经开始在关系数据库的信息检索过程中得到了应用。路径索引概念与查询方法之间的融合,可以通过路径索引的便利来实现关键词的查询。这种基于关键词的关系数据库查询方式与文本数据库查询方法之间存在着一定的相似性。但是前者并不是通过文件搜索的方式来实现的。在数据库的关系表中查询相关记录,可以让关键字的元祖和与之有关的连接关系进行发挥。因而用户只需要通过提交关键词的查询列表的方式,就可以让系统根据用户所提供的关键词对相关的结果进行检索。
1.2关系数据库关键词查询的意义
关系数据库中的关键词查询涉及数据的收集、处理和可视化的多个环节。在对现有现有数据进行分析的基础上,用户可以借助关键词查询更好地获取到自己所感兴趣的信息。关键词查询的意义主要表现为以下几个方面,首先,关键词查询结果的董涛优化,可以为关系数据库的信息查询工作提供一种新的友好型的方法。对SQL语言查询给用户所带来的问题进行优化,是对信息查询工作进行优化的一种有效方式。关键词查询可以让用户从大量的数据中迅速查找到与关键词有关的内容和结构信息,并通过形象化的方式,对检索结果进行展示。
关键词查询也可以为数据的深度发掘提供一定的参考作用。从Web的应用情况来看,常用的搜索引擎只能对一写网页数据进行有效检索。对于一些长期存储于后台之中的信息,相关的搜索引擎只能表现出鞭长莫及的问题。从这一问题的产生原因来看,它与数据库查询与搜索引擎的信息查询方式之间的差异性存在着一定的关联,因而关键词查询结构的应用,可以帮助用户更好地获取一些需要通过特定接口才能查找的信息。
除此以外,关系数据库中的关键词查询技术也可以为信息检索结果的排序提供一定的思路。查询结果的精准性的缺乏,一度是基于关键词的关系数据库查询结果所表现出来的主要特点。在用户借助自己所关注的问题的关键词对相关的信息进行检索以后,他们往往会在数据库中获取到大量的信息。很多时候用户往往无法对自己利用关键词所搜集到的每一条信息进行研究分析。对查询结果的排列策略的优化,也是对查询结果进行动态优化的一种有效措施。它可以从信息检索结果与用户的自身需求的相关性人手,通过由高到低的方式对信息进行排序,这就可以让用户有效节省信息的检索时间。
2.蚁群优化算法在关键词查询问题求解过程中的应用
2.1蚁群优化算法的基本原理
蚁群算法是意大利学者在上世纪末建构的一种查询结果优化办法。从这一名字的字面含义来看,这种算法与蚂蚁在自然界中的觅食行为存在着一定的相似性。自然界的蚂蚁在寻找食物的过程中,往往并不会对食物的信息进行感知,但是在某一只蚂蚁找到食物以后,它会将相关的信息释放在环境之中,因而会让大量的蚂蚁找到食物。一些没有找到食物的蚂蚁依据信息素的浓度变化对事物的位置进行确定。蚁群优化算法就可以被看做是与之有关的一种优化方式。在信息检索过程中,这一算法的应用可以让用户对最优化的问题处理方式进行发掘。
从这计算方法的應用情况来看,它是对旅行商问题进行解决的一种有效方式。随着这一算法的不断发展,在众多学者的努力下,蚁群优化逐渐成为了一种优化技术。它可以对传统搜索算法中无法解决的一些复杂问题进行有效解决。正反馈性成为了这一算法在实际应用中所表现出来的主要特性,分布式环境是这一算法的主要应用环境。
2.2蚁群优化算法求解关键词查询问题的正确方式
从蚁群优化算法的应用情况来看,关系数据库中的关键词查询问题可以被转化为Steiner树问题。从国内外学者对这一问题的研究现状来看,这一问题可以被看做NP-hard问题的一种特殊表现形式。所谓的NP-hard问题主要指的是一些可以利用一定数量的运算对多项式时间内可解决的问题进行处理的问题(NP是非确定多项式的简称)。在对这一类问题进行处理的过程中,启发方法是我国学者所采用的对搜索空间进行缩小的方式。从国内一些学者的研究实验来看,不论是NP-com—Dlete问题还是NP-hard问题,蚁群算法都是对问题的解答效率进行提升的有效方法。随着这一计算方法的不断发展,利用蚁群优化法对Steiner数问题进行解决的研究已经表现出了一种逐渐上升的趋势。其中,不同的研究机构所采用的研究方法还存在着一定的差异性。但是从这一算法的总体来看,学者对蚁群算法在NP问题中的应用作用的研究,是为Steiner数问题及其应用场景的研究提供服务的,因而,在具体化的研究过程中,学者并没有对其中的一些关键问题进行有效考虑,因而这一方法并不能在关系数据库的关键词查询中发挥自身的作用。
3.基于概念漂移的查询结果动态优化
3.1基于概念漂移的查询结果动态优化的核心思想
概念漂移也是机器学习领域研究中的一大重要课题。数据分布变化在时间变化的影响下所产生的变化,可能会让一些基于旧数据的计算模型表现出对新数据特点难以适应的问题。因而在数据库关键词研究工作的开展过程中,有关人员也需要对相关的模型进行进一步的创新与完善。从我国社会的发展现状来看,在信息化进程的发展过程中,概念漂移理论的研究成果已经在多个领域得到了应用。以零售业为例,概念漂移理论的研究成果的运用,可以让超市、商场的经营着对消费者的购买行为进行综合分析,进而在第一时间对消费者购买行为的变化进行充分了解。这就可以通过对相关的经营战略进行优化的方式,对信息战略进行处理。在信息检索过程中,用户查询兴趣的变化可以被看做是一次概念转移的过程,因而,在将概念漂移理论应用于信息用户的研究工作以后,数据库的管理设可以对用户的检索兴趣的变化进行及时感知,进而在对查询结构的核心要素进行优化的方式,让数据库更好地满足用户区的需求,因而,基于概念漂移的查询结果动态优化就成为了对关键词查询结果进行优化的有效方式。
3.2动态优化过程
在对与之有关的动态优化过程进行探究以后,我们可以发现,在基于概念漂移理论的查询结果的优化过程中,相关人员首先需要借助概念漂移理论的应用,对用户的兴趣节点集进行确认,进而在对与之有关的ACOKS算法进行简单修改的基础上构建一种新型化的ACOKS算法。用户兴趣节点集的运用,客户对用户的查询兴趣进行充分的展示。因而这种动态优化过程也可以被看做向用户反馈查询结果的过程。在这一过程中,数据库的各个查询结果是由多个元祖连接而成的元祖树。这种元祖树通常也会被称为是Steiner树。用户在对关键词查询法进行应用的过程中所查询的关键词就蕴藏在这些节点之中,这样在对查询结果进行访问的过程中,查询系统可以将元祖樹中的所有节点都储存于用户兴趣节点集之中。下图中所示的内容就是基于概念漂移的查询结果优化过程图。
3.结论
蚁群优化算法是适用于分布性环境额一种优化方法。数据图在关系数据库中的应用,可以让关键词的查询问题转变为Steiner树问题。给予1概念漂移理论的用户查询兴趣探查法的应用,可以让有关人员在第一时间对用户兴趣的变化问题进行处理,因而这一理论是对查询结果进行动态优化的一种有效方式。它可以让关键词查询结果与用户的自身预期之间的统一性得到有效强化,这一优化方式也可以让查询结果的有效性得到充分的保障。