试析关系数据库中关键词查询结果动态优化
2016-11-09孙伟
孙伟
摘要:关键词查询有利于用户从数据库中更加便捷的查询到所感兴趣的内容,用户不用具备专业的数据库结构化查询语言就能够获取到自身所刚兴趣的内容,这在很大程度上使其门槛得到了有效降低。本文就关系数据库中关键词查询结果动态优化进行简要分析,深入探讨了蚁群优化算法求解关键词查询问题和基于概念漂移的查询结果动态优化。
关键词:关系数据库 关键词查询结果 动态优化
中图分类号:TP311 文献标识码:A 文章编号:1007-9416(2016)09-0228-01
关系数据库随着不断的发展和创新,其数据储存及管理技术已经日渐成熟,且应用范围也在不断扩大,在各个领域中的应用越发普遍。在关系数据库中,相关的数据信息大都存储在“关系”中,所具备的数据结构十分规范。所以这种数据的另外一个名称则为结构化数据。而针对于该种数据,通过结构化查询语言的强大功能能够将满足其需求的记录集合查找出来,其中最为常见的有SQL语句等。随着SQL语句查询法的不断创新,与其相应的性能优化算法也越来越多,因此通过SQL语句查询,能够更快的帮助客户获取到所需要的只是,具有较高的查询性能。但是,这种方法也存在一定不足之处,它需要用户具备一定水平的数据库专业只是才能熟练掌握和使用,这对于很对普通客户而言则存在着较大的难度。
1 运用蚁群优化算法求解关键词查询问题
1.1 蚁群优化算法的基本原理分析
蚁群算法是在二十世纪九十年代有意大利学者Dorrgo等人所提出的一种优化方法,从其字面意思就不难看出,这种算法是借鉴自然界蚂蚁搜索食物的行为,经过多年努力而研发出来的一种智能进化算法,将其在图中进行使用,能够将最为优化的方法挖掘出来出来。自然界蚂蚁在找寻食物的过程中,开始均都不会得到有关食物的相关信息,每只蚂蚁在找寻食物的过程中,所选择的路径从表面上看属于一种随机行为,一旦其中某只蚂蚁找到食物,其就会将信息素释放到环境中,其余蚂蚁则能够结合信息素的指引找到食物所在之地。由于蚂蚁数量较多,大量的蚂蚁寻找必然会找到很多食物,则其他没有寻找到食物的蚂蚁则会按照信息素浓度来寻找最近的食物位置,信息浓度和路径长度成正比例,长度也肠信息素浓度则越低,因此一段时间后其中最短的路径则会被绝大部分蚂蚁“光顾”,由此可见,单个蚂蚁的行为虽然较为简单,但是众多蚂蚁通过信息素则能够更加快速的找寻到最佳解[1]。
蚂蚁优化算法最开始大都运用于旅行商问题的解决,而且还获取到了较为显著的效果。后随着其不断发展和众多学者的不懈努力,越来越多的研究成果被研发出来,从而也就逐渐成为了一种优化技术。蚁群优化算法针对于传统搜索算法中的一系列无法解决的复杂问题,能够起到很好的效果。这种方法具有正反馈性,且多适用于分布式环境。
1.2 蚁群优化算法求解关键词查询问题的正确运用方法
关系数据库中关键词查询问题,从某种角度上而言,能够将其转化成Steiner树问题。据国内外的相关文献,Steiner树问题从客观上来看,属于一种NP-hard问题,因此当下我国一系列研究中,大都是选择启发方法来让搜索空间缩小。据相关研究实验显示,针对于诸多的NP-complete和NP-hard问题而言,运用蚁群算法来进行求解更加高效。就目前而言,运用蚁群优化算法求解Steiner树问题的相关研究项目数量越来越多,不一样的研究所使用的方法也都存在一定差异,但是从总体上而言,这些研究都是为了探讨和分析Steiner树这个理论问题及其他应用场景,对于关系数据中的关键词查询并没有做到有效考虑,所以这种方法并不适用于关系数据库的关键词查询上。
2 基于概念漂移的查询结果动态优化
2.1 基于概念漂移的查询结果动态优化的核心思想
在机器学习领域研究中,概念漂移属于重要课题之一。概念漂移主要是指随着时间变化数据分布也会出现变化,这些改变会在一定程度上促使原本建立在旧数据上的模型,在新数据的特点上,出现了一定的不适应现象,因此也就必须对模型进行进一步的创新和完善[2]。就目前我国所处的现状而言,越来越多的领域都开始普遍的引起概念漂移理论的研究成果,例如:在一系列的零售行业中,如超市、商场等,可以借助于概念漂移理论的研究成果,对消费者的购买行为进行综合分析,针对于其购买行为变化做到第一时间发现,从而也就能够及时运用相应的措施来进行有效处理。在用户查询兴趣出现一次变化,则就意味着出现了一次概念转移,由此原本多运用于机器学习领域的概念漂移理论,逐渐在用户的兴趣变化探测上得到普及。借助于对概念漂移理论进行充分利用,能够对用户兴趣的转变做到及时发现,并以动态优化查询结构核心,促使其能够更加符合用户查询语气,这是基于概念漂移的查询结果动态优化的重要核心思想。简单而言,就是先通过概念漂移理论,将用户的兴趣节点集找到、并确认,然后只需要ACOKS算法进行简单的修改,就能够获得一种全新的ACOKS算法[3]。总而言之,就是在蚂蚁移动时,引导其以更大的概率移动到兴趣节点集中的节点,以较小的概率,让其移动到非兴趣节点集中的节点上,从而让查询结果中逐渐在展现出更多的兴趣节点集中的内容,进而和用户兴趣更加贴切。
2.2 动态优化过程
通过用户兴趣节点集,促使用户的查询兴趣能够得以展现出来,简单而言,就是将一系列查询结果,向用户进行反馈的一个过程,在该过程中各个查询结果,均都是由众多元组连接而成的一个元组树,另一种名称被称为Steiner树,查询关键词隐藏在树的节电中,当用户对某个查询结果进行点击访问时,则就代表这个结果,是大多数用户较为感兴趣的,从而也就能够将查询结果中,与之相对应的元组树上所有节点都储存到用户兴趣节点集上。(见图1)
3 结语
综上所述,本文将关系数据库中的元组建模成数据图,将关键词查询问题转变成相似的最小Steiner树问题,并将已经通过一系列试验研究,良好性能已然得到认可的蚁群优化算法求解引入到其中,借此来使得该问题得到有效解决。同时对基于概念漂移理论的用户查询兴趣的探查方法进行了简要分析,希望通过这种方法,能够第一时间发现并处理妥善用户兴趣的变化问题,从而达到查询结果的动态优化的目的,促使查询结果和用户预期之间,能够更加统一、更加贴切,使查询结果的有效性得到有效保障。
参考文献
[1]教巍巍,董万鑫,李昕.关系数据库上的关键词查询系统[J].辽宁工程技术大学学报(自然科学版),2014,07:960-964.
[2]刘晨,尚博祥,倪家明.关系数据库的关键词查询性能优化[J].电子技术与软件工程,2015,22:176-177.
[3]杨路明,王佳宜,谢东.关系数据库上基于非数值属性关键词的模糊查询[J].计算机科学,2008,06:236-239.