APP下载

基于关联规则的数据挖掘算法

2018-03-21胡涛

电子技术与软件工程 2018年2期
关键词:反馈机制关联规则

摘 要 在数据挖掘技术中,基于关联规则的数据挖掘算法是较为重要的一个课题,是我国信息技术领域的热门研究课题。基于此,本文从数据挖掘算法入手,对基于关联规则的数据挖掘算法进行了分析,将这一算法的原理作为基础,提出了提高数据挖掘算法概率的改进措施,意在提高数据挖掘算法的处理效果,使其应用于更多领域中。

【关键词】关联规则 数据挖掘算法 反馈机制

在基于关联规则数据挖掘算法中,有很多算法,比如Apriori算法、完全频繁项集挖掘算法以及Patition算法等。但是这些算法需要大量的候选集,导致数据挖掘的效率比较低。近些年来,很多研究学者都对数据挖掘算法效率的提升进行了分析研究,也取得了一定的成效,然而就改进的数据挖掘算法来说,存在着各自的优缺点。因此,仍旧需要加强对数据挖掘算法的分析和研究。

1 数据挖掘算法概述

作为一种先进的信息处理技术,数据挖掘技术具有非常高的商业价值,该技术可以帮助人们改变传统的联机查询,而是将数据的应用提升到决策分析预测等方面。常用的数据挖掘技术主要包括规则归纳、支持向量、模糊集以及统计方法这四个特点。数据挖掘技术应用的挖掘方法非常多,比如,当代数学分析法、证据理论法、神经网络发以及遗传算法等;数据挖掘技术的使用对象也比较广泛,比如,空间数据库、事态数据库、多媒体数据库以及遗产数据库等。

2 基于关联规则的数据挖掘算法分析

2.1 算法的原理

在多种数据挖掘算法中,基于关联规则的数据挖掘算法是最基本的算法之一,这种算法的适用性和可操作性都比较强,而且十分简单。具体原理如下:首先进行数据出现频率支持度和关联规则可信度的设定,然后通过特定的算法在已知的数据中找到满足支持度要求的频繁项集,并在该项集中应用剪枝等多种策略来获取满足可信度要求的关联规则。在关联规则数据挖掘算法中,频繁项集的确定是重點研究内容。

2.2 算法的改进

2.2.1 实现机制

在以前对于数据挖掘算法的分析中,很多研究学者都将关注点房子阿勒数据挖掘模型和相关算法之上,但是从这一角度分析得出的结果较为孤立,数据处理的效果不是很理想。随着研究的深入,专家学者们发现,在对数据挖掘算法分析的过程中,不仅要对算法进行研究,更要制定相应的实现机制,这样能够将挖掘计划真正转变成对系统工作的控制,从而使挖掘项目取得较为理想的数据处理效果。与此同时,在进行挖掘算法的过程中,相关人员需要严格按照计算流程,这样才能确保挖掘任务的准确完成。

2.2.2 反馈机制

数据挖掘计算会受到很多因素的影响,有些因素比较难控制,从而使挖掘算法的数据处理结果具有一定的不可预测性。因此,需要为数据挖掘算法制定相应的反馈机制,通过这一机制进行数据处理结果的验证,还可以根据验证的状况对结果进行修正。在反馈机制反馈的过程中,不仅需要确保所挖掘数据的准确性,更要确保这些数据是用户重点关注的。这就需要对算法中的问题进行约束,从而保证数据挖掘算法能够满足用户的需求。

2.2.3 约束机制

在进行数据挖掘算法的使用中,非常容易出现如下问题:计算人员会将重点放在系统处理中存在的问题,却忽视了系统规模的控制,从而阻碍挖掘算法的有效应用,使问题的解决过程更加困难,因此,需要构建相应的约束机制。在对挖掘的数据进行约束时,要对系统采取增量式扩充措施,根据用户的实际需求来明确数据挖掘算法的目标,按照相关的约束参数,对需要解决的问题进行实施验证,如果验证过程中明确了相关的数值之后,就能够通过实验的交互式输入来获取较优值,这种约束机制可以用于数据挖掘算法的全过程。与此同时,在对数据进行预处理的时候,需要正确设置约束的个数,从而提高数据挖掘处理结果的准确性,还能够保证数据的规模,而且约束机制的应用还能够简化数据挖掘算法。

在进行约束类型的选择时,关联规则能够通过一次数据库扫描挖掘算法,在减少I/O个数的前提下,提升数据量,从而提高计算机内存的占用量。因此,在数据挖掘算法中,还要注重ISS容量控制,以此来减少CPU的占用量。相关人员可以对数据采取分批处理措施,以此来组织相关数据,改善数据的结构,从而使数据形成独立的关联规则,在降低CPU的同时,提高数据挖掘算法的准确性。

3 结论

综上所述,数据挖掘算法能够从大量的数据中找到有价值的信息,从而解决相关问题。分析可得,通过本文的分析可知,基于关联规则的挖掘算法需要构建相应的实现机制、反馈机制以及约束机制,这样才能简化数据挖掘算法,提高算法处理数据的准确性和效率,从而使数据挖掘算法能够获得进一步的应用。希望本文能够为相关人员探究基于关联规则的数据挖掘算法提供参考。

参考文献

[1]李仕琼.数据挖掘中关联规则挖掘算法的分析研究[J].电子技术与软件工程,2015(04):200.

[2]戴小廷.关联规则数据挖掘算法及其在智能物流中的应用分析[J].科技和产业,2014,14(02):113-116.

作者简介

胡涛(1990-),女,湖南省衡阳县人。硕士研究生学历。主要研究方向为计算机软件工程。

作者单位

湖南交通工程学院电气与信息工程系 湖南省衡阳市 421000

猜你喜欢

反馈机制关联规则
大学生课程考试反馈机制的研究