数据挖掘聚类算法在学生信息管理系统中的应用

2017-09-28陈志忠

电脑知识与技术 2017年24期

关键词：信息管理系统信息管理数据挖掘

陈志忠

(四川邮电职业技术学院，四川成都610067)

数据挖掘聚类算法在学生信息管理系统中的应用

陈志忠

(四川邮电职业技术学院，四川成都610067)

针对传统的K-means聚类算法在学生信息管理中受随机中心地址的影响，提出了数据分段方法进行中心地址选择。该算法将数据源进行K段划分，接着在每段内中选择中心地址，使用迭代回归方法进行中心选择。在现有部分学生信息上进行仿真结果表明，算法的迭代次数降低，所改进算法提高了传统K-means算法。

K-means；中心选择；学生信息

随着高校扩张，各高校在校人数不断增多，学生管理难度加大。同时对学生来讲，在学校中接受教育时，希望学生能接受多样化的管理制度，为学生提供轻松、自由的学习环境。在信息化进程日益加快的今天，学校管理中也开始引入计算机、互联网等信息技术，通过先进技术的应用提高管理水平。学生人数的增多，给学校管理带来了挑战，为了提高学生管理效率和水平，很多学校都开始致力于学生信息管理系统的研究和应用。在学生信息管理系统中，除了实现学生基本信息如专业、学籍、班级等的管理外，还将学生选课服务、学习进度、毕业论文管理、就业信息管理等相关内容融入其中，实现了学生所有信息管理的“一条龙”服务。通过专门的学生信息管理系统，将学生各项信息都融合在一起，实现了所有信息的高水平管理。

当今时代属于信息时代，各类信息数据较多。在学校中，学生相关信息也多，而在互联网的帮助下，学生信息也呈现出价值、海量特点。学校在开展学生信息管理时，需要根据学生信息情况合理进行分类，并根据学生具体需求开展相应的信息管理，以提高信息管理水平。而要实现这些就需要借助学生数据信息的分析，如何从海量的信息中提取到真正有用的信息，则成为学校开展学生信息管理时面临的一个重要问题。在这种情况下，就需要用到数据挖掘技术，通过数据挖掘对海量的学生信息进行深度挖掘、分析，提取到真正有用的学生信息，并用到学生信息管理中，提高学生信息管理水平。数据挖掘技术较多，如聚类算法、分类算法、回归分析、关联规则算法等，都是数据挖掘中经常采用的方法。本文主要对数据挖掘中的聚类算法在学生信息管理系统中的应用进行了分析，为数据挖掘在学生信息管理中的具体应用提供参考建议。

1 数据挖掘概念

数据挖掘是计算机学科中的一门重要技术方法。数据挖掘是从好靓数据信息中搜索出有用或潜在的信息。一般情况下，数据挖掘主要通过统计、分析等实现。数据挖掘技术产生以后，最初在统计、数据库、人工智能等行业和领域内进行应用。随着大数据时代的到来，各行各业都开始加大数据挖掘技术的应用。数据挖掘时，在数据信息来源判断的基础上，获取到相关数据信息，并将相关数据信息整合到一起，进行数据检查，将不符合要求的数据去除，然后建构数据模型，实现数据的挖掘、分析，从而完成数据挖掘工作。在数据挖掘过程中，最重要的一步工作是对数据进行预处理，保证数据信息、格式等和要求相符，从而进行深度挖掘、分析。

数据挖掘技术较多，如聚类算法、分类算法、回归分析、关联规则算法等，都是数据挖掘中经常采用的方法。如下是对几种方法的具体分析：

关联规则分析：关联规则分析方法主要是对数据信息中隐藏的关系进行挖掘分析。采用关联规则分析法进行数据挖掘时，主要是通过两个环节实现：第一个环节是从海量的数据信息中寻找出真正符合要求的数据；第二环节则是对这些数据信息中存在的关系进行挖掘。在金融行业中，关联规则分析法应用较为广泛。

分类：将海量数据中的具有相同点的数据按照类别归为一类，并通过分类模型等实现数据的挖掘分析。在应用分类、趋势预测等领域中该方法应用方法，如目前电商平台都会采用分类算法向用户推荐相关联的商品信息。

聚类算法：将海量数据中相似的数据聚集到一起归为一类，从而实现数据挖掘分析。

在聚类算法中，相似的数据在一个聚集内，实现了数据挖掘。聚类算法在学生信息管理系统中应用时，将具有相似特征的学生信息聚在一起；基于学习目标将选课相同的学生汇集一起等。聚类算法也较多，如下对几种聚类算法在学生信息管理系统中的具体应用了详细分析。