APP下载

大学生图书馆门禁数据与成绩关联分析

2020-04-14孙可可李忠李海洋李莹王圆圓

电脑知识与技术 2020年4期
关键词:学生成绩Apriori算法

孙可可 李忠 李海洋 李莹 王圆圓

摘要:为研究大学生学习成绩与利用图书馆门禁信息之间的关系,此项研究选取了防灾科技学院2017和2018届学生的成绩数据和图书馆门禁信息,并从门禁信息中提取出学生去图书馆学习的时长和次数,利用数据挖掘技术中的Apriori算法,分析学生成绩和学生去图书馆学习的次数及时长之间的关联性。研究结果显示,学生去图书馆的时间和次数与学生的学习成绩的关联程度比较高。

关键词:学生成绩;图书馆门禁;Apriori算法;防灾科技学院

中图分类号:TP391

文献标识码:A

文章编号:1009-3044(2020)04-0235-02

收稿日期:2019-10-18

基金项目:中央高校基本科研业务费专项(ZY20180121)

作者简介:孙可可(1994—),男,安徽临泉人,硕士研究生,主要研究方向为灾害信息处理技术;李忠(通信作者),男,博士,教授,研究方向為数据挖掘、可拓学理论、灾害评价等;李海洋,男,安徽合肥人,硕士研究生;李莹,女,内蒙古通辽人,硕士研究生;王圆圆,女,河南洛阳人。

Correlation Analysis of Library Access Control Data and College Students ' Achievement

SUN Ke-ke,LI Zhong,LI Hai-yang,LI Ying,WANG Yuan-yuan

(Institute of Disaster Prevention,Sanhe 065200,China)

Abstract:To study the relationship between college students' academic achievement and the use of library access control information,this study selected the data from the 2017 and 2018 students ' academic achievement of the Institute of Disaster Prevention library ac-cess control information,and extract the length of time and frequency of the access control information which students went to the library,By using the Apriorialgorithm in data mining technology to analyze the correlation between students achievement and the length of time and frequency which students went to the library for learning.The results of the study show that the length of time and number of students going to the library are highly correlated with the student's academic achievement.

Key words:student achievement;access control information of library;Apriorialgorithm;Institute of Disaster Prevention

伴随着校园信息化的发展,校园一卡通作为校园信息化的媒介,成为每个学生必不可少的工具,因此校园一卡通积累了大量的学生行为信息数据。利用数据挖掘技术,可能从这些数据中挖掘出有价值的知识,对学生管理、教学等具有指导意义。然而目前这些数据没有能够有效地利用,仅仅停留在增删改查、统计分析和图表展示等程度,造成数据资源的极大浪费[1]。图书馆是一个学校图书、资料等文献的汇集点,是培养人才的重要支撑,是一所学校的学科建设的重要基地。众所周知,学习成绩与学生的生活习惯密不可分。本文希望分析大学生利用图书馆资源的次数与学生成绩之间的关系,研究二者之间的关联性问题,为更好地利用图书资源、指导学生行为习惯、提高学习成绩等提供科学支撑。

1 数据预处理与特征分析

由于所有拿到的数据都是原始数据,而Apriori算法要求数据必须是分类属性的数据,无法对原数据进行分析,所以对于原始数据进行一定的处理,才能从中找到相应的特征。数据预处理主要包括数据清洗、集成、变换、规约[2]。数据清洗主要是从原始数据中删除数据缺失严重且无法使用的记录、删除重复的记录;数据集成则是把多个数据源或者数据表中的数据合并放到一个一致的数据存储中;数据变换主要是对数据进行规范化处理,将数据转换成便于使用的形式;数据规约是在保持原有数据的特征的和原有数据的完整性的基础上,适当降低数据的规模或者维度,降低数据存储成本,减少数据挖掘所需要的时间[3]。

数据质量的高低直接关系到数据挖掘结果的好坏,因此需要对原始数据进行清理、整理、除噪、集成等预处理操作,这是数据挖掘过程的重要环节。本文所选取的数据是防灾科技学院2013和2014这两年人学学生的图书馆进出信息和学习成绩信息,计算每个学生每个学年进出图书馆的次数以及在图书馆内的时长(单位:分钟),以及每学年的成绩和总成绩。按照成绩分为三类学生,分别是:A类为该年级学生成绩排名前15%的

学生,C类是该年级学生成绩排名最后15%的学生,其余为B类学生。如图1所示的是一次数据挖掘任务的流程。

猜你喜欢

学生成绩Apriori算法
浅析数据挖掘技术在学生管理系统中的应用
基于Hadoop平台的并行DHP数据分析方法
学生成绩管理系统的开发与设计