融合关联规则挖掘算法的信息化教学管理系统设计
2020-12-23朱晴
朱晴
摘 要: 为提升高校教学管理的水平与效率,设计融合关联规则挖掘算法的信息化教学管理系统。该系统的关键组成部分为客户端、服务器和数据库,客户端和服务器分别负责面向用户的交互功能呈现和系统应用程序的逻辑运行,系统通过创建涵盖教学管理不同方面数据的数据库体系,采用改进关联规则挖掘算法,从系统数据库内挖掘用户各方面教育信息关联数据,并通过客户端主界面为用户提供教学、选课、课程等服务。以某高校信息平台为例测试该系统性能,结果表明,该系统能够实现课程查询功能,客户端兼容性较好,能够应用于各类浏览器及操作系统内,应用性较强,且具有良好的数据挖掘性能。
关键词: 教学管理; 关联规则; 挖掘算法; 数据挖掘; 数据库管理; 课程查询
中图分类号: TN02?34; G434 文献标识码: A 文章编号: 1004?373X(2020)23?0159?05
Abstract: In order to improve the level and efficiency of teaching management in colleges and universities, an information?based teaching management system integrating the association rule mining algorithm is designed. The key components of the system are client?side, server and database. The client?side and server are respectively responsible for the presentation of user oriented interactive functions and the logical operation of system application program. The improved association rule mining algorithm is used in the system to mine the association data in each aspect of user′s education information from the system database by creating a database system covering the data in different aspects of teaching management, and provide users with services such as teaching, course selection and courses in the main interface of client?side. The performance of the system is tested by taking a university information platform as an example. The results show that the system can achieve the function of course query, its client?side compatibility is good, it can be used in various browsers and operating systems, and it has strong applicability and good data mining performance.
Keywords: teaching management; association rule; mining algorithm; data mining; database management; course query
0 引 言
当前各高校管理中的重点即为教学管理,有效的教学管理不但需要管理人员设定良好的管理制度,而且应具备理想的信息管理系统[1]。由于各高校的管理方式与教学模式各不相同,因而各高校所应用的教学管理系统也有区别,各高校的日常教学管理中,教师信息、学生信息、课程信息及成绩信息等数据信息对于教学管理人员来说较为繁琐,但若通过教学管理系统依据各自的管理特点将此类信息数据与不同管理方向相结合,便可有效地降低管理人员的压力,同时将教学管理系统的效果最大程度地发挥出来[2?4]。作为当前一种新颖的教学管理方式的信息化教学管理被逐渐引入高校管理中[5],能够从根本上简化管理人员的工作内容,因而设计信息化教学管理系统成为各高校管理的重中之重。
数据挖掘(Data Mining)是指由数据库内将感兴趣的知识提取出来,关联规则挖掘为数据挖掘领域内的研究重点[6?7]。关联规则是指数据库内某组对象间某种联系的规则,其挖掘对象通常为事务数据库[8]。由于高校的教学管理中会持續累积大量的历史数据,其中包括很多有价值的信息,将关联规则数据挖掘应用在高校的信息化教学管理中,能够分析并挖掘出教学管理中的有用信息,为高校教学管理人员实现科学有效地管理提供帮助[9]。
基于以上分析,本文设计融合关联规则挖掘算法的信息化教学管理系统,可提升高校教学管理效率与管理水平,为实现科学全面地管理高校教学奠定基础。
1 融合关联规则挖掘算法的信息化教学管理系统
1.1 系统设计
1.1.1 系统总体结构设计
通过客户端、服务器、数据库三个关键部分共同组成信息化教学管理系统,其结构如图1所示。其中,向用户提供呈现与交互功能的为客户端的核心功能[10],完成应用程序的逻辑运行则通过服务器核心功能实现。客户端在此系统内应用C/S结构模式,重点针对当下普遍使用的智能手机移动终端;服务器在系统内可应用B/S与C/S两种结构模式,并且通信协议能够兼容HTTP与SOCKET。分析图1可得,在分层原理的基础上开发信息化教学管理系统,系统数据库采用关系型在线处理分析(ROLAP)方法储存全部数据,利用融合关联规则挖掘算法有效挖掘数据后,通过客户端的主界面呈现系统信息化管理各项功能,如成绩管理、课程管理、选课管理等,并在系统网络内通过防火墙等方式提升系统及数据信息的安全性。
1.1.2 系统数据库设计
采用SQL Server 2009软件设计系统数据库。数据库中包含学生表、教师表、学习调查表、课程表等,完全涵盖教学管理中不同方面的数据。数据库中的数据模型如图2所示。
基于数据模型图中的数据,创建系统数据库,为简化数据挖掘流程并提升挖掘效率,设计系统数据库体系架构,如图3所示。具体过程描述为:通过数据抽取、转换及装载等过程将数据源放入数据集内,整合数据集之后生成数据库,同时通过ROLAP方法储存数据;当用户登录系统后,可通过数据挖掘及查询等工具实现对数据库的访问,同时能够管理、维护数据库数据;将经由数据挖掘后获取的知识通过客户端的主界面向用户呈现。
1.2 关联规则挖掘算法应用
1.2.1 数据挖掘过程设计
数据挖掘过程为:将需要挖掘的数据类型进行确准,对数据库中的数据实行转换、清洗等预处理,依据确准的数据类型通过关联规则挖掘算法实行数据挖掘,完成挖掘之后,分析评估挖掘结果,经由客户端向用户展现。系统的数据挖掘详细过程如图4所示。
1.2.2 关联规则挖掘算法设计
1) 关联规则挖掘算法
通常可将关联规则挖掘算法Apriori的根本思想分为两个子问题:
① 频繁项目集的发现[11]。依据用户所给定的最小支持度(minsupport)对全部大于等于最小支持度的频繁项目集(Frequent Itemset)予以找寻,所找寻的频繁项目集或许存在包含关系,通常情况下仅对不包含在其余频繁项目集内的频繁大项集(Frequent Large Itemset)的集合予以找寻,此类频繁大项集即为生成关联规则的根本。
② 关联规则的生成[12]。以用户给定的最小可信度(minconfidence)为依据,由各最大频繁项目集内将可信度(confidence)大于等于最小可信度的关联规则找寻到。
2) Apriori算法核心
为实现全部频繁集的生成,Apriori算法运用递推的方式,具体如下:
[K1=]{large 1?itemsets}
For([l]=2;[Kl-1≠μ];[l]++) do begin
[Al=]apriori?gen([Kl-1]) //新候选集
For all transactions [t][JB] do begin
[At=]subset[(Al,t)] //事务[t]内所含候选集
For all candidates c[J] [At] do
c.count++
End
[Kl]={c[J][Al]c.count3minsup}
End
Reply =[l?Kl]
频繁第一项集[K1]与频繁第二项集[K2]相继生成,直至出现某个[u]值令[Ku]为空,算法终止。在第[l]次循环中,将候选[l]项集的集合[Al]生成,[Al]内各项集的作用是生成频集的候选集,各项集的生成是通过([l-2])连接仅存在一个不同项的[Kl-1]频集完成的,最终生成的频集[Kl]一定为[Al]的某个子集。需在数据库内验证[Al]内的各个元素,确定各元素能否向[Kl]内加入,验证时需数次对数据库实行扫描,若频集内最多有12项,则应对数据库实行12次扫描,需较大的I/O负载,且数次循环将生产大量候选集,为此造成验证时仍需多次扫描数据库。故Apriori算法的缺点即为候选集生成量过大且反复多次扫描数据库导致扫描时间过长,此为Apriori算法的瓶颈。
3) Apriori算法改进
为改进Apriori算法,提升算法的效率,将修剪技术加入算法中,降低候选集[Al]量的大小。修剪技术向算法内加入所依据的性质为:某个项集属于频集并且其全部子集均为频集[13],若[Al]内某个候选项集存在一个([l-1])子集不属于频集([Kl-1]),可将此候选项集修剪掉,此方法能够将运算全部候选集的支持度代价降低。
1.2.3 改进Apriori算法在系统中的应用
依据改进Apriori算法获得在约束基础上的关联规则。
定义1:设[n]个不同项目的集合为[J=j1,j2,…,jn],針对[J]的管理集合为[B],每一次管理包括数个项目[j1,j2,…,jl],关联规则可表示成:
将以上关联规则挖掘算法应用于信息化教学管理系统中,能够挖掘出用户各方面的教育信息,以挖掘的关联信息为依据进行相应的管理[14],提升系统的管理性能。
1.3 查询课程实现
课程查询主要包含选课信息查询及课程成绩查询。由教学管理人员设置开设的课程,学生进行网络选课,教师能够随时查看不同选课的学生名单,并在课程结束之后将课程成绩录入到系统内,学生可随时通过系统查看自身课程成绩。期间教学管理人员不仅能够查看教师的信息,而且能够查看与统计学生的成绩信息,教学管理人员通过系统实现对所开设课程的管理[15]。课程查询过程图如图5所示。用户输入“课程查询”关键字之后,点击开始查询即可进入课程查询选择页面,选取选课信息或成绩查询后,点击开始,若系统内有相关信息,查询到结果后可退出,若用户想继续查询其他信息,可点击返回查询,重新回到输入页面;若无相关信息则自动跳转到初始输入页面。
2 系统性能测试
以某高校为例,将本文系统应用于此高校的信息平台中,通过检验本文系统在此平台运行时的课程查询功能、兼容性及数据挖掘各方面性能,测试本文系统的总体性能。本文系统的运行环境为:酷睿i5 CPU,1 TB硬盘容量、8 GB内存、华为USG6330防火墙、Windows 8操作系统及谷歌浏览器。
2.1 系统功能测试
从实验高校某班级中随机挑选出一名学生,采用本文系统对其课程成绩进行查询,测试查询过程中本文系统的查询课程功能。学生进入课程成绩查询界面后,界面显示如图6所示。由图6中的课程成绩查询界面可看出,本文系统能够实现课程查询功能,且界面显示清晰。
2.2 系统兼容性测试
对本文系统客户端实行兼容性测试,测试中对各种浏览器与操作系统环境下程序能否正常运行实行检测,测试中主要针对当前比较常用的谷歌浏览器、IE浏览器、360浏览器及火狐浏览器等实行测试,操作系统为Windows 8和Windows XP操作系统。以两台电脑分别安装两种操作系统、两种浏览器实行本文系统的兼容性测试。
从实验高校的某班级中随机挑选一名学生和一名教师分别对两台电脑实行操作,操作内容为:输入个人验证信息登录本文系统后,进入到各自所需的信息查询页面,查询个人成绩与选课名单,然后退出登录。对整个操作过程中本文系统能否按不同用户需求正常运行进行记录,记录结果如表1所示。
通过表1可看出,本文系统仅在应用IE浏览器时查询信息的文本显示格式略有误差,但数据准确且运行正常,不影响日常使用,其余浏览器下应用均正常,且数据准确,由此说明,本文系统能够实现在不同浏览器下正常运行,系统客户端具备较好的兼容性,能够应用于各类浏览器及操作系统内,应用性较强。
2.3 系统数据挖掘性能分析
为检验本文系统数据挖掘的性能,从实验平台中随机抽选21 000条数据,通过本文系统对所抽选数据实行课程信息、教师信息、档案信息及成绩信息等关联规则数据挖掘,检验所挖掘结果的漏检与误检情况,分析本文系统的数据挖掘性能,检验结果如表2所示。
通过分析表2中数据可知,本文系统在对实验平台中的关联规则数据实行挖掘时,对小于12 000条数据的关联规则数据挖掘精准度更高,未出现漏检与误检的情况,随着数据量总数的增加,漏检率与误检率略有上升, 但上升趋势不明显,说明,本文系统整体数据挖掘性能良好,能够实现关联规则数据的有效挖掘。
3 结 论
本文设计一种融合关联规则挖掘算法的信息化教学管理系统,关联规则挖掘算法可实现从海量数据中通过某种关联规则挖掘所需信息的目的,通过此方法挖掘的信息为高校实行信息化教学管理提供了科学有效的依据,本文通过此方法从数据库中挖掘实施教学管理的所需信息,实现信息化教学管理,并通过实验验证本文系统的查询课程功能、客户端兼容性及数據挖掘各方面优越性能,未来的研究中将继续检验本文系统的运行性能及其他功能性能,验证本文系统的实际应用性,扩大本文系统的应用范围。
参考文献
[1] 常凯,赵艳莉,黄文峰.“新常态”下的研究生教育管理信息化系统设计:以福州大学为例[J].中国远程教育(综合版),2017(1):71?76.
[2] 余舒萍,熊越强.基于OpenKM的高校校院二级教学档案管理系统的设计与应用[J].山西档案,2017(6):78?80.
[3] 黄波,朱昌平,黄健元,等.基于用户视角的教学管理信息化建设绩效评价:以教学管理信息系统建设为例[J].中国电化教育,2018(9):69?74.
[4] 张宝君,邢西深,杨辰,等.迈向2.0时代的天津市基础教育信息化调查研究[J].中国电化教育,2019(7):127?133.
[5] 李尚滨,王德才.基于网络平台的高校体育教师评教系统设计与实现[J].继续教育研究,2017(10):81?83.
[6] 张晓枫,郭芳,王利军,等.基于关联规则挖掘算法的审计综合管理系统研究[J].电网与清洁能源,2017,33(12):48?51.
[7] 李涛,郁美辰,陆正邦,等.基于关联规则挖掘的气象观测设备一致性检测算法[J].电子测量与仪器学报,2017,31(10):1568?1573.
[8] 刘亚男.一生一档·对症施策:基于大数据挖掘的区域教学改进[J].中小学管理,2019(2):30?33.
[9] 张琳,李小平,来林静,等.基于游戏教学的分层数据挖掘方法研究与应用[J].中国电化教育,2019(2):87?94.
[10] 刘军煜,贾修一.一种利用关联规则挖掘的多标记分类算法[J].软件学报,2017,28(11):2865?2878.
[11] 王玲,李树林,徐培培,等.基于频繁项集树的时态关联规则挖掘算法[J].控制与决策,2018,33(4):591?599.
[12] 刘莉萍,章新友,牛晓录,等.基于Spark的并行关联规则挖掘算法研究综述[J].计算机工程与应用,2019,55(9):1?9.
[13] 黄文成,贾立,彭道刚,等.基于Apriori的关联规则算法及其在电厂中的应用[J].系统仿真学报,2018,30(1):266?271.
[14] 侯燕,刘辛.基于主从架构和GA的模糊关联规则挖掘算法[J].控制工程,2017,24(2):276?282.
[15] 胡玉宁,丁明,伊鹏.基于数据挖掘的大学生虚拟社群社会网络分析[J].中国成人教育,2017(8):64?68.