APP下载

基于数据挖掘技术的教务综合管理平台的设计

2023-04-06周日辉

电脑知识与技术 2023年5期
关键词:教务管理软件工程教育信息化

周日辉

关键词:教育信息化;数据挖掘;教务管理;软件工程;关联挖掘

1 教育数据挖掘技术

教育领域的信息化脚步是影响目前教育信息数据的快速增长的重要原因。面对如此庞大的教育资源数据,充分运用数据挖掘技术把数据背后一系列有用的知识深度挖掘出来,比如隐藏的规律,相互影响的因素,相互關联的成分等,并且在一定程度上加以灵活地二次运用,这不单只是教育资源的充分利用,对于教育资源的决策者、教育工作者、学生来说,更是一个福音,这也是教育数据挖掘技术出现的原因[1]。

教育过程数据挖掘和学习分析技术是目前数据挖掘技术在教育领域中研究应用的两大主要方向。教育过程数据挖掘是在大数据环境下,通过利用数据挖掘和机器学习等方法[2],对教与学过程中所产生的数据剖析,可以实现对学习行为和学习过程进行量化建模,进而揭示教学规律。其关键任务需要解决教育过程中的几大问题,如何调整教学顺序适应不同学生,影响优异学习成绩的因素,预示学习质量的学生行为,在线学习环境的优化等。而学习分析技术是为探索新的学习模式,为理解和优化学习模式以及学习情境,一般通过对实验对象以及学习环境的数据进行监测、汇总与分析。其主要应用是监测和预测学生的学习成绩,及时有效地发现问题、做出干预、规避风险。

2 需求分析

2.1 功能性与非功能性需求

基于数据挖掘技术的教务综合管理平台以高职院校作为研究切入点与服务对象,为其教育管理者、教师、学生等提供一个综合数据分析平台,在实现基本教务功能的基础上,运用统计学方法及数据挖掘中的关联规则挖掘算法进行成绩分析[3],挖掘成绩之间的相关性模式并对这些模式进行二次使用,具体主要的功能性需求描述如下:

1) 考虑到平台的实用性,基本确定使用范围主要为教学管理人员(管理员)、教务分析人员(分析员),以及校内教师用户。通过深入使用范围内的群体进行调研和访谈,结合系统在功能表现上的各种约束条件,基本可以确认管理员的使用需求,以用户管理、系统管理、教务管理及成绩数据管理为主,分析员进行成绩关联规则挖掘以建立知识库为主,教师用户以成绩查询、上传、数学统计分析以及二次使用挖掘模式为主。

2) 平台以学生成绩数据为基础数据,与成绩数据相关的一些基本教务功能要求可以实现,利用数据库技术进行学生成绩数据的增、删、改、查。为方便大批量成绩数据的添加可使用文件上传和编辑添加两种方式。对于存放在数据库中的历年成绩数据,为适应使用者的使用目标,通过设置精确或模糊的多种条件,把范围小到学生个人,大到整个专业的各学期阶段成绩数据进行查询并展示。

3) 针对查询得到的成绩数据结果,对特定科目进行常规数学统计对比分析。利用不同的图表形式,纵向和横向对比成绩的各分数段比率、优秀率、及格率、平均分、最高分,最低分、标准差、超平均分比率等统计信息。纵向对比是通过比较同一专业不同年级的情况实现,横向对比是通过比较同一学年不同专业或不同班级的情况实现。如此统计比较可以一方面让教学人员充分了解当前自身的教学质量情况及学生对科目的学习情况,通过两向对比获取教学建议,另一方面通过图表化统计对比获知的信息可以引导进一步地关联挖掘分析成绩数据之间规律。

4) 平台为探索学生成长成才的因素及因素之间的联系,建立抽象模型,把各种人才培养分析的因素“成绩化”,包括学科成绩、素质成绩、发展能力成绩三种类型。通过此模型可以把握人才培养分析的多个维度。

5) 平台利用关联规则分析算法进行数据挖掘工作[4],首先提供用户进行准备数据的选择,为确保通过挖掘算法能够最终挖掘出有利用价值的模式信息,通过界面用户选择有效条件,从数据库中获取成绩数据,此有效条件主要从数量及质量上体现;然后能够实现对准备数据的预处理,预处理主要工作是把成绩数据从分数值、连续型的数据转化为离散型数据,并通过界面展示预处理结果;最后对预处理结果数据进行关联规则挖掘,界面展示得到成绩数据中的强关联规则并确认是否存档。

6) 平台对于已存档于数据库中的强关联规则基础库可进行二次利用[5],实现根据学生现有的成绩状态进行预测,预测后续的成绩状态,从而规避劣势课程成绩的发生,或者根据现有成绩状态进行溯因,查找可能导致此状态的原因(当前成绩状态),从而方便教学人员调整教学顺序或策略。

作为对功能性需求的补充,在对平台进行需求分析的过程中,还识别到一些非功能性的需求,用于描述系统性能或运行情形的要求和约束等。主要内容包括:

1) 响应的实时性,平台要求对用户在界面上的操作能够实时响应,对于操作引起的数据库上数据的变更,能实时地反映在后续操作上。

2) 数据的准确性,由于平台中的数据要为数据挖掘工作提供准备数据的支持,所以在数据的录入、修改、保存的过程中,需要在每个环节上设定条件规范数据的合理性,保证数据完整、准确。

3) 平台针对不同用户类型设置相应权限,保证系统的安全性及可靠性,此外系统设计上使用B/S模式,允许多用户同时通过网络使用系统对数据进行不同操作。

2.2 用例图

针对前文关于平台系统的需求描述,系统使用的角色有管理员、分析员以及教师用户三类,对系统核心的功能需求建立用例图,如图1所示。

3 系统的设计

3.1 系统架构

基于数据挖掘技术的教务综合管理平台的架构设计是符合MVC[6](模型Model-视图View-控制器Controller)模式的B/S(Browser/Server)解决方案,遵循“统一管理平台,统一操作界面”的总体设计思路,从系统架构功能逻辑上划分为表示层、业务逻辑层、数据层及基础层四层体系结构作为构建应用的基础,其中以业务逻辑层即中间层作为架构的核心,以下对整体的设计思路作阐述。

表示层,B/S解决方案使得用户终端的访问及操作在Web浏览器上进行,程序的运行及数据库的访问等在服务器上完成,统一简约风格的操作界面,菜单管理和输入显示的逻辑清晰明了,结合操作便捷灵活的H5页面设计,界面适配不同尺寸及分辨率终端,让操作体验更具人性化和便捷性。

业务逻辑层,是系统技术架构实现的功能和管理核心,实现用户面对系统的基本应用功能,基本应用包括基础的系统管理、操作日志管理及权限管理,教务管理实现学院基础信息的完善,其中学科管理维护学院人才培养分析的参数“学科成绩化”模型,学生成绩管理维护本系统的成绩样本基础库及进行数学统计分析,核心应用业务对成绩数据进行关联挖掘分析,功能以Weka数据挖掘引擎为基础[7],并改进其技术支撑,Tomcat中间件服务器作为应用服务器。

数据层,实现数据存储、查询和共享,灵活的数据库存放及读取操作,数据库进行合理的逻辑分区,通过多源数据接口实现与学院原教务系统的信息共享, 以方便业务逻辑层使用,此外构建学生原始成绩数据文件库,ARFF文件库[7],以方便核心业务关联挖掘功能的实现。

基础层,包括有物理网络及云服务器等相关设备,负责数据传输,以及作为系统底层网络硬件平台基础。

以上为系统的技术架构,其逻辑结构图如图2 所示。

3.2 系统功能模块

根据前述对平台的需求分析,结合系统架构功能逻辑,对本系统各功能需求进行梳理,在进行系统开发过程中,将按以下功能模块图进行设计,具体见图3。

系统的功能模块主要分成四个模块、系统管理、教务管理、学生成绩管理及基于关联规则挖掘的成绩分析。

1) 系统管理模块:包括用户管理、角色管理、菜单管理、操作日志管理、数据库备份还原等系统相关的日常维护管理功能,其中用户管理及角色管理对管理员、分析员、教师用户三类用户信息及权限设置进行管理。

2) 教务管理模块:包括专业管理、年级管理、班级管理,学科管理以及學生信息管理,对学生简单的个人基本学籍信息情况数据进行维护,教师任课管理维护各学期分配给教师用户的教学任务信息,学科管理根据需求分析,将学科进行分类,各项学科成绩根据实际情况均定为100分制,在模型中成绩数据包括学科成绩、素质成绩、发展能力成绩三种类型。

3) 学生成绩管理模块:功能主要包括管理学生成绩数据的基本操作。如,成绩数据的上传录入;教师用户在规定格式文件中,登记本学期担任学科班级的成绩,并通过系统上传至数据库中;成绩查询编辑:管理员对需重录成绩进行修改,用户均可查询学生的成绩数据,教师用户可查询本人担任学科班级成绩;成绩统计分析:分析员及教师用户对查询的成绩数据进行数学统计分析,并图例展示。

4) 基于关联规则挖掘的成绩分析模块:这是整个系统最核心的业务模块,分成成绩关联挖掘分析子模块和成绩预测及溯因子模块。前者包含对成绩数据样本完整的数据挖掘流程,后者是对系统的关联规则知识库进行查询。

3.3 系统用例分析与设计

根据需求分析,系统用例较多,本节仅以关联挖掘用例为例进行分析。用例分析包括用例的功能描述、用例的交互过程和用例的类(边界类、控制类、业务类、实体类)分析与设计。

关联挖掘用例功能描述:分析员在完成数据预处理工作后对数据预处理结果文件利用关联挖掘算法以获得强关联规则的工作。

关联挖掘用例交互过程:关联挖掘属于基于关联挖掘成绩分析功能里最重要的一个子过程,分析员用户在获得预处理数据文件ARFF文件后,读取文件并转换成事务集合,根据设定的“最小支持度上限”“最小支持度下限”“最小置信度”“支持度增量”“最优规则数量”以及“优化算法的支持度峰值”运行改进Apriori算法[8]获取关联规则结果页面显示,并保存至数据库关联规则表中。

关联挖掘用例的类分析和设计。

1) 边用界户类界:面关类联)挖,该掘类的负边责界显类示为关A联sso规cia则tio列nI表nte以r?及获取关联挖掘各项参数。

2) 控制类:页面类MiningAction.java对逻辑对象Apriori.java进行调用,负责接收对象传递数据及领域对象数据的转换。

3) 业务类:Apriori.java类是挖掘算法的核心类,执行Apriori算法运算流程,为实现算法功能对逻辑对象Instances.java、AprioriItemSet.java以及Association? Rules.java 进行调用;Instances.java 类调用逻辑对象PreproResultData.java,该类的作用是从数据源中向程序读入所有数据记录,通过实现此类,生成算法所需的事务集Instances并返回;PreproResultData.java类读取本地ARFF文件并解释成数据源;AprioriItemSet. java类是改进Apriori算法的频繁项集类[9],处理挖掘频繁项集的主体工作并返回频繁项集集合;Associa? tionRules.java类是Apriori算法的关联规则类,从频繁项集集合中生成关联规则并返回,调用逻辑对象RulesResult.java。

4) 实体类:规则结果类RulesResult.java可实例化存储各条关联规则的序号、规则前件、规则后件、参数信息、备注信息等属性的规则结果对象。

4 结束语

综上所述,在大数据时代的背景下,在教育领域,仅提供普通事务处理的传统信息管理平台已经不能满足日新月异的教学场景需求,利用数据挖掘技术在传统的教务管理平台进行功能拓展,构建具备决策支持的教务综合管理平台符合教育信息化的发展趋势。文章根据高职院校的教学实践进行需求分析,对目标系统进行设计,为推进该方面系统技术的实施应用做出努力。

猜你喜欢

教务管理软件工程教育信息化
信息技术与教学难以深度融合的成因及解决途径探析
创新信息技术支撑教学变革
关于如何创新和完善计算机软件工程管理的探讨
新形势下高校二级学院教务管理优化路径探析
有关开设跨文化课程优化教务管理的讨论