基于关联规则的在线教学分析
2020-09-16刘克礼
刘克礼
(安徽广播电视大学 信息与工程学院,安徽 合肥 230022)
教学分析是教育管理中的重要环节,是进行有效教学、提高教育质量的有力保证。随着教育信息化技术的广泛应用,网络在线教育的持续发展,这种突破时间和空间限制的教学及学习方式,为学习者提供了便利,也使得在线学习平台积累了大量的教学及学习记录数据。在线教育快速发展为广大学习者提供了方便、优质的教学服务,同时在线教育也存在着监控不力,也就是说学习者学习过程得不到有效监督。特别是网络学习效果以及网络学习质量、网络学习影响因素等,这也是目前国内外学者集中研究的重点问题[1]。运用关联规则寻找教学活动之间的内在联系,为教学改革和管理提供科学依据[2]。通过关联规则分析方法,深入研究课程的内在联系,探寻在线学习的规律,从而更好地开展教学工作,提高学生的学习效果。
1 关联规则与数据挖掘
数据挖掘就是在数据存储仓库中,自动地发现有用信息的过程,即从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中事先未发现但有意义的数据,因此,数据挖掘又称作知识发现,随着教育信息化不断发展,数据挖掘技术在教育领域也受到普遍关注[3]。
2 基于关联规则的教学分析
2.1 问题提出
基于网络的教学发展至今,其办学规模、教学效果都取得了长足的发展。目前,基于网络的学习还是缺少监控和评价,学习成果的考核基本采用期末考试与平时网上行为加权来评定。期末考试通常是纸质笔试或机考的方式进行,网上学习行为通常也是网上作业,或是统计课程点击次数、或是统计在线时长进行评定。网络教学设计、教学内容的安排是否合理,学生通过网络进行学习的成效如何等都无法准确的衡量[5]。如何充分利用网络平台积累的这些学习记录和课程数据,通过对数据进行深度分析,找出其潜在的价值,为优化网络学习提供有力保障,这就需要对数据进行分析挖掘。利用数据挖掘技术中的关联规则,对在线学习平台中积累的数据进行挖掘,将关联规则应用于在线学习的教学分析,分析教学效果、学生的网上学习行为、学习成效等因素之间的关联关系。
2.2 数据收集
本研究所用数据来自于在线教学平台,该平台提供了课程各章节的视频资源、重难点辅导文本、重点内容的拓展阅读资料、课程的导学及期末复习资料、单元在线测试等。同时平台还记录了学生在线学习情况,如资源的点击量、在线时长、单元测试成绩等数据。
除了上述平台记录的在线学习数据外,本研究所使用的数据还包括学生个人信息、数据库应用技术课程期末考试成绩。通过对在线学习平台各学习环节与课程的考试成绩进行关联分析,挖掘其中的潜在的联系,为教师更加科学地进行课程教学设计,提高学生学习效率提供支持服务。
2.3 数据处理
在线学习平台中记录的数据通常是不完整的,这些数据存在噪声和离群点,数据遗漏、不一致或重复,数据有偏差的情况。这些原始数据需要加以处理,一方面是要提高数据质量,另一方面要让数据更好地适应数据分析。数据分析就是要找出在线平台各教学环节之间及教学环节与考试成绩之间的联系。这些数据均为连续性数据,而关联规则算法主要是针对离散属性值进行数据分析,因此需要对这些数据进行离散化处理。
数据离散化方法主要有三类:无监督和有监督离散化、全局和局部离散化、动态和静态离散化,其中无监督离散化又包括等宽分箱法和等频分箱法[6]。等宽方法将属性的值域划分成具有相同宽度的区间,这种方法可能受离群点的影响,以至于对噪点过于敏感,不能把属性值分布到各个区间,导致有些区间的数值分布不均,这样可能会损坏离散化之后建立的数据模型。等频方法是将相同数量的记录放在每个区间,保证每个区间的数量基本一致,不会像等宽离散那样出现某些区间记录过的多或过少的情况。本研究采用无监督离散化的等频分箱法进行数据分类。
以2017年秋季至2018秋季三个学期的数据库应用技术课程网上学习记录及考试成绩数据为基础,离散化分类的属性为期末考试成绩、在线单元测试成绩、在线时间及资源学习进度,各属性离散化编码表如表1所示。
表1 各属性离散化编码表
在对学习环节各属性进行分类时,特别关注考试成绩在60分以下的数据,将60分以下的数据分为两类,因此根据等频分箱法分为四个类别;单元测试属性也是如此分为四个分类;课程网上视频总时长8.8小时,因此将0至8.8小时设为一个分类,然后参照学生在线学习的时间分布,分为四个分类;此外,依据学习平台上资源学习的情况,将资源学习进度分为四个分类。
2.4 关联规则结果分析
采用的关联规则算法是基于Apriori的算法,利用在线学习平台积累的原始数据,挖掘平台中数据库应用技术课程学生的在线时长、资源学习进度、单元测试成绩及期末考试成绩之间的关系。通过数据挖掘,最终得到6条关联规则。
试验分为4组,对照组(100%基础精料+黄贮饲料)、试验1组(80%基础精料+膨化秸秆生物发酵饲料)、试验2组(70%基础精料+膨化秸秆生物发酵饲料)、试验3组(60%基础精料+膨化秸秆生物发酵饲料)。其中100%精料即按体重的1.2%给予精料。
规则1:在线时长=“H1”,资源学习进度=“J1”,单元测试成绩=“C4”,期末考试成绩=“D4”,支持度位0.382,置信度为0.812。学习中投入的时间较少,期末考试成绩较低。
规则2:在线时长=“H2”,资源学习进度=“J2”,单元测试成绩=“C3”,期末考试成绩=“D3”,支持度位0.368,置信度为0.711。基本上能能完成在线课程的视频学习, 学习了部分文本资源,单元测试成绩有待提高,考试成绩接近及格。
规则3:在线时长=“H2”,资源学习进度=“J4”,单元测试成绩=“C1”,期末考试成绩=“D1”,支持度位0.358,置信度为0.801。期末考试成绩分数较高,系统学习了课程各类资源。
规则4:在线时长=“H3”,资源学习进度=“J3”,单元测试成绩=“C1”,期末考试成绩=“D1”,支持度位0.418,置信度为0.832。期末考试成绩分数较高,在线学习时间能满足课程学习的需要。
规则5:在线时长=“H4”,资源学习进度=“J3”,单元测试成绩=“C3”,期末考试成绩=“D3”,支持度位0.312,置信度为0.731。在线学习的时间超20小时,没能较好完成单元测试,以致考试成绩并不理想。
规则6:在线时长=“H4”,资源学习进度=“J2”,单元测试成绩=“C3”,期末考试成绩=“D3”,支持度位0.322,置信度为0.741。在线学习的时间超20小时,但时间多集中在少数资源上。
分析上述6条规则,如果学生的网络学习达到一定时长,资源学习时间分布合理,则考试成绩较高;当学生的在线学习较少,或学习集中在部分资源上,则考试成绩较低。
3 结果分析
通过网络学习平台中数据库应用技术课程的学习数据进行关联规则分析,筛选出较高支持度和置信度的6条规则,发现了学生在网络平台进行课程学习中存在的问题,对于教师的教学设计、教学管理及学生的自主学习都有着一定的指导意义。网络教学过程中,教师更多注重课程的教学设计,特别是学习任务的布置,对于学生的学习督促和指导不够,这不利于学生的学习,也不利于老师的个性化教学。依据数据挖掘的结果,为数据库应用技术课程教学提出几条相关信息和教学建议:
3.1 有效的在线学习与期末考试成绩有密切关联
根据关联结果分析,学生在线学习时间越多,点击的资源数量及类型越多,且单元测试成绩较好,期末考试就会取得好成绩;同时发现,在线时间超过20小时,且浏览资源较少的学生考试成绩均不理想,这说明学生没有进行有效的网络学习,存在着应付学习的情况。学生在学习课程之前,往往缺乏对资源的选择能力,也不清楚课程重点及难点;同时部分学生的自主学习意识不够,学习中存在着走马观花的现象。
为此,课程教师需要加强网络教学设计能力,加强资源选择、开发能力。在课程页面的显著位置告知学生课程的学习方法,课程重点、难点知识。根据课程特点增加课程实践,实践依托一个具体的项目,以项目为载体,知识点为学习单元,采用基于项目贯穿式课程体系知识点方法进行实践教学。加强网络学习的监控,如在视频学习中增加答题环节,以测试学生学习效果。增强师生交流,定期开展网上实时答疑活动,解决网络学习中遇到的疑问。
3.2 简洁明了、个性化的网络学习模块能提高学习效率
通过关联分析结果,发现文字辅导材料与期末考试成绩关联性不强,说明纯文字的网络学习资料对学习数据库应用技术这门课程没有起到促进作用。课程在线学习平台不只是教材内容的搬迁,更应该注重知识的易学性和实践性,在学习平台中增加习题辅导解析、实践模拟操作等板块,让学生在理论知识学习的基础上提升实践动手能力。
3.3 辅导教师的监督和引导有助于学生的自主学习
基于网络的学习是人机交互式学习,需要学生有较强的自主学习能力。研究中发现教师适当的监督和引导,有助于提高学生的自主学习效率。首先,教师实时引导有助于学生掌握课程的学习方法,了解课程的学习安排、课程重难点等,为课程的学习打下一个良好的基础;其次,学习全过程监控,及时掌握学生的学习情况,对未按课程教学安排完成网络学习任务的学生给予反馈;最后,适时的网上交流,畅通教师与学生沟通渠道,解决在学习过程中的疑惑,消除在网络学习中产生孤独感。因此,需要加强基于网络的沟通能力、组织引导能力的培养,以便更好地共享、交流信息和知识,确保网络教学的正常有序进行。
4 结语
利用数据挖掘技术对学习平台积累的数据进行关联规则分析,研究网络学习要素和学习成绩之间的内在联系,找出影响网络学习效果的因素,为改进网络学习方式,优化网络教学,提高网络学习质量提供数据支持。