APP下载

基于Apriori算法的课程内容关联分析及教学策略改进

2020-05-12詹静范雪刘一帆

教育教学论坛 2020年15期
关键词:Apriori算法

詹静 范雪 刘一帆

摘要:挖掘学习数据并对教学策略进行正向反馈已成为改进教学质量的重要手段。基于Apriori算法对计算机网络基础课程教学中学生学习数据进行挖掘和分析,生成课程教学内容之间的强关联规则。通过对这些生成规则的分析,找出影响学生成绩的难点教学内容,从而帮助教师利用这些反馈信息进行有针对性的教学策略改进。

关键词:教学策略改进;课程内容关联;Apriori算法;强关联规则

中图分类号:G642.0     文献标志码:A     文章编号:1674-9324(2020)15-0219-03

一、背景

学习数据挖掘是一种常见的高校学生学习效果分析方法。而简单的数理统计方法只能简单展示学生的最终学习效果,学习过程中的潜在信息没有得到有效分析;数据挖掘能够分析出影响学生成绩的因素,关联规则算法是数据挖掘中的一种重要方法,可以对教学过程形成正向反馈。当前的关联规则方法多用于课程间规则分析,对于课程中不同内容之间规则分析较少。而课程的重点内容和难点内容才是决定学生某门课程是否及格的关键。

本文利用Apriori算法对计算机网络基础的学生的学习数据进行深入挖掘和分析,生成课程教学内容之间的强关联规则,分析影响成绩的难点内容,根据课程教学大纲的重点内容和分析所得的难点内容,提出课程教学方案的改进,帮助提高学生的学习质量和学校的教学质量。

二、相关工作

关联分析广泛应用于教学改进中,潘燕利用决策树C5.0算法对学生成绩进行数据挖掘,得到该专业核心课程与其他课程之间的关联关系,便于掌握学生学习状态[1]。司马碧蓉根据学生课程成绩分析得到课程间依赖关系和依赖程度,能预测学生后续课程的学习成绩[2]。贺超波等用粗糙集相关性质对决策数据进行属性约简,基于分辨矩阵的关联规则提取算法发现课程成绩数据中隐藏的课程相关性规则[3]。陈青山通过优化决策树算法提取了有效关联规则,找出了影响教学效果的关键因素[4]。孙洁等人利用Apriori算法分析了課程之间的相关关系和紧密程度,得到核心课程和课程结构,对专业课程设置及改革提出意见与建议[5]。江静娴等人使用改进的AprioriTid算法,减少了频繁项集和关联规则的数量,过滤不能生成有效候选项集的元素,提高了算法效率[6]。曾子贤等人结合矩阵,基于改进频繁模式树和候选集频数优化策略提出了改进的关联规则挖掘算法,提高了效率[7]。

三、课程成绩数据处理

根据教学大纲,计算机网络基础课程内容分为网络操作系统、网络模型、网络接入、以太网、网络层、IP编址、子网划分、传输层、应用层、安全共计10个内容。

本文将2014级和2015级在在线练习、实验和期末考试三类考核在上述10个内容中分别统计,得到课程内容得分(2014级没有考核实验)。即先计算每个内容在各类考核中的实际得分乘以成绩权重,求和得到内容实际得分;再计算每个内容总分乘以成绩权重,求和得到内容总分;用内容实际得分除以内容总分,可得到处于[0,1]的每个课程内容得分数据。

四、课程内容关联规则分析及教学策略改进

通过Apriori算法对上述数据进行分析,可得到有价值的课程内容关联规则,从而为教学策略改进提供帮助。

本文对学生的不同课程内容成绩,筛选出每个内容得分较差的学生,将筛选出的内容表示成算法支持的输入形式,进行关联规则的生成。首先,实验开始时给定最小支持度和最小置信度。最小支持度表示项集在统计意义上的最低重要性,是被认可的项集的最低出现频率,最小支持度可以在生成频繁项集时,将之筛选出来;最小置信度表示关联规则的最低可靠程度。其次,选择低分的课程内容,也就是课程的难点内容进行关联规则的生成和分析,因为课程难点内容的掌握情况决定了学生得分的高低。经过反复试验,最终筛选出每个内容得分在0.7以下的学生,在生成频繁项集时设置支持度为0.2,在生成强关联规则时设置最低置信度为0.45,得到如下表所示18条强关联规则。

支持度大于0.15,且得分比例低于0.7(即低分)的课程内容项一共有7个,支持度从高到低依次为网络接入、传输层、应用层、子网划分、IP编址、网络层、网络操作系统。其中,支持度越高表示该课程内容项得分低的人数越多,是教学中学生掌握的较差的难点。以太网、网络模型和安全课程内容项没有出现,说明学生掌握相对较好。

我们将规则先按教学重点内容(即网络模型、子网划分、IP编址、网络层、传输层)和非重点内容分类,然后将支持度从高到低分类,最后将置信度按从高到低分类,提出如下教学内容改进策略。

(一)重点内容改进策略

1.传输层教学改进策略。传输层支持度为44%,仅低于网络接入45%,说明这是学生掌握的较差的重点和难点内容,需要重点分析改进策略。

首先分析传输层作为前提条件的规则2和10:在传输层得分低的前提下,子网划分也得分低的可能性为58.62%;在传输层得分低的前提下,应用层也得分低的可能性为64%,都小于65%,说明传输层对其他课程内容的影响不大。

再分析传输层作为推理出的关联内容的规则1,7,8,9,仅有规则8的置信度为66.66%,大于65%,其含义是网络层得分低的前提下,传输层得分低的可能性较大。实际上,网络层确实是传输层的重要前提学习内容,两者有许多比较相似的抽象概念,比如服务和协议特点,地址分类等。学好网络层对后续的传输层学习确实有比较好的引导作用。

从教学策略改进的角度考虑,教师可在传输层教学后增加网络层与传输层的内在关联分析和比较,帮助学生掌握两个内容之间的关联,适当增加习题巩固相关知识点,从而提高学生传输层的学习效果。

2.子网划分、IP编址、网络层教学改进策略。子网划分支持度为33%,IP编址支持度为32%,网络层支持度为23%,均大于20%,因此可将子网划分,IP编址和网络层内容看作课程难点。

首先分析这三个内容作为前提条件的规则。

分析子网划分作为前提条件的规则1、4、5、12,置信度大于65%的规则只有规则5。说明子网划分得分低的前提下,网络层也得分低的可能性为77.27%。

分析IP编址作为前提条件的规则3、7、13、17,置信度大于65%的规则只有规则3,15。IP编址得分低的前提下,子网划分与网络层得分低的可能性都为66.66%。

分析网络层作为前提条件的规则6、8、15,置信度大于65%的规则只有规则6,8。网络层得分低的前提下,子网划分和传输层得分低的可能性都为66.66%。

再分析这三个内容作为推理出的关联内容的规则,且置信度大于65%的规则,同样只有规则3,5,6,8,13。

由上可知,子网划分、IP编址、网络层三部分内容具有较大的关联度,实际上三者也确实都属于网络模型中的网络层,知识点有很高的相关度。并且由于这三个内容都对学生实践能力有一定要求,从教学策略改进的角度考虑,教师可适当为这三个部分在实验环节增加指导,帮助学生提高子网划分、IP编址、网络层的学习效果。

3.网络模型教学改进策略。网络模型的支持度小于等于0.2,因此没有相关规则,实际上,这部分内容在网络模型的不同层次教学内容中都会反复提到,学生掌握的相对较好也是比较符合实际的,暂时不需要变化。

(二)非重点内容改进策略

1.网络接入教学改进策略。网络接入课程内容项的支持度最高,为0.45,也就是说,网络接入内容学习的低分人数占总人数的45%,因此可以将网络接入看作是课程教学中的最难内容。

首先分析网络接入作为前提条件的规则。仅有规则16表示网络接入影响了IP編址的学习,但置信度为46.67%,小于65%。实际上该内容和IP编址的关联关系也不大。

再分析网络接入作为推理出的关联内容的规则17和18。置信度也小于65%。

因此可以认为网络接入是一个较为独立的难点内容。该内容处于网络模型的最底层(包括物理层),学生在日常生活中接触较少,概念不容易理解,因此确实掌握的相对较差。

从教学策略改进的角度考虑,由于该内容不是课程内容重点,教师可通过增加相关实验环节指导和习题练习,提高学生的学习效果。

2.应用层教学改进策略。应用层支持度为38%。说明应用层内容学生掌握的相对较不好。

首先分析应用层作为前提条件的规则9、11、14、18,置信度均没有超过65%。

再分析应用层作为推理出的关联内容的规则10,12和15,置信度也没有超过65%。

因此,也可以认为应用层是一个较为独立的难点内容。该内容处于网络模型的最高层,与生活中的网络活动有密切联系,但协议内容和分类都较多,因此学生掌握的相对较差。

从教学策略改进的角度考虑,教师可以通过增加应用层相关的习题和实验的方式提高学生的学习效果。

3.网络操作系统、以太网、安全教学改进策略。网络操作系统,以太网和安全的支持度都小于等于0.2,说明这部分学生掌握的相对较好,且根据教学大纲,这三部分内容都属于非重点内容。从教学策略改进的角度考虑,教师可以适当通过增加在线和课后练习的方式,让学生更多通过自学掌握这些部分内容。

五、结论

本文使用Apriori算法,针对计算机网络基础课程进行了课程教学内容的关联规则生成,通过分析难点内容之间的关联规则,结合课程教学大纲的重点,给教师提出了教学策略改进建议,包括:对重难点内容传输层部分进行理论教学方法改进,对重难点内容子网划分、IP编址和网络层增加实验环节指导;对非重点但确是难点的网络接入和应用层内容增加习题和实验指导;而对于非重点又非难点的其他部分,适当通过学生自学自测的形式进行引导。通过上述教学策略改进,期望能够提高后续教学质量。

参考文献:

[1]潘燕.决策树算法在高职院校课程关联分析中的应用研究[J].现代信息科技,2019,3(02):151-153.

[2]司马碧荣.基于贝叶斯分类的高职软件课程教学应用研究[D].云南大学,2010.

[3]贺超波,陈启买.高校课程相关性粗糙集分析模型及应用[J].计算机工程与应用,2011,47(27):233-235+245.

[4]陈青山.决策树算法在高校教学质量评价系统中的应用研究[D].西南交通大学,2010.

[5]孙洁,沈桂兰.基于关联规则及知识网络的专业课程关联分析[J].中国电力教育,2014,(21):55-57.

[6]汪静娴,杨厚俊,范延滨.AprioriTid改进算法在课程关联分析中的应用[J].工业控制计算机,2018,31(09):37-38.

[7]曾子贤,巩青歌,张俊.改进的关联规则挖掘算法——MIFP-Apriori算法[J].科学技术与工程,2019,19(16):216-220.

猜你喜欢

Apriori算法
基于Hadoop平台的并行DHP数据分析方法