基于随机森林的混合教学学习行为评价模型
2019-12-16朱家成陈刚向华李支成吴开诚
朱家成 陈刚 向华 李支成 吴开诚
摘要:混合教学是在当前基于在线学习的基础之上,提出的一个全新的教学模式,该模式推广急需更为客观的过程评价。通过收集混合教学实施过程的各种学生学习行为数据,进行归纳总结,可以划分为三大类数据:传统课堂数据,在线学习數据,阶段测试数据。在此基础上增加了特有的人工干预模型,并在这些数据的基础上,搭建了学生行为分析评价数据挖掘模型。经过真实教学数据的验证,增加了人工干预的随机森林数据挖掘模型能够更好好的评价学生的学习效果,达到了实验预期。该模型为混合教学的探究提供了更深入的支持。
关键词:混合教学;人工干预;行为分析;评价模型;数据挖掘;随机森林
中图分类号:TP391 文献标识码:A
文章编号:1009-3044(2019)29-0118-03
在当前全球化的信息社会里,大数据应用到各行各业的时代里,社会高校的教育方式日新月异,基于MOOC之类的混合教学模式如雨后春笋,并得到了国内外诸多优秀高校的认可,包括国外的斯坦福,哈佛,麻省理工等,国内的北大,清华,复旦等诸多名校。在当前背景下顺应而生了各种各样的在线教育平台,以及多样化的在线教学模式,如何更好地提高在线教育的教学质量与教学效率,利用好这个教学模式是当今研究的热点。
而MOOC和SPOC类在线课程要求学生要具有较强的自主学习能力和学习动力,而学生在长期应试教育模式下,无法适应在线课程的学习模式。在线课程难以实现个性化教学,以及缺少对学生学习行为的制约,因此无法达到预期的学习效果。为了解决这一问题,我们江汉大学采用的是混合教学模式。
1混合教学
混合教学将MOOC和SPOC等在线教育形式引入到高校传统课堂中,混合教学中的在线学习是在教师指导下实现有意义的个性化自适应学习和深层次学习。采用混合学习形式,既有利于共享优质在线教育的资源,提升高校的品牌效应,又能够发挥在线学习的特点,使线下课堂变得更加动态、灵活,提高了校内教学质量。混合教学是把学生作为教学活动的主体,教师变成教学过程控制的主体,将传统教学的优势和互联网在线课程的优势结合起来,既发挥教师引导、启发、监控教学过程的主导作用,又充分体现学生作为学习过程主体的主动性、积极性与创造性,从而取得最优化学习效果的教学方式。混合教学是在线教育在高校校内教学中应用的真正价值。
本文是通过江汉大学计算机中心在超星平台上开设的《大学计算机基础》这门课为基础,通过分析这门课采用的混合教学模式下的学生学习行为相关数据,构建模型,对学习效果进行预测,以达到对混合教学,在线学习这种教学模式的探究,并为教育模式的改进打下坚实的基础。江汉大学计算中心推行《大学计算机基础》混合教学已有两年有余,本人也是混合教学实施的一线教师研究者,积累了丰富的混合教学数据,通过对前人研究的总结与归纳,对自己教学行为数据的分析,并通过最终期末测试验证,充分证实了混合教学的优势,与行为分析预测模型的准确性。
2学生行为数据分析
2.1发现行为
混合教学中,学生在教师的监控、引导下利用在线课程进行自主学习。在线学习与课堂学习混合进行,在线学习平台和课堂教学信息化平台提供大量和学生学习行为数据,数据包括线上数据和课堂数据两部分。线上数据包括在线学习平台中记录的各种学习行为数据,例如学生观看视频的时间序列,学习资源的浏览形式、在线交流的时间、参与教学互动和论坛讨论,交互式练习测试的结果等等。线下课堂学生行为数据包括学生点名、实验、小组讨论、课堂测试、报告、期末考试等数据。总的来说,所有的学生参与的教学行为可以分为三大类:传统教学数据、在线教学数据、阶段单元测试数据。
2.1.1传统教学数据
传统教学数据顾名思义,来源于混合教学中传统课堂上产生的数据,而《大学计算机基础》这门课比较特殊,除了常规的点名作业之外还是有上机练习实验部分,所以归纳起来传统教学数据有以下几种:
(1)课堂点名
(2)课堂提问
(3)课堂限时作业
(4)课下实验
(5)课下作业
2.1.2在线教学数据
在混合教学中与传统课堂最明显的区别就是增加了大量的在线学习数据,一般在线学习都是有相应的在线学习平台,本文研究中学生所使用的在线学习平台是超星学习通学习平台。一般不同的平台所提供的在线学习数据都不尽相同,但归纳起来也基本在以下几点以内:
(1)在线点名
(2)任务点完成情况
(3)视频完成情况
(4)讨论详情
(5)访问详情
(6)在线作业
(7)在线测试
2.1.3阶段单元测试数据
在本次混合教学中,将大学计算机基础的教学内容分为了六个阶段,分别是(A)计算机基础理论知识,(B)计算机软硬件系统,(c)Windows 7操作系统的概念与使用,(D)word软件的使用,(E)Excel软件的使用,(F)计算机网络多媒体相关知识。
江汉大学计算中心为了更好地配合《大学计算机基础》这门课程的混合教学的顺利展开,由系里的老师专门开发了针对这门课的一个学生测试平台,该测试平台和最终期末考试形式类似,通过知识点划分,将每阶段的内容都拿出来给混合教学的学生进行测评,从而可以得到阶段测试数据。
2.2总结行为
课堂数据和在线学习数据相比,具有真实、可控的特点,同时也具有主观成分,使得混合教学中的数据也更加复杂。对学习过程的追踪和评估促进了学习分析和教育数据挖掘的发展和应用。随着大数据时代的来临,大数据存储系统和数据分析方法的不断发展,数据挖掘、机器学习和人工智能等相关领域的蓬勃发展为本课题提供强大的技术支撑。
如何将这些复杂学习数据进行清理、整合、分析、建模,从中发现有价值的模式和知识,并对学习效果进行及时预测是本课题关注的焦点,也是混合教学研究中需要着重解决的关键问题,具有极大的理论和实际应用价值。
3建模评价
可以看出本次研究的数据众多,在这些教学与学习行为数据里,本文根据数据最终的评价方向,构建了随机森林数据挖掘模型,来判定最终的学习状态。
3.1人工干预模型
人工干预模型主要是通过对平时教学工作中,学生实时表现情况的记录,来进行一个综合指数的评价,因为平时的学生数据记录过程中,首先是在开放环境中,不可避免有些数据是通过其他非常规手段得来的,而这些数据会在一定程度上影响最终评价结果,其次,是机器记录的数据相对来说不是特别完整,很多学生态度认真,表现积极等信息很难被数据记录下来,所以人工评fire型也尤为重要。
数据来源:传统数据诚信记录(点名代签记录,作业舞弊记录,实验舞弊记录,阶段测试舞弊记录),在线数据舞弊记录(在线测试舞弊,在线作业舞弊,在线其他非诚信记录),老师人为判断数据(课堂表现积极记录,闪光点记录)。基本判断规则:总分100分,有一次不诚信记录扣10分,有一次闪光记录,加5分。
3.2数据挖掘综合评价模型
综合模型是在前三个模型所得结果的基础上的一个综合判断,能够较为全面地把一个学生的真实学习效果给预估出来。
3.2.1数据挖掘算法
对于数据挖掘,一般的方向是分类与回归,分类是进行定性分析,回归是进行定量分析,在本文中主要是进行学习效果的评价,故进行分类分析。首先第一步是利用已有分类的数据作为训练数据,来检测模型;然后用没有分类的数据输入到模型里去,输出该数据的类别。
3.2.2随机森林综合评价模型
隨机森林是一种机器学习模型。它比神经网络计算量小,集成多棵决策树的预测,2001年Breiman把分类树组合成随机森林,即对变量和数据进行随机化,生成很多分类树。
随机森林实施第一步是得到基分类器,主要有两个步骤:
首先对原始集进行放回随机抽样,得到和原始集规模大小一致的训练集;然后进行属性及的随机分配,从一定量的属性中选取小于该数值的属性个数作为分裂属性进行分裂。
4实验与结论
4.1实验实施
将初始样本的数据分成M*N维,对该数据进行有放回的取样,取出同样为M*N的样本数据。
从数据的N维中提取无放回的M维特征,即对每个数据样本都采用决策树的模式。通过计算找到分类最优的特征K以及阈值th来进行划分。
重复训练所有的数据样本,得到ntree个决策树。
多次训练之后,所得到的集合便是随机森林,应用随机森林进行预测结果是,通过对预测及进行分类,得到分类之后的结果。
在本文中具体实施步骤如下:
第一步:导人数据:
将第2章总结的数据全部导人系统,分别有传统教学数据(分为五类)、在线教学数据(分为七类)、阶段单元测试数据(包含六个阶段)。
第二步:人工干预指数计算
人工干预就是根据老师的上课过程自己的一些观察数据以及个人判断数据给予每个学生的综合打分。
第三步:数据整合
首先中传统教学数据T按照数据顺序,分别将课堂点名,课堂提问等等设置为TO,T1,T2,T3等;将在线教学数据设为L,同理属于在线数据的在线点名,任务点完成情况,视频完成情况,讨论详情等设置为L0,L1,L2,L3等;阶段单元测试数据六个阶段的成绩分别是A,B,C,D,E,F;再加上我们人工干预模型得到的评估值v,就可以构成我们此次研究的数据集。
第四步:导人模型
在本次模型实施中,总共将两套数据分别代人随机森林数据挖掘模型,采用的是weka数据挖掘平台。可以得到以下两种预测结果:
(1)不增加人工干预参数
可以得到准确率为0.64。
(2)增加人工干预参数V
可以得到准确率为0.79。
4.2实验结论
可以看到,加入了人工干预参数的随机森林数据挖掘模型,可以更好地预测学生学习行为,有大幅度地提高了预测的准确性。因为相比于传统的数据,加入了人工干预参数,能够更为全面的记录学生的真实学习情况,包括学习能力,学习态度,以及数据获取的准确性判断,该模型对混合教学的发展有着极大的推进作用。