SPOC 课程学习行为数据分析
——以微机原理及单片机技术课程为例
2021-09-28陈逸菲马辰来翟慧茹袁加伟陆安祥朱晓雅
陈逸菲,马辰来,翟慧茹,袁加伟,陆安祥,朱晓雅
(南京信息工程大学滨江学院,江苏无锡 214105)
0 引言
2020 年春季新冠疫情防控期间,全国高校实施了大规模的在线教学。2020 年11 月,教育部推出首批国家级一流本科课程 5 118 门,其中线上一流和线上线下混合式一流课程分别有1 875 门和868 门,共占54.86%[1]。可以预见,作为教育教学与信息技术、人工智能技术深度融合的教学模式,线上以及混合式教学法将越来越受到关注[2-3]。这两类课程在建设与实施的过程中产生了大量学习数据,如果能有效利用这些数据进行教学改革,对学生的学习与教师的授课情况做出实时反馈,使整个教学过程成为一个数据驱动的“闭环”,将有助于提升教学质量[4-6]。
近年来,国内外学者在学习数据分析方法上进行了多种尝试[7]。宗阳等[8]采用RFM 模型对MOOC 学习者的在线学习行为进行了分析;张峰[9]、罗永[10]等基于视频学习数据分析了不同类型学生学习行为的差异;陈长胜等[11]分析了MOOC 学习者的学习时间分配特征与差异;田娜等[12]分析了MOOC 平台上多个指标与期末考试成绩之间的关系;蒋卓轩等[13]基于MOOC 数据进行了行为分析,并预测学习者能否完成学习任务而获得证书;Liu 等[14]设计了一种多变量时间序列分类算法对MOOC 学生的辍课行为进行了预测;李雪娇[15]针对在线学习参与度低、学习效果不佳的现象,提出利用学习者画像进行在线学习支持服务策略设计,提供精准化学习支持服务。此外,数据挖掘、大数据、机器学习等技术也被用于学习行为的分析与预测[16-19]。
以上研究大多是针对MOOC 平台[8,10-16],但目前有一部分高校课程采用的是基于SPOC 的混合式教学,在教学模式、互动方式、评价指标方面与MOOC 有一定差异[20]。例如,SPOC 往往是有监督的,学习任务完成率较高,课程平台会记录课堂活动数据。然而,有些MOOC 课程是无监督的,因此完课率低[13-14],平台记录一般不包括课堂活动数据,在此基础上分析得到的行为数据特征对SPOC 课程不一定适用。文献[7]将两者列为不同的研究对象,前者属于“学习者”,后者属于“在线学习过程”。此外,SPOC 课程的数据分析往往也只是针对某些特定指标[9]。例如张岩等[21]虽然从4 个方面分析了SPOC 混合式教学模式下的学习者特征,但指标较少,尤其是在线行为特征仅涉及了登录次数、资源访问次数、发帖量、作业完成量4 个指标,而且没有分析这些指标与学习成绩之间的相关性,仅分析了性别、民族、学习经验、计算机水平与成绩的关系,并不能反映学习行为对成绩的影响。
为此,本文以超星泛雅—学习通平台上的SPOC 课程为例进行实证分析,首先全面分析了该平台记录的课前、课中、课后各类学习行为数据与期中、期末卷面成绩之间的相关性,创新性地引入了任务点完成时间先后这类指标,结果发现作业、实验报告的提交先后与卷面成绩的相关性比二者得分更高;然后分析了各指标在不同分数段学生中的情况,发现最优秀的学生在所有指标上的表现均为最佳,而对于成绩位于中段的学生,学习方法比学习投入时间对成绩的影响更大;最后全面分析了与卷面成绩相关性最高的章节学习次数指标在一学期不同月份、一周内各天、一天内不同时段的分布情况,并据此为教学任务的设计与发放提供建议。
1 学习行为数据相关性分析
以南京信息工程大学滨江学院2018 级2 个班的《微机原理及单片机技术》课程数据为例展开实证分析,参与课程的学生共80 人,学习通平台上共发布任务点223 个,视频128 个,时长17h 39min,其中课程章节测试46 次,实验报告4 次,随堂练习12 次,讨论17 次,学习页面访问次数共46 030 次。期中、期末均为闭卷考试,以主观性试题为主。学习通平台上可以直接获得的学习行为数据包括音视频观看、任务点完成、讨论详情、章节学习次数、章节测验统计、签到等情况。对所有学生的章节测验提交时间进行排序,与章节测验平均分共同作为指标参与分析。
课程采用仿真平台进行实验,实验报告也是在学习通平台上提交,因此实验成绩与实验报告的提交时间也进行了类似处理。分析以上行为数据与期中、期末卷面成绩之间的相关性,结果见表1。
Table 1 The correlation coefficients among indicators表1 各指标相关性
从表1 可以看到,章节学习次数、实验完成先后、实验得分、章节测试完成先后、视频反刍比和课程积分与期中、期末卷面成绩相关度高,相关性系数绝对值均超过0.6,其中章节学习次数、实验完成先后、实验得分的相关性系数绝对值均超过0.7。章节学习次数(观看视频、完成各项任务均统计在内)反映的是学生学习的认真程度,一般情况下学习认真的学生访问课程的次数也较多。
由于受疫情影响,实验课于5 月份恢复线下课程后开始,共有4 次仿真实验。然而实验任务是在3-5 月份陆续发布,实验需要的仿真软件工具在返校前就已经提供给学生安装,且在平时线上教学与小组任务过程中已经引入该软件的使用。以第一次实验为例,最快的学生在3 月31 日完成,最慢的学生到5 月8 日才完成,相差近40 天。部分学生在家已经完成了前3 次实验内容,其在学习态度与学习能力上也比较突出。因此实验成绩和提交时间能比较准确地反映学生的学习质量。
章节测试以选择题为主,部分学生在课前预习时完成,部分学生是课后完成。章节测试得分与期中、期末成绩的相关性明显没有提交先后顺序高,这是由于提交早的往往是学习态度好、能主动预习的学生。课程积分包括课堂抢答、投票、问卷、课后小组任务、讨论等得分,比较全面地反映了学生参与学习的积极性和主动性,因此与期中、期末成绩的相关性也较高。
视频反刍比在一定程度上体现了学生学习投入的时间,因此与期中、期末成绩的相关性也较高。
课程采用的是SPOC 形式,线上学习是有监督的,绝大部分学生能够完成所有任务点,因此任务点完成情况与考试成绩的相关性不大。表1 中未列出的签到数据也是如此。
2 学习行为在不同分数段的情况分析
按照期末卷面成绩将学生分为5 个等级,对不同分数段的学生在各类行为数据上的差异进行分析。结果发现,90 分以上学生的平均访问次数高出80-89 分数段学生近40%,约是<60 分学生访问次数的3 倍。而80-89 和70-79两个分数段学生的学习访问次数无明显差异,说明这两个分数段学生的成绩差异原因主要为学习方法,而不是投入时间。通过对比其他指标发现,这2 个等级学生差别最大的是讨论次数,80-89 分数段的学生参与讨论的平均次数为70-79 分数段的1.86 倍,说明前者的学习更主动,更愿意深度思考,而后者的学习相对被动,满足于完成必须的学习任务。
3 多时间因素下章节学习次数分析
由上述分析可知,章节学习次数与期中、期末考试成绩的相关性最大。为此,对章节学习次数在不同月份、一周内不同时间、一天内不同时段的分布情况,以及疫情前后的变化情况进行分析。
Table 2 The learning behavior indicators of students in different score ranges表2 不同分数段学生学习行为指标
3.1 章节学习次数逐月变化情况
该课程的第1 次上课时间为2 月19 号(因平台原因,这一天没有相关访问数据),但于2 月9 日发布了课程以帮助学生适应平台,因此数据记录从2 月9 日开始。2 月份整体访问次数最少;4 月份中旬由于学生返校,中间停课1 次,并且推迟了作业提交时间,因此4 月份访问量较3 月份明显下降;5 月份理论课减少,开始实验课,由于实验任务、实验分析与操作视频的发布,以及部分实验报告的提交均通过学习通平台进行,5 月份访问量再次上升;6 月份课程以实验为主,6 月23 日期末考试,因此6 月份日均访问量在所有月份中最高;3 月份是该学期唯一完全线上教学的月份,故日均访问次数仅次于6 月份。
Table 3 The variation of learning times with months表3 学习次数逐月变化情况
3.2 章节学习次数周内变化情况
表4 和图1(a)按照周一到周日的顺序对课程访问次数进行了统计,发现高访问次数主要出现在周二和周五。课程是周三和单周周五上课,而章节测试、分组任务等提交截止时间大多是周二22∶00 点,因此周二的访问次数较高,图1(b)中也验证了这一点,课程共46 次章节测试,有31%的学生是周二提交。课程实验为24 学时,于返校后5 月份开始,每个周五平均有3 节实验课,实验要求、操作视频、部分实验报告的提交均在平台上进行,因此周五的访问次数明显高于其他时间。虽然都是休息日,但是周日的访问量明显高于周六,原因是每周新的学习任务,包括视频资料、章节测试都是在周日12∶00 前后发布,部分学生在发布后就开始学习。以完全在线上学习的3 月份为例,这个现象非常明显,如图2 所示,周日12∶00 后学习次数较12∶00 前明显增加。周五学生基本都在实验室访问平台,老师可以直接给予指导。周二晚上老师应尽量在线以便给学生答疑辅导,帮助其更好地消化知识点并完成练习。
Table 4 The variation of learning times in a week表4 周内学习次数变化情况
Fig.1 The variation in a week图1 周内变化情况
3.3 章节学习次数不同时段变化情况
表5 列举了1 天内不同时间段课程的访问情况,其中8∶00-12∶00 时段的访问次数占30.8%,原因是上课都是在这个时段,部分实验课也在这个时段。由于学生课前、课中、课后都会用到学习通平台,因此除了睡觉的0∶00-4∶00、4∶00-8∶00 两个时段,其余时间访问量均在18.0%以上,分布相对均匀。
Table 5 The variation of learning times with time intervals表5 不同时段学习次数在情况
3.4 纯线上教学与混合式教学对比
为了更清晰地分析学生的学习规律,对3 月份纯线上教学与5 月份线上线下混合式教学的访问次数进行对比分析。
3 月份是整个学期唯一完全线上教学的月份,线上直播教学共6 次,课前、课中、课后的大部分教学环节依托泛雅—学习通平台进行。可以看到,3 月份访问量最高的两个时段是周三和周五的8∶00-12∶00,与上课时间匹配。此外,除了0∶00-4∶00、4∶00-8∶00 两个时间段,周二其他3 个时间段的访问量明显高于一周内的其他时段,说明大部分学生是在提交截止日完成作业。课程在每周日12∶00 后发布新一周学习任务,因此周日12∶00 后有一个访问小高峰。详见图2。
Fig.2 The variation of the learning times with time intervals during a week in March(on-line teaching)图2 3 月份1 周内各时段章节学习次数变化(线上)
5 月13 日起学生回到教室上课,其中周三理论课共3次,虽然还是使用泛雅—学习通平台,但如图3 所示,学生对学习通的依赖程度比3 月份纯线上教学降低,周三访问次数明显下降,与3 月份比较减少了约40%。由于5 月份的周五集中安排了6 次实验课程(4 次在8∶00-12∶00 时段,1次在12∶00-16∶00 时段,1 次在16∶00-20∶00 时段),实验任务、视频资料、部分报告提交都需要使用学习通,因此周五访问量出现了明显高峰。周二相对于其他天有较高的访问次数,但与3 月份相比,访问时间段更加集中在没有课的16∶00-24∶00 时间段,而白天访问数明显下降,详见图3。
Fig.3 The variation of the learning times with time intervals during a week in May(blended teaching)图3 5 月份1 周内各时段章节学习次数变化(混合式)
对比两个月的时段曲线可以发现:在3 月份纯线上学习时,12∶00-16∶00 时段的访问次数明显高于5 月份返校后,原因是返校后学生可以自由支配的时间变少,例如原来无法在线上实施的实验课程陆续开课。
4 结论
本文主要得出以下结论:①在所有指标中,章节学习次数与期中、期末卷面成绩的相关性最高;章节测试、随堂测验和作业得分与期中、期末考试成绩的相关性并没有以往纯线下教学时那么大,相比之下,完成任务的时间早晚与考试成绩的相关性更高;②在线上教学环境下,成绩优秀学生的所有指标表现都远优于其他学生,可见该种教学模式对学习主动的学生而言更有利,而对于不自觉的学生,如果教师干预不够,最终取得的成绩会低于纯线下教学;③不少学生选择在提交截止日完成作业,教师可在此之前安排线上集中答疑环节,帮助学生更好地掌握知识,并尽量将作业提交截止时间提前到下一次课前的24h,以便于掌握全班学生的完成情况,有针对性地在课上进行讲解;④可将新一周的学习任务发布时间提前到周六,便于学习主动的学生更好地利用周末时间预习。
SPOC 平台记录的数据非常有价值,提供了大量纯线下教学无法体现的学习行为特征,这些数据对于整个教学周期,甚至学生整个大学期间学习行为的分析、反馈与调整十分有利。今后将持续对常态化混合式教学过程中的课程数据进行分析,如平行班之间学习成绩差异与教师教学模式、教学设计、班级学习氛围等因素的相关性,根据学生日常学习行为数据对其成绩进行预测[22]和预警等。