大数据视角下在线教学行为研究
——以国开学习网教育数据为例
2021-03-08王莹莹
王莹莹 涂 韬 彭 丽
(湖北广播电视大学,湖北 武汉 430074)
一、引言
随着大数据时代的到来,学习行为数据的变迁也受到大数据的影响,教育大数据随之而生。与传统的教学不同,互联网技术的发展使得学生的学习活动越来越个性化,学习行为越来越丰富和富有层次性,教师得到的学生反馈也越来越具有针对性。在网络环境下的教学过程所产生的大量数据反映了更多的个性化学习特点,通过研究这些数据能够有效改善教学模式和教学效果,因此,教育大数据成为教育专家们的“新宠儿”。远程学习者在进行网络学习的时候,会发生一系列的动作:点击、浏览、保存、下载、查看、发帖等,教育者通过对这些动作的分析,包括质和量的分析,从而得出有价值的信息,可以提供更加个性化的教学服务。
二、国内外研究现状
远程教育中,利用大数据技术进行行为分析的实践研究主要包括三个方面:第一,通过数据统计的方法进行数据分析;第二,通过新建模型或者优化模型的方法进行数据挖掘;第三,通过社会网络交互分析探索学习者情绪特征从而构建学习者模型的研究。学者们采用数据统计的方法进行数据分析,再通过一门具体的课程进行实验验证。陈坚根据“电子商务”这门课的学习行为分析,提出了一个具体课程的资源建设方案[1]。宗阳等人利用数据统计的方法进行数据分析,挖掘出远程学习者在线学习行为与学业情绪之间的关系,并以“媒体辅助英语教学”课程作为实验对象,改进了讨论区建设[2-3]。魏顺平的在线学习行为特点及其影响因素分析研究,通过对学习者学习行为的统计分析,得到学生登录行为比较分散的特点[4]。新建模型进行数据分析方面,周俊等人构建了基于大数据的学习过程控制策略模型,制定了影响学习过程控制的影响因子分析框架,为了提高学习者的学习效果,在教学策略方面提出了学习风格、学习交互、学习进度和学习成就四类控制策略[5]。而王林丽利用数据统计的方法进行数据分析,从知识、行为、情绪三个方面构建模型,分别设计知识掌握程度预警机制、行为预警机制和情绪预警机制[6]。对数据模型的优化研究也在同时进行,杨可晗等人提出利用多属性决策理论组建最初远程教育课程决策矩阵,获取作业单元的组织形态和远程教育知识分科的组织形态,并组建远程教育有效资源的提取模型[7],但会产生决策矩阵的关联度不够高,只能是阶段性的决策。结合社会网络交互分析,探索学习者情绪特征的研究方面,郁晓华在2013年提出,社会网络交互中隐含了多元化的交流行为模式[8]。而在教学过程中,这种行为模式的分析是我们进行学习分析和教育大数据挖掘的热点[9]。目前已经有很多学者分析了学习者在学习过程中的情绪变化特征和学习成效的关系,其中较为全面的是刘智等人对具有社会网络关系中的学习者的情绪特征以及学习成效的分析,得出具有网络交互关系的学习者情绪倾向趋于一致的结果。[10]
总的来说, 目前学者们的研究,还需扩展数据规模和课程类型。因此,本文在以往的基础上扩大了数据规模,将学生数据扩展到几十万条,并且丰富了课程类型,以国开统设和省开选修两种类型的课程为例,分析二十多万条课程日志,得出师生行为特点以及影响因子,为教学目标和教学方法精准定位提供数据支撑,为教学设计改良提供支持,为开放教育改革提供可行性建议。
三、数据分析
数据来源:国家开放大学学习网后台报表系统。
数据对象:以国家开放大学平台后台数据库为依托,以反映师生教学行为的登录行为为数据基准,实际获取2019年到2020年春季学期湖北电大校本部教师教学登录行为、湖北十堰电大教师教学登录行为和学生学习登录行为以及国家开放大学的统设课“ERP原理与应用”和湖北自开课“数字与图像处理”的课程日志作为数据对象。
(一)以登录行为作为分析对象, 以月作为分类字段的在线学习行为分析
以2020年2月17日(开学日)为起始时间,按照月计算登录率,即全体学生月登录率,如公式(1):
f1=一月内学生登录的人数n1/学生总数n
(1)
1.2019年春季、2019年秋季、2020年春季三个学期起止时间,如图表1、表2、表3所示。
表1 2019年春季平台登录周期的各月及起止时间(140天)
表2 2019年秋季平台登录周期的各月及起止时间(147天)
表3 2020年春季平台登录周期的各月及起止时间(147天)
2.湖北十堰电大各学期全体学生月登录率情况,如图表4、表5、表6所示。
表4 2019年春季湖北十堰电大学生月登录率情况表
表5 2019年秋季湖北十堰电大学生月登录率情况表
表6 2020年春季湖北十堰电大学生月登录率情况表
3.湖北十堰电大各学期全体辅导教师月登录率情况,如图表7、表8、表9所示。
表7 2019年春季十堰电大教师月登录率情况表
表8 2019年秋季十堰电大教师月登录率情况表
表9 2020年春季十堰电大教师月登录率情况表
4.湖北省电大各学期全体责任教师月登录率情况,如表10、表11、表12所示。
表10 2019年春季省电大教师月登录率情况表
表11 2019年秋季省电大教师月登录率情况表
表12 2020年春季省电大教师月登录率情况表
5.由表4~12表通过数据整合得出三个学期学生、辅导教师、责任教师的月登录率变化折线图,分别如图1、图2、图3所示。
图1 2019年春季月登录率分布图
图2 2019年秋季月登录率分布图
图3 2020年春季月登录率分布图
从图1、图2、图3可以看出:
(1)省责任教师、十堰辅导教师、学生的登陆率变化规律基本上是一致的。远程教育的教学过程和传统的课堂教学过程有所不同,传统的教学过程需要教师和学生,并且相互合作,而在远程教育中,教师有责任教师和辅导教师两类,整个教学过程,责任教师是教学设计者,而辅导教师是教学督促者,两者需要相互配合完成整个教学。辅导老师的督促力度、对教学设计的理解度、课程考核方案的熟悉度以及平台的操作熟练度直接影响到学生的学习效果。而责任教师教学设计情况也会影响到辅导老师和学生的登录行为。
(2)2020年春季学期责任教师、辅导教师、学生的登录行为数据起伏不定。这年全国遭遇疫情,疫情让教育工作者面临新的挑战,包括硬件条件不够、网络不通畅、资料在异地等因素。
6.由表4~12分析出学生、辅导教师、责任教师三学期同比登录率变化情况,分别如图4、图5、图6所示。
图4 学生三学期同比登录率情况图
图5 辅导教师三学期同比登录率情况图
图6 责任教师三学期同比登录率情况图
从图4、图5、图6可以看出:
(1)2019年学生的每月登录率在稳步增长。自2018年开始使用国开学习网平台以来,全体教师和学生对平台的操作能力、业务能力有所提升,并且针对这两年多以来教学过程中总结出的问题,制定了更加严谨、更加贴合实际的教学管理规范,让责任老师、辅导老师、学生在平台上的行为数据更加可观。
(2)2020年的责任教师、辅导教师、学生的登录率起伏不定,但仍保持在一个比较高的位置,这同样与这年全国遭遇疫情有关。
7.个人登录率:选择十堰电大500名学生进行抽样,2019年春季、2019年秋季、2020年春季抽样结果分别见表13,表14,表15。
表13 2019年春季十堰电大500名学生每月个人登录率在月区间中的占比情况表
表14 2019年秋季十堰电大500名学生每月个人登录率在月区间中的占比情况表
表15 2020年春季十堰电大500名学生每月个人登录率在月区间中的占比情况表
8.通过三个学期的个人登录率情况表进行折线图分析,如图7所示。
图7 十堰电大500名学生登录率分布图
从图7可以看出:
(1)每年学生的登录率最高的时候都在每学期的第三个月。这与开放教育学情有关,由于每学期的第三月是形考时间,涉及学生的期末成绩,登录率自然就上去了;
(2)每年学生的登录率降低最快的是在每学期的第三月和第四月之间。这与开放教育学情有关,每学期的第三月过后,大部分学生的形考完成并且及格后,就不会再去上网学习了,因此会导致学生的登录率有所下降,但也有一些学生还没完成,会在形考截止时间第四月结束前上网学习,从而导致第三月后学生的登录率还在上升,但是上升速度比较慢。
(二)课程学生日志作为分析对象
采用“图悦”大数据分析工具进行日志分析,该工具支持将excel表中大量数据进行分词生成词云图片,包括词云、关键词云图、词频分析等,多功能且高效。以下用图悦分别对“ERP原理与应用”以及“数字与图像处理”两门课的日志数据进行词频分析,结果如图8和图9所示。
1.统设课程行为日志分析
“ERP原理与应用”是计算机信息管理专业的核心课程,属于国开统设课,湖北的选课人数为576人,全省包括70个老师,产生了239078条数据,通过大数据分析工具“图悦”得到词频图,如图8所示。
图8 “ERP原理与应用”课程日志词频图
2.自开课程行为日志分析
“数字与图像处理”是计算机信息管理专业的核心课程,属于省开选修课,湖北的选课人数为774人,全省包括62个老师,产生了139439条数据,通过大数据分析工具得到词频图,如图9所示。
图9 “数字与图像处理”课程日志词频图
从图8、图9可以看出:无论是国开统设课还是省自开课,课程模块、测验、实例、学习、评分、贴文是出现频率比较高的词语。电大教育是学历教育,进行学历教育的学生往往更加在乎的是最终的结果,因此涉及考试内容的模块会比较受关注。
四、结论
本文以国开学习网教学行为数据为依据,以国开课程和省开课程为例,分析了教学行为特点以及影响因素,得出以下三点研究结果:第一,从学生群体角度分析,学生大都集中在每学期的第三个月进行突击学习,不能熟练掌握课程知识,达不到培养学生应用学习内容解决实际问题能力的目的。第二,从师生群体角度分析,辅导教师和学生的登录行为在整个学期都趋于同步,而责任教师和学生登录行为只在学期初期趋于同步,反映出整个教学过程中缺少师生互动,影响学生学习积极性、学习动机以及学习获得感。第三,从资源建设角度分析,学生的关注点主要在形考作业、课程测验、评分、帖子等,反映出学生只求成绩与结果的心态,无法充分调动学生学习能动性,难以充分落实教学过程、构建优质教学资源。
综合以上结论提出以下建议:第一,学习跟踪、定期形考、分时评阅。基于国开学习网的教学设计,学习活动设置成定期跟踪, 形考作业设置成分时间段形考,评阅工作也进行相应的分时段,落实教学过程,提高学生知识理论水平和解决实际问题的能力。第二,将师生互动量化,完善师生评价体系。目前,湖北电大国开学习网行为数据在全国位居前列,但仍存在教师开放教育研究投入不够、学生学习投入时间偏低的问题。对于老师,师生互动体现在帖子的最高有效跟帖数(教师的帖子后学生的最高有效跟帖);对于学生,需要建立平时学习行为成绩评价体系,促进学生学习过程中的满足感和成就感。第三,合理设计国开学习网资源。责任教师需要对照课程标准,钻研信息化教学,研发开放教育新模式,让学生有趣学习、学有所得。另外,教师还需结合学生的学习习惯,合理设计课程界面,给学生更友好的交互体验。
本研究利用可视化的分析方法,以促进师生教学行为为手段,最终达到落实教学过程、提高教学效果的根本目的。通过扩大行为数据规模,进行数据挖掘获得更具有代表性的行为特点,有助于学生培养良好的学习行为、习惯和反思,有助于教师的教学目标和教学方法更具精准性和趣味性,也能为广大的远程教育工作者今后的研究提供新的视角。