两类在线学习者行为分析
——同一课程的成人与在校生行为对比
2021-03-13宋丽哲魏顺平顾丽凤魏芳芳
宋丽哲 魏顺平 顾丽凤 魏芳芳
(1.国家开放大学,北京 100039;2.中央民族大学,北京100081)
一、文献研究
在大数据技术迅速发展的今天,利用海量的学习数据对学习者的学习过程进行数据分析,建模和解读是在线教育研究的热点和难点问题。在线学习行为的研究是一门综合性较强、跨领域较广研究,涉及多个学科领域的知识,例如行为认知、心理学、教育学、统计学、数据挖掘、人工智能等,因此不同研究者从不同的角度出发,其研究方法和研究范畴也各不相同。
(一) 对在职学习者的网上学习行为研究
目前有关在职学生行为分析的研究主要从以下三个方面展开:(1)学习者的特征的维度,对学习者画像,侧重于分析成人学习者的人口学特征、学习态度(情绪)、学习动机(兴趣)和学习风格等。(2)学习行为维度。注重学习过程中学习者的学习行为和影响因素,主要集中在发现学习规律(如影响学习的因素研究、学习行为模式研究)、分析学习特征及习惯(如学习特征研究、学习习惯研究)。(3)学习效果评估与预测维度。侧重于在线学习的评估评价方法,以及根据评估结果进行行为预测的方法与实现。
肖君等建立了知识水平、行为特征和态度特征三个维度的学习者画像模型[1]。
张洪玲等将学习者静态信息和浏览网络平台课件资源的典型行为动态信息作为研究对象,分析得出网络学习者在线学习若干问题及影响因素,构建了便捷性、交互性、时代性、开放性的概念性学习支持服务体系框架,提出了合理性建议及对策[2]。
魏顺平采用数据挖掘方法对在线学习的网络日志做了细致深入的分析,从学习时间、学习活动、师生交互、学习资源、考试成绩等多个角度发现学习行为特点,影响因素分析更加注重内在因素,即学生自身因素的分析[3]。并针对特定的学习系统,提出按照学生访问系统各个模块的广度、深度和持续度来评价学习者的学习效果[6]。
王改花等采用数据挖掘技术中的决策树方法对网络学习者的学习行为与成绩进行了预测,构建了适应性学习系统学习干预模型,可以较好地预测网络学习行为与成绩,为适应性学习系统提供了实证依据[4]。
陈晋音等提出了基于BP神经网络的学习成绩预测方法来预测其相应的线下学习成绩; 提出了基于实际熵的在线学习行为规律性分析;基于Felder-Silverman性格分类法获得学习者的性格特征, 对学习者实现基于K-means的聚类分析获得相似学习者的类别,实现协同推荐[5]。
宗阳等从MOOCs在线学习过程出发构建了学习行为指标,并应用逻辑回归对MOOCs学习数据进行分析,就学习者在线学习行为对学习成绩的影响展开了探索。检验了逻辑回归对于在线学习效果研究的价值,发现了课程注册时滞、登录课程次数、提交作业测试次数、习题保存次数的均值和视频观看完成度等指标与成绩的相关性。研究发现在该课程中提交作业测试可以作为MOOCs学习成绩预测的关键指标[7]。
(二) 对在校大学生的网上学习行为研究
对大学生网上学习行为的研究主要关注学生的行为、影响因素、对学习目标和教学对策的影响三个方面,以及三方间互相影响的关系。主要的研究方法是问卷调查。
郝珺对大学在校学生的网络学习情况进行调查,分析学生对待网络学习的态度,最终得出了影响大学生网络学习目标达成的主要原因是主动性、持续性和自信心[8]。
沈晓平等提出大学生网络学习有用性、易用性、期望确认、自我效能、促成因素等感知潜变量对大学生网络学习行为的影响程度,在此基础上总结大学生网络学习行为的特征[9]。
周梦英等通过问卷调查,了解本地高校大学生在线学习行为特征,分析影响因素,以提出促进大学生在线学习自主性、有效性的策略和措施[10]。
谢舒潇等对在校大学生数字化学习的基本情况、学习环境、学习目的、学习态度、学习方式、学习资源、学习效果、学习障碍、行为特点和心理特征及教育价值认知等方面进行了调查和分析,提出了树立数字化学习理念、创设良好数字化学习环境、加大学习资源的建设力度、广泛开展混合学习的试验、提高学生学习效果、培养学生终身学习能力等建议[11]。
徐红彩从实际调研出发,分析了目前在校大学生网络学习过程中存在的实际问题,探讨了影响大学生网络学习行为的主要因素,并针对这些因素提出了相应的对策[12]。
曾贞通过分析在校大学生特征、需求及其基本行动方式,论述教师教学对策[13]。
这些研究采用文献研究、问卷调查、访谈、网络日志分析、内容分析等方法,对大学生与在职学习者(成人)的研究也有不同的侧重,但是并未见二者的对比分析。本文拟通过同一课程、同一平台、同一教学团队,使用同一数据集,通过分析在职生与在校生的不同行为表现来发现二者的不同,以期对教学过程改善提供建议。
二、研究设计
(一) 研究样本
以国家开放大学(以下简称国开)实验学院2019年秋季学期“计算机应用基础”课程,专科层次的学习者为研究对象。学习者来自23个学习中心,分布在全国各地。其中部分学习中心是国开实验学院与教育集团、培训学校、技师院校等合作成立的,这些院校的在校生也使用国开的统一学习平台进行自主学习。因此研究样本中的成人和在校生使用同样的平台学习。
数据来源于Moodle学习平台的日志,Moodle平台日志记录了教师、学生在平台上的所有活动,如师生与课程各教学模块之间交互的所有数据、师生登录数据等。本研究所选2019年秋季计算机应用基础课相关日志数据共包含316万条,日志中涉及在职生2170人,在校生680人,有276人无法确认身份。对数据进行清洗,删除无法确定身份的学生以及其他主要信息有缺失的记录,最终得到包含2850人和296万条记录的日志数据作为研究样本。
对研究样本中的学生基本信息进行分析发现,94.1%的学生是2019年入学学生;在职生男女比例基本持平,在校生男生占多数;在职生的年龄主要分布在20-40岁,而在校生大部分是20岁以下。
(二) 研究方法
从时间维度、空间维度、质量维度三个方面分析在校生与在职生的行为差异。
时间维度是按照学生上线学习的时间来分析,分析学生天上线、周上线以及一周周期内每一天上线的规律。从时间维度上能看到学生学习的持久性。
空间维度是指按照学生在平台上所涉及的模块来分析。Moodle学习平台将学生的各种类别的行为如浏览、看视频、做作业、做测试、论坛发帖等称之为模块,例如学生浏览各种资源、学习各种文字内容属于浏览模块,学生完成作业的行为属于作业模块,学生完成网上的测试题属于测试模块,学生在论坛上发帖回帖属于论坛模块。Moodle会记录学生所有在网上的动作,并能够区分这些动作是在哪个模块上发生的。我们将学生的动作数量称为行为频次,学生在某个模块的行为频次表示了学生在这个类别上投入的多少,频次越高,行为越多,我们认为学习的越多。从空间维度能够看到学生学习方式的广度。
质量维度综合考虑时间维度、空间维度与学习的深入程度。以某个模块的使用频次除以使用此模块的人数,以此得到此模块人均使用次数。人均使用模块的次数越多,表示在这个模块上活动越多,学习的越深入。通过计算人均模块使用率在整个学期随时间的变化,说明学生投入学习的深度和持久度。
(三) “计算机应用基础”课程信息
“计算机应用基础”是各专业学生必修的公共基础课,全国的学生使用同一个学习平台进行学习,且由同一个教师团队对学生进行学习指导。课程是一门有关计算机知识的入门课程,主要着重计算机的基础知识、基本概念和基本操作技能的学习和培养,课程为模块化结构设计,课内学时为72学时(4学分),其中必须完成的学时包括:视频课(CAI或IP)14学时,上机实验49学时,定期辅导9学时,对于在校生来说,上机实验一般安排在晚自习的时间。
课程考核采用100%形成性考核方式,考核完成时间为2019年12月31日,本研究的秋季学期截止日期也定于此天。其中作业“计算机应用基础课程形成性考核册”成绩占35%,实训成绩占50%,教学单位规定的考核内容占15%。课程综合成绩达到60分及以上(及格),可获得本课程相应学分。
三、结果分析
(一) 时间维度差异分析
分别统计两组学生每天和每周的上线人数占总人数的比值、截止到该天(周)的累计上线人数占总人数的比值,分别绘制两种比值的时间分布曲线,比较二者的差异。
1.上线人数占总人数的比值随时间变化趋势。以每周上线人数除以各自的总人数,得到当周上线人数占总人数的比值。
如图1所示,整个学期分为明显的三段:学期开始的前六周学习人数较少,中间三周学习人数呈指数增长,后五周人数维持在一定高度。
图1 每周上线人数占比变化图
第一段普遍学习人数少,后两周在职生人数稍微有所增加;第二段在职生的学习人数增长更快;第三段中,在职生学习人数自第47周开始持续五周保持在40%的水平,第52周是考试最后的截止时间,学习人数又有一个大飞跃达到最高点52%;在校生学习人数在第49周达到顶点57%,之后的三周学习人数逐渐下降但仍保持较高水平。
两类学生有共同的规律,一个学期的开始上线学习的人非常少,学期中后时段是上线学习的高峰时段。这是因为学期开始学生对课程有新鲜感,一些尝鲜学习者会来翻阅学习资料,因此学期开始有少量的访问。课程中后期,随着考试的临近,越来越多的学生才开始登录学习,学习的行为增多。到学期末考试期间,学习行为达到最高峰,尤其是在职生,尤其善于“临时抱佛脚”,在最后一周考核完成时间之前达到本学期最高的上线人数52.21%。相比起来,在校生稍微“从容”一些,在截止时间前一个月达到最高上线人数56.91%。
2.周累计上线人数占总人数的比值。 以从学期开始到当周上线的人数除以各自的总人数,得到周累积上线人数占总人数的比值。
如图2所示,学期开始阶段学生的累积登陆人数都不高,自第45周开始出现快速增长,学期中段在职生累积上线人数增长较快,在第47周至48周之间(11月27日)在校生累积上线人数占比首次超过在职生。在校生与职生分别在第50和51周超过80%的上线率,接近课程结束、形考截止时间的时候才能有大部分学生来上线学习,可见学生存在学习拖延现象,在校生尤其明显。
图2 周累积上线人数占比
3.周内七天。为对比一周七天中每天学习的人数多少,两组学生分别统计一周七天每天上线的学生数及占总人数的比值。计算本学期在所有周一上线的学生数,求和并除以总人数,得到周一上线人数占比,同样算法计算周内其他天的占比数据。得到两组学生一周七天每天的上线人数及占总人数的比值,比较差异。
如图3所示,两类学生一周七天内的学习量并没有特别大的差异,总体来说在工作日上线比例高于周末,在职生的高峰出现在周一,在校生的高峰出现在周二,二者周末学习的人都偏少。这与我们预想的在职生主要通过周末的时间学习不符,这一方面说明当前的学习比较便捷,随时可以进行学习,另一方面说明,当代人的生活压力比较大,周末可以安心坐在电视机前面进行学习的场面一去不复返了。
图3 一周每天上线的学生占比
4.每天各个时段。两组学生分别统计一天中每个小时上线人数及占总人数的比值,绘制折线图,比较差异。
如图4所示,在职生10点至17点之间学习的人数高于在校生,其他时间在校生学习的人数高于在职生。有90.23%的在职生在工作时间(早上8点到下午5点)学习,由于有家庭生活等各方面的压力,在休息时间学习的量相对较少。在校生大部分来自于培训学校、技师院校,白天的时间他们有自己的其他课程安排,而且受经济条件的影响,学生并非人人能有笔记本用来上课,学校的机房也不会随时开放给学生进行学习,大部分学生白天上课仅可通过手机进行学习,学生上课是在晚上,教师在机房统一组织学习,因此在校生晚上学习的人数偏多。
图4 4小时学习人数占比
另一方面,除去睡觉的时间,一天之中,各个时间都有学习出现,且学习人数占比都维持在30%-60%之间,从另一方面体现了在线学习的便捷性,学生随时可以进行学习。
(二) 空间维度差异分析
根据日志数据查询本学期学生学习所涉及的模块类型,包含作业模块、论坛模块、测验模块、辅助模块、资源模块等。对这几个模块使用进行统计,挑选使用较多的资源、作业、论坛、测验模块四个模块的使用频次,再加上行为实际的产出成果数,包括论坛发主帖数、论坛总字数、提交作业数、完成测验数这四个维度一起组成空间维度的指标。
1.模块使用频次。对两组学生分别计算每个模块上有行为的学生人数占总人数的比值,以此来观察学生在空间维度的表现,绘制雷达图。
如图5所示,两类学生使用测验和作业模块相对较多,在职生尤其明显,有93.04%的在职生完成作业,95.21%的在职生完成测验,而只有49.26%的人在论坛上有行为,71.38%的人浏览资源;而在校生在这几个方面表现相对均衡,分别有79.71%、80.44%、62.5%和86.03%的人使用了资源、作业、论坛和测验模块。
图5 使用各模块的学生人数占比雷达图
由于本课程是形考课程,最终课程的评价以完成测验的成绩为依据,可见在职生完成课程检验的目的性更强一些。
2.成果数目。对两组学生分别计算论坛发主帖数、论坛总字数、提交作业数、完成测验个数四个维度上有行为的学生人数和行为次数,用行为次数除以人数,得到人均行为数,以此来观察学生在不同的教学过程的参与的程度。
如表1所示,在校生在人均论坛发主帖数高于在职生,人均论坛总字数是在职生的五倍,可见在校生对论坛的使用是远远多于在职生的,这与雷达图中的结论一致。在校生人均提交作业数和人均完成测验数高于在职生,而在雷达图中,在职生使用作业和测验模块的人数占比高于在校生,可见虽然有更高比例的在职生使用测验和作业模块学习,但是他们实际人均完成的测验和作业的数目并没有在校生高,可见在校生在完成测验和作业的时候效率更高,学习更深入。
表1 人均成果数目
(三) 质量维度差异分析
从资源、作业、论坛和测验模块的利用频次,以及论坛发帖数,提交作业数,完成测验个数等七个方面,以模块利用的频次(完成成果数)除以使用人数得到人均频次(成果)数,以周为单位,计算两类学生在整个学期的人均频次(成果)数的变化情况,并加以对比,说明学习的深入程度以及持久度。
1.资源浏览。资源模块利用频次代表学生学习浏览平台文本资源的情况。由图6可以看到,在校生在学期初有一个浏览高峰,而在职生的浏览高峰出现在学期中间偏后;在校生的浏览高峰时期深度明显高于在职生;整体来看在校生对资源浏览深入学习情况好于在职生。
图6 人均浏览资源数量变化
2.作业情况。作业模块利用频次代表学生在平台完成作业的频率。如图7所示,学期大部分时间中,在职生人均访问作业模块的频次都高于在校生,可见在职生做作业的行为更多;在校生与在职生都是在学期末对作业模块的使用达到峰值,在校生的峰值出现的更早一些,在职生的峰值在最后一周才出现,这也再次说明在职生“临时抱佛脚”的问题更加突出。
图7 人均使用作业模块频次变化
提交作业数说明学生一周内完成作业的个数,如图8所示,大部分时间在职生的作业完成个数高于在校生,再次说明了在职生更看重作业的提交。
图8 人均提交作业数变化
系统里同一作业可以多次提交,在第50周,在校生使用作业模块的频次比在职生高54%,但是提交作业数仅比在职生高22%,可见在校生在作业模块上效率更高。
3. 测验情况。测验模块使用频次说明了学生在测验上投入的多少。如图9所示,学生的人均测验模块利用频次与完成测验个数变化的曲线基本一致,可见二者在测验模块上的效率是一样的;在职生的在测验上的投入平稳上升,并且保持在一定的数量,而在校生有明显的起伏变化,而且有明显的大幅上升的投入。在职生的表现来自学习的内驱力,他们对于测验非常重视。
图9 人均测验模块利用频次和完成测验个数变化
4. 论坛情况。论坛模块利用频次说明了学生在论坛上进行活动的深入程度。如图10所示,总体来说,学生在论坛的活动很少,每周人均使用论坛大部分在1至2次之间。在职生在论坛的活动是平稳下降的,即便在期末也仍在较低水平。在校生论坛使用稍多,而且出现的波动比较大。可见在职生并不热衷论坛的活动,本门课的成绩计算并未包括对论坛使用情况的考核,因此对于学习目标明确的在职生来说,在论坛上投入较少是可以预见的。
图10 人均使用论坛模块频次和人均论坛发帖数变化
(四) 形考成绩差异分析
教务系统中查询得知共有2747人有形考成绩,其中在职生有2158人、在校生589人,使用spss25分析其成绩差异。
1. 方差分析。在职生的平均分为70.37,低于在校生的平均分73.56,在校生的标准偏差小于在职生。
T-检验分析结果表明两类学生的成绩差异显著(F=4.737,p=0.030)。
表2 学生成绩描述性统计
2. 频数分析。为了了解成绩的分布特征,对两组学生分别进行频数分析,如表3所示。进行频数分析之前,先对原有数据进行分组重编码,将形考成绩分为五档,分别是“不及格”(60分以下)、“及格”(60-70分)、“良好”(70-80分)、“较优”(80-90分)与“优秀”(90-100分)[15],再针对分组变量进行频数分析,绘制双层饼图如图11所示。
图11 成绩分布图
从频数分析的图表可以看出,两类学生在“不及格”这档的人数都比较多,都高于20%,尤其是在职生,不及格的人数高达26.5%;在“及格”这档的人数都很少;在职生及格以上的人数在各个区段分布相对均匀,在校生在“较优”区段人数最多,占总人数的36%。
四、结论与建议
(一) 结论
1.学习拖延在在线学习中普遍存在。学习拖延是指学习者有意而无必要的推迟启动或推迟完成学习任务的行为。近年来对学习拖延的研究主要针对大学生学习。已有研究发现,学习拖延在大学生中普遍存在,不同专业、区域和不同类别高校的大学生之间无显著差异,而且,在自主学习任务的拖延程度最高,达到48.1%[18]。
本文在时间维度的研究发现在职生与在校生都是在学期初学习行为较少,前六周基本没有学习行为发生,学期后半时段学习行为才开始增多,一直到考试前一两周才能有80%的学生登录学习。这就说明在线学习者与大学生一样,存在学习拖延现象。而且,由于在线学习的特点,对于学习者的学习能力和自我约束能力要求较高,因此拖延现象更为普遍,尤其是在校生年龄较小,学习动机不足,时间管理技能缺乏,受消极情绪影响,完美主义倾向和懒惰个性等方面的影响,在校生的在线学习拖延情况更为严重。
2.成人学习者学习目的明确,内在动力相对较强。在职的成人学习的主要目的是为了适应社会和生活变化,或提高自身职业竞争力,或获取文凭,如此明确的目标能够形成强劲的学习动力,但是在工作与生活的压力下,他们能够抽出时间来学习实属不易,很多人不得不在工作时间抽空学习。
成人学习者由于他们学习目标明确,功利性强,而本门课程考核采用100%形成性考核方式,因此大部分成人在职学习者是以完成本课程的考试要求、拿到相应的学分为目的。在学习的过程中,他们会直奔主题,以完成作业和测验为目标。因此在整个学习过程中,在职生作业和测验的行为基本平稳,持续维持在一个中等水平,而在浏览与论坛上相对不足。另一方面,由于在职学习者内在学习动力较强,自我导向学习,因此他们参与各种活动的时间更长一些,他们会按照自己的步调参与各种教学活动。
本文的这些发现与以往的文献研究相吻合。如樊平发现成人学习者在学习中呈现出目标明确、动力内发、方式自主等群体性特征[16]、纪河等提出了成人学习者在学习过程中表现出功利学习、自我导向学习、经验学习等特征[17]、陈程认为成人学习者具有学习目的明确、学习心理成熟、理解力强、自我意识强烈、社会经验丰富的心理特征[18]等。
3.各个模块均衡的深入学习与使用是提高成绩的关键。在校生年龄小,可控性高,学校会定期安排上机学习,学习时间上有保障,他们喜欢浏览资源和参与论坛活动,论坛活跃度远高于在职生。对作业和测验,在职生有更高比例的人来使用了这两项模块,但是在校生的人均提交作业数和人均完成测验数更多,可见在校生在作业和测试上学习的更深入。各种学习方式的使用再加上深入的学习,这就是在校生的成绩高于在职生的关键。
(二) 建议
第一,对于学习拖延的问题,教师和学习平台应该采取干预措施,比如使用任务要求、策略性教学和心理疏导相结合的方式,增加课程设计的趣味性,布置有趣的学习任务;针对作业模块使用清晰的要求指示,使得学生知道其完成规范;把大的作业分解为多个相互依赖的小作业;课程开始引导学生制定自己的学习计划;给学生普及时间管理策略和自我监控策略,增强其自主学习能力;设定激励与预警机制,对可能出现问题的学生及时提醒。
第二,优化课程的设计,首先课程的内容要对学生有用,理论联系实际,以帮助学生解决实践问题作为教学工作的出发点;其次针对学生使用较少的模块进行研究,分析原因,通过改进模块的设计吸引学习者访问;再次增加同学之间的互动,使得学习的经验不仅来自学生自身,还能从同伴那里获得。
第三,针对不同的学生要进行个性化的学习方法与意识的指导,对在校生要增强他们的内在学习动力,明确学习目的,通过内在驱动提高学习的积极性。对在职生提供更多的督促与提醒,增加教师的监督力度,明确不同模块的学习任务,鼓励他们参与多种教学活动,可以考虑将资源浏览、论坛活动等的行为纳入最终成绩考察范畴。
五、结语
本研究从时间、空间和质量三个维度对两类学习者行为进行了对比,也对学习的最终成绩进行了对比分析,接下来的研究计划将对比的三个维度进行量化,来计算两类学生的学习投入,研究学习投入与学习效果的关系,以此来发现提高学习效果的方法,优化教学。
本研究存在一定的局限性。研究选择“计算机应用基础”这门专业基础课进行分析,是因为这门课学习的人数比较多,数据量大,数据分析更有代表性,然而对于不同学科,不同考查方式的课程来说,学生的行为是否有其他差异仍需进一步验证。从另一方面来说,对于在职生来说,一部分从事与电脑相关工作的人来说,课程的内容在日常工作中会有用到,这个因素是否会影响本研究的结论,在后续的研究中需要进一步探讨。下一步将在选择更多课程来进行对比分析的基础上验证优化本结论。