基于随机森林的在线学习行为评价研究
2024-01-03余楷鑫
余楷鑫
一、研究背景及目的
随着互联网技术的普及与发展,在过去的几年当中,在线教育迅速发展,俨然成为全球教育领域的一个重要趋势。宽带互联网、智能手机、平板电脑和高速数据传输等技术的进步,使得学习和教育资源更易于在线获取。在线教育为学生学习提供了更大的学习灵活性,学生可以根据自己的节奏和时间表安排学习。同时,在线教育也无须受到地理位置的限制,实现了在家也能随时随地的学习,大量的优质课源极大地丰富了学生的学习选择。在线教育提供的各种各样的学习资源,包括视频课程、在线教材、互动课程、讨论论坛和在线测验等,使得学生可以根据自己的学习风格和需求选择适合的资源。在在线教育领域不断发展和创新之下,新的教育科技工具和学习平台不断涌现,改变着教育的方式和体验。越来越多的高等教育机构和企业开始提供在线学位课程和职业培训。
尽管在线教育有很多优点,但它也面临不少挑战。如何准确评估在线学习平台中学生的学习效果,为个性化的教育提供支持,这是在线教育的一个难点。不同于传统教学的单一性,在线教育可以提供大量学生学习过程中的学习行为数据,包括观看视频、参与讨论、完成作业、测试等,这些数据可以多维度评价学生的学习表现。然而传统的评价方式过于简单,仅仅通过简单的数值加权方式得到的评价不能有效反馈学生学习的效果。这将不利于学生的个性化发展,另一方面也很难正确跟踪学生具体的学习情况。差异化的学习行为评分带有大量的主观性,我们无法快速地对一个学生的学习效果进行评价,且评价过程中存在计算难度大等问题。对此,我们迫切希望能够利用这些数据准确预测学生的学习效果。基于此问题,本文旨在开发一种基于随机森林的在线学习行为评价方法,通过对学生学习行为数据的分析,正确地识别出学习行为与学习成绩之间的关联,进而建立一个可靠的评价模型,以提高对学生学习效果的预测准确性。
二、随机森林算法介绍
随机森林(Random Forest)作为一种强大的集成学习(Ensemble Learning)方法,广泛应用于分类和回归问题。其核心思想在于将多个独立构建的决策树集成,以提升模型性能和稳定性。在随机森林中,每棵决策树都是独立构建的,它们采用不同的训练数据子集和特征子集,以确保模型具有多样性。这种多样性是通过引入两种主要的随机性因素来实现的:自助采样与特征随机性。自助采样方法针对原始训练数据集,对每棵决策树都随机抽取一个与原数据集大小相同的子集,允许同一样本在不同树中出现多次。而特征随机性方法则在每次分裂决策树节点时,随机选择一个特征子集用于分裂。这样确保了不同树的特征选择方式不同,增加了模型的多样性。在分类问题中,每棵决策树对于一个新的输入样本都会投票选择类别。最终,随机森林会将所有决策树的投票结果进行统计,选择得票最多的类别作为最终的分类结果。在回归问题中,各树的预测值通常以平均的方式得到最终的回归值。
随机森林因其性能卓越可适用于各种数据类型,包括高维数据和带有噪声的数据。此外,由于多棵树的平均效果有助于减少过拟合的风险,因此随机森林对于应对过拟合问题具有较强的抵抗力。此外,随机森林还能够估计每个特征的重要性,这将有助于帮助我们深入了解哪些特征对模型性能具有较大的影响。总而言之,随机森林是一种功能强大的机器学习算法,通过构建多个决策树并引入随机性,能够显著提升模型性能、鲁棒性和泛化能力,适用于多种不同类型的问题。
在我们本次实验当中,随机森林充当了一个重要的角色。在一定程度上,随机森林相当于多个教师对学生评价的综合。一个决策树相当于一位教师对学生的评价,随机森林通过构建多个决策树的方式,间接模拟出相当于多位教师的评价,采取综合评价的方式,可以更准确地量化学生的学习效果。
三、随机森林模型构建
1.数据收集
在本次实验当中,我们以课程计算机网络基础为例,收集了近三年27个班,总共1034名学生的在线学习行为数据,包括观看视频的时长、参与讨论的频率、作业完成情况等。这些数据是通过在线学习平台自动记录的,包括学生的个人信息和学习活动。每一阶段都邀请了四位教师交叉互评的方式评价,最后取其平均数作为最终的成绩,以此避免评分的过程中存在大量的主观性问题。另一方面,为了对成绩的量化更为方便,我们将成绩分为5个区间,将5个区间的数值转化为[A,F]进行表示,数据集包括以下特征:(1)观看视频时长(以分钟为单位);(2)参与讨论次数;(3)作业完成情况;(4)学生回看次数;(5)资料查阅时长;(6)掌握程度测验问卷;(7)最终课程成绩(A、B、C、D、F)。
2.数据预处理
数据预处理作为数据分析和机器学习中至关重要的一步,我们需要将数据转化为更具表征的形式,使其适合模型的训练与分析任务。由于各个指标之间的数据形式不同,在很大程度上还需将数据映射到新的表示形式或尺度,以改善模型性能。在處理学生在线学习行为数据时,我们进行了精细的数据预处理,以确保数据的质量和适用性。首先,为了确保整个数据集当中的各项指标完整,我们对指标的各个缺省值进行补充。其次,在数据当中,我们也检查了一些数据的可靠性,剔除掉一些异常值。在各个指标的评价中,对于标准化的评价,例如像观看视频时长、讨论次数这一类定性指标,我们使用了这些值,并对这类值进行标准化处理。对于作业完成程度、掌握程度测验问卷这类主观评价,我们采取综合四位教师的评价结果进行定量测定。最后,针对最终课程成绩,也是同样综合四位教师的评价计算平均成绩,并将其转化为五个区间。通过这些具体的数据预处理步骤,可以确保每个数据变量的数据质量,为后续的数据分析和机器学习任务提供坚实的基础,以便深入地探讨学生的在线学习行为与最终课程成绩之间的关系。
3.模型训练与评价
经过上一步骤的预处理,包括数据清洗和特征提取等步骤。我们构建了本次实验的数据集。在本实验当中,我们将采集到的数据分为训练集和测试集两类,其中将80%的数据作为训练集,将20%的数据作为测试集使用。随后将训练的数据输入到随机森林模型当中,并使用交叉验证方法对模型进行评价,基于sklearn包构建代码进行训练,其伪代码如表1所示。
我们比较了基于随机森林的评价模型和传统线性回归模型在预测学生学习成绩方面的结果。从表2可以看出,基于随机森林的评价模型在预测准确性方面表现更好,其R2值高于传统线性回归模型。
实验结果表明,该模型相比传统的线性回归模型,其在预测学生学习成绩方面表现出色,预测的准确性更高。
4.学习行为与学习成绩的关联分析
在我们的研究中,通过对随机森林的指标重要性进行深入分析,探究了学生在线学习行为与最终课程成绩之间的关联:学生观看课程视频的时长与他们的最终课程成绩之间呈现明显的正相关关系。换句话说,那些投入更多时间来观看课程视频的学生通常能够获得更高的成绩。这一现象可能反映了他们对视频内容的深刻理解和学习投入。
进一步地,我们发现学生参与讨论的频率与他们的最终成绩之间同样存在正相关关系。积极参与讨论的学生通常表现出更出色的学术成绩,这也意味着积极参与互动有助于促进学习过程。此外,在学生的作业完成情况方面,我们发现作业的完成度与最终课程成绩之间存在显著关联。按时提交作业的学生通常获得更高的成绩,而与作业缺失相关联的学术表现则呈负相关。这一发现再次强调了任务的及时完成对于学术表现的重要性。
此外,我们的分析还揭示了学生回看学习材料的次数与最终成绩之间的正相关关系。这表明通过反复回顾课程内容有助于加深理解和记忆,从而提高学术成功的机会。学生资料查阅的时间与最终成绩之间也呈现正相关关系,这暗示着花更多时间查阅额外资料的学生通常表现出更高的学业成绩,这也反映了他们的积极主动学习行为。
最后,我们对掌握程度测验问卷进行了深入分析,发现学生对于自己掌握程度的主观评价与最终成绩之间存在关联。这提示了学生的学习自信程度可能对他们的学术表现产生影响。
总体而言,我们的指标分析结果强调了学生的学习行为与最终课程成绩之振兴背景下国家大力推行电商扶贫,这对如何培养具有爱农情怀、能适应时代发展需要的乡村振兴电商人才提出了挑战。因此,将助农使命融入思政,将课程思政融入专业课程,能让技能培养与思政教育同步,更好地发挥专业课堂育人功能,提高学生综合素质,培养乡村振兴需要的电商人才。
(三) 课程思政的思路
根据高职学生的学习特性和电子商务专业的培养目标,视觉营销的课程思政目标从教学内容、教学方法、教学评价三个维度与乡村振兴的时代使命相结合,将知识传授、价值引领和思想政治教育有机融合,做到课程教学全过程育人,实现立德树人润物无声。
第一, 在教学内容上,将乡村振兴、传统文化传承、审美能力提升、版权意识培养、职业道德提升、价值观树立等几个方面的教育融入课程教学内容。教学上设计典型项目,选择一些具有地方特色的农产品进行视觉营销设计实操,让课堂学习与乡村实践同步进行,通过实地或者虚拟现实技术让学生了解农作场景,感受助农的意义,从而使学生在学习过程中厚植爱农情怀,练就兴农本领,实现助力乡村振兴的使命。
第二, 在教学方法上,将自主学习能力、团队合作能力、精益求精工匠精神等方面的培养融入课程。把传统教师为主的讲授课堂转变为学生为主的实操型自主探究课堂;把传统的线下教学为主的课堂教学模式转变为线上线下相结合的课堂课外教学模式,增加学生的课堂互动讨论环节,提高学生的课堂参与度和学习热情;引导学生在学习过程中养成不断思考、精益求精的学习习惯,培养学生的工匠精神。
第三, 在教学评价上,将创新能力、沟通协助、团队合作、吃苦耐劳等方面素质的评价融入课程的评价体系。在传统的以知识、技能评价为主的评价体系中适当地融入课程思政评价内容,并提高课程思政的评价比例,关注学生在学习过程中的创新能力、沟通能力、团队精神、吃苦耐劳等职业素养和思想品质等方面的表现,从而实现“知识传授+能力培养+价值塑造”三位一体的教学目标。
二、视觉营销课程思政的设计与实践
(一)教学内容
视觉营销课程的教学内容主要有认识视觉营销、图片视觉营销、视频视觉营销、商品网店视觉营销综合实训、商品新媒体视觉营销综合实训五个教学模块。在乡村振兴背景下,根据电商专业特点、课程的特性、学生的学情、企业的能力要求,在传授学生知识、提升技能的同时,帮助学生树立正确的社会主义核心价值观,了解乡村振兴的使命,培养乡村振兴的能力,提升审美的能力,增强职业素养和创新的能力,落实立德树人的教育目标。学习模块的思政融入如表1所示。
(二)教学方法
在教学方法上结合任务驱动法、团队合作法、案例探讨法等教学方法,提升学生的自主学习能力、集体观念、协作意识,以及发现、分析、解决问题的能力;借助信息化手段如雨课堂、微信、QQ平台等在课程思政教学上的應用,实现线上线下的课程思政教学;利用图像影音、VR和AR虚拟等数字化手段丰富教学资源和形式。
以模块五新媒体视觉营销综合实训中的“推文视觉营销设计”为例。通过对岭南臻品——新会陈皮进行新媒体视觉营销综合实训,教育学生传承岭南文化,增强文化认同和自信。思政元素的融入要求学生把岭南陈皮的饮食文化与我国传统二十四节气相结合,设计养生系列微信公众号推文。
课前,借助雨课堂发布推文视觉营销设计任务,让学生以团队的形式完成推文作品设计。学生自学推文知识和二十四节气传统文化,自主组建团队完成作品,遇到问题通过雨课堂留言或者微信学习群与同学、教师互动探讨,培养学生的自学能力和团队合作能力,学生通过课前线上学习,提高学习效率。
课中,在线下课堂采用翻转课堂模式,以学生为主体,首先以小组为单位对课前作品进行分享展示,教师引导组间作品互评,接着采用线上或线下的方式让企业导师修改指导作品。教师针对学生的共同问题和难点内容进行补充讲解和演示操作,把教学难点制作成微视频放在雨课堂提供给学生反复观看学习。接着,学生修改和完善作品。通过丰富的教学手段,提升学生的学习兴趣和合作能力,通过企业导师的指导,让学生的作品与企业要求和市场需求同步,培养精益求精的匠心意识。
课后,针对推文设计任务,要求学生利用推文知识以陈皮制作为主题设计公众号推文视觉营销,培养学生发散思维和学以致用的能力。通过陈皮制作流程的知识普及,让学生能对岭南臻品陈皮有进一步了解,通过陈皮推文的设计推送也吸引更多人加深对陈皮的了解,为乡村振兴助力。
(三)教学评价
在教学评价上,对学生的学习态度、耐心、团队合作能力、沟通能力、思想品质、职业道德、职业素养、政治面貌等方面的素质进行评价。
本门课程的评价由过程性评价(60%)、终结性评价(40%)和增值性评价(加分项)三部分组成。过程性评价主要评价学生课前(10%)、课中(40%)、课后(10%)三个阶段的表现,整个考核评价过程由小组自评、小组互评、教师点评、企业参评等多方进行多维的评价,重视考查学生的学习态度、耐心、团队精神、创新精神、工匠精神、文化传承、爱国爱党爱农等。终结性评价考核学生最终项目任务的完成效果,由教师和企业一起进行综合评价,考核标准参考行业标准、企业标准。增值性评价采用对比性评价,主要考查评价学生在不同学习项目任务的前后成绩和素质方面的变化,鼓励学生在学习过程中积极参与相关比赛、社会服务,实现自我价值。获奖情况和社会服务实践表现等纳入课程的考核加分和德育考核。
三、视觉营销课程思政實践成效
视觉营销课程思政教学设计和实践取得了一定的成效,主要体现在四个方面。
第一,思政元素细化融入不同的项目任务,提高了学生的思政接受度,使思政元素与课程教学更融合,提高了学生的学习热情。
第二,在乡村振兴背景下与岭南臻品企业进行的陈皮视觉营销合作项目,提高了新会陈皮的知名度,助销了新会陈皮,传承了岭南文化,练就了学生兴农本领和爱农情怀,增强了学生的社会服务意识和社会实践热情。在暑假,学生踊跃参与广东大中专学生志愿者暑期文化科技卫生“三下乡”社会实践活动,取得积极成效。
第三,提升了学生的比赛热情和团队合作能力,学生团队积极参与中国国际“互联网+”比赛。
第四,课程思政的开展对本课程的专业教师提出了新的教学能力要求,激发了教师的课程思政研究能力,促进教师团队教科研能力的提升。
四、 结语
课程思政是实现“知识传授+能力培养+价值塑造”三位一体教学目标的重要路径,是专业人才素养提升的有效方法。在乡村振兴背景下,电商专业的课程思政可以从教学内容、教学方法以及教学评价三方面来探索乡村振兴思政元素的有机融入,让学生在学习电商专业知识技能的同时,把课堂学习与乡村实践结合起来,培养“一懂两爱”的电商人才,让其具有服务三农的能力,引导其在乡村振兴的舞台上建功立业。
[基金项目:2021年广东省继续教育质量提升工程项目(编号JXJYGC2021AY 0017),广东省教育厅重点科研平台和科研项目(编号2018WTSCX242),广东开放大学(广东理工职业学院)校内科研课题(编号1818)。]
责任编辑 陈春阳