APP下载

基于机器学习的大学生网络学习分析

2023-06-25刘冬邻

现代信息科技 2023年7期
关键词:网络教学平台

摘  要:针对依靠大学网络教学平台的相关学习大数据,为教育管理者提供决策依据,为师生提供教学效果评估的需求,研究利用网络教学平台中的课程数据、学习过程数据、科目成绩等数据,采用不同的数据处理和数据分析方法,对大学生网络学习进行学习效果相关性分析、用户聚类分析和学习效果预测。通过研究得到了大学生网络学习效果的主要影响因素,不同类型学生的网络学习行为特点,以及对大学生网络学习效果进行预测的模型。

关键词:网络教学平台;网络学习分析;学习效果评估;高校决策

中图分类号:TP311    文献标识码:A    文章编号:2096-4706(2023)07-0186-04

Abstract: Aiming at related learning big data which relies on university network teaching platform, the need of providing decision basis for education managers and evaluation of teaching effects for teachers and students, this paper studies to use the course data, learning process data, subject grades and other data in the online teaching platform, uses different data processing and data analysis methods, so as to analyze the correlation of learning effect, user clustering and predict the learning effect for college students' online learning. Through this research, the main influencing factors of college students' online learning effect, the characteristics of different types of students' online learning behavior, and the model for predicting college students' online learning effect are obtained.

Keywords: online teaching platform; online learning analysis; evaluation of learning effect; university and college decision-making

0  引  言

近年,高校教育信息化建设进入了发展的快车道,各种网络教学平台纷纷在大学落地,学校通过购买和鼓励教师自建等方式,在平台上建设了大量的专业学科课程,有选修、必修以及用于学生自主学习的各种学习课程和资源[1]。网络教学平台给大学生提供了一种不受时间、空间限制的学习模式。传统教学形式的教学内容、教学过程等都由教师决定,教师可以通过统一的考试,对教学效果进行事后评估。网络学习的学习形式,使学生成为学习的主体,教师很难及时、全面掌握学生的学习动态;更不能通过预测学生的学习效果进而改进课程内容设计、教学规划、指导學生学习;学生也无法通过学习效果预测改进自己的学习安排和学习投入,从而改善学习效果预期[2]。

基于这些问题,本文以某高校MOOC网络教学平台中的“大学计算机基础”课程为例,利用平台中该门课程的数据、学生学习该课程的详细过程数据、平台使用日志数据、教务系统中的考试成绩数据、机考系统中的具体考试数据等,研究使用基于机器学习和统计分析方法及数据可视化技术,对大学生网络学习进行分析:分析各种学习行为与学习效果的相关性;对同一门课程的学习用户,基于学习行为和学习效果进行聚类,分析每一类学生的学习特征;通过机器学习的CART决策树算法,建立用户分类决策树模型并使用该模型对学生学习效果进行预测评估[3]。

1  分析问题与分析目标

1.1  基于网络教学平台的网络学习

20世纪末,随着Internet技术的发展和应用,网络学习E-learning也迅速发展起来,此时的网络学习指利用互联网络、学习内容网站、信息搜索引擎、远程学习交流等技术的一种学习方式[4]。随后,大规模开放在线课程慕课(Massive Open Online Course, MOOC)兴起并迅速发展起来,国内大学也纷纷加入MOOC项目的建设。各网络教学系统供应商也推出了各种MOOC网络教学平台如:中国大学MOOC,网易公开课——名校网课在线学习,超星学习通等网络教学平台。这些大学网络教学平台相较于传统的授课和学习模式有如下几个新特点[5]:

1)无时空限制:任何学生都可以在学校的网络教学平台上,选择自己感兴趣的课程学习;只要能上网,学习的时间和空间也不受任何限制。

2)自主学习:学生根据自己的兴趣和实际情况,可以自由选择学习内容、学习重点、学习资源,自由参与讨论和问答,自主决定学习开始、结束时间,学习进度和复习巩固的安排等。

3)灵活交互:学生和老师之间可以实时同步交互,也可以离线后以问答留言形式进行交互。

4)教学形式多样:教师可以利用教学平台,采用近似与传统授课的模式直接进行网络直播教学,也可以将授课录制好,再结合其他课程资源做成网络课程供学生使用。

1.2  存在的问题

和传统课堂授课相比,网络学习的学习过程都是基于网络在网络教学平台上完成的,是以学生为中心进行的,对学生的自主性和自觉性依赖更多,给网络学习的管理和网络学习效果的保证带来了如下挑战[6]:

1)学习效果无法保障:传统教学过程中,教师通过在固定时间、地点进行集体教学,可以对学生的学习过程进行直接的观察和监督;在网络学习过程中,完全依赖学生的自觉性,老师无法掌握和监督学生在学习过程中的学习行为,学生的学习效果无法得到保障。

2)学习评价困难:传统的教学中,教师通过学生平时的考勤、学习表现、作业完成、期末考试等综合考核,可以得到比较客观的评价结果;网络学习虽然也有这些评价项和评价手段,但却无法对学生的学习过程进行客观、准确的评价、分析。

3)无法指导教学改革:由于无法对学生的学习效果和学习过程进行客观评价,因此不能指导教学管理和教学改革,无法反馈给师生指导他们教与学的改进。

1.3  网络学习分析目标

基于以上存在的网络学习当中的问题和网络学习分析需求,结合网络学习分析可得的数据源,本文基于大学网络教学平台进行的网络学习分析的目标是:分析不同的网络学习行为对课程学习效果的影响;基于网络学习行为进行网络学习用户聚类分析,分析不同用户类型的学习特征;构建用户学习效果分类决策树模型并用于对用户的网络学习效果进行预测。

2  网络学习分析数据与分析模型

2.1  分析数据

分析数据主要包括:课程数据、学生学习课程的过程数据、平台使用日志数据、机考系统中的具体考试数据等。

1)平台使用:登录平台学习次数、浏览课程次数、学习课程外其他资源情况等。

2)课程学习:课程学习次数、视频观看次数、观看时长、课程章节任务点及完成数等。

3)学习交互:课程评价次数、讨论参与次数、提问次数、问题及结果查看情况等。

4)作业:课程作业数、作业完成及相应得分情况。

5)考核:课程单元测试、半期及期末考试。

2.2  系统分析模型

针对网络学习分析的分析对象、分析目的,从网络教学平台及相关系统数据源按照以上分析数据需求,进行数据采集、预处理并进行集成,选取需要的分析数据进行相关性分析,网络学习用户聚类分析,建立用户学习行为分类决策树并对用户学习效果进行预测,指导师生的教与学。建立网络学习分析模型如图1所示。

3  分析方法与过程

3.1  相关性分析

通过对不同数据特征间的关系进行分析,发现针对分析目标的关键影响因素。这些方法有的可以快速发现特征之间的关系,如正相关、负相关或不相关;有的可以对特征间关系的强弱进行度量,如完全相关或不完全相关等;有的方法可以将数据间的关系转化为模型,进而通过模型进行预测。

简单直观的相关性分析方法是将数据进行可视化处理,但这种方法在分析过程和解释上过于复杂,在处理复杂一点的数据或者相关度较低的数据时就会出现问题。本文采用相关系数方法,针对大学生网络学习行为的主要特征,计算特征间的相关系数。相关系数是反应特征之间关系密切程度的指标,相关系数的取值区间在1到-1之间。1表示两个特征完全正相关,-1表示两个特征完全负相关,0表示不相关,数值越小表示相关关系越弱。相关系数的计算:

3.2  聚类分析

不同于分类算法要使用有类型标记的样本组成的训练样本集,聚类算法是一种非监督学习算法。聚类分析是在没有给定划分类别的情况下,根据样本的相似度或样本间距离等方式进行分組的一种方法。分组的原则是组内样本间相似性尽可能大,组间样本间的差异尽可能大。聚类方法可分为基于划分的聚类方法、基于密度的聚类方法、层次聚类方法、基于模型的方法等[7]。本文根据所分析的数据类型、数据量和分析任务,采用基于划分的K-means聚类方法。

3.3  决策树分类预测

分类是为一个没有添加类别标注的样本预测其类标签。分类器是一个模型或函数,对于给定的待分类样本,能够预测其类标签。我们可以使用带有正确类标签的样本即训练集,建立这样的分类模型。建立模型后,我们就能使用模型对给定的样本进行自动分类预测。常用的分类模型有:决策树、朴素贝叶斯概率型分类器、支持向量机、人工神经网络等。

其中,决策树算法产生的模型容易理解;可以方便地用图形描述;计算量相对小,速度快。决策树有ID3算法、C4.5算法和CART算法(Classification And Regression Tree,分类回归树)[8],本文即采用CART方法。

4  大学生网络学习分析

4.1  学习效果相关性分析

本文在对“大学计算机基础”这门课程的课程及学习数据进行探索分析后发现,老师们既有通过平台进行网上直播或录播形式进行教学,也有仅仅制作课程章节资料,提供给学生自主学习的。收集到的各个年级、各不同院系、班级的课程学习数据完整度、完成度都不一致,所以为了进行大范围的学习效果评估、预测,我们选取了任务完成数、视频观看时长、学习次数、期末考试成绩进行相关性分析,得到特征相关性矩阵如表1所示。

从特征系数矩阵看,任务完成数与期末成绩的关系最大,其次是视频观看时长。因此,老师可以将重要内容用视频等形式去呈现,同时加强对学生完成情况进行监督,从而改善学习效果。

4.2  网络学习用户聚类分析

选取2020级本科新生学习数据,经过数据清洗和预处理后,采用K-means聚类方法,基于选取的主要网络学习特征,对用户进行聚类分析。通过将K设置为2、3、4、5、6分别进行聚类,并对聚类结果进行对比发现当K设置为3时,分类效果最佳。3个类别的用户特征概率密度函数图如图2、图3、图4所示。

从概率密度图2可知,类别1的同学基本都完成了30次的任务点学习,视频观看时长主要集中在120~300分钟之间,学习次数在20~60次,少数超过60次,学习情况整体较好,基本完成学习任务。

从图3分析:类别2的同学任务完成情况较差,绝大多数只完成了几次,甚至没有较完整的参与学习;视频观看时长很少超过150分钟,多在100分钟以下;学习次数主要分布在20次以下区间,很少超过50次,可知该部分同学平时学习任务完成情况较差,视频观看效果不佳,存在较大刷视频的可能。

对某类用户可以继续结合其数据分布,如成绩分布,对其学习行为进行分析。以用户类别3为例,通过图4能直观分析出:该类用户基本都完成了所有30个课程章节的学习;视频观看时长主要集中在200~450分钟;学习次数也较多集中在50~100次,可以得出该部分学生的学习完成情况较好。针对该类学生的学习成绩进行可视化分布分析如图5所示。该类学生成绩主要集中在80分以上分数段,这部分学生该门课程学习情况较好,学习效果也好。针对其他类型学生可以继续进行这样直观的分析,得到更多有用的决策信息,从而辅助教学改进,指导教学改革。

4.3  学习行为决策树分类预测

利用CART决策树算法进行分类预测,通过实验比较,将决策树深度设置为3,使用机器学习决策树算法对2020级学生学习数据和期末成绩等数据进行学习,得到网络学习分析决策树如图6所示。在此基础上,可以通过进一步的剪枝,简化决策树,使我们的决策规则更清晰,比如当学习次数少于85次,视频观看少于200分钟时,期末考试不通过的概率就非常大,可以剪掉相应后续节点划分,直接在此生成“需要加油”的叶节点。

对2021级学生的“大学计算机基础”课程学习数据进行预处理,将最后考试结果离散化为能通过考试的和“需要加油”的两类同学,利用已建立的决策树分类模型进行期末考试结果预测,预测准确度达到91.2%。

5  结  论

本文利用大学网络教学平台的使用日志数据和大学生学习数据,选择不同的分析方法和技术,进行了相关性分析、聚类以及决策树分类预测。分析结果准确度高,能直观反馈给不同的用户使用:能帮助老师改进课程内容的建设和教学任务的安排、实施;能对学生学习结果进行预警评估,提高期末考试合格率;能为教学管理者提供丰富的教学质量管理和教学模式改革的决策依据。

今后可以继续完善数据的记录、收集,提高数据质量;针对不同分析需求将各种分析功能模块化;提高分析模型准确度和模型泛化能力。

参考文献:

[1] 刘冬邻.高校科研资源的个性化融合推荐 [J].重庆大学学报,2022,45(7):122-130.

[2] 李衡.地方高校网络教学平台面临的应用问题及对策 [J].教育与职业,2015(33):93-94.

[3] 韩锡斌,黄月,马婧,等.学习分析的系统化综述:回顾、辨析及前瞻 [J].清华大学教育研究,2017,38(3):41-51+124.

[4] 赵兴龙.翻转课堂中知识内化过程及教学模式设计 [J].现代远程教育研究,2014(2):55-61.

[5] 赵磊,朱泓,吴卓平.中国高校MOOC建设情况及制度环境研究 [J].中国远程教育,2019(10):64-73+91.

[6] 安颖.MOOC在中国高校发展的现状、问题与对策 [J].高教探索,2015(9):38-41.

[7] 王改花,傅钢善.数据挖掘视角下网络学习者行为特征聚类分析 [J].现代远程教育研究,2018(4):106-112.

[8] 范洁,杨岳湘,温璞.C4.5算法在在线学习行为评估系统中的应用 [J].计算机工程与设计,2006(6):946-948.

作者简介:刘冬邻(1979—),男,汉族,重庆人,高级實验师,工学硕士,主要研究方向:数据挖掘、机器学习。

猜你喜欢

网络教学平台
护理专业《医学免疫学与病原生物学》THEOL网络教学平台构建初探
基于网络教学平台的对话式课堂建构与教学实践
试论高校网络教学平台建设的研究与实践
《电子商务网站实务》精品课程建设探讨
基于网络教学平台的大学计算机教学改革探讨
对信息时代高职高专外语课堂教学模式的探索
利用翻转课堂促进高职英语教学初探
职业学校应用网络教学平台对提高教学质量的研究
分析如何构建基于现代学徒制和网络教学平台的中医针灸人才培养模式
基于Moodle的国家开放大学网络教学平台探讨与研究