基于大数据的在线学习行为分析与干预研究*
2020-12-16王文晶闫俊伢
王文晶,闫俊伢
(山西大学商务学院信息学院,山西 太原 030031)
0 引言
国际人工智能教育大会2020(AIED),会议主题为“增强智能赋能教育”,探讨人工智能如何与教育进行深度融合。2019人工智能与教育大数据峰会,北京师范大学互联网教育智能技术及应用国家工程实验室主任黄荣怀教授,指出面向智能教育的三个基本计算问题:从“智能教学系统”到“学习过程认知计算”、从“课堂行为分析”到“教学行为计算”、从“学习环境设计”到“学习环境计算”,并指出,当前我国教育需要解决的问题是如何平衡规模化教育与个性化培养。智能教育应具有个性化、情境化、数据驱动、新教育生态等特点,从学习者“适应”机器,再到机器“真正”服务学习者,还需要一段时间。
疫情之下,各高等院校积极响应教育部“停课不停学”,利用各平台积极开展线上教学。本文首先对平台选用与教学模式进行了调查,平台主要包括国家教育资源公共服务平台、教育主管部门平台、教育机构或高校自发开展的资源平台[1]。
随着越来越多的教学平台涌现,在普及教学资源的同时,也带来巨大的挑战。目前各种在线学习平台的学情统计,可以全面记录学生在学习过程中的所有学习行为数据,记录整个学习过程,形成在线学习大数据,比较集中。对于学生个人数据信息基本稳定,包括视频观看时间、帖子回复数量、测试情况、签到情况、访问量,学习行为显示为非线性的数据,从属性上是稳定的、静态的。但这些在线学习行为随着时间的推移,是事务的过程,所以数据又是动态的。如何利用海量的数据,如何应用大数据技术对学生以及教学效果进行精准测试,是目前研究的趋势。目前关于在线学习行为数据挖掘,主要模式有:WEB内容挖掘、WEB记录挖掘、WEB结构挖掘。WEB内容挖掘是从文本语义角度进行挖掘,从而对教学内容进行推荐。WEB记录挖掘,进行行为识别。将这些丰富的数据利用数据分析技术,对在线学习行为的大数据进行挖掘,在线学习行为类型多样并且复杂,所以需对其进行筛选和分类,建立特征集,利用人工智能工具对其建立模型,通过库中已有数据对其进行训练,从而动态调整模型中各项参数,从而优化模型。该模型通过在线学习的学习行为数据进行挖掘及智能分析,教师通过模型获得相应的学习数据,精准分析学习过程和学习效果,教师可为学生提供个性化指导和教学干预,及时调整教学策略以及学生行为,最终为学习者提供一种基于互联网+的新型智能在线学习形式[2]。
1 研究内容
本模型以研究在线行为为导向,目标是优化教学资源推荐个性化教学,利用自底向上的思想将模型分为数据抽取、数据分析、干预机制三层。数据层为学习者或平台产生的原始行为数据;分析层采用智能化工具和技术对行为数据进行分析;干预机制层为预警或者推荐个性化教学,最终分析结果反馈给教师和管理者[3]。如图1所示。
图1 基于大数据的在线学习行为分析模型
1.1 数据采集
本项目主要研究面向学生的教学活动数据流。学习平台,提供了大量的学生行为数据,例如视频观看数据、签到数据、作业完成情况(正确率、互动情况),学生可能视频在挂线,登录状态,但学生自己本人可能处于离线状态,平台的学情分析是反映不出来的,但是可以通过学习行为记录,获取并分析学生行为。本项目的数据来源于SPOC的在线学习环境,采集疫情期间的《编译技术》教学活动的数据,数据分析包括数据采集、数据处理、数据分析、数据预测,最终根据分析结果调整教学策略和学生行为。
目前学者研究主要对线上教学数据进行统计分析,包括作业数据、帖子数据、论坛数据、回答问题、互评机制、签到情况等,也有利用数据分析构建平台或者框架,例如大数据平台MOOCviz,该平台的搭建可对不同课程、平台的数据进行分析,同时可对学习者的行为进行建模后预测学习行为[4]。
本课题在借鉴以上各种方式的基础上,首次对学习行为进行画像,并利用聚类分析法对学习群体行为特征进行分类,将采集的数据一部分作为训练集,另外一部分为测试集,通过训练集训练模型,用测试集分析,预测学习成绩,为学生提供个性化指导和教学干预,也是当前在线教育的趋势所趋。
1.2 行为指标设计
对采集来的数据进行清洗、转换操作,有针对性挖掘学习行为。学习行为指标主要包括学习成绩、学习态度、综合能力,其中学习成绩包括过程性行为和结果成绩;学习态度包括学习活动中的参与度、时间度、讨论回复帖子数量;综合能力包括课堂的小测试、协作以及创新能力。同时对这些指标设置不同的权重。
慕课平台上本学期选课人数113人,每周在平台参与讨论的人数为74-89人左右,原始数据采用平台中记录数据,如表1所示。
表1 学习行为类型
1.3 数据清洗和分析
需要对以下数据进行清洗:1) 注册单并未开始学习的学生数据;2) 指导教师的相关记录删除;3) 学生回复相同的帖子内容,或者相同的习题答案;4) 对采集的数据需要进行格式化处理。
清理后的数据,按照表1中的指标计算采集的数据,通过聚类方法对群体学习行为进行分析,得出学习者的学习情况。通过上一步的数据分析结果,教师及时调整教学模式使教学内容和教学步调,并且实时了解目前的教学情况。同时教师发现群体学习规律以及个别化规律,及时对个体进行思想教育,提高教学效果。平台也大大增加了用户体验。
1.4 机制
模型中另外一个模块是分析机制模块,通过对学习者数据的聚类分析、时间序列分析,利用模型中的规则,对模型中特征之间的关联进行分析、转换、数据预处理以及推理,从而设计基于问题学习行为的教学干预机制。利用模型将学生的学习行为数据进行预测后续学习问题,如果预测结果有问题,则对学习者进行干预,及时修正学习者的行为。
1) 在线反馈机制。在线反馈机制将加入自适应分析机制,对学习资源进行合理、智能化配置调整,将得到的合理、全面、客观的学习者数据及时反馈,对个人的学习状态进行解释并诊断。
2) 诊断。为了达到更好的在线学习效果,教师需要根据诊断结果及时进行干预,诊断结果包括过程性诊断和结果性诊断。利用机器学习中的人工神经网络,对学生的学习需求进行预测。
3) 学习习惯及偏好。通过学习平台的行为路径、资源访问频率等数据分析,向学习者推荐适合自己学习的方案以及知识点。
1.5 案例
本文以《编译技术》为例,采用MOOC学习的数据作为样本数据,利用数据挖掘技术对在线学习群体行为进行分析,并且用数据对模型进行训练及测试,得出模型预测结果即学习者的评价。对学习者,分析预测结果提示学习者学习的效果和状态,同时提示学习者是否可以进入下一阶段的学习,并推荐相关的主题资源,如果当前预测不达标,则会推荐相关章节习题和复习资料。对于教师,模型预测结果显示出群体学习状况,知识点、难点掌握情况,及时了解学习者的动态和疑问。针对大多数错误率或者疑问度比较高的知识点需要重复讲解,使错误率降低,或者采取其它的教学模式。
2 结论
本研究主要是从在线学习群行为进行挖掘,将数字教育通过学生的典型行为特征分析,对学习成果进行预测,为线上教学的评测提供了一种依据。针对在线学习行为模式识别,并针对不同类型的学习行为进行跟踪,设计相应的干预机制,有助于转换学习者类型。
教师通过调整测试难易度来对比测试性化学习路径,最终根据数据制定不同的个体内容。同时在线教学,由于缺乏真实的课堂互动性,所以教师应结合教学任务,精心设计教学内容和模式,引导学习者和教师深层次行为交互和融入性投入,激发学生的学习兴趣,提高学生的创新能力。通过优化学生的行为路径,从而优化课程教学资源,所以干预机制中应根据数据的引导设计合理的学习路径,防止无效的学习路径。同时干预机制,一定要根据行为层次以及学生的特点进行不同干预策略,向学习者推荐适合个人的个性化学习方案。