APP下载

基于学习通平台数据的学习者学习行为投入画像分析

2022-12-09范长胜雷冬飞任小璐杨冬霞

中国轻工教育 2022年5期
关键词:画像聚类学习者

范长胜 雷冬飞 任小璐 杨冬霞

(1.东北林业大学机电工程学院,哈尔滨 150040; 2.哈尔滨学院土木建筑工程学院,哈尔滨 150086)

一、引言

随着云计算、大数据、人工智能、深度学习等信息技术的发展,由于不受时空限制,在线学习已经成为越来越多的学习者选择的学习方式。信息技术的快速发展促使教育教学推陈出新,教育信息化平台应运而生并得到了快速发展,逐步渗透到教育的各个环节,可以对大学生的学习过程、行为和内容等进行记录、传递和评价。目前各类高校常用的信息化学习平台主要有雨课堂、学习通、智慧树、中国大学慕课、蓝班云墨等,这些云课堂在与实体课堂的交互中起到了很好的配合作用。师生通过学习平台提供的功能可以将课前、课中和课后的教与学连贯起来,打破了学习者在时间和空间上的壁垒,将知识的理解变得形象化、生动化、碎片化。如何依据大学生的学习特征,透过学生在线学习问题的表象,挖掘教育信息平台上学习者的学习数据,找到学习者的学习习惯、投入、情感和态度等问题[1],准确描述学习者的特征,动态反映学习者状态,客观地对学习者进行评价,并依据学习者学情提供精准的服务,这些都是教育研究者关注的问题。

学习者画像是借用商业领域中的“用户画像”概念,用户画像是基于用户在互联网上留下的各种数据,通过数据加工产生一个个刻画用户兴趣偏好的标签组。学习者画像作为全新的描述学习者学习特征的方法,在教育领域中的应用潜力正在被挖掘[2]。张治等[1]学者以研究在线作业为目标场景,以在线学习行为投入为切入点,建立了参与、坚持、专注、学术挑战和自我调控5个主要维度的分析框架和测量目标。采用K-Means聚类对在线学习者的行为特征和结果特征进行标签分类,形成了四类学习者的画像,提出了相应的学习指导建议[1]。张倍思等学者从学习者行为特征视角出发,设计了多源过程性数据驱动的学习者综合评价模型。利用流数据聚类算法对不断涌入的学习者数据进行处理,及时生成或更新学习者画像,然后基于学习者画像的行为进行分析,构建学习者综合评价模型,实现对学习者学习表现的实时反馈[3]。李红燕等学者基于学习者画像,通过对学习者学习状态的描述性、诊断性、预测性分析,有针对性地提供可视化、精准推送和个性化咨询指导[4]。目前对学习者画像的研究大都基于一个开放、通用的学习平台,学习平台上内容丰富、信息量大、学习者众多、可以选用的学习数据量充足,有利于分析学习者的学习行为、学习效果,优化平台内容。张治等[1]学者通过“一起作业”智能作业平台,研究学习者在线作业行为,并对学习者学习行为与学习指标进行了可视化和差异化分析。傅正科[5]学者通过大规模开放在线课程(MOOC)平台的公共关系课程,对现有理论进行梳理,对学习者画像形成的理论依据及操作化指标的建立进行分析,生成了基于学习者标签的个性化教学方案。孙金晓[6]学者选取了“The HarvardX-MITx Person-Course Dataset AY2013”公开数据集三个学期16门课程的64万多条数据,采取了K-Means聚类方法进行了用户基本信息、学习者行为和学习态度三个维度的学习者特征指标构建,为教育决策提供了一定的依据。

以上学者研究学习者画像的数据都来自大型的公共用户平台,选取这种学习平台最大的不足是学习者的人员不固定、学习目标不够明确、学习时间随机性强、学习内容更换较为频繁,很难评价和考量学习者的学习过程,后续学习者的学习优化难以跟进,这就为学习者画像的具体描述带来很大的困难。学习者中学习内驱力最强的人群是学生,而大学生是这群人中学习内容、时间、地点自由度最大的群体。因此,为大学生构建一个动态的学习者画像模型,实现个性化学习路径、精准服务和学习辅导用于精准教学是十分必要的。基于以上原因,本文选取超星学习通平台,选择地方应用型本科院校的一个工科专业进行分析,主要原因有:(1)在线平台统计学习者学习一门专业课程在一学期内的全部过程,包括课前导学;课中学习者参与讨论的各种活动及个体与全员参与互动环节;课后作业及小组任务等。(2)以学习者深度参与、多元互动、开放共创为特征的新型教学模式[7],在线学习平台可以提供学习者完整的学习过程数据。(3)在线学习平台已经被我国大学普遍使用,能够对学习者学习过程的数据采集和课程总结性评价提供必要支持。

二、学习行为投入评测框架

“学习行为”与“学习行为投入”这两个概念是既有区别又有联系。学习行为投入是学习投入的基本构成维度,是情感投入和认知投入的载体[8]。学习行为投入指学生在学习活动中积极、持久及有效地可以被观察到的行为表现,它最早由泰勒提出[9]。

学习行为投入是影响学习者学习绩效的重要因素,对学习行为投入的及时评测与干预可以促进学生学习成绩的有效改善[10]。随着教育评价理念的发展,学习行为投入成为改善高等教育教学质量的关键指标[11]。李爽等人综合分析了国内外教育研究者对学习行为投入的研究,将其定义为学习者在学习活动中投入的时间、精力和努力,这是可以被观测到的行为表现,具体为准时上课、认真听讲、积极回答教师问题、准时提交作业、遇到难题时不放弃等,行为投入的分析大多涉及参与、坚持、交互、专注、寻求挑战等方面。目前,学习行为投入是可以通过课程学习管理系统数据对学习者成绩进行测评的。学习者学习行为投入度主要分为投入、游离和脱离三类。应用超星学习通平台可以查看学习者的出勤情况、作业完成度、与教师间的互动等;同时也可以通过观察学习者在课程学习过程中的努力度、专注度、主动性等[12]对学习者深度参与学习的程度进行衡量,并对其学习结果进行预测和评估。本文以研究学习行为投入为出发点,对近年来在学习行为方面具有代表性的研究进行了整理,如表1所示。

表1 学习行为投入测评维度

在表1中可以看到,研究者在研究学习行为投入度时对坚持、专注两项维度比较认可,它们可以有效地反映出学习者对学习行为的投入程度。学习行为投入中的“参与”是课程学习的基本行为投入,可以明确体现学生对于课程的规则、要求与认同程度,是其他行为投入的基础。“坚持”类学习行为反映了学生为实现学习目标对努力和情感的管理。“专注”类行为体现了学生对学习内容本身的兴趣,同时体现出学生抗外界干扰的能力[13-14]。关于“交互”维度,杨港等[15]学者的研究表明,它是在线学习行为投入的重要特征,是行为投入的核心构念,交互的频次、时长、质量等对学习投入都有直接影响,起到正向调节作用。“学术挑战”主要强调在面对有难度的问题时学习者学习行为的投入表达。学术挑战的行为表现是在面对有挑战性的学习任务时,积极参与解决其中的重难点问题[16]。“自我调控”主要指学习者对自身学习行为与时间的管理、调节和控制。体现在学习者学习行为的反思、时间管理及学习规律等方面[1]。“主动性”主要体现为学习者在完成既定的任务过程中做出的主动与努力。

依据以上文献研究分析,将地方应用型院校学情特点与在线学习平台相结合,可构建基于学习通平台数据的在线学习行为投入分析框架。参与、坚持、专注和主动性四个维度可作为学习行为投入的主要维度,如表2所示。

表2 基于学习通平台的在线学习行为投入分析框架

“参与”是由学习者在线学习时课前、课中和课后三部分投入的时间、精力来体现的,表现为学习者对课前或课后发放问卷的回答时长、准确率、完整度;课中呈现的抢答、主题讨论、随堂练习、选人等活动的参与度,这些活动使学习者在学习过程中一直保持与教师交互;课后分配的小组活动可以将学习者的学习情感如积极、懈怠或厌倦都表现出来。这项内容体现学习者对在线学习活动规则和要求的认同和接受。“坚持”指在线学习时学习者在课前或课后对预留作业的完成度、完成时长、准确率;课中实验的操作、数据处理及报告的完成情况,随堂测试的正确率、完成时长和完成度也可以体现学习者对课程学习精力和时间的投入;课后阶段测试的准确率、完成度和回答时长也能再次体现学习者的坚持和努力。“专注”可以在课前或课后的作业及阶段测试中体现出来,包括学习者在学习课程中抗外界干扰的能力。“主动性”是从以教学为中心转变为以学生为中心的具体体现,表现为课程之外学习者借助书籍、期刊及网络等工具获取知识的内在驱动力。

三、构建学习者画像

1.案例课程与样本数据

本研究以地方应用型本科院校工科专业学生为研究对象,目前,此学院一届学生人数为330人,参与线上线下融合式学习的人数占总人数的98.6%。在此情况下,选取1门核心课程的学生在线学习数据,从参与、坚持、专注、主动性4个维度进行指标分析。

2.指标分析

(1)参与类指标分析

参与类指标分析主要对学习者学习过程进行分析。学习者的最终成绩由平时成绩和期末考试成绩两部分构成,平时成绩占比为40%,期末考试成绩占比为60%。期末考试成绩侧重于知识评价,平时成绩可以对学习者学习过程中的行为进行考量。参与类活动占平时成绩的20%,参与类活动可以有效反映学习者的学习过程,体现学习者参与学习的行为。

图1中成绩以百分制计算,期末考试成绩60分以下的学习者在最终成绩与参与类活动成绩两项上表现出较低的分值;期末考试成绩60分以上的学习者最终成绩与参与类活动成绩两项分值则明显高于60分以下的学习者,且这部分学生参与类活动的成绩相对来说较为稳定。最终成绩在80~90分之间的学习者,两项的成绩都较为理想。

此外,参与类指标可以反映学习者的学习态度,与最终成绩及参与类活动成绩之间大多数情况下成正相关。

图1 学习者期末考试成绩、参与类活动成绩、最终成绩曲线图

(2)坚持类指标分析

坚持类指标中主要有平时作业、实验和阶段测试三项内容,图2所示为这三项内容与学习者的综合成绩之间的关系曲线。在绘制曲线时,平时作业成绩是选取学习者15次作业的平均成绩,实验成绩是7次实验的平均成绩,阶段测试是6次测试的平均成绩。将这三项指标的平均成绩与学习者的综合成绩进行比较分析。可以从图2曲线上看出,综合成绩在80分以上的学习者,他们在平时作业、实验和阶段测试中的成绩也都表现平稳,得分也处于高分段位;综合成绩在70~79分的学习者,在平时作业、实验和阶段测试三项指标上成绩都有浮动,但成绩的变化范围较小,总体还是较为平缓;综合成绩在60~69分的学习者,在平时作业、实验和阶段测试三项指标上成绩上下波动较大,成绩的变化范围较大;综合成绩在59分以下的学习者,在平时作业、实验和阶段测试三项指标上成绩变化范围很大,一小部分学习者成绩直接为0分,这部分学习者的学习态度需要老师或家长通过相应的心理辅导进行端正,同时在知识层面上也需要得到帮助。

图2 学习者的坚持类活动与综合成绩之间的关系

(3)专注类指标分析

专注类指标主要体现为课前或课后作业、阶段测试完成的时长。选用的阶段测试内容与坚持类指标分析的内容数据相同。图3所示为学习者最终成绩与阶段测试平均时长的关系图。没有选用课后作业完成时长,是因为线上发布的作业预留给学习者的时间较长,从作业的发布到学习者作业的提交不能够完全反映出学习者认真做作业的时间。选择阶段测试是因为阶段测试的总时长固定,从试卷的下发到收取其时长对每位学习者都相同,因此得到的测试时长更具有研究意义。从图3中可以看出,最终成绩得分较高的同学相对于得分较低的同学,在测试时所用的时间相对较长,即投入的精力较多、专心投入的时间也较多,因此,学习者也收获了较高的分数。低于60分的学习者存在两种情况:一种是平时没有学习,测试时看到的题都不会直接放弃,坚持到允许交卷时间就上交试卷;另一种是临考试前学习,试卷上的题似会非会,又不甘心放弃,参与测试时间较长,仍得到较低的成绩。

图3 学习者最终成绩与阶段测试平均时长之间的关系

(4)主动性指标分析

主动性指标包括课外学习和网络学习两项内容。课外学习和网络学习都是学习者自行完成和课程相关的学习内容。如果将综合成绩采用四等级制进行排列,则A表示优秀、B表示良好、C表示中等、D表示合格。研究得出,综合成绩与课外学习成绩、网络学习成绩呈正相关,即学习者的综合成绩为A时,学习者在课外学习和网络学习上取得的成绩也为A。综合成绩为B和C的学习者,课外学习和网络学习两部分的成绩会出现波动,表现出其中一种学习取得较好的成绩,另外一种学习则成绩平平。综合成绩为D的学习者,涉及课外学习和网络学习两部分内容时,成绩变化幅度较小,均取得较低的成绩。因此,针对综合成绩为D的学习者应采取导师负责制,对其进行心理疏导,规范学习行为,提高学习成绩。

四、学习者群体聚类分析

现阶段基于学习结果和学习行为特征进行学习者画像分析,大多数研究者采用的方法为聚类分析法。聚类分析法是把数据特征相似的数据集合在一起形成一类,依据数据特征的差异性,把数据进行拆分形成K类,这种方法是以特征值相似度为基础进行区分,不需要数据标记,是基于划分的聚类算法。K-Means聚类分析法一般采用欧氏距离作为衡量数据对象间相似度的指标,相似度与数据对象间距离成反比,相似度越大,距离越小[17]。K-Means聚类分析法通常需要预先指定初始聚类数目K及K值的最优取值。多数研究者根据数据的特点大致确定初始聚类数目K。K值的最优选取通常采用两种方法,第一种方法是手肘法,即采用指标误差平方和(Sum of Squared Error,SSE),这种方法是根据数据对象与聚类中心之间的相似度,不断更新聚类中心的位置,通过多次迭代计算不断降低类簇的误差平方和,当SSE不再变化或目标函数收敛时,聚类结束,得到最终结果。但这种方法的缺点是,有些数据进行拐点评估时,不能得到最优的拐点值,因此,用SSE来评估聚类结果不是最优的指标。第二种方法是轮廓系数法,即聚类计算中轮廓值越高聚类效果就越理想。轮廓值SC的计算见式(1)。

(1)

式(1)中,SC为轮廓值,越接近1越好。

ai为样本数据i到同簇其他样本的平均距离,称为样本i的簇内不相似度。

bi为样本数据i到其他簇的所有样本的平均距离,称为样本i的簇间不相似度,取最小值。

在计算过程中,所有样本的SC均值,即为该聚类结果的均值。SC值接近1,说明样本i的聚类合理;SC值接近-1,说明样本i更应该分类到另外的簇;SC值接近0,说明样本i在两个簇的界上,分类不够合理。

本研究采用K-Means聚类分析法中的轮廓系数法。聚类效果的评判依据是聚类轮廓值的大小,轮廓值的取值范围在[-1,1]之间,越接近-1表示分类的效果越不好,而接近1则表示分类效果较好。本文应用Matlab软件编写轮廓值程序进行学习行为指标的划分聚类。在基于参与、坚持、专注及主动性学习行为上,采用K-Means聚类分析法进行分析,依据学习成绩划分及聚类效果将学习者分为四项,如图4所示。图4中参与类指标中聚类划分的轮廓值为0.63,坚持类指标中聚类划分的轮廓值为0.69,专注类指标中聚类划分的轮廓值为0.70,主动性指标中聚类划分的轮廓值为0.63。四类指标的聚类轮廓值表明学习行为聚类分析模型具有有效性。

图4 四种在线学习行为的聚类分析

图4的四幅图中,不同颜色表示不同的类型,黑色菱形表示分类聚类的中心,可以依据聚类中心从高到低的分布,将综合成绩分为A、B、C、D四种类型。

综合成绩为A的学习者在四项指标的聚类模型中各项指标的得分也都较高。在主动性指标中表现出成绩集中且都得到了高分,表明综合成绩为A的学习者相较于其他3种成绩的学习者有更强的学习意识,学习态度端正,且能积极地进行课程之外的网络学习和阅读学习。

综合成绩为B的学习者的专注类指标成绩较高,表明这类学习者在完成作业时态度较认真,能按课程预期目标要求高质量完成。在进行试卷测试时,也能认真审题按要求作答,作答时长都在规定范围内不会提前或滞后。本类学习者在主动性指标上成绩相对较为分散,说明本类学习者的学习主动意识不强,在需要个人学习和课程相关的知识时不能积极自觉地进行网络学习和课外学习。对此类学习者进行指导时需要关注到学习者个体的兴趣点,让学习者对所学内容产生兴趣,其相应的积极性和主动性也能随之调动起来。

综合成绩为C的学习者在专注类指标上成绩较为理想,与B类学习者有相似之处,但相比于B类学习者在专注类指标上取得的成绩更低。表明此类学习者在完成作业和试卷测试时能够用积极的心态去完成,但由于平时对相关内容知识掌握得不牢固,因此取得的成绩偏低。此类学习者在参与类指标及主动性指标上的成绩都比较分散,说明此类学习者有学习意愿但又不愿付诸行动,出现时学时不学的状态,可能感兴趣的内容就认真学习一段时间,不太感兴趣的内容就比较随心所欲,在头脑中不能够形成相关课程的知识体系,对所学课程也是一知半解,没有积极上进的学习心态和求知欲。此类学习者需要辅导员与家长共同关注和引导,明确学习目标,改善学习态度,从而提高学习效果。

综合成绩为D的学习者在四项指标的聚类模型中各项指标的得分也都较低,表明这类学习者没有良好的学习态度,尤其是在专注类指标中得分最低,说明这类学习者在课程学习过程中很难做到坚持不懈、始终如一地进行学习活动。在主动性指标中成绩分布有高有低,表明他们在学习过程中学习状态不稳定,不定期出现努力学习的意愿和行为。这类学习者需要教师、辅导员和家长都给予关注,沟通了解学生心理,针对问题进行具体有效的干预和帮助。

五、结论与展望

为实现学习者画像,本文在文献研究的基础上,基于学习通平台数据构建了在线学习行为投入分析框架,选用地方应用型本科院校的一个工科专业进行了学习者学习行为特征的研究。依据学习者的综合成绩采用K-Means聚类分析法将学习者划分为四类,并得出以下结论。

首先,学习者的学习成绩与学习行为成正相关,即学习行为投入越多、学习态度越端正、学习目标越明确,学习者的最终成绩就越好,这一结果与已有研究结果一致。

其次,采用K-Means聚类分析法划分的四类学习者,对于成绩优异的A类和成绩不合格的D类在进行类别分析时相对容易。成绩良好和中等和B类和C类学习者学习行为投入情况相对较为复杂,学习行为投入不同取得的学习综合成绩可能相同,这就需要针对学习者个体有针对性地解决问题。

最后,学习者的学习行为是多维度的,学习行为不仅指参与、坚持、专注及主动性等行为,它还会在学习过程中用到推理、思维发散、记忆检索等多种学习策略。学习是一个复杂的过程,是一个需要不断成长的过程,不单单是一个学习维度的连续发生,它需要不断复习和大量的实践反复,找到所学知识的规律,不断大量重复形成长期记忆,这样才有利于学习者真正学会所学内容。

随着信息技术对教育的全面促进和发展,在线学习行为统计对学习信息平台的依赖程度较大。学习者个人信息、课程内容、平台运行情况及课程性质等都会影响学习者在平台上的学习记录。如果学习信息平台做得不够详细和完善,就不能全面客观地刻画出学习者的学习行为轨迹,对学习者的评价会产生偏差。如果学习信息平台对学习者学习行为数据抓取充分,则平台处理的信息量将会很巨大,平台开发者、使用者、管理者之间的沟通则需准确及时。因此,使用学习信息平台最好可以涵盖较多的学习内容和场景,对目标学习者进行研究收集事实数据,在研究数据过程中发现学习者的共性问题,对学习者进行细分寻找规律聚焦细节,这将有利于教师依据学生特点进行个性化干预和督促,提高学习者的学习行为投入效率,有效提高学习成绩。

猜你喜欢

画像聚类学习者
威猛的画像
“00后”画像
画像
你是哪种类型的学习者
十二星座是什么类型的学习者
基于K-means聚类的车-地无线通信场强研究
基于高斯混合聚类的阵列干涉SAR三维成像
汉语学习自主学习者特征初探
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法