APP下载

基于RFL的MOOC学习者细分与忠诚度研究*——以“怪诞行为学”课程为例

2016-12-10

现代教育技术 2016年11期
关键词:细分类别均值

魏 玲 李 阳



基于RFL的MOOC学习者细分与忠诚度研究*——以“怪诞行为学”课程为例

魏 玲 李 阳

(哈尔滨理工大学管理学院,黑龙江哈尔滨 150040)

MOOC在全球掀起应用风暴的同时,也面临着巨大的挑战,学习者课程完成率低或中途选择放弃等用户流失现象尤为严重。为了分析哪些类型的学习者可能中途选择放弃、哪些类型的学习者能够坚持完成课程,需要对MOOC学习者进行细分与忠诚度研究。文章借鉴商业领域中的RFM(Recency+Frequency+Monetary,近度+频度+值度)客户分类思想,构建了基于RFL(Recency+Frequency+Length,近度+频度+值度)的MOOC学习者分类模型。在此基础上,文章以“怪诞行为学”课程为例,对学习者进行了聚类分析,并针对MOOC各级别学习者的行为特征提出相应的教学策略,以期为更好地发展MOOC提供参考。

MOOC;学习者细分;忠诚度;RFL

引言

随着信息技术的发展,网络教育发生了空前的变革,涌现出众多的在线学习平台。在线学习平台具有的共享性和提供的个性化服务,改变着学习者的思维模式,便于学习者知识的构建。MOOC(Massive Online Open Courses,大规模在线开放课程)作为当前在线学习平台的典型代表,起源于加拿大,现已在全球教育领域大受热捧并掀起了新一轮应用风暴[1]。MOOC在全球教育界被广泛追捧的同时,也面临着巨大的挑战。有关调查显示,当前MOOC注册者的实际课程完成平均率不足百分之十,注册者在学习过程中选择中途放弃的现象尤为严重[2]。面对这种较高的用户流失率问题,研究者正努力寻找原因,分析哪些因素会影响学习者的持续学习行为。如康叶钦[3]认为,平台注册人数激增造成个性化学习质量危机,同时学习者充分自治造成主动学习缺乏,进而引发了MOOC完成率不高的现象。

研究MOOC学习者学习的影响因素及学习进展,首先需要明确MOOC学习者的类别。Hill[4]利用数据挖掘技术,将MOOC学习者划分为五种类型;Kitsiri[5]从学习者的职业背景与学习目的出发,对MOOC学习者进行了类别划分;Koutropoulos等[6]将用户在课程中的参与程度作为用户分类指标;斯坦福大学利用学习分析技术,将MOOC学习者分为完成者、取样学习者、观众与脱离式学习者[7];Taylor等[8]根据学生在课程论坛与Wiki中的互动程度,将MOOC学习者分为四类;蒋卓轩等[9]则从认知规律的研究角度出发,对MOOC学习者进行了划分。由此可见,当前关于MOOC学习者分类的标准尚未统一,分类角度与方法也不尽相同,大多依据学习者本身属性进行类别划分,而没有充分考虑学习者在线学习过程中的学习行为。此外,对MOOC学习者的分类大都基于某一个具体的MOOC平台,可实际上同一个MOOC平台上不同课程的学习者类型存在差别。因此,针对MOOC平台上某门具体课程的学习者进行分类,可为其它课程的组织者进行学习者分类研究提供参考,并为动态监督学习者的学习进程、加大学习者的课程参与度提供指导。根据MOOC在线学习平台用户学习的特点,本研究借鉴RFM分析法,提出了MOOC学习者细分RFL指标体系,构建了基于RFL的MOOC学习者分类模型,并以“怪诞行为学”课程为例,采用聚类方法对MOOC学习者进行细分,同时分析了各类别学习者的课程忠诚度。

一基于RFL的MOOC学习者分类模型

1 RFL指标体系

RFM分析法是分析客户行为特征的一种方法,由Hughes[10]于1994年提出,通过近度R(Recency)、频度F(Frequency)、值度M(Monetary)等三个行为变量来区分客户。其中,R指上次购买至现在的时间间隔,F为某一期间内的购买总次数,M是某一期间内的购买总金额。不同于一般的基于客户贡献度的客户分类方法,RFM分析法侧重于以客户的行为来对客户进行细分[11]。虽然RFM分析法是客户细分的有效方法,但传统的RFM分析法并不适用于在线学习平台的学习者分类。在线学习平台与普通的电子商务平台应用有所不同——除了少数想要获取课程结业证书的学习者,大部分在线学习者并没有进行实际消费。但是,在线学习平台中学习者的学习行为与一般电子商务用户的购买行为也存在一定的相似性。因此,可以借鉴RFM分析法,设计出适用于MOOC学习者分类的指标体系,以对MOOC学习者进行有效细分。

根据MOOC在线学习平台的特点,结合在线学习者的学习行为特征,本研究提出了MOOC学习者细分RFL指标体系,如表1所示。其中,指标R(Recency)代表近度,是学习者最近一次登录平台的时间点距离关注点的时间长度,为便于进行数据处理,本研究将指标R定义为从关注点(年月日)到最近一次登录平台之间的天数;指标F(Frequency)代表频度,是学习者在某一期间内的学习总次数,包括观看课程视频次数、做笔记与发帖互动次数;指标L(Length)代表长度,是学习者在某一期间内登录平台观看课程视频的总时长(单位为分钟),观看时长越长,体现学习者对在线课程的依赖程度越高。

表1 MOOC学习者细分RFL指标体系

2 基于RFL的MOOC学习者分类模型

根据MOOC学习者细分RFL指标体系,本研究构建了基于RFL的MOOC学习者分类模型,如图1所示。该模型包括以下几个模块:

(1)数据归一化

由于MOOC学习者分类指标在数量级、量纲上存在较大差异,为消除量纲影响,需对学习者分类指标的取值进行归一化处理[12]。本研究在提出MOOC学习者细分RFL指标体系时发现:指标F取值越大,说明MOOC学习者在线学习频率越高;指标L取值越大,说明MOOC学习者在线观看课程视频时间越长。由此可以判断,指标F、L取值越大,说明学习者在学习过程中注入的时间与精力越多,对MOOC在线课程的忠诚度越高。指标R代表学习者最近一次登录MOOC平台距离分析点的时间间隔,时间间隔越小,说明学习者在这一期间内退出现象不明显,对课程的忠诚度越高。由此得出,指标F、L与学习者稳定程度正相关,取值越大越好;而指标R与学习者稳定程度负相关,取值越小越好,在进行归一化时应区别处理。

图1 基于RFL的MOOC学习者分类模型

(2)确定指标权重

确定指标权重通常使用主观法和客观法——传统的主观法大多采用层次分析法、专家咨询法等,这些方法由专家根据经验进行判断,带有强烈的主观色彩,精确度较低,故不适用于本研究的权重确定;客观法则能够利用客观数据获得比较符合实际的权重,包括主成分分析法、变异系数法和熵值法等。其中,主成分分析法适用于多个指标情形,而本研究构建的MOOC学习者分类指标个数较少;变异系数法适用于指标取值差异较大的指标体系,而本研究构建的MOOC学习者分类指标取值差异较小,因此这两种方法均不适用于本研究的权重确定。综合比较,本研究采用熵值法来确定学习者各分类指标的权重。

(3)K-means聚类与删除极端值

K-means聚类是用户群细分的一种常用方法,是指利用距离公式将样本中的数据分配到随机选取的k个中心,再重新计算新的中心均值,迭代以上步骤直至获得最小聚类[13]。具体来说,首先对分类指标进行描述性统计,发现频度和长度存在极端偏大值,这些极端值会导致聚类分析时存在较大误差,故在分类时应对其进行删除处理。应用K-means算法对MOOC学习者进行分类前,需要确定聚类的个数m。根据生成的各类别中各指标的均值与相对应的各总体指标均值进行大小比较,将聚类个数m设定为2×2×2=8。同时定义:若一个类别中指标R(或F或L)的均值大于相对应的总体指标均值,则该类别用R(或F或L)↑来表示;若一个类别中指标R(或F或L)的均值小于相对应的总体指标均值,则该类别用R(或F或L)↓来表示。

(4)学习者忠诚度分析

由于在客户行为方面评价忠诚度的指标较易获取,故在营销领域对客户忠诚度的研究主要倾向于评价客户的购买行为[14]。当前,对零售行业中客户行为忠诚度指标选取和评价方法的研究比较成熟,但针对MOOC学习者课程忠诚度的研究尚未涉足。而通过分析学习者的在线学习行为,并通过对学习者R、F、L指标及其所赋权重的确定,能够分析出MOOC学习者的课程忠诚度。基于此,本研究设计了MOOC学习者忠诚度计算公式,如公式(1)所示。其中,、、分别代表分类指标R、F、L的权重,、、则代表每个类别中R、F、L指标的均值。

公式(1)

二以“怪诞行为学”课程为例的实证分析

本研究选取MOOC学院的“怪诞行为学”课程作为研究对象。MOOC学院是果壳网旗下的一个在线学习社区,截止到2016年6月,该平台已收录4462门精品课程,超过上千万人次在该平台上进行注册并参与课程学习。本研究利用网络抓包工具,获取从课程开始(2014年3月11日)至课程结束(2014年5月6日)这段时间内全部学习者的学习数据。然后,随机抽取3000名学习者数据作为样本,根据学习社区的历史记录,分别统计出每位学习者“最后一次学习本课程至课程结束时的时间间隔(R,以天为计算单位)”、“本次课程的总体学习次数(F,以次数为计算单位):包括观看课程视频次数、做笔记与发帖互动次数”、“本次课程中观看课程视频的总时长(L,以分钟为计算单位)”等三项指标作为学习者分类的依据,统计结果如表2所示。

表2 研究样本信息收集

由于每种指标的数据类型与格式存在较大差异,故本研究采用Max-Min方法,对获取到的学习者分类指标取值进行了归一化处理。然后,本研究采用熵值法确定课程学习者R、F、L指标的权重,最终得到指标R的权重为0.225、指标F的权重为0.564、指标L的权重为0.211。

学习者分类是通过比较每个用户类别的RFL均值与总体RFL均值的大小来决定的,故单个指标比较只可能存在两种情形:大于等于或小于总体均值,其可能类别数有2×2×2=8个。设置好聚类类别数后,本研究利用SPSS统计软件中的K-means算法,对“怪诞行为学”课程的在线学习者进行了聚类分析,得到8种学习者类别,如表3所示。

表3 聚类分析后产生的学习者类别

根据聚类分析结果,8种学习者类别的RFL均值有显著差异,将其与总体RFL均值进行比较,会产生7种级别的学习者:重要发展学习者、一般重要学习者、一般学习者、重要保持学习者、重要挽留学习者、无价值学习者以及观望者。各级别学习者所占的人数比例如图2所示。

图2 各级别学习者所占的人数比例

图3 各级别学习者的忠诚度排名

为分析不同级别学习者的课程完成率是否有差异以及差异如何,需进行学习者课程忠诚度分析。运用如前文公式(1)所示的MOOC学习者忠诚度计算公式,可得各级别学习者的忠诚度得分,根据得分对各级别学习者的忠诚度进行排名,所得结果如图3所示。

三基于MOOC学习者行为特征的教学策略

根据MOOC学习者分类及忠诚度排名结果,本研究分析了MOOC中各级别学习者的行为特征,并提出了相应的教学策略。

1 重要保持学习者(也称为黄金学习者)

重要保持学习者最近一次登录平台进行课程学习距离课程结束时间较近,学习总次数较多,观看在线课程视频的总时间较长。而忠诚度排名结果显示,该类学习者的忠诚度最高,属于高端学习者。针对该类学习者,教师应采取长期教学策略,及时了解其个性化学习需求;平台管理者则可以借助先进技术手段对海量学习数据进行整合分析,及时发现学习者行为与心态的变化,并针对其学习需求设计个性化的学习服务路径、提供实时的个性化学习服务,以提升该类学习者的在线学习满意度。

2 重要挽留学习者

重要挽留学习者最近一次登录平台进行课程学习距离课程结束时间较长,但在之前的学习过程中,其学习总体次数较为频繁、观看在线课程视频的总时间较长。而忠诚度排名结果显示,该类学习者在学习开始阶段的课程忠诚度较高,但根据指标R可推断出其在课程后期阶段可能会出现流失的迹象。针对该类学习者,教师与平台管理者应采取即时补救策略,在设计课程时强调把知识嵌入到实践运用中,让学习者真正获益;同时,采取有效激励措施,培养并增加学习者对MOOC的认同感与依赖度,降低该类学习者流失的可能性。

3 重要发展学习者

重要发展学习者最近一次登录平台进行课程学习距离课程结束时间较近,但与师生发帖互动交流的次数较少,观看在线课程视频的总时间较长。而忠诚度排名结果显示,该类学习者的忠诚度一般,属于中端学习者。针对这类学习者,教师可以在讨论区适时发布问题,来引导学习者交流、分享学习经验和学习成果,形成学习共同体;同时,通过加大讨论在课程评价中的比重,来激发学习者的内在学习动机。当学习者在线发帖提问时,教师或助教应及时回应,以降低其流失率、提高其在线学习满意度与忠诚度,将该类学习者发展为重要保持学习者。

4 一般重要学习者

一般重要学习者在很长的一段时间内不再登陆平台进行学习,或者说中途放弃了学习;观看在线课程视频、与师生发帖互动交流等学习行为的发生次数比较频繁,但学习总时长较短,投入的时间与精力成本较低。而忠诚度排名结果显示,该类学习者的忠诚度较低。该类学习者虽然积极地参与了课程互动话题讨论,却没有坚持完成课程学习,平台管理者与教师应对其进行监督帮助,即通过定时发送邮件提醒其及时登录平台学习课程、在学习过程中对其行为进行实时、动态的分析评价,以建立起学习监督引导机制,来提升该类学习者的课程忠诚度。

5 一般学习者

一般学习者最近一次登录平台进行课程学习距离课程结束时间较长、学习次数很少、观看在线课程视频花费时间较多。而忠诚度排名结果显示,该类学习者的忠诚度很低。该类学习者偏好在某一期间内长时间地观看课程视频,来满足其特定的学习需求及学习爱好,但之后成为课程脱离者。针对该类学习者,平台管理者应实时分析其学习需求及爱好,以推荐相应的课程,使之成为其它课程的重要保持者。

6 观望者和无价值学习者

观望者最近一次登录平台进行课程学习距离课程结束时间较近,但观看在线课程视频、与师生发帖互动交流等的学习行为较少,处于学习观望状态;无价值用户最近一次登录平台进行课程学习距离课程结束时间较长、学习次数很少或者不学习、观看在线课程视频花费的时间较少或者不观看——这两类学习者都属于脱离者。而忠诚度排名结果显示,这两类学习者的忠诚度非常低。针对这两类学习者,MOOC机构应加大宣传力度,如定期举办宣传讲座普及MOOC个性化学习模式,以吸引更多的学习者深入了解MOOC平台及在线课程,将这两类学习者发展为MOOC长期学习者。

四小结

文章提出了一种新的MOOC学习者细分研究思路,构建了基于RFL的MOOC学习者细分模型。与现有的学习者分类方法相比,该模型能够利用在线学习平台中学习者的大量学习行为数据进行分析,其分类结果更加标准化、合理化。文章以“怪诞行为学”课程为例,通过实证分析,证明该模型可以从学习者的学习行为角度出发,有效地对在线学习者进行精细分类、划分用户级别并分析各类别学习者的忠诚度。因此,将该模型应用于在线学习平台,可以及时发现问题学习者,为教师与平台管理者制定有效合理的教学策略提供指导与支持。

[1]李亮.MOOC发展的国家政策支持研究[J].现代教育技术,2014,(5):65-72.

[2]袁松鹤,刘选.中国大学MOOC实践现状及共有问题——来自中国大学MOOC实践报告[J].现代远程教育研究,2014,(4):3-12、22.

[3]康叶钦.在线教育的“后MOOC时代”——SPOC解析[J].清华大学教育研究,2014,(1):85-93.

[4]Hill P. Combining MOOC student patterns graphic with stanford analysis[OL].

[5]Kitsiri R. Who should take a MOOC?: 9 Types of lifelong learners who can benefit[OL].

[6]Koutropoulos A, Gallagher M S, Abajian S C, et al. Emotive vocabulary in MOOCs: Context & participant retention[J]. European Journal of Open, Distance and E-learning, 2012,(1):1-23.

[7]Kizilcec R F, Piech C, Schneider E. Deconstructing disengagement: Analyzing learner subpopulations in massive open online courses[OL].

[8]Taylor C, Veeramachaneni K, O’Reilly U M. Likely to stop? Predicting stopout in massive open online courses[J]. Computer Science, 2014,(1):1-25.

[9]蒋卓轩,张岩,李晓明.基于MOOC数据的学习行为分析与预测[J].计算机研究与发展,2015,(3):614-628.

[10]Hughes A M. Strategic database marketing[M]. Chicago: Probus Publishing, 1994:23-28.

[11]杨彬.一种基于RFM模型数据挖掘处理双阶段客户关联分类方法[J].统计与决策,2015,(7):77-79.

[12]刘勘,朱怀萍,刘秀芹.基于支持向量机的网络伪舆情识别研究[J].现代图书情报技术,2013,(11):75-80.

[13]叶海智,程清杰,黄宏涛.K-均值算法支持的优质网络学习资源筛选方法研究[J].中国远程教育,2014,(10):62-66.

[14]王文贤,金阳,陈道斌.基于RFM模型的个人客户忠诚度研究[J].金融论坛,2012,(3):75-80.

编辑:小米

Research on Segmentation and Loyalty of MOOC Learners based on RFL——A Case Study on the Course of “Predictably Irrational”

WEI Ling LI Yang

MOOC faces a great challenge when it creats an application storm worldwide. The phenomenon of customer losing, such as the low course completion rate or learners’ choice to give up halfway, is particularly serious. In order to analyze what types of learners may give up halfway and what types of learners may insist on completing the course, it needs to segment MOOC learners and study the loyalty of these learners. Based on the idea of Recency + Frequency + Monetary (RFM) customer classification in commercial field, this paper constructed a classification model of MOOC learners based on Recency + Frequency + Length (RFL). This paper took the course of “predictably irrational” as an example, made clustering analysis of MOOC learners, and proposed corresponding teaching strategies based on the behavior characteristics of various MOOC learners, excepting to provide reference for the better development of MOOC.

MOOC; learners segmentation; loyalty; RFL

G40-057

A

1009—8097(2016)11—0067—07

10.3969/j.issn.1009-8097.2016.11.010

本文受黑龙江省高等教育教学改革项目“信息管理与信息系统专业立体化实践教学体系的研究”(项目编号:JG2013010317)资助。

魏玲,教授,博士,研究方向为管理信息系统,邮箱为245460112@qq.com。

2016年4月10日

猜你喜欢

细分类别均值
深耕环保细分领域,维尔利为环保注入新动力
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
壮字喃字同形字的三种类别及简要分析
1~7月,我国货车各细分市场均有增长
服务类别
整体低迷难掩细分市场亮点
关于均值有界变差函数的重要不等式
多类别复合资源的空间匹配
中医类别全科医师培养模式的探讨