APP下载

大数据学习分析的研究与应用*—以浙江省教师教育MOOC培训平台的课程为例

2016-10-13

现代教育技术 2016年8期
关键词:模块分析课程

陈 雷



大数据学习分析的研究与应用*—以浙江省教师教育MOOC培训平台的课程为例

陈 雷

(宁波教育学院网络与教育技术中心,浙江宁波 315016)

数据为王的大数据时代正在来临,如何将大数据关联于教育变革以及由此衍生的学习分析的应用逐渐成为了热点课题。文章以浙江省教师教育MOOC培训平台为例,任选其中的某门在线课程,通过常规挖掘、频次统计、跳转聚合、数据可视化等方法,以渐进深入的方式,对选课学员的学习行为和日志进行数据挖掘,并根据学员在平台中的学习行为数据,展示学员与课程的相关性和适应度,发掘学员模块的学习规律和学习喜好,定位平台中的模块功能和课程资源缺陷,优化适应性教学资源,定制个性化学习路径,促进个性化发展。研究表明:上述这些举措将大大提高选课学员的用户体验感和满意度。

大数据;学习分析;挖掘;碎片化;界面跳转

引言

信息时代各行各业数据规模逐渐庞大,数据激增,人类的记录范围、测量范围和分析边界在不断地扩大,大数据理念应运而生。大数据之“大”,其重点并不仅仅在于字面理解“大容量”,更在于分析数据的全面性和潜在的“高价值”。学习分析是由大数据与教育结合所衍生出来的崭新概念,现阶段对“学习分析”认可度比较高的定义是:测量、收集、分析和报告有关学生及其学习环境的数据,用以理解和优化学习及其产生的环境的技术[1]。教育中的学习分析应从多方维度(包括学习倾向、教学喜好、智商情商、学习势态、交互协作、领域能力等)深层次挖掘有价值的数据信息,以大数据思维与决策对学习过程中的微观表现进行收集评估[2],揭示其中隐藏的学习行为等模式,并以可视化方式呈现给教育决策者。如此一来,教师可根据学习者的学习行为分析其认知基础和知识结构,定制个性化学习方案;同时,通过全方位记录、跟踪和掌握学习者的特性、学习需求、学习基础和学习行为,可对现有教学平台和教学策略进行全面评估[3],以发现目前存在的教学缺陷和漏洞,为现有教学模式的优化和升级指明方向。

本研究在浙江省教师教育MOOC培训平台(下文简称“平台”)的基础上,任选取其中的某门在线课程,跟踪学员在课程中的行为踪迹,创新性地将大数据挖掘技术应用于学员群体和个体学习行为分析。大数据分析追求的是相关关系,因果关系不再是重点[4],因此本研究在平台课程研究的过程中将会淡化数据的因果关系,而重点探讨遵循学员群体和个体行为能力的适应性举措。

一 平台关键分析技术模式

目前国外普遍流行的学习分析技术涉及学生的学习内容、兴趣点、话语关键词、特征标签、关系网络、系统建模等学习行为内容,并在此基础上采用聚类、异类分析、结构矩阵、可视化、文字挖掘、趋势预测等一系列步骤实现。而本研究的初衷是,在运用大数据与学习分析技术对平台中学员学习行为进行挖掘的基础上,通过梳理并掌握学员的学习规律,进而提出改进策略,对平台现有资源、功能模块进行优化,以将来更好地适应学员的学习习惯,因此所采用的学习分析技术必须与目前流行的有所差异。

本研究以遵循“Ventura”分析技术为前提,并在借鉴美国哥伦比亚大学在线教育模式的基础上[5],规划了平台大数据学习分析模式架构(如图1所示),并付诸实践。该架构包括大数据技术分析流程、挖掘分析工具、数据信息集成三大部分——大数据技术分析流程是分析架构的核心模块,主要包括页面点击量、界面跳转率、页面浏览人次、视频操作、资源利用细节等;挖掘分析工具提供对平台具体研究实施的技术支撑,平台采用的是SQL Server Analysis Service和SPSS两类数据挖掘仿真工具,以及内容语义分析工具VINCA和编码解码标签工具Atlasti;数据信息集成是分析架构的界面终端展示,其功能模块主要包括数据分类、聚合、数据汇总、数据可视化、干预措施、预估测试等。

图1 平台大数据学习分析模式架构

二 课程总体学习情况分析

数据挖掘功能模块追踪学员群体在平台中的行为特征(包括登录时间段、登录持续时间、行为轨迹、页面跳转、浏览视频行为、页面占有率等),采用大数据专有的交叉引用、分类、聚类、关联规则等算法,揭示学员群体和个体在平台中的学习行为规律和平台缺陷,以更好地指导建设者优化平台中的细节。

本研究选用的浙江省教师教育MOOC培训平台是浙江省中小幼教师教育网络培训平台,以该平台2015年下半年的后台数据为参考,并将平台中通过任意选择所得的一门在线课程——“PowerPoint在中学化学中的高级应用”(简称“PPT化学应用”)作为研究对象。该门课程共分为九章,包括57节理论课、43节实践课;配有视频53个、其它资源19个、互动研讨区9个;开课时间为2015年10月16日至12月11日,这一时间段该门课程的选课总人数为995人。

将系统后台中记录的学员登录时间、持续时间经标准差统计,得到如表1所示的数据。表1显示,大多数学员更倾向于利用常规工作时间进行该门课程的学习,而且每次登录学习的时间并不长,基本上平均每次以9~11分钟为主,甚至在线持续时间为3~5分钟的也占了相当一部分比重。这说明,学员善于利用工作的空余时间、闲散时间进行知识点和技能的学习,与传统的教学方式已有明显差异,更加符合碎片化学习的趋势。但是,表1只是粗线条地展示了课程的总体利用状况,而无法解读这些数字的缘由,如为何学员群体的碎片化学习时间集中在10分钟左右。基于此,本研究引入了更多的指标来掌握更具体的信息,包括在线时间、各模块使用频次等数据,其中各模块频次的计算都通过后台插件cookies数据采集而实现,如表2所示。

表1 学员课程学习时间总体分析表

表2 本课程具体使用率数据

由表2得知,学员个人对“PPT化学应用”的利用率处于较高水平,基本上日均单个人次能保持在2.18个频次进入课程学习——抛开持续时间的因素,这个数据本身就说明了“PPT化学应用”的开发比较符合教师学员的需要。但通过比较表2各个指标的访问频次,可知各功能模块的利用率存在较大差异,因此,接下来本研究将对课程各版块的学习状况进行数据挖掘。

三 基于大数据的学习行为分析

1 各功能版块学习情况

表3 课程各版块使用细节

表3显示,学员对平台各个资源模块的学习关注点由高到低依次为:视频资源库、互动研讨区、理论章节、Wiki协作、实践章节、其它资源库。这是因为,视频资源库直观易懂,能在最短的时间内传递最丰富的信息,故一直是学员在线学习的首选;而学员一旦在学习中遇到疑难点,便会主动求助“互动研讨区”或“Wiki协作”——因此,上述三个模块在平台所占的点击量百分比处于高位。但有些意外的是,“实践章节”的点击量远远不如“理论章节”的点击量,并且尽管对“PPT化学应用”的实践内容进行了优化和改进,但点击量却一直维持在较低水平。从表3中无法得出造成上述现象的关联,故必须从另一个角度对大量学员在平台中的学习路径进行分析,以求取得突破。

2 学员学习路径

观察学员群体在平台中各功能模块间的跳转,是学习行为研究最好的途径。表4显示了学员群体在课程各版块中的主要跳转情况,若忽略不具有研究价值的次要跳转路径,则通过该表数据可以比较直观地分析平台中学员的学习行为习惯。

表4 学院群体在课程各版块中的主要跳转情况

注:“变量”代表分析程序中的指针。

从表4可以看出,学员群体在平台中的学习习惯路径是清晰明朗的。视频资源库是学员们进入平台学习的首选;浏览视频资源之后再回过头进入理论内容学习,以加深对知识点理论的印象;一旦遇到课程中的疑难点,则进入Wiki协作或互动研讨区求助,以获得对问题的解答——这就是学员群体在平台中学习的最有效方式。前文所述之课程的实践内容没有受到学员的青睐、学习实践内容的点击量非常低,其原因在于实践内容与视频学习资源内容有所交叉,而动手实践需要花费更多的时间和精力,故学员更愿意选用更省时省力的视频来获取知识。

3 视频浏览点击行为研究

为了获得更加细致的学员行为数据以便改进该门课程,必须从微观视角对学员在具体模块页面学习中的行为片段加以收集和归纳。当前跟踪站点中访客行为的方式有两种:Web服务器日志和Javascript页面标记——Web服务器日志只能记录客户端对服务器的请求日志,而非服务器的行为(包括学员在视频客户端的鼠标点击、对象交互事件、Ajax交互、Flash事件、鼠标运动轨迹和按键输入)无法被记录;JavaScript页面标记则覆盖所有用户能访问到的模块,并能够记录平台中用户的所有动作(包括指向服务器的一般页面控制行为和非向服务器的视频点击行为)。综合以上因素,本研究对平台学员片段化行为的收集采用JavaScript页面标记的方案。

图2显示,相比于“PPT化学应用”中其它章节视频,第七章“控件工具箱和插件”和第九章“课件制作实例”的课程视频播放的持续时间显著增加。图3则显示,第七章中“单项选择题制作”、“多项选择题制作”、“Flash的插入与控制”、“视频的插入与控制”和第九章大部分课件实例的视频播放条回拨次数明显激增,且视频暂停次数的点击抓取量处于高位。同时,模块中视频资源库、理论章节、互动研讨区之间相互跳转循环往复的点击次数也明显高于其它章节。这不仅从侧面印证了这两章内容所涉及的实际技巧对于学员具有很强的吸引力,而且非常直观地反映出这两章内容的复杂度和困难度均较大,因此间接地揭示了目前这两章内容的建设程度和课程内容、视频的优化方向。

图2 课程各章节视频播放的持续时间

图3 课程各章节视频的使用状况

4 学员测评分析

学员测评体系的建立既是交互式平台的关键组成部分,也是本研究的一个重要创新点。平台必须为参加教师教育培训的学员提供完整的教学体验,否则就会与其它普通的远程视频或信息性网络课程站点无异。基于EduSoho的教师教育MOOC平台具有强大的教学测评开发功能,包括教学资源测评、视频课程质量评定、教学交互活动认定、各类教学测验设计、各类教学数据统计等——可以说,该平台丰富的测评活动功能几乎囊括了教学活动所需的大部分功能。针对该门课程的实际需求特点,该平台还提供了四个测试性测评模块:大规模自动评分、教师在线打分、学员互评、在线面试。其中,大规模自动评分是目前在线上和线下运用最广泛的测评手段,是云计算和大数据支撑下的拿手好戏。适合测评的题型包括选择题、填空题和定义题等,这类题型的答案往往明确固定,是精细化自动测评最合适的选择。问答题、分析题等主观性较强的题目应采用教师在线打分系统[6],可有效适应主观类型题目发散性的特点,以给予学员最公平公正的学习质量测评。由于学员之间的熟悉程度往往比师生之间的熟悉程度更深,因此学员互评也是平台测评体系重要的模块。在线面试是平台测评体系中最具创新性的模块,它借鉴了目前主流的视频会议模式。该模块运行时,学员和若干测评专家在线互动问答,由专家根据学员的回答状况在线即时给出测评等级和评语。该模块最能体现出公平公正的原则,是目前最受学员和专家欢迎的测评模式。

表5列举了选课学员针对该门课程所选择的测评模式组合情况,可以看出学员大部分倾向于采用“学员互评+在线面试”的方式来进行学员能力的测评。通过对选课学员的匿名在线问卷调查,发现大部分学员也对这两种测评方式持肯定态度且认可度较高,认为这两种测评方式不仅从学员学习的观察者(授课教师)角度而且从学员相互之间的角度来评价每个学员的学习情况和学习效果,其评价结果比较客观,并且也很符合个人实际。因此,在“PPT化学应用”未来的建设中,除了要保持目前这些受认可的测评模块,还应更加注重开发符合教师、学员需求的成绩测评模式及应用。

表5 学员测评模式后台统计分析表

四 总结

根据上述针对“PPT化学应用”学员学习情况数据的分析汇总,本研究认为可从平台的功能模块和课程资源的结构两个方面来改进课程,其具体优化策略如下:①优化课程内容结构,精简课程,逐步缩减访问量较少的实践教学素材,仅保留必要的内容;②压缩课程视频资源时间,严格控制视频内容,单个视频以控制在10分钟左右为宜,实现真正的微课教学;③改变目前各理论内容页面的版块结构,在教学内容下方增加评论功能,方便学员和教师评价,最重要的是提高用户的体验感;④改进第七章和第九章的教学视频资源,摒弃晦涩、难懂的视频,重新制作适合教师和学员理解的内容;⑤精简课程中的其它资源,或将其它资源形成集中管理模式;⑥调整测评模式,注重设计符合教师、学员需求的成绩测评模式及应用,从学员的角度来形成课程测评体系。

平台和平台中课程的发展是一个不断升级的过程,而数据的挖掘与分析可以为平台的改进指明方向。事实上,平台的优化的确还有很多事情可以做——最具优势的一项,是根据学员在平台中的学习行为数据,向学员推送适应性教学资源,定制个性化学习路径,设计个体理解的学与教的知识结构,促进个性化发展,定位平台中的模块功能缺陷,此外还包括个性化学习、教学资源的个性化推荐、虚拟真实学习场景等。而这一切的一切,都离不开大数据对平台的优化及其对平台中每个人员的定制式分析。

参考文献

[1]顾小清,张进良,蔡慧英.学习分析:正在浮现中的数据技术.远程教育杂志.2012,(1):18-25.

[2]葛道凯,张少刚,魏顺平.教育数据挖掘:方法与应用[M].北京:教育科学出版社,2012:29-30.

[3]魏顺平.在线学习行为特点及其影响因素分析研究[J].开放教育研究,2012,(4):81-90.

[4]Baepler P, Murdoch C J. Academic analytics and data mining in higher education[J]. International Journal for the Scholarship of Teaching and Learning, 2010,(2):170-180.

[5]王苗,刘志超.基于学习分析视角的在线学习行为可视化分析与案例研究[J].中国教育信息化,2015,(9):10-13.

[6]Chen E, Heritage M, Lee J. Identifying and monitoring students’ learning needs with technology[J]. Journal of Education for Students Placed at Risk, 2010,(3):309-332.

Research and Application of Big Data Study Analysis—Taking one of Curriculums in Teacher Learning Platform of Zhejiang Province as an Example

CHEN Lei

The era of taking data as king is coming. How to relate big data to education reform and from which application of study analysis derived, have gradually become hot research topics. This article took teacher education MOOC training platform of Zhejiang province as example, selected one of these online courses, and employed the methods of conventional excavating, frequency statistics, jump aggregation, data visualization to excavate the data of students’ learning behavior and studing log in a progressive way. According to students’ learning behavior data in this platform, the relevance and adaptability of the students with the course were demonstrated, the module learning rules and learning p

of students were explored, the module function and course resource defects of this platform were located, the adaptive teaching resources were optimized, personalized learning path was customized, personal development was cultivated. These initiatives will greatly enhance the students’ experience and satisfaction to this platform.

big data; study analysis; excavate; fragmentation; interface jump

G40-057

A

1009—8097(2016)08—0109—07

10.3969/j.issn.1009-8097.2016.08.016

本文为2014年度全国教育信息技术研究课题“基于EduSoho与移动云技术的教师教育Mooc系统的开发与应用研究”(项目编号:146232067)的研究成果。

陈雷,讲师,硕士,研究方向为大数据挖掘、教育数据建模、远程教育技术等,邮箱为bankstom@163.com。

2016年2月14日

编辑:小西

猜你喜欢

模块分析课程
28通道收发处理模块设计
“选修3—3”模块的复习备考
数字图像处理课程混合式教学改革与探索
隐蔽失效适航要求符合性验证分析
软件设计与开发实践课程探索与实践
为什么要学习HAA课程?
电力系统不平衡分析
A—Level统计课程和AP统计课程的比较
电力系统及其自动化发展趋势分析
集成水空中冷器的进气模块