在线教育中的教育数据分析
2020-05-08董洪华
[摘 要]在线教育具有跨越时空局限性、聚集海量资源的优势,也因此成为开放教育的重要组织形式。对在线教育过程中产生的学生学习行为数据进行挖掘和分析,可以为在线教学的课程改革、教学组织、资源建设、教学评价、学生学习行为及特征跟踪识别提供有效支撑。本文结合聚类算法与Tableau 可视化软件,对开放大学在线教育中的学习行为数据进行分析和可视化呈现,为在线教育优化设计提供有效支撑。
[关键词]在线教育;开放大学;聚类算法;可视化;Tableau
[中图分类号] G434 [文献标识码] A [文章编号]1008-4649(2020)01-0015-04
Analysis of Education Data in Online Education
Dong Honghua
(Xi'an University of Architecture and Technology,Xi'an 710055)
Abstract:Online education has the advantages of transcending the limitation of time and space and gathering massive resources, so it has become an important organizational form of open education. Mining and analyzing the data of students' learning behavior in the process of online education can provide effective support for the course reform, teaching organization, resource construction, teaching evaluation, students' learning behavior and feature tracking and recognition of online education. This paper combines clustering algorithm and tableau visualization software to analyze and visualize the learning behavior data in online education of Open University, which provides effective support for online education optimization design.
Key word: Online education;Open University;Clustering algorithm;Visualization;Tableau
引 言
面對海量的用户和多元化的教育需求,如何实现精准的教育服务,是当下在线教育发展面临的主要问题,但是海量的教育学习行为数据,又增加了统计分析的复杂性和难度。大数据时代的到来,大量数据挖掘分析工具和技术的涌入,为在线教育数据的分析提供了诸多支撑。Tableau是一款应用于数据管理和数据可视化的工具软件,其将数据运算与可视化的图标有效融合为一体,可将海量的学习行为数据,通过自带的数据分析工具,创建直观、可视化的图表,帮助用户简化数据分析的过程,快速获取数据分析结果,从而为优化在线教育过程提供支撑依据。
1.在线教育数据分析的目标定位
在线教育是一种基于网络化教学平台和资源,支持学生在线、自主、碎片式学习的应用支撑,其融合了现代智能化设备和技术,可利用图文、音视频等多媒体形式立体化呈现教学资源,并将师生的教与学的行为数据、学习者特征数据、评价互动、交互学习等海量数据记录并存储下来,成为在线教育数据中的重要组成。透过这些海量的、具有高度教育价值的大数据分析,经由数据准备、预处理、挖掘、统计,可以从中提取出在线教育课堂在课时安排、资源内容、教学方法上存在的显著问题,也可以跟踪、识别学生的学习状态、偏好和行为习惯,从而有的放矢地整合课程资源、优化教学模式、设计教学情景,满足在线教育智能化服务需求和发展的要求,将在线教育推向更高的层次和水平。
2.在线教育数据分析的工具选择董洪华.在线教育中的教育数据分析[J].陕西广播电视大学学报,2020,(1).
在线教育数据分析的意义在于利用数据挖掘工具和方法,准确识别学生多样性、个性化的学习特点和需求。目前,捕获、存储、处理和分析这些数据的工具和方法不断涌现,而如何高效、准确提取有价值的信息,是在线教育数据分析的根本要求。
Tableau可视化分析软件是应用最为广泛的一款可视化数据分析和显示工具,其具有智能运算和简便操作性,能够适用不同领域的数据分析,可以立体、形象的图标形式,将繁杂、海量的数据直观的呈现出来。Tableau融合了文本形式、excel表格、统计文件、SON等不同类型数据,可以远程链接数据库服务器,便捷和数据的存储、调取和分析,特别是Tableau软件无需复杂的编程开发,采用拖拽的方式便可快速生成数据图表,简化的运算过程和步骤,并以优化的图形展示界面来为用户提供数据查询、分析支撑;同时无需导引或程序编写,就可以跟随不同用户的思维轨迹,进行视图的智能切换,数据运算分析效率显著优于一般工具。正是因为Tableau的以上特点,本文将采用该软件对国家开放大学陕西分部2019年秋季的学习行为数据集进行挖掘和分析,力求从多维度提取学习者特征和学习情况,为进一步提供个性化的在线教育服务提供支撑依据。
3.在线教育数据的可视化分析
3.1数据来源
就读于国家开放大学陕西分部的学生在学业持续期,都需要通过指定平台进行注册,选课、发帖、测试、课程学习、形成性考核,这些过程中产生的数据也成为对学生群体进行分析的重要依据,下面将通过选取2019年秋季国家开放大学陕西分部的学习行为数据进行分析。
3.2学习者行为的聚类分析
2019年秋季国家开放大学陕西分部的学生中包括了不同地域、学历层次、年龄和性别的学习者,其学习基础、能力和偏好等存在较大差异,为便于对海量学习数据进行分析,首先需要对学习者进行聚类分析,以准确识别、认知不同类学习者的特征和学习状态。
目前,大数据挖掘技术中聚类分析方法,基于距离的聚类算法K-means是应用最广泛的群组分类方法,下面将选用浏览数、行为总数、学习平台登录数、登陆次数、在线天数等建立聚类中心,应用k-means聚类分析算法将特征相似的学习者划归为一类,对不同类学生的行为数据进行聚类分析,具体的聚类分析依据如下:
(1)第一类学习者,笔者将其取名为过关取证型,这类学习者在线学习的时间和频率较少,学习行为一般集中在形考作业布置的时间段,也就是说,这些学习者基于自我提升的学习要求并不高,仅仅是满足于完成学习任务,获取学分,该类学习者只是在形式上关注师生的互动评论,但参与实质性的课堂学习较少,对于相关课程内容、教学資源更多的简单浏览,形成性考核往往在最后要求的时间点完成,可将其归类为观测者类型。
(2)第二类学习者,笔者将其取名为勤奋学习型,这类学习者在线学习的时间较长,学习频率较高,能够根据教学安排学习教学资源、开展互动交流,按时甚至提前完成学习和作业任务,作业完成质量较好,特别是能够结合自身的工作实践与教师开展专业问题交流,该类学习者的学习目标显然不是定位于获取学分和毕业证书,而是通过在线教育获得更加切实有用的行业知识。可将其归类为具有较强学习意愿的坚持学习者。
Tableau软件的集群统计功能可兼容K-means聚类分析方法,只需要拖拽拟分析的数据字段,便可实现高效、准确的聚类分析,省略了复杂编程、数据运算过程。根据上述聚类分析标准,利用Tableau可视化软件,运用其仪表板中显示的各类型图形,使用Tableau的“Show Me”功能便可将聚类数据拖拽至图表之中,完成可视化的聚类分析,聚类分析中,随机划分的中心点K值可自主设定也可由Tableau软件自动判定,剔除无效数据后将生成两种种群组,结果如图1所示。
依据聚类分析结果,结合上图1可以看出,对于2019年秋季国家开放大学陕西分部89978名学生的学习行为记录聚类后,第一类过关取证型(group1),共聚集72639名学生,占学生总比例80.7%;第二类勤奋学习型(group2),共聚集17339名学生,占学生总比例19.3%。
3.3学习者学习状态分析
鉴于在线教育的开放性、资源优势性,其学习者众多,且特征和基础不一,为了更进一步测度不同类型学习者的学习状态,获取更加有效的分析指标,从而对在线教育的教学方法、教学监督过程、考核方式等进行实时修正,有必要将经过K-means聚类分析后的两类学习者群组的学生行为各聚类指标进行对比,来分析影响学习效果的各项因素,分析结果如图2所示。
由上图可以看出,两类学生学习行为的最主要差异在于xingweizongshu(行为总数)和liulanshu(浏览数),第二类勤奋学习型学生(Cluster_grouping_1)的xingweizongshu、liulanshu数值明显高于第一类过关取证型型学生(Cluster_grouping_0)数倍。在图2中可以明显看到第二类勤奋学习型学生(Cluster_grouping_1)的xuexipingtaidenglucishu数值线,而第一类过关取证型(Cluster_grouping_0)学生该项指标几乎没有数值线。其相应的学习效果无疑将存在很大差别。
接下来,再对两类学生聚类指标的均值进行对比,用Tableau生成图表如下图3所示,可以看出,第一类过关取证型(一组聚类指标)学生的登录平均次数为40.64次,其行为总数平均值634.62次和浏览数的平均值364.81次;而第二类勤奋学习型(二组聚类指标)学生的登录次数为268.59次,其行为总数平均值为5208.56次和浏览数平均值为2909.12次。第二类学生的各项指标明显高于第一类学生,二者的学习效果页体现在形考成绩的较大差异。
综合上述结果可知,为学生提供资源丰富的开放在线学习平台,可以有效的适应开放大学来源多样的学习者,同时为学习者提供灵活自主的学习方式,但是有相当一部分学习者,虽然具有较高的学习热情,但是在学习过程中,只是为了获得学分而开展学习,这种功利化的学习方法大大影响了学习的主动性和持久性,更影响到实质知识水平的提高。
结束语
信息化时代下,在线教育利用智能终端设备、无线通讯技术及网络化平台等优势,为学生提供随时随地的学习支撑,为了全面优化在线教育服务,在激烈的市场竞争中谋求发展优势,开放大学需要借助现代大数据挖掘分析技术对繁杂、无序的教育数据进行深度分析、准确识别,以得出有利于教育优化的决策结论。本文针对大数据时代下,数据分析及可视化呈现的需求,结合开放大学的学习行为数据和聚类分析算法,应用Tableau可视化分析软件生成数据分析图表,帮助管理者分析者快速识别不同的学习群体,为进一步分析更加具有应用价值的教育数据,优化在线教育的教学行为,提升在线教育教学效果提供依据。
[参考文献]
[1]陈佳艳.基于Tableau实现在线教育大数据的可视化分析[J].江苏商论,2018(02):123-125.
[2]陈雷.教师在线教育环境下大数据的应用——以浙江省平台中的课程为例[J].继续教育,2017,31(09):7-11.
[3]申强华,张立群.在线教育的大数据分析实施探讨[J].信息技术与信息化,2016(11):96-100.
[4]唐晋韬,刘越,宁洪,王挺.面向大规模在线学习平台的教育数据分析研究综述[J].计算机教育,2015(21):37-40.
[责任编辑 王爱萍]