在线教育中的教育数据分析
2020-05-06董洪华
董洪华
(西安建筑科技大学 信息与控制工程学院,陕西 西安 710055 )
引 言
面对海量的用户和多元化的教育需求,如何实现精准的教育服务,是当下在线教育发展面临的主要问题,但是海量的教育学习行为数据,又增加了统计分析的复杂性和难度。大数据时代的到来,大量数据挖掘分析工具和技术的涌入,为在线教育数据的分析提供了诸多支撑。Tableau是一款应用于数据管理和数据可视化的工具软件,其将数据运算与可视化的图标有效融合为一体,可将海量的学习行为数据,通过自带的数据分析工具,创建直观、可视化的图表,帮助用户简化数据分析的过程,快速获取数据分析结果,从而为优化在线教育过程提供支撑依据。
1.在线教育数据分析的目标定位
在线教育是一种基于网络化教学平台和资源,支持学生在线、自主、碎片式学习的应用支撑,其融合了现代智能化设备和技术,可利用图文、音视频等多媒体形式立体化呈现教学资源,并将师生的教与学的行为数据、学习者特征数据、评价互动、交互学习等海量数据记录并存储下来,成为在线教育数据中的重要组成。透过这些海量的、具有高度教育价值的大数据分析,经由数据准备、预处理、挖掘、统计,可以从中提取出在线教育课堂在课时安排、资源内容、教学方法上存在的显著问题,也可以跟踪、识别学生的学习状态、偏好和行为习惯,从而有的放矢地整合课程资源、优化教学模式、设计教学情景,满足在线教育智能化服务需求和发展的要求,将在线教育推向更高的层次和水平。
2.在线教育数据分析的工具选择
在线教育数据分析的意义在于利用数据挖掘工具和方法,准确识别学生多样性、个性化的学习特点和需求。目前,捕获、存储、处理和分析这些数据的工具和方法不断涌现,而如何高效、准确提取有价值的信息,是在线教育数据分析的根本要求。
Tableau可视化分析软件是应用最为广泛的一款可视化数据分析和显示工具,其具有智能运算和简便操作性,能够适用不同领域的数据分析,可以立体、形象的图标形式,将繁杂、海量的数据直观的呈现出来。Tableau融合了文本形式、excel表格、统计文件、SON等不同类型数据,可以远程链接数据库服务器,便捷和数据的存储、调取和分析,特别是Tableau软件无需复杂的编程开发,采用拖拽的方式便可快速生成数据图表,简化的运算过程和步骤,并以优化的图形展示界面来为用户提供数据查询、分析支撑;同时无需导引或程序编写,就可以跟随不同用户的思维轨迹,进行视图的智能切换,数据运算分析效率显著优于一般工具。正是因为Tableau的以上特点,本文将采用该软件对国家开放大学陕西分部2019年秋季的学习行为数据集进行挖掘和分析,力求从多维度提取学习者特征和学习情况,为进一步提供个性化的在线教育服务提供支撑依据。
3.在线教育数据的可视化分析
3.1数据来源
就读于国家开放大学陕西分部的学生在学业持续期,都需要通过指定平台进行注册,选课、发帖、测试、课程学习、形成性考核,这些过程中产生的数据也成为对学生群体进行分析的重要依据,下面将通过选取2019年秋季国家开放大学陕西分部的学习行为数据进行分析。
3.2学习者行为的聚类分析
2019年秋季国家开放大学陕西分部的学生中包括了不同地域、学历层次、年龄和性别的学习者,其学习基础、能力和偏好等存在较大差异,为便于对海量学习数据进行分析,首先需要对学习者进行聚类分析,以准确识别、认知不同类学习者的特征和学习状态。
目前,大数据挖掘技术中聚类分析方法,基于距离的聚类算法K-means是应用最广泛的群组分类方法,下面将选用浏览数、行为总数、学习平台登录数、登陆次数、在线天数等建立聚类中心,应用k-means聚类分析算法将特征相似的学习者划归为一类,对不同类学生的行为数据进行聚类分析,具体的聚类分析依据如下:
(1)第一类学习者,笔者将其取名为过关取证型,这类学习者在线学习的时间和频率较少,学习行为一般集中在形考作业布置的时间段,也就是说,这些学习者基于自我提升的学习要求并不高,仅仅是满足于完成学习任务,获取学分,该类学习者只是在形式上关注师生的互动评论,但参与实质性的课堂学习较少,对于相关课程内容、教学资源更多的简单浏览,形成性考核往往在最后要求的时间点完成,可将其归类为观测者类型。
(2)第二类学习者,笔者将其取名为勤奋学习型,这类学习者在线学习的时间较长,学习频率较高,能够根据教学安排学习教学资源、开展互动交流,按时甚至提前完成学习和作业任务,作业完成质量较好,特别是能够结合自身的工作实践与教师开展专业问题交流,该类学习者的学习目标显然不是定位于获取学分和毕业证书,而是通过在线教育获得更加切实有用的行业知识。可将其归类为具有较强学习意愿的坚持学习者。
Tableau软件的集群统计功能可兼容K-means聚类分析方法,只需要拖拽拟分析的数据字段,便可实现高效、准确的聚类分析,省略了复杂编程、数据运算过程。根据上述聚类分析标准,利用Tableau可视化软件,运用其仪表板中显示的各类型图形,使用Tableau的“Show Me”功能便可将聚类数据拖拽至图表之中,完成可视化的聚类分析,聚类分析中,随机划分的中心点K值可自主设定也可由Tableau软件自动判定,剔除无效数据后将生成两种种群组,结果如图1所示。
图1 学生学习行为聚类分析
依据聚类分析结果,结合上图1可以看出,对于2019年秋季国家开放大学陕西分部89978名学生的学习行为记录聚类后,第一类过关取证型(group1),共聚集72639名学生,占学生总比例80.7%;第二类勤奋学习型(group2),共聚集17339名学生,占学生总比例19.3%。
3.3学习者学习状态分析
鉴于在线教育的开放性、资源优势性,其学习者众多,且特征和基础不一,为了更进一步测度不同类型学习者的学习状态,获取更加有效的分析指标,从而对在线教育的教学方法、教学监督过程、考核方式等进行实时修正,有必要将经过K-means聚类分析后的两类学习者群组的学生行为各聚类指标进行对比,来分析影响学习效果的各项因素,分析结果如图2所示。
图2 学生行为各聚类指标分析雷达图
由上图可以看出,两类学生学习行为的最主要差异在于xingweizongshu(行为总数)和liulanshu(浏览数),第二类勤奋学习型学生(Cluster_grouping_1)的xingweizongshu、liulanshu数值明显高于第一类过关取证型型学生(Cluster_grouping_0)数倍。在图2中可以明显看到第二类勤奋学习型学生(Cluster_grouping_1)的xuexipingtaidenglucishu数值线,而第一类过关取证型(Cluster_grouping_0)学生该项指标几乎没有数值线。其相应的学习效果无疑将存在很大差别。
接下来,再对两类学生聚类指标的均值进行对比,用Tableau生成图表如下图3所示,可以看出,第一类过关取证型(一组聚类指标)学生的登录平均次数为40.64次,其行为总数平均值634.62次和浏览数的平均值364.81次;而第二类勤奋学习型(二组聚类指标)学生的登录次数为268.59次,其行为总数平均值为5208.56次和浏览数平均值为2909.12次。第二类学生的各项指标明显高于第一类学生,二者的学习效果页体现在形考成绩的较大差异。
图3 两类学生聚类指标均值对比分析图
综合上述结果可知,为学生提供资源丰富的开放在线学习平台,可以有效的适应开放大学来源多样的学习者,同时为学习者提供灵活自主的学习方式,但是有相当一部分学习者,虽然具有较高的学习热情,但是在学习过程中,只是为了获得学分而开展学习,这种功利化的学习方法大大影响了学习的主动性和持久性,更影响到实质知识水平的提高。
结束语
信息化时代下,在线教育利用智能终端设备、无线通讯技术及网络化平台等优势,为学生提供随时随地的学习支撑,为了全面优化在线教育服务,在激烈的市场竞争中谋求发展优势,开放大学需要借助现代大数据挖掘分析技术对繁杂、无序的教育数据进行深度分析、准确识别,以得出有利于教育优化的决策结论。本文针对大数据时代下,数据分析及可视化呈现的需求,结合开放大学的学习行为数据和聚类分析算法,应用Tableau可视化分析软件生成数据分析图表,帮助管理者分析者快速识别不同的学习群体,为进一步分析更加具有应用价值的教育数据,优化在线教育的教学行为,提升在线教育教学效果提供依据。