基于大数据的高职学生学习行为及效果分析
2018-12-05谢淑敏
谢淑敏
(闽江师范高等专科学校,福建 福州 350108)
1 引言
近年来,随着互联网的快速发展,越来越多的人利用互联网进行工作、学习、娱乐,人们与互联网的交互产生大量的数据,这些数据正在呈现出爆炸式的增长,人类在不知不觉中已经进入了“大数据”时代。“大数据”是指以多元形式,从许多来源搜集而来的庞大数据组。它具有四个方面的特点:数据体量巨大(Volume)、数据类型繁多(Variety)、实时性强(Velocity)、真实性高(Veracity)[1]。大数据是一个广义的概念,不存在定义性质的量,它是众多信息渠道的综合体系,这种体系通过互联网技术来实现网络数据一体化。在教育领域中,可以从微观视角去理解大数据的内涵。大数据的“大”,可以不是数据的“大容量”,而是分析数据的“全面性”和潜在的“大价值”。教育中的大数据分析,可以对学生学习过程的微观表现进行测量,深层次挖掘有价值的数据信息,揭示隐藏在其中的学习行为等模式并通过可视化的方式呈现出来。
许多世界知名高校纷纷启动了教育大数据的相关研究,2012年,美国国家教育部发布了《通过教育数据挖掘和学习分析促进教与学》报告,该报告对教育数据挖掘和学习分析应用领域作了详细的描述,主要包括学习者知识、行为和经历建模[2]。其中学习者行为建模主要解决的是学习者不同的学习行为范式与学习者的学习结果相关关系的问题。研究者可以采集学习者与网络学习平台的交互数据,通过数据挖掘和分析,探索学习者学习行为与学习者学习结果的相关关系,为提高教师的教学效率和学生的学习成绩提供帮助。本研究将利用蓝墨云班课平台获取学生的学习行为数据,系统、全面地记录、跟踪和掌握学生的学习行为特征,通过挖掘数据中有价值的信息,为教师有针对性地实施教学干预,促进教与学提供依据。
2 研究对象与研究内容
为了方便取样,笔者以闽江师范高等专科学校计算机系16物联网应用技术1、2班和17数字展示技术(VR方向)三个班级的学生为研究对象,共127人,采用蓝墨云班课作为研究平台,分别在平台中开设《多媒体技术》和《三维设计技术(3dsMax)》两门课程,分析学生在课程学习过程中的学习行为特征。为了准确描述学习者的学习行为,本文选取了三个班级在平台上产生的以下数据:浏览课程资源次数、视频观看时长、作业成绩、参与头脑风暴次数、参与答疑/讨论次数、测试成绩等作为学习行为分析的客观依据,以此为基础进行学习行为特征分析。每个班级有16个二维关系表,每张表格大约40条数据,我们采用Excel等数据挖掘软件对这些数据进行分析。
3 学习行为分析
3.1 资源学习情况
平台共发布资源50个,主要包括视频类、图片类、图文页面类等多种类型的资源。浏览资源是一种重要的学习方式。对于每门课程,笔者将资源分为视频资源和非视频资源两大类,并在此基础上统计两类资源的学习情况。
3.2 非视频资源学习情况
非视频资源是教学内容的载体,对于学生来说,查看非视频资源是一种重要的学习方式。非视频资源的类型可以是音频、图片、文档、课件等。教师将资源上传到平台,学生可以在线浏览或者下载使用。对于每门课程,平台统计了每位学生查看非视频资源的数量,笔者在此基础上计算每位学生的非视频资源查看率,即非视频资源查看数占非视频资源总数的比值。统计结果如表1所示。数据显示的结果表明,有四分之一的学生对非视频资源的学习积极性不高。
表1 非视频资源学习情况
3.3 视频资源学习情况
视频是重要的知识呈现形式,学生通过视频学习可以加深对知识点的理解。对于每门课程,平台统计了每位学生观看视频的时长,笔者在此基础上计算每位学生的视频观看率,即实看视频时长占视频总时长的比值。统计结果如表2所示。看视频是网络平台学习中最直接获取知识的方式,可以反映学生对课程的学习深度,数据显示的结果表明有一半的学生几乎不看视频资源,可以推测,真正发生深入学习的学生很少。
表2 视频资源学习情况
3.4 作业完成情况
平台记录了平时作业成绩,三门课程共开展作业20次,参与756人次,总体平均参与率85%,提交结果845个,总体平均分62.90分,最低分0分,最高分94分,标准差22.27,方差495.79。不同分数段的相关数据统计结果如表3所示。
表3 作业成绩统计情况
3.5 头脑风暴参与情况
头脑风暴是一种线上的,背对背的发言活动模块,它的核心思想是独立思考,独立发言,学生之间互不干扰。平台共开展头脑风暴9次,参与281人次,发表观点281个,获赞238人次。平台统计了每位学生参与头脑风暴的次数,笔者在此基础上计算了学生的参与度,统计了每个参与度占有的学生人数。统计结果如表4所示。
表4 头脑风暴参与情况
3.6 答疑讨论参与情况
答疑讨论是一种线上的、面对面的答疑或讨论的互动模块,类似于微信群的功能。平台中每一次教学都设置了若干答疑讨论活动,供学生之间、师生之间开展答疑和讨论。平台共开展答疑讨论10次,参与276人次,消息总数799个,获赞65人次。平台统计了每位学生参与答疑讨论的次数,笔者在此基础上计算了学生的参与度,统计了每个参与度占有的学生人数。统计结果如表5所示。由数据可以分析得出,四分之一的学生参与答疑讨论的主动性还有待提高。
表5 答疑讨论参与情况
3.7 测试成绩情况
测试主要用来开展课堂小测,平台记录了平时测试成绩,三门课程共开展测试7次,参与263人次,总体平均参与率85%,交卷总数264个,总体平均分70.52分,最高分100分,最低分0分,标准差28.08,方差788.66。不同分数段的相关数据统计结果如表6所示。
表6 测试成绩统计情况
4 学习效果分析
4.1 学习成绩分析
通过收集学生在课程学习过程中产生的日志数据,并对这些数据进行过滤与筛选,得出学生参与活动的情况与学生的学习成绩呈正相关的关系。本研究以学生中最高经验值为基数,超过80%(含)的为优秀,60%(含)至80%的为及格,60%以下为入门。通过统计分析,优秀学生占总人数53.54%,及格学生占总人数29.92%,入门学生占总人数16.54%。优秀学生参与活动的平均次数为14.46,及格学生参与活动的平均次数为10.3,入门学生参与活动的平均次数为8.17,显然优秀学生参与活动的次数高于及格学生与入门学生。
4.2 学习效果可视化分析
本研究采用大数据学习分析,实时量化跟踪学生的学习过程,记录学生的学习行为,并将学生的行为数据进行可视化呈现,以一种直观的形式呈现给学生、同伴和教师,使教师了解学生的学习效果,从而开展有针对性的教学活动。下面我们以一位学生在平台上产生的行为数据为例展开论述。为了保护学生隐私,暂且以A同学命名。如图1所示,这是A同学在平台上获取的经验值及其分布、参与活动、查看资源、出勤情况的可视化统计。
在大数据分析的支持下,可以全面地记录、跟踪和掌握学生的不同学习特点、学习需求、学习基础和学习行为[3]。在云班课平台上,学生的学习效果是以其获得经验值为参考指标。如图2所示,动态反映A学生获取经验值的过程,图例中,周增长经验值是A学生每周相比上一周增长的经验值,周发布经验值是教师每周发布的资源和活动的经验值(不包括点赞经验值和课堂表现经验值),学生经验值是学生总共获得的经验值。从图中可以看出,学生每周的经验值都在增加,第三周增加的幅度最大。第五周由于教师发布的经验值明显降低,学生的周增长经验值的增长幅度也降低了。最后一周,教师并没有发布新的经验值,而学生的经验值有所增加。从整体上看,说明教师的教学活动对学生的学习行为有一定的影响。
图1 A同学的经验值面板
图2 A同学的经验值报表
如图3所示,将A同学经验值和优秀同学(经验值超过总经验值80%的同学的平均经验值)及同班同学平均经验值进行对比,我们可以看出A同学各项活动的经验值均超过优秀同学以及同班同学的平均水平,说明该同学在平台中的成绩较优秀,积极参与班课活动。
图3 A同学的经验值对比
5 结束语
教学平台中学生的参与程度是影响学习效果的重要因素。本研究通过蓝墨云班课平台,获取学生的学习行为数据,通过学生与学生之间的对比、学生自身学习过程的对比,分析学习行为对学习效果产生的影响。但本研究的局限性还是存在的,首先是样本太少,只通过三个班级学生的行为数据进行分析,得出的研究结论难以推广;其次,学生的学习行为会受多方面因素的影响,仅仅从平台上获取的数据无法完全反映学生的学习效果。在今后的研究中,将进一步扩大研究的样本,可以设置实验组和对照组,进行教学实验,并融合结构化与非结构化的数据进行综合研究。