基于关联规则的《外科护理学》在线学习数据挖掘分析研究
2022-12-31沈鸣雁万鹏夏劳玲娣傅亚红冯志仙
沈鸣雁,万鹏夏,劳玲娣,傅亚红,冯志仙
浙江树人学院树兰国际医学院,浙江杭州 310015
新型冠状病毒肺炎疫情改变了全球教育生态系统[1]。作为重大突发公共卫生事件的应急之举,全国各地护理院校相继开展线上教学,实现“停课不停教”。在线教学平台保存了大量课程资源数据、学习行为数据、线上互动数据等,构成研究护理本科生在线学习模式的样本,极具大数据特征和挖掘价值。在线教学是一个复杂和系统的过程,教学数据因其变迁序列及其关系性集群,具有无序性和不确定性,对挖掘对象的广泛性、挖掘算法的复杂性、提供决策的准确性方面提出了更高要求[2-3]。关联规则作为数据挖掘技术的重要分支,通过设置最小支持度和置信度阈值对所有变量进行分析,能清晰描述一个事物和其他事物的相互关系,得到潜在、有价值的规则[4]。近年来,此规则被应用于信息、金融、医学领域,在教育领域应用较少[5-6]。对此,浙江树人学院树兰国际医学院外科护理教研组联合信息部门,运用经典的Apriori关联规则算法,对《外科护理学》线上教学多类别数据进行挖掘,得到17条强关联规则。现报告如下。
1 资料与方法
1.1 数据来源
本研究所在大学自2016年与“超星学习通”合作建立在线教学平台(以下简称“教学平台”),集课程建设、教学互动、资源管理、教学评估于一体。经3年使用,平台性能稳定,能满足开展线上教学的需求。2019至2020学年第二学期授课章节为第6版人民卫生出版社《外科护理学》的第1~18章节,共上传包括59个教学视频(含理论教学视频、实践教学课视频、直播视频),20次作业(含课前、课后),7 次章节测试。本研究以学习者在教学平台上的学习行为所留下的信息作为主要数据来源。
1.2 数据提取
所有数据由经过授权的研究人员凭借密码在系统中提取,全过程做好学生信息保护。采集数据后,使用Excel软件对数据汇总和整理,数据分为3 类。第一,从教学平台采集的学生数据,包括基本信息(班级、学号、姓名、性别、登录IP)、行为信息(视频观看时长、任务点完成百分比、反刍率、章节学习次数、总讨论数、回复讨论次数、发表讨论次数、观看视频得分、作业得分、章节测验得分、线上综合成绩)。其中,讨论区文字部分不适宜做关联规则,故将发表讨论次数高于平均值设定为“积极”。第二,从学校考务平台采集的数据,包括期末理论考试成绩、实践考核成绩。第三,通过问卷星平台提取的调查问卷数据,包括平台在线学习经历、学习终端种类(电脑、手机/平板、混合)、网络条件流畅度、学习投入度自我评价数据。
1.3 数据预处理
包括数据清理和数据离散化处理。数据清理是指进行缺失属性的填补,噪声数据消除,一致性处理。数据离散化处理是指将收集资料中的连续型的数据转化为离散型数据,以“正常/是=1”“异常/否=0”表示。经预处理后,共得到11 076项数据。
1.4 数据挖掘
应用 Apriori算法进行数据挖掘。从原始资料集合中找出所有高频项目组,表示为“Large k”;再从“Large k”中产生“Large k+1”,直到无法再找到更长的高频项目组为止。利用前一步骤的高频项目组来推导关联规则,必须满足最小支持度阈值和最小置信度阈值。由于本组数据属性较多,为查找出更多属性之间的潜在关联,使用递减的最小支持度阈值,设定最小支持度50%,最小置信度60%,提升度>1。
1.5 统计学处理
关联规则中的置信度为计数资料,使用SPSS 23.0软件进行x2检验,以P<0.05为差异具有统计学意义。
2 结果
2.1 基本资料
本研究共纳入156名学生,其中男20人、女136人;所有学生视力(含矫正视力)和听力正常;以往有在线学习经历85人;学习终端为手机80人、电脑76人;网络流畅138人、网络卡顿18人;线上学习签到率100%。
2.2 关联规则分析
通过Apriori算法挖掘出关联规则245条,再经x2检验筛选出94条规则,最后结合6名副高及以上职称的护理教育专家的专业分析,得到17条强关联规则,见表1。
3 讨论
3.1 关联规则用于在线学习数据挖掘的可行性分析
借助互联网平台推动教育模式改革已成为医学教育现代化的必由之路[7]。《外科护理学》作为护理本科生专业核心课程之一,理论与实践并重,鲜少有开展全线上教学模式的报道。与传统课堂教学模式相比,在线学习平台真实记录了学生群体的学习行为与轨迹,是教学结果的重要表征。目前教育领域的数据分析应用主要是教育数据挖掘和学习分析,其本质是以教与学为本位[8-9]。挖掘教育过程数据中的有效信息和核心价值是探索教育规律的重要依据,准确把握教育过程挖掘内涵是洞悉教育机制的关键[2]。有专家提出,不仅要借助信息处理与统计方法分析显性行为,更要关注学生感知和体验的内隐性情境认知数据[10]。本研究联合高级信息工程师,采集156名本科生的线上学习过程数据、评价数据、交互数据等,应用Apriori算法进行关联规则分析,经过严谨的数据预处理和支持度约束设置确定频繁不独立项集的范围,缩小产生规则的项集空间、减少冗余规则。再使用x2检验进行规则有效性的验证,对规则前后项之间的相关性度量进行分析,检验2组或2组以上样本间的差别及变量间的关联性,得到既符合要求又有统计学意义的94条关联规则。为更好地满足对挖掘结果的高效用性要求,凸显与数据本身密切相关的丰富的领域知识[11]。本研究邀请了教学专家进行深入分析,结合护理教育领域知识,加深洞悉,注重规则的情境性、实用性,最终得到17条强关联规则,以期为护理本科在线教学研究提供新视角和基于实证的理论依据。
3.2 学习过程与效果之间的关联性分析
3.2.1章节学习次数与反刍率
教学结果是多因素叠加的累积效应,学习时长可反映学习努力程度。已有研究显示,学习者观看视频时长的多少与测试得分高低呈正相关[12]。本研究调取的章节学习次数与反刍率可反映学习时长。规则1、15显示,章节学习次数>平均值与期末理论考试及格呈强关联。规则2、14、16显示,反刍率大于100%与线上成绩和期末理论成绩呈强关联。从“学”的角度而言,反刍率反映了学生课件观看反刍时长,有助于知识记忆和内化,促进知识体系建构。从“教”的角度而言,反刍率一定程度上反映了线上学习内容的难度,学生需要反复观看才能理解掌握。提示教师应动态跟踪学生的学习轨迹,分析反刍率高的原因,采取针对性的强化巩固措施,切实提高教学效果。
3.2.2交互行为对学习效果的影响
贯穿于课中及课后的师生交互和生生交互是促进深度学习发生的重要渠道。有研究对1 014名本科生调查发现,虽然在线学习平台提供了更多师生交流互动的机会,但仍存在交互不深入的现象[13]。本研究中,线上讨论包括学生自发讨论或教师根据课程进度组织相关讨论。规则7、12、14~17均提示讨论积极与学习成绩有强关联。提示教学平台建设过程中强化交互方式和功能,教师可组织开展有挑战性和情景性的交互学习活动,如引入游戏机制提升学生兴趣和动机,引导学生从被动学习向主动学习、联结式学习转化。在线学习资源质量是实现人机交互的关键要素[14]。教师应注重信息化教学能力的提升,制作高清晰度的视频、清楚和易于理解的音频,课程时长控制在15~20 min,从而提升学习效果。
3.3 在线学习经历和基础条件与学习效果之间的关联性分析
教育信息化高速发展的当下,大学生习惯于屏幕学习,碎片化、移动化、数字化获取知识的学习行为[15]。在线教学的基础条件包括数字资源、学习设备、网络速度等。规则6、7显示,有在线学习经历与综合成绩、讨论积极呈强关联,提示有在线学习体验的学生接受度较高。规则4、5显示,网络条件好、学习终端为电脑与期末理论考试及格呈强关联,提示了在线环境对于学习效果的作用,流畅的网络条件有助于保障信息反馈速度、资源的易获取性,提升在线学习效果。在学习终端的选择上,电脑因其界面大、功能齐全,是首选的学习终端。使用手机端的学生不仅易受网络娱乐信息吸引而中止学习,还有研究发现,手机依赖是学业倦怠的重要影响因素之一[16-17]。因此,教师应重点加强无在线学习经历、手机端学习的学生的关注与干预力度。
3.4 学习投入度与学习效果之间的关联性分析
在线学习行为是影响学习成效的关键因素,但并不是唯一因素[18]。作为学习主体,学习投入是指学生开始和执行学习活动时的情感和行为投入,是预测学习效果的重要因子之一,直接影响学生的学习质量、学业成绩、核心能力等[19]。本研究提取学习投入度自评量表的分值进行数据挖掘,规则8~10显示,学生精力、专注力、动机高于平均值,与期末理论考试成绩呈现强关联。规则17,讨论积极/线上综合成绩80~100分的学生,与章节一的测验成绩、期末理论与实践考试成绩呈强关联,提示在线学习投入有助于预测在线学习效果。教师可基于各种学习动机理论激发学生的学习动机,从内源和外源两个视角提升投入度,如以学习者视角开发在线课程、保证平台功能实用且易用、增强学生的归属感和满意度等。完善对学生学习投入度的评价,指标包括课件学习时长、资源访问量、任务完成度、作业质量、交互对象和内容等。此外,随着信息化技术的发展,今后可利用眼动追踪技术、电生理测量技术等实时测量学生的认知加工情况和情感状态;通过社会网络分析、情感计算、文本挖掘等对学习过程中表现出来的情感、态度做出在线评价[20]。
3.5 形成性评价与学习效果之间的关联性分析
在线教学平台的智能化、实时性为形成性评价提供了便利[21]。形成性评价是指教学过程中为获得有关教学的反馈信息、改进教学,对学生所学知识掌握程度进行系统性评价,是保证本科人才培养质量的重要手段[22]。本研究中的线上综合成绩是由平台按教师设置好的评分项目及权重自动生成,包括章节学习次数(10%)、课程视频(30%)、章节测验(30%)、作业(20%)、线上互动参与(10%),允许学生实时查看。规则3、11、12、14、16、17显示线上综合成绩80~100分与期末理论考试成绩、反刍率、积极讨论呈强关联,提示基于在线教学平台的多元化评价体系有助于实现足够细粒度的形成性评价,辅助教师及时对学生进行全面、客观、准确的评价。规则11、13、14、16、17中均出现“章节一测验成绩”与外科综合成绩之间呈强关联,该章节考核内容涉及水电解质和酸碱平衡、休克护理内容,是以往考试中错误率较高的内容,不仅提示了章节一成绩可作为预测期末理论成绩的指标,还提示学习任务的难度与学习成绩存在强关联。教师要利用反馈机制促进上述内容的教学方案和评价体系的再设计,引导学生运用所学知识、加深对知识的理解和巩固,打好外科护理学理论基础和思维模式。
3.6 本研究局限性及今后研究方向
本研究对某学院《外科护理学》群体学习者多类别数据线上学习数据采集、处理和分析,得出17条强关联规则。虽然研究数据来源于一家学院,在全面性上存在不足,但在数据提取、关联规则挖掘、冗余规则处理上值得借鉴。今后研究方向在于:扩大在线学习数据采集范围,选取不同年级、不同课程的学生学习群体进行数据挖掘研究,作为洞察在线教育过程全貌并支持改进的突破口。构建线上学习群体用户画像,从学生学习行为、学习内容、学习结果的角度进行属性标注,体现每位学习者的独特性,构建对改善教学质量有意义的决策支持模型。探索建立线上教学改革团队,分析障碍因素,促进在线护理课程的完善和教师素养的提高。