基于学生成绩的高职医疗设备应用技术专业课程相关性分析
2019-12-23丛茂柠
摘 要:目的:分析高职医疗设备应用技术专业基础课与专业课之间的相关性,为相关专业在课程设置和教学管理上提供参考;方法:采用SPSS25.0和SPSSModeler对南京卫生高职校医疗设备应用技术专业近5年110名学生的20门课成绩进行了简单相关分析、典型相关分析、多元线性回归分析和关联规则分析;结果:该专业的基础课和专业课之间高度相关(典型相关系数0.864,P<0.01),基础课中临床医学概论、物理、电工技术、模拟电子技术、数字电子技术、单片机原理等课程对后期专业课程的影响程度较大,专业课中医疗设备管理和医疗器械概论对前期基础课的依赖程度较小;结论:医疗设备应用技术专业课程设置跨度较大,对专业基础课应给与高度重视才能培养出符合行业需求的高素质、技能型复合人才。
关键词:医疗设备应用技术专业;简单相关分析;典型相关分析;回归分析;关联规则分析
基金项目:江苏省教育科学“十三五”规划课题课题“建立医疗设备应用技术专业课程设置与从业能力相关性模型的研究”(项目编号:B-b/2018/03/27)
作者简介:丛茂柠,男,高级讲师,主要研究方向为临床医学工程教学。
中图分类号:G712 文献标识码:A 文章编号:1674-7747(2019)14-0034-08
医疗设备应用技术专业是医学与工程相结合的交叉专业,课程涉及临床医学基础知识、电子和机械知识、计算机及各类医疗设备原理,知识结构跨度大,课程设置的合理性就显得尤为重要。学生的成绩不仅可以反映个体学习的情况,而且还包括了课程间的潜在联系,从中寻找对课程设置有价值的信息将有利于教学质量和教學效果的改善[1],从而提高人才培养的质量[2],这也将直接影响到学生的就业和学科的发展。[3]通过对学生成绩的分析,不仅能探讨学生成绩评价的科学性,而且可以挖掘出课程之间的相关性,并将分析结果用与指导专业课程的设置,为改进教学方式,促进课程改革和专业建设提供必要的支持。
一、数据分析的对象及工具
本文数据选用了南京卫生高职校医疗设备应用技术专业2014年—2018年间110名学生20门课程的成绩,其中有10门专业基础课和10门专业课,使用SPSS25.0统计分析软件进行课程间的简单相关分析、典型相关分析和多元线性回归分析,使用SPSSModeler数据挖掘软件进行课程关联规则的分析。
二、课程的相关性分析
(一)数据预处理
首先,对从成绩数据库中导出的数据进行清洗和格式转换,以符合数据分析的要求。考试的成绩以首次成绩为准,不计算补考及重修后的成绩。对留级学生的成绩进行合并处理,去除冗余数据。因特殊原因缺失成绩较多的记录,将其删除;缺失成绩较少的记录,采取邻近点线性趋势方法来填补缺失值。
其次,根据专业常识和教学安排,将20门课程分成5组,并给每门课程赋予相应的变量名,如表1所示,以方便后期处理。
最后,通过散点图(如图1),预观察变量间的线性趋势。根据图1所示,变量间基本成线性趋势,学生的成绩也基本成正态分布。
(二)基础课与专业课之间的简单相关分析(Pearson相关分析)
Pearson系数r是用来衡量课程间联系紧密度的统计指标。当|r|≥0.5 并且显著性检验的 p<0.05时,说明两课程显著相关;当0.3≤|r|<0.5 并且显著性检验的 p<0.05 时,说明两课程低度相关;当|r|<0.3,说明两课程在统计意义上不相关。通过Pearson相关分析,基础课与专业课之间的Pearson相关系数如表2所示。
(三)基础课与专业课的典型相关分析
典型相关分析是借用主成分分析降维的思想,在两组变量中都选择若干有代表性的综合指标(变量的线性组合),综合指标能包含大部分原变量组的信息,通过研究两组综合指标之间的相关关系来反映两组变量之间的相关关系,是将两组变量之间的多重线性相关研究转化为两个典型变量之间的简单线性相关研究。
1.数据的降维处理。不论是基础课之间还是专业课之间,均存在一定的共线性问题,通过降维处理,减少变量间的重叠信息,便于进一步分析处理。此环节采用主成分分析法进行降维处理。[4]
以专业课1为例,第一主成分特征值为4.056>1,方差解释率57.945%;其后的主成分特征值均<1,所以此处只提取第一主成分,根据成分得分系数矩阵可列出第一主成分表达式,所有主成分表达式如表3所示。
2.典型相关分析。使用SPSS的典型相关分析功能,计算z1,z2,z3和z4,z5这两组典型变量之间的典型相关系数和显著性检验系数,只得到一对典型变量的P<0.01,其典型相关系数是0.864,说明这一对典型变量能够解释86.4%的信息量。根据标准化典型系数表,可得基础课的典型变量表达式为:U1=0.168z1+0.004z2+0.861z3;专业课的典型变量表达式为:V1=0.780z4+0.337z5。
(四)专业课程的多元线性回归分析
线性回归是分析变量间数量依存关系的统计分析方法,1门专业课同时受多门基础课的影响,通过构建多元线性回归模型来对专业课程进行分析和预测,图2~4和表4是以常用医用电子仪器课程(y11)为例。
1.残差分析与条件检验。图2~4说明成绩数据和残差近似服从正态分布,回归标准化残差与标准化预测值散点图数据点在正负3个标准差以内,无异常点。
2.建立多元线性回归方程模型。模型摘要和ANOVA方差分析数据显示,R2=0.636,模型解释度较好(>0.5),F统计量36.387,P=0.000,结果有统计学意义。根据系数表4,可以写出因变量常用医用电子仪器(y11)的回归方程,y11=18.766+0.198x22+0.351x31+0.318x32-0.150x33+0.251x34。所有专业课的回归方程见表5。
(五)基于关联规则的相关分析
简单相关分析和典型相关分析均无从判断课程前后顺序设置的合理性[5],可以通过关联规则法来进一步挖掘课程间的相互关系,更好地了解成绩背后的规律。[6]目前,以数据挖掘为理论指导的相关性研究中,应用最多的是基于Apriori算法的关联规则法。[7]本文使用SPSSModeler中的Apriori算法,通过设置前项课程与后项课程,得到课程间的关联规则。
1.成绩的离散化处理。关联规则分析针对的是离散数据,本文综合考虑了每次考试会因难易程度不同而导致成绩差异,对成绩离散处理的方法是:依据正态分布原则,将成绩分为四个档次,A=前10%;B=其后40%;C=A和B之后的40%;D=最后的10%;离散化后的成绩单如表6所示。
2.关联规则分析。在SPSSModeler中将基础课作为前项,专业课作为后项,设置有效性指标最小支持度为20%,最小置信度为70%,共挖掘出76条信息,如表7所示。
三、讨论
(一)方法讨论
简单相关分析(Pearson相关)、典型相关分析和线性回归分析都属于经典统计学分析,各有其特点。简单相关分析用于两个变量之间的相关性,当需要分析一组变量和另一组变量间的相关性时,就要用到典型相关分析;这两种方法可以确定相关关系的性质、方向和密切程度,但是要构建变量间的数量依存关系来进行预测和控制,就需要使用回归分析。相关分析是回归分析的基础和前提,两者需要结合起来才能更好的达到研究的目的。在如今大数据背景下,研究的關注点从样本到数据总体[8],随着数据挖掘技术的成熟,可以通过关联分析、决策树、人工神经网络等方法探索更多非线性、高维性数据背后更有价值的信息。
(二)课程相关性讨论
1.简单相关分析结果。根据表2,可以初步从基础课和专业课两个视角分别观察课程间的两两相关性。从基础课电工技术(x31)的视角,发现与其显著相关的专业课程有常用医用电子仪器(y11)、医用传感器(y15)、血透机原理与维修(y16)、医用电动器械(y17)和计量与质控(y22);从专业课常用医用电子仪器(y11)的视角,看出与其显著相关的基础课程有临床医学概论(x11)、人体解剖生理学(x12)、物理(x21)、电工技术(x31)、模拟电子技术(x32)和单片机原理(x34),成绩之间呈正相关且P<0.05,其余情况不再赘述。结果提示我们在今后的教学中,要深刻认识高相关性课程之间存在的密切关系,加强基础课教学,做好课程间的衔接,这是学生学好专业知识的关键。
2.典型相关分析结果。根据表3~6所示,典型相关系数为0.864,说明基础课和专业课之间高度相关,联系密切。从基础课典型变量表达式U1可以看出,电子类的基础课(x3)典型系数(0.861)最大;其次是医学类基础课(x1)的典型系数(0.168),最小的是公共基础课(x2);说明在该专业的基础课中,电工技术、模拟电子技术和单片机原理等电子类的课程非常重要,对后期的专业课程影响较大,其次是临床医学概论和人体解剖生理学,而计算机语言和计算机组装与维修等公共课程的影响相对较小。从专业课典型变量表达式V1可以看出,设备原理类课程(y1)的典型系数(0.78)最大,其余几门专业课程(y2)的典型系数(0.337)较小;说明常用医用电子仪器、影像设备学和医用电动器械等设备原理类课程在专业课中非常重要,其次是医院设备管理、计量与质控和医疗器械概论。从各课程的载荷(表6)上看,x11,x31,x32,x34的载荷值>0.7,说明临床医学概论、电工技术、模拟电子技术、单片机原理在基础课中影响度较大;y11,y12,y13,y15,y17的载荷值>0.7,说明常用医用电子仪器、医用检验分析仪器、影像设备学、医用传感器、医用电动器械这些课程的重要性较高。数据结果与前述基本一致,证明典型相关分析的结论具有较好的可信度。
3.回归分析结果。以常用医用电子仪器课程(y11)为例,从表8中的方程可以看出,电工技术(x31)、模拟电子技术(x32)和单片机原理(x34)的回归系数较大,决定系数R2=0.636,说明这三门课的成绩能解释63.6%y11的信息,对常用医用电子仪器(y11)课程的影响较大,其余课程不再赘述。根据回归方程模型,可以为后续专业课的成绩预测做参考。方程中的个别自变量系数为负值,原因可能是课程之间还存在共线性、样本容量不够大或考试成绩不能反映真实情况造成的。超声诊断仪器(y14)、医院设备管理(y21)和医疗器械概论(y23)这三门课程回归模型的R2值较低,说明相应模型尚不能很好的预测成绩,同时也反映了这几门课程与基础课间的相关性不高。
4.关联规则分析结果。根据表10可以挖掘出前项某一门或某几门基础课对后项专业课的影响和制约关系。例如:前期人体解剖生理学和数字电子技术两门课的成绩是C档,那么后期影像设备学的成绩也是C档的概率>76%;前期模拟电子技术和计算机语言是B档,后期的常用医用电子仪器也是B档的概率>73.9%。通过梳理、归并挖掘出的76条信息,得出以下四点结论:(1)对影像设备学影响较大的基础课程有人体解剖生理学、模拟电子技术、数字电子技术、计算机语言、临床医学概论、电工技术和物理。(2)对医用检验分析仪器影响较大的基础课程有计算机语言、模拟电子技术、数字电子技术、物理、临床医学概论、人体解剖生理学和单片机原理。(3)对医用电动器械影响较大的基础课有单片机原理、电工技术、模拟电子技术、数字电子技术、临床医学概论和单片机原理。(4)对常用医用电子仪器影响较大的有模拟电子技术和计算机语言。前期基础课成绩对后期专业课影响的概率在70%以上。
四、结语
本文所述分析方法和结论尚存在许多不足之处:样本量受限于专业的学生数而略显不足;部分课程的成绩因考核评价方法等原因,导致成绩不能完全真实的反映实际学习情况,不完全符合正态分布。定量分析中出现数据结论与专业知识相悖的情况,应服从专业解释,不能一味的唯数据论。
医疗设备应用技术专业的毕业生有很多都是未来的临床医学工程技师,要求的知识结构跨度大,必须在原有院校专业知识学习的基础上进行再学习、再拓展、再充实,这样才能更好地适应医院临床医学工程专业工作。[9]通过对成绩数据的分析和挖掘,可以得出在统计意义上显著相关的课程、不同类别课程间的整体相关性以及课程间的相互影响制约程度,这对学校课程的合理编排、课时分配、优化设置、学生成绩预警等均起到积极的参考作用。教师可以根据专业特色和学生的学情,优化教学内容、有针对性的改进教学方法并评价教学效果,从而科学、合理、高效的培养学生良好的职业素养,为行业输出高质量的专业人才。
参考文献:
[1] 储速梅.基于SPSS的成人教育课程设置相关性分析[J].科教导刊(上旬刊), 2016(6):105-106.
[2] 吴文玲.基于数据挖掘技术的课程相关性分析及其应用研究[D].成都:四川师范大学, 2018.
[3] 杨明霞.课程相关性分析探讨——教育技术学课程关联分析[D].上海:华东师范大学,2008.
[4] 王和勇,洪振钦.基于典型相关分析的科技民生发展对策的实证研究[J].信息系统工程, 2018(3):141-146.
[5] 宋小敏,張国防,邢淑兰,等.基于数据挖掘的课程相关性分析方法[J].山西财经大学学报, 2012,34(S3):240-257.
[6] 刘世欢.基于教育数据的相关性分析研究[D].杭州:浙江工商大学, 2018.
[7] 王成勇.基于关联规则Apriori算法的学生成绩分析[J].价值工程, 2018,37(5):171-173.
[8] 梁吉业,冯晨娇,宋鹏.大数据相关分析综述[J].计算机学报,2016,39(1):1-18.
[9] 汤黎明,申倩,张宇翔.医院临床医学工程人才知识结构构成的探讨[J].医疗卫生装备, 2014,35(11):141-142.