基于PLS-SEM的预防医学专业《卫生统计学》教学评价模型构建*
2021-05-08罗明明罗江洪吴春眉
王 琪 罗明明 罗江洪 吴春眉 许 琪 邱 伟△
【提 要】 目的 构建预防医学专业《卫生统计学》教学模型,对其进行评价,旨在为预防医学专业《卫生统计学》教学效果评价提供合理有效的工具,为改进教学效果提供依据。方法 以某高校2014-2017级预防医学专业本科生为研究对象,以课程认知度、学习行为情况、师生沟通度、知识掌握度和课程满意度为潜变量构建PLS-SEM模型,从模型的信度、效度、效果等方面对模型进行考评。结果 模型的Cronbach′s α值为0.910,分半信度为0.740;各潜变量的Cronbach′s α值在0.700~0.839,组合信度在0.829~0.899,AVE值在0.553~0.749;所有潜变量的相关系数均低于AVE平方根值;模型的外部因子载荷在0.599~0.893;模型的路径系数、外部因子载荷均有统计学意义。各潜变量对知识掌握度(内生潜变量)的解释程度为62.0%。结论 本次构建的预防医学专业《卫生统计学》教学效果评价模型具有较好的信度、效度和解释能力。
预防医学是以人群为研究对象,探讨预防疾病、延长寿命的学科[1]。预防的各项工作,诸如病因探索、病因验证、疾病预测等都离不开统计的应用。作为预防专业的学生,应该具备良好的统计学思维和应用能力[2]。受限于预防医学专业在全国高校中的数目较少,针对预防医学专业《卫生统计学》教学效果评价的研究也相当缺乏。本研究采用偏最小二乘回归下的结构方程模型(partial least squares structural equation model,PLS-SEM)构建预防医学专业《卫生统计学》教学模型(以下简称“模型”),对其进行评价,旨在为预防医学专业《卫生统计学》教学效果评价提供合理有效的工具,为提升教学效果提供评价依据。
对象与方法
1.调查对象
本研究以某高校2014-2017级预防医学专业学生为研究对象。在2014-2017级预防医学专业学生学习《卫生统计学》的学期,经培训的调查员采用不记名方式在学生课外时间进行问卷调查。问卷调查前已征得所有被调查学生的同意。本次调查共发放问卷402份,收回问卷366份,回收率91.04%,有效360份,有效率98.36%。将360份调查问卷随机分为两组,其中第一组数据(180份)用来构建预防医学专业《卫生统计学》教学模型,另一组数据将在教学评价模型构建好以后用于模型评价。
2.问卷设计
通过查阅文献、访谈、预调查等方法,设计调查问卷。问卷包括课程认知度、学习行为情况、师生沟通度、课程满意度以及知识掌握度5个维度共19个条目。
课程认知度反映学生对本门课程感知的主观价值。根据期望值理论,Wigfield及Eccles认为学生感知课程重要性(成就价值)或有用性(效用价值)将影响其学习投入[3-4]。Cybinski及Selvanathan在对本科生统计学学习方式和学习效果的研究中发现,学生对统计学重要性等主观感觉会影响其对统计的学习行为,进而影响其效果[5]。此外,许多学者的相关教学研究也同样证实,自我感知价值高且对未来目标有用的课程会积极影响学生进行学习的行为意图[6-8]。据此,拟定课程认知度的3个条目:对课程重要性的认识(A1)、对课程实用性的认识(A2)以及对课程必要性的认识(A3)。同时设置模型的第一条路径:课程认知度→学习行为情况。另外,考虑到课程认知程度可能从主观上会对课程满意度产生影响,设置第二条路径:课程认知度→课程满意度。
学习行为情况参考建构主义学习理论、认知学习理论构建相关条目。早在1985年,Newble、Gordon就提出学生的学习方式和学习方法可能对学习效果有重要影响[9],Cybinski及Selvanathan的研究中也同样提到了学生对统计的学习行为会影响统计学习效果[5]。Mansouri等认为学生的学习风格和/或学习方法等会影响学生的学习成绩[10-11]。据此,拟定学习行为情况的4个条目:课程的学习兴趣(B1)、课程知识学习的主动性(B2)、学习课程的难度(B3)、扩展课外学习的主动性(B4)。同时设置模型的第三条路径:学习行为情况→知识掌握度。
师生沟通是教学过程所有阶段的要求。师生间的交流可以将教师、学生、学习内容、技术设施等建立相应的联系[12-13]。Offir等认为师生互动对于学习者的学习过程具有非常重要的作用,通过师生沟通可以保障教学质量,提高学习效果[14-15]。研究还表明,互动沟通的学习经历对学生的成绩和满意度有积极的贡献[13,16-18]。基于此,拟定理论教学过程中的参与度(C1)、课后同伴交流的参与度(C2)、实验教学过程中师生交流的参与度(C3)、课后与教师交流的程度(C4)、涉及统计学各项课题的参与度(C5)5个条目来反映师生沟通情况。同时设置路径:师生沟通度→知识掌握度;师生沟通度→课程满意度。另外考虑到学生在开展学习的过程中,会通过师生、生生交流来促进知识掌握,因此补充路径:学习行为情况→师生沟通度。
知识掌握度参考本杰明·布鲁姆的学习层次分类法进行学习效果评估[19-20],结合卫生统计学自身的特点以及可行性,归为四类:理论知识的掌握程度(D1)、具体的学习方法和统计思路形成情况(D2)、知识的应用程度(D3)、知识体系构建程度(D4)。因知识的掌握情况会影响学生对课程的满意度,故设置路径:知识掌握度→课程满意度。
课程满意度参考顾客满意度理论[21],从学生的角度出发来进行满意度评估。学生接受教师的教学服务,可视其为特殊的“顾客”。通过学生在学习本门课程前后主观感知的教育质量与预期的差距来反映学生对本门课程的满意程度。基于此,拟定教学内容满意度(E1)、教学方法、教学过程(教学方法、知识点的时间安排)的满意度(E2)以及教师水平的满意度(E3)来反映课程满意度。
综上,通过3个外生潜变量(课程认知度、学习行为情况、师生沟通度),2个内生潜变量(知识掌握度、课程满意度)构建教学评价模型。从知识掌握度、课程满意度来反映综合教学效果。知识掌握度受课程认知度、学习行为情况、师生沟通度的影响,其中学习行为情况、师生沟通度为直接影响,课程认知度对知识掌握度的影响为间接作用;课程满意度受课程认知度、学习行为情况、师生沟通度和知识掌握度的影响,其中课程认知度、师生沟通度和知识掌握度对课程满意度起直接影响作用,学习行为情况对课程满意度的影响为间接作用。外生潜变量与内生潜变量的关系通过图1反映。各条目采用里克特5级评分(1表示“非常不赞同”,5表示“非常赞同”)进行测量。条目中缺失数据采用线性内插法填补。具体条目见表1。
图1 预防医学专业《卫生统计学》教学效果评价模型
表1 模型中的潜变量与测度指标
综合考评成绩通过形成性评价和终结性评价相结合的方式计算。以学生期末理论成绩为终结性评价成绩;以实验报告成绩和考勤情况为形成性评价成绩。其中终结性评价成绩占比70%,形成性评价成绩占比30%。
3.样本量的估计
根据结构方程模型样本量估计方程[22]:50r2-450r+100(r=观测变量数/潜变量数)算得构建《卫生统计学》教学效果模型的最低样本量应为112。本次研究共获得有效问卷360份,将其随机分为两组进行建模和验证,样本量均能满足结构方程模型的要求。
4.统计分析方法
采用EpiData3.1建立数据库,并进行双人双录入;对“学习课程的难度”B3进行反向赋分转换后,运用SPSS 21.0进行信度分析以及调查对象一般资料的描述;运用德国汉堡大学Ringle等开发的SmartPLS 3.1.2软件构建PLS-SEM[23],验证模型的合理性。
模型评价指标:①模型的信度,通过Cronbach′sα系数、组合信度(composite reliability,CR)、分半信度反映。一般要求信度系数>0.7[24-25];②模型的效度,通过聚合效度和区分效度反映。聚合效度通过平均方差提取值(average variance extracted,AVE)、因子载荷来评价。一般要求AVE值>0.5[26]、因子载荷>0.7[27]。区分效度由AVE平方根和潜变量-潜变量间的相关系数共同评价。若AVE平方根值远高于潜变量-潜变量间的相关系数值,则模型区分效度较高[26];③模型效果评价,通过模型的总体适配度、解释能力、因果关系、预测能力反映。模型的总体适配度通过适配度(goodniness of fit,GOF)来反映,GOF>0.36时认为模型整体适配度较好[28]。模型的解释能力由R2、外部权重、外部因子载荷来反映,要求所有潜变量的R2值>0.2。通过路径系数及Bootstrapping检验结果反映模型变量间的因果关系[28]。通过冗余反映变量内外部关系的预测能力,一般要求冗余值>0.325[22,29]。检验水准α取0.05。
结 果
随机抽取的180份样本中,男生59人,女生120人,缺失1人。2014级33人,2015级50人,2016级49人,2017级48人,平均年龄(20.72±0.94)岁。《卫生统计学》综合考评平均成绩(77.33±8.53)分。
问卷的信度、效度、模型评价结果见表2~表4。
表2 模型拟合情况#
表3 潜变量间路径系数Bootstrapping分析结果
表4 模型外部权重及因子载荷分析结果
问卷Cronbach′s α值为0.910,分半信度为0.740;表2中,各潜变量的Cronbach′s α值在0.700~0.839,组合信度在0.829~0.899,具有较高的信度。
表2中各潜变量的AVE在0.553~0.749,具有较好的收敛效度;所有潜变量的相关系数均低于AVE平方根值,模型具有较好的区分效度;表4中,除A3←课程认知度、B1←学习行为情况、B4 ←学习行为情况的外部因子载荷稍低于0.7外,其他因子载荷均高于0.7,具有一定的聚合效度。
模型GOF值为0.485,整体适配度较好。各潜变量的R2值在0.255~0.620;Bootstrapping分析结果显示潜变量间的路径系数、潜变量与观测变量间的外部权重及外部因子载荷均有统计学意义,具有一定的解释能力,因果关系成立。知识掌握度的冗余值为0.463,具有较好的预测能力,课程满意度冗余值为0.220,预测能力略弱。
知识掌握度与学生综合考评成绩的相关系数r为0.736,课程满意度与学生综合考评成绩的相关系数r为0.523,差异均有统计学意义(P<0.001)。
讨 论
目前,使用最广泛的SEM估计方法为最大似然估计(maximum likelihood,ML)法。应用ML法进行模型估计时,要求样本量比较大,且要求观测数据满足正态分布[30]。PLS法是从主成分分析发展而来,具有很强的解释与预测能力,对样本数据的分布没有严格的要求,小样本的结果依然稳健[31]。本次研究的数据不满足正态分布,故选择PLS法进行模型估计。
本次研究以2014-2017级四届预防医学专业学生为研究对象,构建了预防医学专业《卫生统计学》教学效果的评价模型,并对其进行评价。考虑到教材的更新和教学方法的不断优化对模型的影响,本次研究连续调查了4届学生,获得的数据具有较好的代表性。本次构建的模型Cronbach′s α值和分半信度值均超过最低阈值水平0.70,说明模型具有较高的可靠性[23-24]。所有潜变量的AVE值均高于最低阈值0.50[25],这表明模型具有较好的收敛效度。与潜变量间的相关性相比,每个潜变量提取的差异都更高,表明模型具有较好的区分效度[25]。Fornell等提出因子载荷应该不低于0.70[26]。Hulland等认为,因子载荷最小的可接受标准为0.4[32-33];Hair等认为,在确定每个条目因素负荷的相对重要性和显着性时,大于0.30即可被认为是重要的;因子载荷超过0.50或者更高被认为是非常重要的[34]。本次研究构建的PLS-SEM模型因子载荷在0.599~0.893。其中,A3←课程认知度的外部因子载荷为0.651、B1←学习行为情况的外部因子载荷为0.599、B4←学习行为情况的外部因子载荷为0.657,其他外部模型载荷均大于0.70。根据上述标准,可以认为模型具有一定的聚合效度。
模型的GOF值高于0.36,可以认为模型总体适配度较好。各潜变量的R2值均大于0.2,模型的路径系数、外部因子载荷等均有统计学意义[27],可以认为模型具有一定的解释能力,因果关系成立。知识掌握度、课程满意度与学生综合考评成绩均呈正相关,差异均有统计学意义。知识掌握度的冗余值为0.463,具有较好的预测能力,课程满意度冗余值为0.220,预测能力略弱。通过模型的信度、效度以及模型评价结果,总体可以认为预防医学专业《卫生统计学》教学效果评价模型是可行的,有效的。R2描述了依赖潜变量的解释方差的程度,并用于确定模型中变量的解释能力[35]。根据Hair等[36],R2的值不应低于0.2,本次研究的所有潜变量的R2值均高于该标准。其中,内生潜变量知识掌握度的R2值为0.620,提示课程认知度、学习行为情况和师生沟通度解释了知识掌握度中62.0%的变异。
本次研究还存在一些不足。首先,本次研究所用问卷为参考国内外教学相关领域的文献自行设计的问卷,而查阅到的统计学教学相关的文献较少,虽根据学科特色对问卷进行了更改调整,难免会有遗漏部分相关指标的可能;另外,问卷所设计的观测变量为主观评价指标,导致结果会受到主观判断的影响。目前《卫生统计学》教学采用线上、线下混合教学模式,其中部分观测变量可以通过线上教育平台的一些环节设计来进行客观的评价,以弥补其不足;其次,因本校各年级预防医学专业学生人数不多,通过随机抽样研究获得的样本恐不足以构建及验证PLS-SEM模型,故采用目的抽样法对2014-2017级全部预防医学专业学生(学习《卫生统计学》后)进行问卷调查,这也是本研究的缺陷之一,但因该模型尚初步建立,今后将通过加大样本量,补充层次更丰富的数据来验证和优化此模型;最后,本次研究对象仅局限于预防医学专业学生,其他专业的医学生也接受了统计学相关知识的学习,为了解其他医学专业学生对统计学知识的掌握情况、课程满意度,以及模型的外推适用性,后续研究可扩大研究对象的范围,对模型进行进一步探讨,以期为所有学习统计学的学生提供有效的评价模型,为提高学生的统计学知识提供有力的参考。