行为投入与学业成就关系的元分析研究
2021-10-28孙丽娜王艺霏张晓光
孙丽娜 王艺霏 张晓光
(1. 东北石油大学 计算机与信息技术学院,黑龙江 大庆 163318;2. 东北师范大学 信息科学与技术学院,吉林 长春 130117;3. 东北石油大学 机械科学与工程学院,黑龙江 大庆 163318)
一、问题的提出
近年来,学习投入一直是教育研究者关注的主题。虽然学术界关于学习投入的定义和组成要素还没有达成共识,但普遍认同学习投入由行为、认知和情感投入三部分构成(Wang & Eccles, 2013)。其中,行为投入作为学生学业成就的重要预测指标,以其“易观察”的显著特征得到了广泛的关注(Ramirez-Arellano, Bory-Reyes, & Hernández-Simón,2019; Finn & Zimmer, 2012)。
行为投入定义可以从积极参与活动和消极参与活动两个角度进行界定,即“投入”的正反两方面。从“投入”的正面分析, Fredricks、Blumenfeld和Paris(2004)综合了以往研究者的看法和结论,认为行为投入是指学生积极参与学校学术和非学术活动;从“投入”的反面分析,即消极的行为投入,主要表现为倦怠(Salanova, Schaufeli,Martínez, & Bresó, 2010)、脱离(Martin, Anderson,Bobis, Way, & Vellar, 2012)或不满(Skinner, Furrer,Marchand, & Kindermann, 2008)等行为。
综合以上研究者的定义,本研究将行为投入定义为学生表现出积极或消极参与学校课内活动(包括在线学习活动)的学习行为。有研究表明,行为投入是影响学业成就的重要因素(Martin, 2007;刘哲雨,王志军,2017)。但也有研究者发现行为投入与学业成就并不是显著相关(Ramirez-Arellano et al.,2019; Baranova, Khalyapina, Kobicheva, & Tokareva,2019)。因此,行为投入与学业成就之间的关系探究还需要更充分的定量数据进行支撑。元分析方法是对同一主题的多项独立定量研究结果再次分析的定量统计分析方法,从而总结出具有普适性的研究结论(Glass, 1976)。
综上所述,本研究的研究问题分为两部分:第一,利用元分析方法对行为投入与学业成就已有研究进行分析,探究两者的整体相关度;第二,通过对相关研究进行要素编码、抽取,总结出显著影响行为投入与学业成就关系的调节因素,并提出与之对应的实践策略。
二、文献综述
(一)行为投入测量
从定义中可以发现,衡量行为投入的指标主要集中在努力、持续、注意力特征上,既可以通过教师报告或学生自我报告(Olivier, Archambault, &Dupéré, 2018),还可以利用在线平台记录的学生登录平台次数(Ahammed & Smith, 2019)、论坛互动次数、完成作业次数(Strang, 2017)等数据汇报学生行为投入度。有研究者将行为投入测量特征(包括投入度、注意力和自力更生)的整合作为培养课堂“行为投入型”儿童的测量方法,通常表现为遵守教师的指导和课堂规则、专注于学习活动、保持持续的注意力以及投入大量毅力(Guo, Sun, Breit-Smith, Morrison, & Connor, 2015);还有研究者将行为投入划分为个体行为投入度和课堂行为投入度两部分(Robinson & Mueller, 2014);在线数据方面,从学习行为层面,有研究者将行为的次数、频率作为学习行为的分类指标(于玻,徐珺岩,谭律岐,2020),还有通过学习管理系统(Moodle)中的登录频次、课程资源访问次数以及讨论区回贴次数来衡量学生投入度(张雯雯,姜强,赵蔚,2020)。
(二)行为投入与学业成就
很多研究证明,行为投入与学业成就高度相关。一方面,研究者从积极的行为投入出发,如小学生的行为投入与阅读和数学测试分数呈现正相关(Dotterer & Lowe, 2011),中学生的行为投入与标准化考试成绩(Griffin, Cooper, Metzger, Golden, &White, 2017)、GPA(Wang & Holcombe, 2010)呈现正相关;学生的行为投入和学业成就随着性别等个人特征的不同而不同,男生的行为投入和学业成就往往比女生弱一些(Olivier et al., 2018)。另一方面,从消极的行为投入出发,倦怠(Salanova et al.,2010)、脱离(Martin et al., 2012)和不满(Skinner et al., 2008)与学业成绩呈现负相关。但也有研究者认为行为投入中的参与LMS活动的感知时长与学生平均绩点(GPA)之间没有统计学上的显著差异(Almoslamani, 2018)。
虽然多数研究结果都表明行为投入能够显著影响学业成就,但两者之间的关系强度具体如何,依旧是目前需要重点深入研究的问题。Lei、Cui和Zhou(2018)对2003年至2015年的69项关于“学习投入与学业成就之间的关系”的独立研究进行元分析,并对学习投入报告方式、文化价值观和性别等调节因素进行调节效应分析;Chang、Chien和Chou(2016)对1990年至2014年的58篇关于“学习投入对学业成绩影响”的相关文献进行元分析,并得出教育程度这一因素对学习投入和学业成绩关系存在调节作用,但样本来源只有美国学生群体。
综上所述,本研究将在先前研究者在元分析中所使用的性别、行为投入报告方式、教育程度三个调节因素基础上,探索其他新的调节因素(如样本来源、成就类型等)是否对行为投入与学业成就关系产生影响。本研究采纳的文献包括2005年至2020年面向普通学生的52项横断面研究和纵向研究,采用元分析方法探索行为投入与学业成就关系的影响程度,并分析哪些调节因素影响两者关系。
三、研究过程
(一)数据收集
本研究通过Web of Science、Scopus和EBSCO数据库检索了行为投入和学业成就的相关文献,选择主题词检索方式,以投入度“engagement or involvement”和学业成就“academic performance or educational outcomes or academic achievement”为关键词,并设置全文检索词为“behavior or behavioral”进行检索,检索语言为英文。通过以上检索限定,本研究共检索出5 689篇文献,数据库检索有效期至2020年5月30日。
检索完成后,本研究对检索出的文献进行了两次筛选,并参照PRISMA(2009)流程图描述具体检索和筛选。首先,选择Endnote文献管理软件对不同数据库的5 689篇文献进行查重,查重后剩余4 983篇文献;其次,由一名有经验的研究人员对另一名研究人员做文献筛选标准培训。培训后,两名研究人员按照四个标准分别对4 983篇文献的题目和摘要进行初次筛选,排除不符合纳入条件的文献。经过初次筛选后,剩余344篇相关文献。由这两位研究人员共同完成对剩余文献的全文阅读,并按照纳入标准对初筛后的文献再次进行筛选。根据纳入标准,全文阅读后,最终有52篇文献符合元分析纳入标准且大多数是期刊文献。
(二)文献编码
经过文献的检索和筛选后,由两名研究人员对最终获得的52篇文献逐篇进行独立编码。编码后,再由上述两名研究人员共同规范编码变量以确保编码一致。本研究采用科恩的Kappa系数测得编码一致性系数为0.823。因此,本次编码具有可靠性。编码变量包括研究名称、样本特征(样本来源、年级、学段、样本量、平均年龄、性别)和自变量特征(行为投入报告方式)、因变量特征(学业成就报告方式、成就类型、科目类型),获得以下编码标准(部分)。
表1 编码标准(部分)
本研究采用两个标准对效应值进行编码。首先,如果一项研究中包含多个独立样本,则进行多次编码(张辉华,王辉,2011)。假设某项研究按照不同年级(参与者人数不同)测量出多个效应值,编码时将这些年级的效应值划分成不同独立样本。同理,根据不同科目类型、性别等内容划分也是适用的。其次,如果一项研究包含多个效应值,为了避免因同一项研究采用多个效应值,通常取其平均,得出研究中平均效应值用于元分析(Lipsey &Wilson, 2001,p78)。例如:当某项研究针对不同年级同一批样本,测量相同成就类型效应值时,则采用各年级效应值的平均值,并将年级信息进行合并。最后,通过以上方法,本研究将120个效应值合并为85个,总样本量为65 255。
(三)元分析过程
1. 效应值计算和分类标准
本研究使用r值(皮尔森相关系数)作为效应值,r值是文献中的单个相关系数或经过处理的平均相关系数。在计算过程中,先把每个r值转化为对应的Fisher Z分数,采用的结果再通过Fisher Z转化回相关,效应值Z及其方差可以计算效应值大小和95%的置信区间(CI)。
根据Cohen评估效应值大小广泛使用的分类标准,即相关系数大小r0.1为较小影响;0.1 2. 异质性检验 在元分析过程中,由于不同的研究设计、研究时间、研究样本和统计方法使得不同的研究存在效应值的差异,需要进行元分析的异质性检验。目前比较普遍的异质性检验方法是Q检验和I2检验,其中Q检验只能评估研究间是否存在异质性,而I2指数可以评估异质性程度(Higgins, Thompson,Deeks, & Altman, 2003)。因此,当Q值达到显著(p<0.05),则表明研究之间存在异质性;当I2值分别为25、50、75时,则意味着研究间存在低度、中度、高度异质性(Higgins et al., 2003)。如果异质性存在,说明研究不只存在研究内的抽样误差,还存在研究间的差异,所以采用随机效应模型;反之,研究只存在研究内抽样误差,则采用固定效应模型(Borenstein, Hedges, Higgins, & Rothstein,2009)。 3. 数据分析工具 本研究选用Comprehensive Meta-analysis 2.0(简称CMA 2.0)软件,主要对效应值计算、异质性检验、调节效应分析、发表偏倚和敏感度进行数据分析。 由表2可知,在行为投入与学业成就关系的整体效应研究中,效应值大小为0.255,95%置信区间的下限为0.214,上限为0.294,该效应值说明行为投入与学业成就关系有中到高等影响。在异质性检验中,通过Q检验得出研究间存在异质性(Q=2 203.122,df=84,p<0.001),I2检验得出研究间存在高度异质性(I2=96.187>75)。因此,本研究采用随机效应模型。从I2指数可以看出,效应值大小的异质性有96.187%来自效应值的真实差异,而3.813%由抽样误差引起。 表2 行为投入与学业成就关系的整体效应分析 为了探索异质性产生的原因,本研究就前面提到的五个调节因素进行调节效应分析。通过Q检验分析研究样本的组间差异,采用随机效应模型分别对学段、样本来源、行为投入报告方式、成就类型四个类别变量进行亚组分析;性别则作为连续变量采用元回归方法分析。 1. 学段对行为投入与学业成就关系的影响 由表3可知,学段的调节效应分析表明,高中(r=0.456)对行为投入与学业成就关系的影响为高等;中学(r=0.339)、小学(r=0.274)的影响为中到高等;初中(r=0.177)的影响为小到中等;大学(r=0.087)影响较小。在异质性检验中,组间效应(QB=46.961, df=5,p=0.000<0.001)说明学段也对效应值的影响存在显著差异,具有调节效应。 表3 学段对效应值的影响分析结果 2. 样本来源对行为投入与学业成就关系的影响 由表4可知,样本来源的调节效应分析表明,北美洲(r=0.304)和亚洲(r=0.275)对行为投入与学业成就关系的影响为中到高等;欧洲(r=0.207)的影响为小到中等;大洋洲(r=-0.323)的影响为较小。在异质性检验中,组间效应(QB=7.925,df=4,p=0.094>0.05)说明不同样本来源对效应值的影响差异不显著,不具有调节效应。 表4 样本来源对效应值的影响分析结果 3. 行为投入报告方式对行为投入与学业成就关系的影响 由表5可知,行为投入报告方式的调节效应分析表明,教师报告(r=0.334)和学生自我报告(r=0.269)对行为投入与学业成就关系的影响为中到高等;观察者报告(r=0.161)的影响为小到中等;平台数据报告(r=0.045)影响较小。在异质性检验中,组间效应(QB=14.299, df=3,p=0.003<0.01)说明行为投入报告方式对行为投入与学业成就关系的影响差异显著,具有调节效应。 表5 行为投入报告方式对效应值的影响分析结果 4. 成就类型对行为投入与学业成就关系的影响 由表6可知,成就类型的调节效应分析表明,GPA(r=0.344)和标准化测试分数(r=0.309)对行为投入与学业成就关系的影响为中到高等;课程分数(r=0.229)和其他类别测试(r=0.128)的影响为小到中等。在异质性检验中,组间效应(QB=15.632, df=3, p=0.001<0.01)可以看出,成就类型显著影响了行为投入与学业成就之间的关系,具有调节效应。 表6 成就类型对效应值的影响分析结果 5. 性别对行为投入与学业成就关系的影响 由表7可知,在元回归分析中,性别对行为投入与学业成就关系的影响(斜率=0.00089,p=0.019<0.05)存在显著差异,且有较小的正向影响,具有调节效应。也就是说,性别的调节效应数据结果表明,研究样本中的女性比例越大,行为投入与学业成就关系的效应值就越大。 表7 性别对效应值的影响分析结果 1. 发表偏倚 本研究采用主观漏斗图和客观Egger法检验数据的发表偏倚。在没有偏差的情况下,图形分布将类似于对称的倒漏斗;相反,如果存在偏差,则漏斗图通常会偏斜且不对称(Egger, Smith, Schneider, &Minder, 1997)。样本量大的研究分布在图的上方且接近平均效应值,而样本量小的研究则分布在图的下方且呈现与平均效应值较分散的位置。如图1所示,各研究集中在图形上方,分布较为均衡,说明本研究存在发表偏倚的可能性很小。 图1 漏斗图 由表8可知,Egger法检验发表偏倚结果p=0.24135>0.05,数据表明所选文献不存在发表偏倚。结合漏斗图和Egger法的检验结果,说明本研究不存在发表偏倚,结果具有可靠性与稳健性。 表8 Egger法检验 2. 敏感度分析 敏感度分析(Sensitivity Analysis)是用来检验某些研究结果有异常或影响力很大的研究。本研究使用“One study removed meta-analysis”程序进行敏感度分析,逐一检验单一研究对效应值大小的影响。本研究删除任何一项研究后的效应量仍然在95%置信区间(0.214~0.294)。因此,该结果表明删除任何一项研究样本都不会影响总体效应值,且没有任何研究对总体结果有显著影响。 本研究采用元分析方法对国外2005年至2020年关于行为投入与学业成就关系的52项量化研究进行分析,主要从学段、样本来源、行为投入报告方式、成就类型和性别五个方面展开研究并得出以下结论。 行为投入与学业成就关系的整体效应值为0.255,表明具有中到高等程度正相关,这一结果与Lei等人(2018)和 Chang等人(2016)的研究结果一致。本研究发现,大部分研究比较关注行为投入与学业成就关系,可能的原因是行为投入变量可以通过问卷、量表以及学习平台数据获得并衡量,易观察且可操作性较强。在实际研究中,研究者可以从行为投入测量角度开展相关研究,例如:利用行为投入度来衡量学生学习成绩以及依据行为投入对学习成绩的显著影响,开展相关学习干预研究主题。 从学段作为调节因素的结果可以看出,从小学到大学教育对行为投入与学业成就关系都有不同程度的影响。具体来说,高中教育对行为投入与学业成就关系的影响最大,小学教育对行为投入与学业成就关系的影响次之,大学教育对行为投入与学业成就关系的影响最小。该数据结果与之前的研究结果一致,高中教育的效果显著高于小学和大学教育,这表明高中生的行为投入在学业成绩上的体现会更显著(Chang et al., 2016)。产生数据结果的原因可能是:不同学段的学生学习特征有很大差异,自我学习需求也会随着社会对人才需求不断发生变化。小学生的注意力很难长时间处于集中状态,自控能力较差,需要外部的鼓励和督促;高中生因升学需求逐渐增大,学习自律性也在提高,需要持续地投入更多时间和努力,而大学生学习知识结构相对来说比较稳定,除了满足自我知识水平的提升外,更多的时候他们还会关注学业以外未来需要面对的各种压力,如就业压力、求学压力等,这也使得大学生群体有选择地投入学习时间。因此,本研究建议研究者在进行教学实验时应当结合不同学段学生心理特征的差异性,有针对性地总结可能对行为投入产生影响的因素,进而提出促进学生行为投入的干预策略和方法供一线教师以及其他研究人员参考。 样本来源对行为投入与学业成就关系不存在显著差异,但北美洲、亚洲和欧洲的效应值都达到了统计学上的显著(p<0.001),说明这三个洲的样本来源对行为投入与学业成就关系有显著的正向影响。从样本来源作为调节因素的结果可以看出,特别是北美洲(以美国为主)对行为投入与学业成就关系的影响最大。产生数据结果的原因可能是美国中小学教育具有丰富的学科课程内容体系,注重学生问题解决与创造能力的提升。以STEM教育为例:华盛顿特区贝尔维尤学区初中职业技术课程通过项目学习方式开展STEM学科教与学,不断通过动手操作项目培养学生的工程思维能力,这使得学生的学习行为关注点也有所改变(赵章靖,2015,p125)。此外,本研究还发现,目前的研究大多是选取某个国家为样本来源开展相关实证研究,较少进行多国家横向比较,这也使得之后的研究者不能全面了解不同国家学生行为投入与学业成就之间的关系。因此,建议未来研究者应适当考虑样本来源的多样性,从更多国家的视角进一步研究(Krause& Coates, 2008),尝试探索多个国家研究者之间的协作模式。 从性别作为调节因素的结果可以看出,女性性别比例越大,行为投入与学业成就关系存在越显著的相关。该数据结果与之前的研究结果是一致的,性别这一因素影响了行为投入与学业成就之间的关系。随着样本中女性参与者数量的增加,行为投入与学业成就之间的相关性变得更强(Lei et al.,2018)。同时,研究发现性别对行为投入与学业成就关系的影响是很小的(Hayam, 2016)。整体上看,产生数据结果的原因可能是:从学习动机角度来看,女生表现出主动学习的意愿比较强,自主学习动力也很大,趋向于“绩效导向”的学习动机,更加关心学业成就。以工科女生为例,外在行为表现可以看出,女生学习努力程度更强,投入时间更多,学业成就也会更好(靳敏,胡寿平,2018)。因此,本研究建议从教师支持角度出发,教师应帮助行为投入较低的男生提供目标导向支持,如建立明确的学习目标,将游戏化学习元素融入到个性化学习环境,采用积分制“小步子”引领目标完成。也有研究建议关注同伴干预策略,帮助男生缩小性别差距。按照异质分组,实施同伴小组协作学习,帮助男生体会到榜样的作用,不断减少同伴消极行为影响,还可以采用社会规范干预策略,教师引导男生逐渐意识到同伴积极的行为表现,向学生灌输积极的社会规范可能有助于减少男生成绩不佳的情况(King, 2016)。 行为投入报告方式对行为投入与学业成就关系存在显著差异,教师报告、学生自我报告和观察者报告的效应值都达到了统计学上的显著(p<0.05),但平台数据报告方式对行为投入与学业成就关系不显著。其中教师报告对行为投入与学业成就关系影响最大,学生自我报告次之,观察者报告最小,说明这三种行为投入报告方式对行为投入与学业成就关系有不同程度的显著正向影响。整体上看,产生数据结果可能的原因是教师报告相比学生自我报告更为客观。在某些情况下,学生自我报告可能不会反映他们的实际行为,存在信度和效度问题,而观察者报告可能受观察者主观因素的影响,较难提供相对准确的行为投入测量(如努力程度、投入时间等)信息(Fredricks et al., 2004),这也使得观察者报告效应值最小。因此,本研究建议研究者根据各自的研究需求,选择不同的行为投入报告方式。在条件允许的情况下,优先考虑教师报告或学生自我报告测量行为投入。但不管选择哪种测量方式,都需要注意测量结果的有效性和可靠性。值得一提的是,学生自我报告需要研究者对学生进行适当引导,明确承诺数据的保密性,确保学生尽可能真实回答;观察者报告则需要适当增加观察者人数,通过课堂视频录像辅助多个观察者测量学生行为投入,取其观察日志平均值,最后确定行为投入数据。 从成就类型作为调节因素的结果可以看出,GPA对行为投入与学业成就关系的影响最大,标准化测试分数和课程分数次之,其他类别测试最小。产生该数据结果可能的原因是在学校教育中,GPA是衡量学生一定时期内整体学习成绩情况。相比标准化测试分数、课程分数和其他类别测试来说,GPA更能反映出学生整体学习成绩程度;标准化测试分数和课程分数对行为投入与学业成就的影响差别不大,这说明教师选择的课程考试信效度较高,评分标准逐渐接近标准化测试分数,能够反映出学生比较真实的学习状况,而其他类别测试由于不是学校通用测试类型,较难反映出学生实际学习成绩。因此,本研究建议研究者关注行为投入与学业成就关系的时候,选用的测试应涵盖更全面的知识点,能够客观反映学生真实知识水平的学业成就,如GPA、标准化测试分数或者信效度较高的课程考试。值得注意的是,应尽量减少选择比较片面的测试问题,从而准确地测量学业成就。 本研究通过对52篇行为投入和学业成就相关的文章进行元分析,得出学段、性别、行为投入报告方式以及成就类型四个调节因素,并有针对性地对各个调节因素进行了解释和总结。基于研究结果,本研究将对该研究领域提出以下展望,供之后的研究人员参考。 第一,本研究的研究结果表明样本来源对行为投入与学业成就关系不具有调节效应,表明目前研究极少关注多国家之间的横向对比,且针对国内外文章的元分析研究也较少。因此,后续研究者可以利用元分析方法对国内外研究进行综合分析并针对多国家学习者开展教学活动,探究在不同样本来源下行为投入与学业成就的关系。 第二,元分析方法能够发现影响行为投入与学业成绩关系的相关因素,但是各因素间是独立且分割的,且只考虑了直接影响,对于各因素间的相互作用关系还未深入探究。并且各因素对于行为投入与学业成就关系的调节机制具体如何体现,还未有确切数据进行支撑。因此,在行为投入与学业成就相关影响因素模型方面还有更深层次的研究空间。 第三,本研究文献研究对象包括课堂学习和在线学习,其中在线学习文献占比较少,但随着互联网教育的发展,在线学习普及度增高,通过在线数据测量行为投入的研究越来越多,且在线行为投入测量方法也日趋多样化。因此,之后可以重点研究在线学习环境中行为投入与学业成就关系,或将学习环境作为一个调节因素开展相应研究,从而获得更有针对性的研究结果。 本研究局限主要体现在两方面:元分析研究所选文献只包含了国外常见的三个数据库,纳入的文献以国外期刊为主,没有纳入国内数据库文献,未发表的文献也很少,这可能使得研究结果受限。另外,本研究还未考虑社会因素的影响,比如社会经济地位、种族、文化背景等调节因素。 未来可以继续探索这些因素对行为投入与学业成就关系的调节作用,这对于系统总结行为投入与学业成就关系有一定的实际意义。四、研究结果
(一)行为投入与学业成就关系的整体效应
(二)调节效应分析
(三)发表偏倚和敏感度分析
五、讨论
(一)行为投入与学业成就的关系
(二)学段对行为投入与学业成就关系具有调节效应
(三)样本来源对行为投入与学业成就关系不具有调节效应
(四)性别对行为投入与学业成就关系具有调节效应
(五)行为投入报告方式对行为投入与学业成就关系具有调节效应
(六)成就类型对行为投入与学业成就关系具有调节效应
六、展望与局限