系列研究在体育科学研究中的价值及设计思路
2019-06-14张连成张力为
张连成,张力为
(1.天津体育学院 竞技运动心理与生理调控重点实验室,天津301617;2.北京体育大学 心理学院,北京100084)
科学研究的终极目标是尽可能地接近、建立事实,倘若研究者发现某种事实,而这种事实却是随机产生的,那么就会产生虚假结果。虚假结果呈现为两种形式:假阳性结果是研究所发现“现象”或“事实”并不是真实现象或事实,而是随机现象;假阴性结果是研究没有发现应该发现的真实现象或事实。这些虚假结果的后果会直接误导实践。例如,医学科研的假阳性结果会将一个无效的医疗手段视为有效,进而导致医生推广使用后无治疗效果,或使用很多非必要的治疗手段(Nuovo,2016)。进行系列研究是科研方法中遏制虚假结果的必要手段。一个常用的方法是研究者在对研究问题进行清晰界定的基础上对研究问题进行恰当分解,进而通过系列研究来解答,这种方法常见于对较为宏观的研究问题进行研究;另一个方法是研究者采用平行的或并列的多次实验设计,通过反复验证来揭示所研究事物的规律,从而验证其可重复性、逻辑性,以避免产生虚假结果,进而提高研究的效度。
综上,系列研究是指围绕某一研究问题,采用横向并列多研究设计或纵向层层递进设计来揭示变量之间的关系,以使研究结果可重复性更强,研究效度更高的包含 2个或更多子研究的设计。这一开展系列研究的趋向也渐渐被体育科学研究领域的学者所重视。张力为等(2013)曾比较了2010年Journal of Personality and Social Psychology(JPSP)、《心理学报》与《体育科学》3本学术月刊刊载的系列研究论文情况。结果发现,《体育科学》2010年没有一篇论文是系列研究,而JPSP和《心理学报》则刊登了较多的系列研究论文,尤其是JPSP每一期都有超过一半的论文使用的是系列研究设计。作者对《体育科学》2017年的 12期论文进行统计后发现,共刊载实证研究论文 47篇,系列研究论文 3篇,系列研究所占比例为 6.38%,较过去有所提高,但仍不是体育科学研究的主流。因此,本文将围绕系列研究的价值及其设计思路来进行讨论,以帮助读者了解体育科学领域开展系列研究的基本逻辑和具体做法。
1 系列研究的价值
1.1 验证研究的可重复性
方法学学者曾警告说,不可重复的单一研究无论如何精心设计,结果无论如何具有统计意义,在对所研究现象的深层次理解、概括和因果解释上都几乎毫无意义(Hubbard et al.,2013; Nelder,1986; Popper,1959)。可重复性是通过科学研究认识事物的基本原则之一。研究结果的可重复性帮助人们避免不加批判地接受似是而非的研究结果,这些结果的来源常见于研究者不知觉所犯的统计 I型错误(得出假阳性结果的结论),无意中所犯的其他错误,或有意识的违反学术道德进行欺骗(Hubbard et al.,1994)。开展可重复性研究可以巩固科研中观察到的事实或经验概括,进而推动科学的进展(Hubbard et al.,2013)。目前,科学界对多个研究领域的可重复性不断地进行质疑。Nature杂志对1 576名研究者进行调查发现,超过70%的研究人员尝试过并且未能重现另一位研究者的实验结果,超过一半的研究者未能重现他们自己的实验结果,90%的研究者认为在科学界存在着可重复危机,有 52%的研究者认为存在可重复的重大危机(Baker,2016)。
在改进研究的可重复性方面,学者们给出了提前注册,开放数据库,改进统计方法,使用元分析等举措(胡传鹏 等,2016; Cumming,2014)。除此之外,也可以考虑通过设计系列研究来进行可重复验证。正如牛津大学的神经心理学家 Bishop(2016)曾指出,心理学上的经典效应,如“系列位置效应”(Serial Position Effect)等之所以能够经得住可重复检验,是因为当初心理学家们常常会通过一系列实验,来证明这一效应的存在,并阐明这些心理效应的适用条件,而这个过程本身也是一种可重复性研究。
可见,围绕某一主题开展系列研究,是验证研究可重复性的有效方法。可重复性研究可以使用直接验证、系统验证、概念验证等方法(郭秀艳 等,2005)。在直接验证中,研究者努力尽可能准确地重复原实验,看能否在第二次得到同样的实验结果。而在系统验证中,则会变换某些实验条件来观察先前实验结果是否仍然会出现;研究者的兴趣并不在于精确地重复实验,而在于描述某一现象产生的边界条件,即保证该现象存在的条件是什么的问题。在概念验证中,则更强调变换研究范式等,讨论某一概念或某一理论的可重复性。早在1993年,Lindsay等就建议在发表实证结果时,期刊应鼓励某种程度的可重复性研究,至少是一些内部的简单重复(直接验证)。若重复成功,应该简要报告重复的结果。若是进行差异化的可重复性研究(系统验证或概念验证),则有必要详细描述变化的研究条件和背景等方面。系列研究更多地体现在差异化的重复性研究上。在概念或理论上进行重复性研究,可以检验研究发现的事实和经验是否可以得到概化,是否可以拓广研究或理论的应用范围,进而为科学研究积累可信赖的证据(Uncles et al.,2013)。
1.2 提高研究的整体效度
研究效度是指研究真实、正确地揭示所研究问题的本质及其规律的程度,即研究结果符合客观实际的程度(董奇,2004)。研究效度是评价一项研究质量的重要标准,也是该研究能否在实践中得以应用的重要前提。研究效度包括内部效度和外部效度。内部效度指研究中自变量与因变量之间存在一定关系的明确程度(董奇,2004)。外部效度指研究结果能够一般化和普遍化到样本来自的总体和其他变量条件、时间和背景中去的程度,即研究结果的普遍代表性和适用性(董奇,2004)。
在实验研究中,对实验条件和环境施加控制和使用对照组的目的往往就是为了保证因变量测量值的(内部)效度。因此,对实验条件和环境施加控制程度往往和研究结果的内部效度成正比。但由于对实验条件和环境施加控制程度越高,实验环境和真实环境的差距就越大,因此,对实验条件和环境施加控制程度和研究结果的外部效度成反比。因此,系列研究还包括了一个非常重要的方面,即对实验室得到的结果,哪怕在实验室条件下已经重复成功,也要在不同的环境中(特别是真实环境)进行重复系列研究,以建立和维护研究结果的外部效度。例如,段艳平等(2012)针对中德成年人被试进行的“从无活动到保持活动的 4步骤(FIT)模型”的跨文化系列研究结果表明,FIT能够较准确地描述中德两国成年人身体活动变化过程的阶段性特征及其影响因素,并且效度、诊断功能及服务干预的功能均得到初步验证。正如 Munafòt等(2018)所强调的,仅具有可重复性还远远不够,坚实的研究结论需要多种证据,也就是验证该研究结果在不同的环境下是否还成立。
由于建立研究结果的外部效度常常要在改变了的实验条件下和环境中进行,对研究者带来的挑战是巨大的。比如,环境的改变造成控制变量和原始研究的控制变量有所不同,或常常会有一些无关因素混杂在相同的控制变量中,这些因素都会导致对因变量呈现程度的变化使其或观测不到或过度呈现。这些实验条件或环境的变化也会导致自变量产生变化,影响研究结果的内部效度,造成研究结果不可靠。反过来说,在不同实验条件和环境下重复,这恰恰是系列研究的价值所在。
另外,研究者进行研究的目的往往是为了发表研究成果。在学术刊物发表方面,一个常常出现的现象是发表偏倚性(Publication Bias),即阳性结果(如定量方法中具统计显著性的结果)更容易得到发表的现象。发表偏倚性是一种系统误差。由于阴性研究结果不常得到发表,所发表的阳性研究结果使外部效度向虚假高端游移,即向着有统计意义的方向偏移。因此,发表偏倚性最终会降低研究结果的外部效度。已有研究者指出,心理学中自我损耗领域的研究中存在发表偏倚现象(Carter et al.,2014)。由于阴性结果得不到发表,所以出现高估外部效度,即研究结论与实际观察的吻合性低,因此,立足于这些研究结果上的结论并不可靠(Carter et al.,2015)。
不显著的研究结果必须受到和显著性研究结果同样的重视。在进行文献分析工作时,研究者必须尽可能将所有不显著的研究结果也纳入到文献分析中,这样才能反映某一领域的研究全貌。为避免发表偏倚性,除了期刊应该鼓励发表不显著性结果论文外,研究者也可以通过构建系列研究来整合那些不一致的研究结果。最近,有一些研究者在以往元分析的基础上,提出可以使用迷你元分析(Mini Meta-analysis)的方法对系列研究的结果进行整合,进而明确自变量与因变量的关系(Goh et al.,2016)。
1.3 提供强证据或证据链
科学研究的可信度建立在科学事实的基础上。何为科学事实?证据在哪里?这就需要研究者提供有力证据,这样研究结论才能被接受和推广。研究的信、效度是决定一个研究为科学提供证据质量的直接因素,因此,系列研究在验证研究可重复性,提高研究效度的同时,可以进一步为科学研究的发现和实践提供强证据或证据链。
关于证据强度的评价,可以参考循证实践领域的相关研究。张力为等(2017)曾给出体育科学研究为运动实践提供证据的力度(图1),从图1不难看出,实验研究的证据强于调查研究,多个研究的证据强于单一研究。可见,开展系列研究可以为体育科学领域提供更强的证据。例如,孙拥军等(2013)通过 1项质性研究与 2项实验讨论了自控损耗对运动员运动表现的影响,质性研究发现,实施自我控制产生的损耗会导致运动员的运动表现受到不利影响;2项实验则进一步检验了自控损耗对运动员运动表现的影响,实验 1研究发现自控损耗(思维抑制任务)不利于运动员注意的稳定保持,实验 2研究发现自控损耗(注意控制任务)会降低运动员处理冲突与应对干扰的能力。通过这 3项研究,为自控损耗对运动操作表现的不利影响提供了可信赖的证据。
图1 调查研究与实验研究提供因果关系证据的力度(张力为 等,2017)Figure 1. The Strength of Evidence in Causality about Investigation and Experimental Research
证据链往往体现在递进关系假设检验的系列研究上。例如,王进(2005)的研究通过 3个系列实验揭示了运动中的“Choking”现象,实验 1研究了有意控制对运动中“Choking”的影响,实验 2进一步检验了与自我注意有关的压力是否会引起自我关注进而影响操作表现,实验 3则更进一步地讨论了自我意识强以及特质性焦虑高的人是否更可能在压力情境下出现“Choking”。由此可见,系列研究通过层层递进、环环相扣的逻辑链条和证据链条为该领域的研究与实践提供了强有力的证据。
2 系列研究的设计思路
2.1 依提高内部效度视角设计
2.1.1 额外变量的控制
对额外变量的恰当控制是增加研究内部效度的重要保障,但有时可能在一个研究完成之后才会发现某一个或某些无关变量可能对结果产生影响。因此,通过对额外变量的进一步控制,就可能成为后续研究的起点,成为系列研究有序推进的策略之一。例如,Werle等(2015)在实验1中将研究参与者分配到在运动组(告知该研究的目的就是锻炼,要求他们在地图上 6个不同的停止点指出他们的能量水平)或有趣组(参与者被告知这项研究的目的是通过mp3播放器听音乐,并在 6个不同的停止点评估音乐的清晰度),之后测量食物消耗。研究发现,有趣组的参与者比运动组的参与者摄入的卡路里更少。随后,研究者发现,研究 1中的有趣组可能因为有音乐使得他们的情绪更加积极。据此,研究者改进了实验设计,在实验 2中将有趣组的实验条件描述为校园参观,并且参与者被指示在运动条件下观光。完成任务后,为他们提供甜点作为感谢,结果同样发现,运动组食用了更多的甜点。
再如,Sun等(2016)通过两个实验探讨了移动目标任务中静眼对运动表现的影响。实验 1通过掩蔽法(无掩蔽、小掩蔽、大掩蔽)操控静眼开始时间,进而操控不同时长的静眼时间。结果发现,静眼时间越短,运动表现越差。随后,研究者发现,对静眼开始时间进行掩蔽操控,也延迟了动作开始的时间,限制了可用于技能在线控制的时间。这样就导致结果混淆,到底是预编程,还是在线控制对运动表现的影响。因此,研究者在实验 2中通过掩蔽法操控静眼开始时间和结束时间,以探索晚期视觉信息对截击任务表现的影响。结果发现,同实验 1,早期信息遮蔽同样可以缩短静眼时长,进而影响截击动作表现;晚期遮蔽条件进一步回答了静眼准备期的重要性,更长时间的早期加工可以补偿整体静眼时间缩短和晚期视觉信息缺失带来的问题。
2.1.2 内在机制的探讨
科学研究需要不断积累研究证据,其中策略之一便是从发现研究结果到对内在机制的探讨。而这种探讨往往通过两个途径展开:1)引入中介变量和观察中介效应;2)探讨脑的结构与功能。
关于引入中介变量和观察中介效应,本文介绍两例。第 1个例子来自宋刚等(2017)的研究。他们通过两个实验分别探讨了耐力训练不同时间点C57BL/6J小鼠ATGL基因和蛋白表达的变化及 ATGL变化可能的信号分子机制。实验 1,C57BL/6J小鼠进行 4周的跑台耐力训练,使用实时荧光定量 PCR和蛋白质印迹法测定腓肠肌和比目鱼肌ATGL基因和蛋白表达的变化;实验2,采用跑台耐力训练小鼠 4周,分别每天腹腔注射 forskolin、T0070907和DMSO,测定腓肠肌和比目鱼肌ATGL基因和蛋白表达的变化。结果发现,耐力训练会引起C57BL/6J小鼠比目鱼肌和腓肠肌中的 ATGL基因和蛋白表达上升,而信号分子cAMP和PPAR-γ参与了这一过程。第2个例子来自徐飞等(2017)的研究。他们通过两个实验分别探讨了运动性肌损伤(EIMD)后低氧对细胞膜通透性的影响及其机制问题。该研究首先通过大鼠 EIMD模型,研究 EIMD后低氧对细胞膜通透性的影响,探索低氧调控 EIMD膜损伤效果及与MAPK各信号通路的关系,再通过测定抑制MAPK各信号通路对膜损伤的影响,明确 MAPK信号通路中有关低氧调控EIMD后膜损伤的机制。结果发现,EIMD后低氧明显加剧膜损伤并造成损伤峰值前移,低氧调控膜损伤主要通过BMK1通路实现,抑制BMK1磷酸化能阻止低氧对膜损伤的加剧作用。BMK1/ERKS通路是低氧调控EIMD后膜损伤MAPK机制的关键途径。
关于探讨脑的结构与功能,本文仅介绍一例。王丽丽等(2018)通过 3项实验探讨了中国运动员赢分和输分后的面孔表情和身体姿势。实验 1通过评估运动员赢分与输分条件下面孔表情和身体姿势的效价和强度,实验 2进一步探讨了运动员赢分和输分后面孔表情和身体姿势的情绪类型。前两项研究结果似乎表明,相比面孔,身体信息更能区分赢分和输分的效价,而且身体姿势传递的情绪内容相对单一,面孔表情传递的情绪内容相对复杂和多样化。实验3采用ERP技术探讨产生这一现象的脑机制,结果发现,身体的情绪信息能更早地被大脑识别,表现在 N170成分上,面孔表情的情绪效应反映在EPN成分上。在加工的晚期,面孔和身体条件下,均观测到胜利比失败表情诱发了更大的 LPP成分。结果表明,大脑在多个阶段对身体姿势进行情绪评估与分类,为行为上身体对效价的高区分性提供了证据。
综上,在发现变量关系之后,再探讨内在机制可以进一步阐释变量间作用的机理,为明确自变量与因变量之间的因果关系提供中介效应证据或脑功能证据,进而提高整个研究的内部效度。不仅如此,内在机制的探讨,还将对已有理论的完善与发展提供依据。
2.1.3 调节变量的引入
调节变量指影响自变量(或预测变量)和因变量(或准则变量)之间的关系强度或关系方向的变量(张力为,2001)。在以往很多研究领域,人们发现研究结果存在不一致现象,而产生不一致的一个重要原因便是存在调节变量,即研究中变量关系的存在需要界定在一定的条件下。例如,李强等(2018)分别通过观察法和访谈法探讨了青少年足球教练员的训练模式和执教方式。首先,通过对 13名青少年足球教练员训练课进行客观观察,并使用修订后的青少年足球教练员执教观察记录表来统计教练员的训练模式和执教方式,研究发现,青少年足球教练员应用“直接式”训练模式多于“情境式”训练模式,更多的使用训练指令。然后,通过对教练员的半结构访谈来了解教练员训练和执教的理念,结果发现,访谈结果与训练实际观察结果存在较大差异,即教练员在训练中的实践操作与他们访谈语言表述的训练理念相悖。这就提示研究者,需要关注造成研究结果不一致的第三变量,进而考察变量关系存在的边界条件问题。
再如,郑程浩等(2017)通过两项研究探讨了葡萄糖补给时机对运动员自控损耗的影响。实验1选取72名男性网球运动员,探究补给时机和补给策略对 Handgrip任务(坚持性自控任务)坚持时间的影响;实验2选取72名男子篮球运动员,探讨补给时机和补给策略对 Visual-CCPT任务(认知性自控任务)的虚报数、漏报数和反应时的影响。结果发现,自控损耗前、后补给葡萄糖均可提升运动员坚持性自控任务的表现;自控损耗后补给葡萄糖对于改善认知自控任务表现的效果不大,自控损耗前补给葡萄糖可有效促进运动员认知性自控任务的表现。提示,为了控制自控损耗的负面影响,应该根据自我控制任务的不同来选择合适的葡萄糖补给策略。
通过上述例子可以看出,通过引入调节变量,研究者可以进一步明确自变量对因变量产生作用的边界条件所在,进而提高研究的内部效度。
2.1.4 研究方法的变换
近10年来,共同方法偏差(Common Method Biases)问题越来越引起学者们的重视。所谓共同方法偏差,指的是因为同样的数据来源或评分者、同样的测量环境、项目语境以及项目本身特征所造成的预测变量与效标变量之间人为的共变(周浩 等,2004)。而解决共同方法偏差的一个重要手段便是采用多种研究方法。通过变换不同的研究方法,可以有效控制单一方法内在的系统误差,进而提高整个研究的内部效度。这一思路至少可以从3个方面进行:
第一,从调查研究到实验研究。Grohs等(2015)通过2项调查和 1项实验探讨了球迷对对方球队赞助商的负面态度和抵消负面态度的方法。第 1项调查研究发现,球迷对自己球队赞助商的态度明显好于对对方球队赞助商的态度与非球迷的态度;第 2项调查研究发现,对球队的认同虽然不会导致对竞争对手的冷漠,但会导致对对手球队赞助商的负面认知;研究 3的实验研究发现,当团体成员将赞助者视为外群体时,赞助会产生负面影响,团队认同水平增加了对对手团队的负面群体感知,球迷对对方球队的赞助商的负面态度随着团队内部认同的程度而增加。
第二,从质化研究到量化研究。陈小蓉等(2017)的研究首先基于我国体育非物质文化遗产传承保护工作模式和扎根理论,运用实地考察法、质性研究法以及德尔菲法等研究方法,构建了中国体育非遗综合评价体系(包括申遗评价和申遗后保护评价两部分)。然后使用申遗后保护评价体系对我国国家级和省级体育非物质文化遗产项目进行了具体评价,进而验证了该评价体系的有效性,结果表明,体育非遗保护实践评价指标的鉴别力较为理想,该评价体系的各指标能够区分和鉴别不同类型体育非遗保护措施的优劣程度。史小强等(2018)也是采用这一策略,首先使用文献和深度访谈等质性研究方法建构了新时代我国全民健身公共服务绩效的假设模型(主要包括全民健身公共服务的服务效率、服务质量、服务民主性和服务回应性4个方面),随后选取了 12个省(市),包括 30个市(县、区)的 2 400位居民进行调查,检验了全民健身公共服务绩效结构模型的有效性。
第三,从横向调查到纵向追踪研究。孙国晓等(2013)从自我决定理论视角,通过横向和纵向两个研究检验了自我决定动机对运动员心理疲劳的消极影响。通过对 225名现役运动员的横向调查发现,自我决定动机对心理疲劳 3个维度均有可靠的负向预测作用。对60名柔道运动员冬训前、后为期12周的纵向追踪研究发现,冬训初期的自我决定动机对冬训末期运动员的心理疲劳具有可靠的负向预测作用,冬训前、后自我决定动机的变化程度对运动员心理疲劳的变化具有可靠的负向预测作用。
综上,从调查到实验,从质化到量化,从横向调查到纵向追踪,均是不断提高研究内部效度的有效策略。就像Munafò等(2018)在 Nature上所发表的评论那样,坚实的研究需要三角验证。也就是说,通过使用相互独立的不同的方式方法验证结论。因为每一个方法都有互不相关的假设、优点和缺点,如果不同的方法得出相同的结果,那么这个结果为假的可能性就下降了。正如19世纪中期博学家William Whewell提出的“一致性”理论,它假设强大的理论源于多重证据的综合论证,就像达尔文提出自然选择学说时一样(Munafò et al.,2018)。可见,研究方法的不断变换可以为研究结论提供三角验证,这也为研究者有序推进系列研究提供了借鉴。
2.2 依提高外部效度视角设计
如前所述,可重复性是科学研究的重要特征之一。在验证研究的可重复性时,学者们往往会通过系列研究来检验已发现研究结果在更广泛情境中的适用性。因此,下文将讨论依提高外部效度视角如何开展系列研究设计。
2.2.1 变换自变量的操控方式
通过增加自变量数目、变换自变量操作方式或条件来设计系列研究,是增强研究外部效度的重要手段。胡路明等(2018)通过 3个实验探讨了多目标追踪中基于运动信息的分组效应。该研究的主要思路为,实验 1确立在多目标追踪中存在基于运动信息的分组效应,实验 2和实验 3通过分别操纵不同颜色和不同形状组合特征来探讨基于运动信息的分组效应的稳定性。实验 1采用单因素三水平被试内设计(设置 3种不同的运动信息条件,分别对应目标内配对运动、目标与非目标间配对运动和随机运动)来考察这一分组效应。实验 1发现,多目标追踪中存在基于运动信息的分组效应,并且这一分组效应是自动化的。实验2采用2(基于运动信息分组:目标与目标配对条件和目标与非目标配对条件)×3(基于颜色分组:颜色相同条件、颜色不同条件、颜色混合条件)的两因素被试内设计考察不同颜色条件下基于运动信息的分组效应的稳定性。实验3同样采用2(基于运动信息分组:目标与目标配对条件和目标与非目标配对条件)×3(基于形状分组:形状相同条件、形状不同条件、形状混合条件)的两因素被试内设计考察不同形状组合条件下基于运动信息的分组效应的稳定性。综合实验 2和实验 3的结果发现,不同表面特征的组合不会干扰基于运动信息的分组效应的形成,但其效应量均会因表面特征的改变而缩减。
该研究通过增加自变量个数、变更自变量操控形式设计了 3个系列实验,证明了多目标追踪中基于运动信息的分组效应是稳定的,可靠的,进而提高了研究的外部效度。
2.2.2 改变因变量的测量方法
因变量测量方式的改变也是推进系列研究的重要策略之一。Dorris等(2012)通过两个实验探讨自控损耗对运动员常规训练的影响。实验1的研究参与者为24名男子赛艇运动员,实验 2的研究参与者为 18名曲棍球运动员(2男,16女)和6名男子橄榄球运动员。实验要求损耗组运动员首先完成从 1 000连续减 7的心算任务,产生自控损耗,然后完成俯卧撑(实验 1)或仰卧起坐(实验 2)任务。结果发现,自控损耗降低了运动员俯卧撑和仰卧起坐的成绩。
再如,Werle等(2015)分别在 3项研究中使用了 3种因变量的测量手段,为身体活动感知影响食物消耗提供了可重复性验证。实验 1,研究参与者在有趣或运动两种条件下进行30 min的步行活动,完成任务后邀请大家吃自助餐,结果表明,两组人在随后的自助餐中摄入的热量没有显著性差异,但是对所选甜点和饮料的卡路里进行分析发现,有趣条件下的研究参与者比运动条件下的研究参与者摄入的卡路里更少。实验 2,研究参与者还是在有趣或运动两种条件下进行30 min的步行活动,完成任务后为他们提供甜点作为感谢,结果同样发现,运动组进食了更多的甜点。研究 3是一项真实的马拉松竞赛,参与者被要求评估他们跑步时的乐趣,并提供巧克力棒(相对不健康的食物选择)或谷物棒(相对健康的食物选择)之一作为实验报酬,研究发现,人们对比赛的评价越有趣,他们就越不可能在运动之后使用享乐食品(巧克力棒)进行补偿。
通过上述两个例子可以看出,不断变换因变量的测量方式可以增加研究的外部效度,进而使研究获得的结论更加稳定,这样可以为该领域的知识积累提供坚实证据。
2.2.3 转变研究情境
现场研究相对于实验室研究,可以提高研究的外部效度,是更加客观地揭示自然、真实的心理活动规律的研究方法。因此,诸多研究者在研究情境选择中,采用从实验室研究转变到现场研究的思路有序推进系列研究。
王希等(2014)以自我决定理论为指导,通过 2项研究探讨了外部动机内化对运动员心理疲劳的影响。研究 1包含 2个实验室实验,分别通过无趣认知任务(从小到大点击1~100之间的数字,练习时间60 min)和无趣运动任务(60 min的飞镖靶心瞄准练习)诱发心理疲劳,并检验不同程度外部动机内化对运动员心理疲劳的影响。研究 2将研究情境转变到真实运动情境,以教练为运动员提供的自主环境为自变量,考察运动员外部动机内化对心理疲劳的影响。结果发现,无论是实验室实验,还是现场实验,当运动员外部动机内化水平较低时,心理疲劳程度就越高,通过创设自主支持的环境可以促进运动员外部动机的内化,进而减轻运动员的心理疲劳程度。
Hüttermann等(2018)也是通过实验室实验和现场实验检验运动员注意力训练对运动员注意力视窗的影响及其二者的效果差异。结果发现,无论是在实验室进行的计算机认知训练,还是在现场对集体项目运动员进行的注意力训练均对扩大运动员的注意力视窗产生积极作用,并且在两种情况下,运动员的注意力表现得到了同等程度的提高。
2.2.4 扩大被试范围
在一些基础研究中,研究者常常先在动物群体中进行实验,再在人类被试中进行实验,这也是系列研究有序推进的策略。Kim等(2015)分别通过动物实验和人类实验,揭示了鸢尾素表达在抗阻训练改善肌肉力量和功能中的重要作用。在动物实验中,将19个月大的雄性小鼠随机分成对照组和阻力运动组(持续12周,每周3天进行具有尾部负重的阶梯攀爬练习)。在人类实验中,40名65岁以上的女性参与者被分配到对照组或阻力运动组(持续 12周,每周2天,每天1 h的弹力带训练)。动物实验结果发现,阻力训练可以有效提高小鼠血清和比目鱼肌中的鸢尾素水平,改善肌肉力量和肌肉质量。在人类实验中,与对照组相比,阻力运动组的等速腿力和握力得到改善。此外,鸢尾素水平与阻力运动组的握力和腿力呈正相关。因此,抗阻训练可能是一种有效的干预方法,它可以增加鸢尾素水平,防止与增龄相关的肌肉力量和功能退变。
此外,也有一些研究通过将研究结果推广到不同的人群中来设计系列研究。Swami(2017)通过3个研究探讨了人体写生对积极自我意向的影响。研究1对84名女大学生进行一次人体写生的训练,结果发现,参与人体写生可以提升女大学生的状态自我意向,但前提是绘画者观察的是人体模特而不是非人体模特。研究 1中都是女性研究参与者,且都是女性模特。因此,研究 2在研究 1的基础上进行了拓展,采用 2(绘画者性别)×2(模特性别)被试间实验设计,结果发现,无论绘画者是否观察到模特与自己性别一致或不一致,人体写生对女性和男性的身体意向都有积极的影响。研究 1、研究 2仅仅是考察了人体写生对状态身体意象的影响,研究 3探讨了长期人体写生对特质自我意向的影响。结果发现,为期 6周的人体写生课程干预可以有效促进特质积极自我意向(身体吸引力和身体自豪感),提高具身感,并减少社会体格焦虑;然而,干预对负面的身体形象(为瘦身而努力和为肌肉发达而努力)没有显著影响。该研究从女性拓展到男性,从状态自我意向到特质自我意向,不断推进,提高了整个研究的效度,为人体写生促进自我意向提供了坚实的研究证据。
2.2.5 拓展应用情境
实践是检验真理的唯一标准。好的研究一定会经得住实践的检验,并对实践具有重要指导意义。因此,从科学发现到具体情境下的实践检验也是开展系列研究的重要思路。
舒川(2018)综合运用文献分析、访谈调查、问卷调查、行动研究等研究方法,构建了学龄前残疾儿童运动康复课程理论体系。之后开展了近 1年的行动研究,结果发现,该课程在实际教学中具有较强的可操作性,并能有效提高学龄前残疾儿童的基础动作能力、体适能、认知及社会适应能力。Papaioannou等(2011)等通过两项研究探讨了个人改善目标在健康生活中的积极作用。在研究 1中,研究者通过对 381名成年女性的调查发现,生活中的个人改善目标与积极的自我调节过程和自我效能信念相关联,进而促进成年人规律锻炼;研究 2进一步拓展了个人改善目标在青少年人群中的应用,通过对 1 508名青年学生为期两年的纵向调查发现,生活中的个人改善目标可以正向预测学生两年后的运动参与情况,可以负向预测吸烟和逃学等负面行为。Williams等(2002)通过两个实验检验了预期技能在网球比赛中的重要意义。在实验 1中,作者采用专家新手范式,并使用逼真的电影模拟网球比赛,通过对网球正手和反手击球运动表现和眼动指标进行分析,发现了专家优于新手的预期技能的重要特征;在实验 2中,将实验 1中发现的网球预期技能特征用于网球运动员的实际训练中,结果发现,预期技能可以通过训练得到增强,并且可以应用于真实比赛任务中。该研究从发现网球运动员的预期技能特征(实验 1),到预期技能特征的具体应用(实验 2),拓展了应用情境,进而提高了该研究的外部效度。
需要特别强调的是,系列研究在有序推进时,也可能是将上述多种策略结合在一起使用。耿晓伟等(2018)通过 3个实验考察了健康目标启动对食物热量摄入及其内在机制问题。实验 1是实验室实验,考察了健康目标启动对高热量、低热量食物选择的影响;实验 2是一项现场实验,采用2(健康目标启动:启动目标/控制组)×2(巧克力热量:高热量/低热量)的被试间设计考察健康目标启动对高热量和低热量食物摄入的影响,同时考察对食物的情感预测的中介作用。为了提高研究的外部效度,同时进一步检验前两个实验的研究结果,实验 3以成年人为被试,在真实情景中再次考察了健康目标启动对高热量和低热量食物选择的影响,以及对食物的情感预测的中介作用。该研究中,作者不仅从发现结果到探讨作用机制,设计了研究1、研究2,而且从提高研究的外部效度角度进一步设计了研究3。Ring等(2018)通过3个研究(1项调查,1项实验和 1项现场研究)探讨了成就目标在运动竞赛作弊中的作用。研究 1的调查发现,自我定向与运动员竞赛作弊接受度呈正相关,与任务定向呈负相关;在研究 2的实验中,通过操纵不同的指导语,将研究参与者随机分配到自我定向目标、任务定向目标和对照组中,然后让其在 1~7分的作弊可能性上打分,结果发现,自我定向目标组较对照组运动员作弊可能性更高,自我定向目标与任务定向目标之间没有差异,但是任务定向目标组的作弊可能性也显著高于对照组;在研究 3中,作者使用现场研究的方法检验了目标取向与跑步比赛中作弊的关系,结果发现,为了增加在比赛中赢得奖金的机会而作弊的运动员比没有作弊的人有更高的自我目标取向。该研究从调查(研究1)到实验(研究 2),提升了研究的内部效度,再到现场研究(研究3),扩展了研究的外部效度,为自我定向目标与竞赛作弊之间关系的确定提供了层层深入的证据。
3 小结
科学研究需要一点一滴的积累,科学结论需要系列研究提供强证据。否则,就像 Kaelin(2017)所言:“科学论文的目标已经从使用多种方法来检验具体的结论,转移到了以多种方式做出尽可能广泛的论断,而每个论断都基于有限的证据。”证据对于科学研究大厦的重要性不言而喻,而系列研究则可以提高研究的可重复性和说服力,为科学研究的结论提供更强的证据或证据链。作者希望通过本文呼吁,在强调大胆假设和创新开拓的同时,也要重视系列研究体现的步步为营、小心求证的科学精神,将我们的研究做实、做细、做深、做长。
致谢:感谢美国北卡罗来纳大学格林斯堡分校陈昂教授对本文提出的极富启发性的建议。