可重复性:盘旋在具身认知实验室上方的“幽灵”
2014-01-23陈巍
Williams 和 Bargh(2008)的实验发现,手捧热咖啡的被试会倾向于将实验人员评价为是“热情的”, 而手捧冷咖啡的被试则会倾向于将实验人员评价为是“冷淡的”。该项研究已经成为具身认知的经典实验。
近十年来,具身认知(embodied cognition)正在挑战心理学的各个分支与研究主题,并逐渐成为一种强势的、流行的心理学实验文化[1]。然而,近来的种种迹象显示,“可重复性”(replicability)或“再现性”(reproducibility)问题已经成为了盘旋在具身认知实验室上方的“幽灵”,如果不引起研究者的足够警惕,那么它随时可以摧毁该领域现有的科学公信力。
在认识论层面上,“可重复性”特指科学研究被重复实施时得到的结论与原研究结论之间的一致性程度。它是衡量科学的“黄金标准”(gold standard),也是科学与非科学的分界线[2]。原则上,科学证据的所有组成部分都可以由其他研究者遵循原始的方法而得到独立的再现,并由此检验先前的研究者的探究发现是否真实有效。然而,当前的具身认知研究正在经历“可重复性危机”。以近期围绕Bargh等(1996)的经典研究及其争议为例,早在20世纪90年代中期,耶鲁大学著名的社会心理学家Bargh等的实验用句子启动关于老年人的刻板印象(stereotype),尽管启动没有涉及与缓慢相关的字词,但是被启动的被试较之那些没有被启动的被试,他们在离开实验室的时候走路的速度变得更加缓慢,参与者并没有意识到自己的走路速度变慢[3]。这个研究开启了“社会性启动效应”(social priming effect)时代,并被视为具身认知领域内无可争辩的研究范
例[4]。然而,Doyen等(2012)的实验完全重复了该报告的实验二,并使用红外装置测速代替Bargh等实验中的人工计时,结果发现并不存在上述启动效
应[5]。这一事件旋即引发了心理学内部一场规模庞大的“唇枪舌战”,甚至连心理学巨擘、诺贝尔奖获得者Daniel Kahneman的出面调停都无济于事[6-9]。
与之形成鲜明对照的是,从表面上看,具身认知领域的研究数量及相关证据依然在逐年激增,这些海量具身认知研究秉承的是 “概念性重复”(conceptual replication)的策略[10]。与“直接重复”(direct replication)旨在尽可能忠实地再现原始的科学证明不同,概念性重复往往刻意改变研究设计中核心要素(例如自变量、因变量或者两者)的操作方式。在当前的具身认知实验中随处可见这种设计。你用物体的粗糙程度(自变量)来启动对社会性任务困难程度的评估(因变量),我就用物体的坚硬程度(自变量)来启动性格判断(因变量)。然而,概念性重复在理论上并非是一种对直接重复的有效替代方案。正如具身启动效应的批判者Nosek等(2012)批判的:“直接重复能够产生事实,而概念性重复只可能产生理解。因为原始设计的特征被刻意地改变了,概念性重复仅仅被用来证实(并且是抽象)原始的结论,而不能用来证伪它。一个成功的概念性重复研究可以被用来作为原始结论的证据,但一个失败的概念性重复却会因为没有对原始现象进行检验而惨遭摒弃。” [10]
在实用论层面上,使用概念性重复作为直接重复的替代方案反映了科学研究中普遍存在的“证实偏见”(confirmation bias),而具身认知正在成为这种偏见在心理科学中的新代言人。所谓证实偏见就是研究者倾向于偏爱那些能够支持他们信念或假说的信息,反映在研究设计中一般表现为各种“期望效应”(expectancy effects)。例如,Klein等(2012)以及Loersch 和Payne(2012)指出,实验者的“期望效应”或由此引发的被试的“心理污染”(mental contamination)导致了Bargh等实验中出现社会性启动效应[11-12]。“证实偏见”导致的更为严重的恶果是以选择性筛选数据(cherry-pick data)获取阳性统计结论等直接的学术造假。这个问题正在严重影响具身认知研究的信誉与形象。例如,2011年,荷兰著名社会心理学家Diederik Stapel的学术造假案中牵涉的多篇研究报告均曾被视为具身认知的重要支撑证据。随后,以从事具身认知研究成名的Dirk Smeesters、Lawrence Sanna等纷纷陷入学术造假丑闻[13]。据笔者不完全统计,自2011年以来,《心理科学》《人格与社会心理学杂志》《实验社会心理学杂志》等重要学术期刊撤销了十余篇与具身认知相关的实验稿件。伴随具身认知研究结论的不可重复性被频繁地曝光,具身认知运动也正陷入一场空前的信任危机。
针对上述问题,近两年来心理科学内掀起了一轮有关可重复性的大规模检省与调查。2012年11月,《心理科学透视》出版专辑探讨了可重复性对于心理科学研究的重要性。最近,在Pashler倡导下运营的“心理文件柜”(psychfiledrawer)网站成立,并已经对20余项具有影响力的心理学实验进行了一系列严格的直接重复研究[2]。相关的结果令人触目惊心——具身认知领域内的大量研究均存在不同程度的不可重复问题:与老年人有关的词汇启动步伐速率;画线段的长短启动与家庭成员关系的心理距离;金钱概念启动自立动机(self-reliance motivation)从而影响助人行为;等等(详见PsychFileDrawer. org,2013)。与此同时,Nosek组织的“公开科学协作”(Open Science Collaboration)运动更是邀请了来自全球范围内41个心理学研究机构的71位志愿科学家来为心理科学研究的可重复性把脉[14]。这些措施也得到《公共图书馆·综合》等期刊的大力支持。最近,英国伦敦大学学院的心理学家Shanks等在该杂志发表的实验报告直接重复并质疑了荷兰心理学家Dijksterhuis等开展的一项著名具身认知实验所得出的结论:有关智力高低形象的刻板印象直接影响个体在一般知识测验上的成绩。例如,联想到大学教授的被试要比联想到足球流氓的被试在知识测验上的表现更好[15]。Harris等也在该杂志发表了针对Bargh等(2001)的直接重复实验,后者曾发现与成功有关的词汇(例如,奋斗、成就)可以让被试在随后的认知任务中表现更好,而Harris等的实验并没有发现相同的结果[16]。
此外,心理统计学家Simonsohn等坚持以统计学手段来甄别、打击与消除当前心理科学实验中由证实偏见导致的伪阳性(false positives)的研究结论[17]。阿姆斯特丹大学实验心理学家Wicherts则呼吁实验心理学家们应该尽可能透明化地公开自己研究的原始数据以供他人进行重复验证[18]。
近来,面对上述种种猜忌与质疑,无论是Bargh还是Dijksterhuis都给出了自己的回应。Dijksterhuis(2013)甚至抱怨:“近来心理学家中存在的意识形态就是不愿相信我们的行为可以受到环境的无意识提示。” [19]然而,具身认知的支持者应该牢记:实验心理学家的使命不在于“斗嘴”,而在于拿出确凿的实验证据,没有任何一个研究者或研究可以例外。因此,若想驱散这个在具身认知实验上方盘旋已久的“幽灵”,《心理学家》杂志提供的对策却出奇得简单——那就是:可重复!可重复!可重复![20]
[1] 陈巍, 郭本禹. 具身—生成认知: 走出 “战国时代”[J]. 心理学探新, 2014, 33: 出版中.
[2] Pashler H, Wagenmakers E J. Editors introduction to the special section on replicability in psychological science: A crisis of confidence?[J]. Perspectives on Psychological Science, 2012, 7: 528–530.
[3] Bargh J A, Chen M, Burrows L. Automaticity of social behavior: Direct effects of trait construct and stereotype activation on action[J]. Journal of Personality and Social Psychology, 1996, 71: 230–244.
[4] Glenberg A. Embodiment as a unifying perspective for psychology[J]. Wiley Interdisciplinary Reviews: Cognitive Science, 2010, 1(4): 586–596.
[5] Doyen S, Klein O, Pichon C L, Cleeremans A. Behavioral priming: Its all in the mind, but whose mind?[J]. PLoS ONE, 2012, 7: e29081.
[6] Yong E. The data detective[J]. Nature, 2012, 487: 18–19.
[7] Yong E. Replication studies: Bad copy[J]. Nature, 2012, 485: 298–300.
[8] Bargh J A, Schwader K L, Hailey S E, Dyer R L, Boothby E J. Automaticity in social-cognitive processes[J]. Trends in Cognitive Science, 2012, 16(12): 593–605.
[9] Yong E. Nobel laureate challenges psychologists to clean up their act: Social priming research needs “daisy chain” of replication[J]. Nature, 2012, doi:10.1038/nature.2012.11535.
[10] Nosek B A, Spies J R, Motyl M. Scientific utopia II. Restructuring incentives and practices to promote truth over publish ability[J]. Perspectives on Psychological Science, 2012, 7: 615–631.
[11] Klein O, Doyen S, Leys C, Magalhaes P, Miller S, Questienne L, Cleeremans A. Low hopes, high expectations: Expectancy effects and the replicability of behavioural experiments[J]. Perspectives on Psychological Science, 2012, 7: 572–584.
[12] Loersch C, Payne B K. On mental contamination: The role of (mis)attribution in behavior priming[J]. Social Cognition, 2012, 30: 241–252.
[13] Yong E. Uncertainty shrouds psychologists resignation[J]. Nature, 2012, doi:10.1038/nature.2012.10968.
[14] Open Science Collaboration. An open, large-scale, collaborative effort to estimate the reproducibility of psychological science[J]. Perspectives on Psychological Science, 2012, 7: 657–660.
[15] Shanks D R, Newell B R, Lee E H, Balakrishnan D, Ekelund L, Cenac Z, Fragkiski K, Mooreb C. Priming intelligent behavior: An elusive phenomenon[J]. PloS ONE, 2013, 8(4): e56515.
[16] Harris C R, Coburn N, Rohrer D, Pashler H. Two failures to replicate high-performance-goal priming effects[J]. PLoS ONE, 2013, 8(8): e72467.
[17] Simmons J, Nelson L, Simonsohn U. False-positive psychology: Undisclosed flexibility in data collection and analysis allow presenting anything as significant[J]. Psychological Science, 2011, 22: 1359–1366.
[18] Wicherts J M, Bakker M. Publish (your data) or (let the data) perish! Why not publish your data too? [J]. Intelligence, 2012, 40: 73–76.
[19] Abbott A. Disputed results a fresh blow for social psychology: Failure to replicate intelligence-priming effects ignites row in research community[J]. Nature, 2013, 497: 16.
[20] Ritchie S J, Wiseman R, French C C. Replication, replication, replication[J]. Psychologist, 2012, 25(5): 346–348.
注:本研究系中国博士后科学基金一等资助项目(2013M540497);中央高校基本科研业务费专项资金;浙江省教育厅科研项目(Y201328164)的阶段性成果。
栏目编辑 / 王晶晶.终校 / 任玉丹
[15] Shanks D R, Newell B R, Lee E H, Balakrishnan D, Ekelund L, Cenac Z, Fragkiski K, Mooreb C. Priming intelligent behavior: An elusive phenomenon[J]. PloS ONE, 2013, 8(4): e56515.
[16] Harris C R, Coburn N, Rohrer D, Pashler H. Two failures to replicate high-performance-goal priming effects[J]. PLoS ONE, 2013, 8(8): e72467.
[17] Simmons J, Nelson L, Simonsohn U. False-positive psychology: Undisclosed flexibility in data collection and analysis allow presenting anything as significant[J]. Psychological Science, 2011, 22: 1359–1366.
[18] Wicherts J M, Bakker M. Publish (your data) or (let the data) perish! Why not publish your data too? [J]. Intelligence, 2012, 40: 73–76.
[19] Abbott A. Disputed results a fresh blow for social psychology: Failure to replicate intelligence-priming effects ignites row in research community[J]. Nature, 2013, 497: 16.
[20] Ritchie S J, Wiseman R, French C C. Replication, replication, replication[J]. Psychologist, 2012, 25(5): 346–348.
注:本研究系中国博士后科学基金一等资助项目(2013M540497);中央高校基本科研业务费专项资金;浙江省教育厅科研项目(Y201328164)的阶段性成果。
栏目编辑 / 王晶晶.终校 / 任玉丹
[15] Shanks D R, Newell B R, Lee E H, Balakrishnan D, Ekelund L, Cenac Z, Fragkiski K, Mooreb C. Priming intelligent behavior: An elusive phenomenon[J]. PloS ONE, 2013, 8(4): e56515.
[16] Harris C R, Coburn N, Rohrer D, Pashler H. Two failures to replicate high-performance-goal priming effects[J]. PLoS ONE, 2013, 8(8): e72467.
[17] Simmons J, Nelson L, Simonsohn U. False-positive psychology: Undisclosed flexibility in data collection and analysis allow presenting anything as significant[J]. Psychological Science, 2011, 22: 1359–1366.
[18] Wicherts J M, Bakker M. Publish (your data) or (let the data) perish! Why not publish your data too? [J]. Intelligence, 2012, 40: 73–76.
[19] Abbott A. Disputed results a fresh blow for social psychology: Failure to replicate intelligence-priming effects ignites row in research community[J]. Nature, 2013, 497: 16.
[20] Ritchie S J, Wiseman R, French C C. Replication, replication, replication[J]. Psychologist, 2012, 25(5): 346–348.
注:本研究系中国博士后科学基金一等资助项目(2013M540497);中央高校基本科研业务费专项资金;浙江省教育厅科研项目(Y201328164)的阶段性成果。
栏目编辑 / 王晶晶.终校 / 任玉丹