基于不同冲突水平的认知控制对性别刻板印象表达的影响*
2022-06-06陈莉石晓柯李维娜胡妍
陈莉 石晓柯 李维娜 胡妍
(西北师范大学心理学院;甘肃省行为与心理健康重点实验室,兰州 730070)
1 引言
性别刻板印象是人们对两性认知的一种固化加工模式(Rudman &Kilianski,2000),它通常给人们提供了一种社会可接受性的标准,这种标准可以传达什么样的行为是适合男人的和什么样的行为是适合女人的信息(Croft,2016)。中国自古就有“男主外,女主内”的说法。国外也有研究表明,人们普遍具有男人应该养家糊口和女人应该照料家庭的性别刻板印象,这种刻板印象导致了对性别角色的不同期望及对性别发展技能上的不同侧重,进而促进了男女在社会行为上的分化差异(Eagly &Steffen,1984;Eagly,1987)。
传统的性别刻板印象对现代女性职业和家庭之间的协调有着很大的困扰,而男性也承担着来自家庭经济主力的巨大压力。这种刻板化的家庭角色分工对性别平等和家庭和谐往往会产生消极的影响(Cundiff &Vescio,2016)。虽然在社会宏观层面,通过设置陪产假、育婴假、利用社会规范等干预措施可以来缓解男性和女性在职业和家庭中的角色分工并进而缓解公众所持有的性别刻板印象。但即便如此,深植于个体认知层面的性别刻板印象依旧没有被消除,并且有可能随时随地被激活。要避免刻板印象的自动激活是较为艰难和复杂的任务,而被自动激活的刻板印象却可以通过调整个体认知控制的方式对其表达进行有效抑制(Amodio &Swencionis,2018)。
认知控制指的是人们能根据目标或任务做出相应的反应,遇到分心物能保存目标、抑制习惯性反应或冲动行为的能力(Miller &Cohen,2001)。双重控制机制(DMC)理论认为个体的认知控制能力具有一定的可变性,这一理论提出认知控制主要包括主动控制(proactive control)和反应控制(reactive control)两种模式(Braver et al.,2007)。反应控制强调了个体在单个认知事件中对目标刺激的感知判断(Brown et al.,2007),能够对快速变化的外部条件作出即时行动,通常代表一种短暂的局部或微观控制,也被称为晚期校正机制(Purmann et al.,2011);主动控制则侧重于个体在整个认知事件中持续保持对目标信息的关注,一种目标驱动的感知信息的方式,对快速变化的外部条件做出更为持久的战略优化行动(Funes et al.,2010;Braver et al.,2009),通常反应了一个较长的宏观时间尺度的发展模式(Braver et al.,2007;Miller &Cohen,2001),也被称为“聚焦模式”(Gratton et al.,1992)。例如,一个人在下班后总是在十字路口左转,但听说那条路上堵车,他可能在到达十字路口之前提醒自己右转,这便是是主动控制策略;但他也可能采用反应控制模式,即到达十字路口后,遇见堵车,然后右转以避开拥挤的交通。从起效的阶段和效果来看,反应性控制依赖于干扰发生后的问题检测和解决(Braver,2012),它是在偏见出现后调整其认知模式,而主动控制依赖于干扰发生前的预期和预防,即在偏见出现之前根据目标来确定其认知模式(Braver et al.,2009)。
传统上,社会认知中偏见控制的理论模型强调的是一种反应性的控制形式,即当检测到偏见后所实施的认知加工方式,其作用是纠正激活的偏见对目标反应的影响(Fazio,1990;Amodio et al.,2004;Sherman et al.,2008)。不同于反应控制,主动控制可以在激活人们头脑中关于刻板印象的相关信息之前,有效地将刻板印象的关注点迁移至任务目标本身,通过对任务困难的体验或对一个人的预期行为增加的动机限制内隐刻板印象在行为中表达的可能性(Amodio et al.,2018),而不仅仅在刻板印象出现或激活之后才开始发挥作用。几乎所有考察刻板印象的研究均离不开对比刻板印象一致信息和不一致信息的加工差异(贾磊 等,2016;Lai et al.,2016),在实验室条件下常采用冲突任务来研究认知控制(Gonthier et al.,2021)。冲突监控理论(conflict monitoring theory;van Veen &Carter,2005)是最常见的对冲突任务理解的理论解释。该理论认为,对冲突信息进行加工包含着两个不同的成份:(1)评价成份(即冲突监测);(2)执行成份(即执行控制)。不一致信息在认知过程中所产生的冲突强度是调节认知加工的基础,用于唤起与任务相关的知觉负载。其中,评价成分是对输入信息进行冲突识别并做出是否需要快速反应的决策成分,而执行成分是基于一定的任务指令,在知觉负载有限的条件下实现决策的成分(崔诣晨,2016)。根据双重控制理论,人们在不同情境下会灵活地使用反应性控制或主动控制,从而影响刻板印象表达以及强度。在低冲突背景下,任务相对简单,对刻板印象的冲突监测不常发生,执行控制的水平会相应下降,难以抑制刻板印象的表达;而在高冲突背景下,任务困难,冲突监测会持续发生,执行控制的水平也适当提高,从而增强对任务目标本身的关注,促进主动控制模式的发生,进一步减弱刻板印象的表达(Amodio &Swencionis,2018)。
Bartholow 和Dickter (2008,2010)的研究对种族分类任务中高冲突和低冲突试验的比率进行了操纵,其结果显示,高冲突组相对于基线组产生了一个减弱的刻板印象冲突模式,而低冲突组相对于基线组产生了一个更强的刻板印象冲突模式(Bartholow &Dickter,2008;Dickter &Bartholow,2010),但这些研究并未直接验证认知控制对种族刻板印象表达的影响。在Amodio 和Swencionis(2018)的研究中,首次提出的主动控制模型(Proactive Model of Control) (图1),分别采用了武器识别范式(Payne,2001)、刻板印象启动任务考察了主动控制对种族刻板印象表达的抑制作用,证实了相比基线组,个体在高冲突水平下会采用主动控制的加工模式,抑制种族刻板印象的表达,在低冲突水平下则会明显地表现出种族刻板印象。
图1 主动控制模型(Amodio &Swencionis,2018)
前人的研究是在不同的任务情境中独立探究了反应性控制或主动控制对刻板印象表达的影响。并且,研究中所聚焦的种族刻板印象是西方社会所特有的一种文化现象,因而无法对双重控制机制理论提供充分的证据。鉴于此,研究着眼于更具文化普适性的性别刻板印象,在同一实验任务中来探究认知控制影响刻板印象表达的机制,即探明反应性控制和主动控制在刻板印象表达中发挥作用的条件。
性别刻板印象的表达与个体接触到的性别信息呈现形式相关。具体而言,性别信息呈现形式主要包括图片和语词两种类型。王沛等人(2010)提出,以具体的图片信息作为刺激,不论所选取的图片与某一群体的刻板联系有多紧密(如,黑人面孔-犯罪图片,女性面孔-家务图片等),都只能反映出刻板印象的动态图式特点,却无法完全体现出刻板印象语义图式结构所暗含的抽象化加工特点;同样地,以抽象语义属性的文字信息作为目标刺激,则无法完全体现出刻板印象典型样例的具体化表征特点。情境-特异性启动效应(context-specific prime effects,CSPC)的研究表明,不同冲突比例的任务情境可以使个体对冲突信息或非冲突信息产生不同的关注程度,并根据冲突的特异性来持续启动不同的信息加工模式(Bailey et al.,2010),在这一研究中,由于设定不同的冲突比例情境,因此可以更好地使知觉者调节对刻板化信息进行概念编码或知觉编码(袁菲,2015;崔诣晨,2016)。此外,刻板印象的语义联结表现为自上而下的概念驱动加工,而具体样例联结则表现为自下而上的知觉驱动加工(Blair &Banaji,1996)。因此,研究进一步探讨不同冲突水平引发的认知控制对性别刻板印象表达的影响是否具有跨信息呈现形式的一致性?
在现实生活中除了使认知控制策略在一定的条件下发挥作用以外,更重要的是在当前情况下引发的认知控制可以为后续的情况创造控制准备状态(Kleiman et al.,2014),使得认知控制可以在不同的任务中进行及时调整。以往的研究普遍认为认知控制调整具有领域特异性,不同领域之间的控制调整是相当有限的(Egner,2008;Hazeltine et al.,2011)。不过也有观点认为,认知控制引发的冲突调整状态具有领域适用性的特点(Kleiman et al.,2014;袁菲,2015)。对刻板印象的研究表明,前面试次中的经典Flanker 任务的控制准备状态对后续刻板印象 Flanker 任务的表达起到了控制调整作用(Kleiman et al.,2014;袁菲,2015),尽管已有研究试图想说明认知控制对刻板印象表达的作用具有跨任务情境的一致性,但由于前后实验试次中采用同一任务范式,所以对于这一问题并未进行有效的解答。
综上所述,本研究探究认知控制对性别刻板印象表达的作用机制。针对上述问题,研究假设:(1)高冲突水平的目标分类任务会引发主动控制,从而抑制性别刻板印象的表达;低冲突水平的目标分类任务会引发反应性控制,从而促进性别刻板印象的表达。(2)不同冲突水平引发的认知控制对性别刻板印象表达的抑制作用具有跨任务情境的一致性。
2 实验1:图片目标条件下的认知控制对性别刻板印象的影响
2.1 方法
使用G-power 3.1 (Faul et al.,2009)计算研究所需的样本量,效应量设置为0.25,设定α 为0.05,并且检验效能为0.8,至少需要36 人。基于先前同类研究中所用到的样本量为25~63 之间(Amodio &Swencionis,2018;Kleiman et al.,2014),以及综合考虑到实验过程中可能出现的问题(如无效被试、男女人数差异等),实际招募被试60 名(男性26 名),平均年龄24.60 岁(=2.82),裸视或矫正视力正常,能熟练操作计算机,之前未参加过类似实验。所有被试均为自愿参加,实验结束后给予一定的报酬。
实验材料由“启动-目标刺激”对构成,以男性和女性面孔图片为启动刺激,以工作和家务场景为目标刺激。启动图片为:4 张男性图片和4 张女性图片,其中2 张男性图片2 张女性图片作为练习刺激,2 张男性图片2 张女性图片作为正式实验刺激;目标图片为:6 张家务图片和6 张工作图片,其中2张家务图片2 张工作图片作为练习刺激,4 张家务图片4 张工作图片作为正式实验刺激。
启动图片的材料参考Croft (2016)研究1,结合已有图库选取男女图片各10 张,用Photoshop7.0软件对选取照片进行统一标准化处理,使所有照片均为相同亮度的灰色背景,大小均为420 × 380 像素(Amodio &Swencionis,2018)。另找176 名被试作为独立样本,对选取的20 张图片进行面孔整体印象的5 点评分(从1“非常不好”—5“非常好”),从中筛选出面孔整体印象位于中间水平的男女图片各8 张。然后对筛选出的图片进行评分的差异性检验,独立样本检验的结果表明,男性图片与女性图片在整体印象维度上不存在显著差异(=3.10,=3.20),(14)=-1.494,0.157;此外,研究表明,人们对不同年龄的男性和女性存在着不同的刻板印象(任娜 等,2012),所以本研究将面孔年龄的范围控制在25~30 岁之间,并且男女图片在面孔年龄上也无显著差异(=27.95,=27.37),(14)=0.492,0.631。另外,单样本检验的结果表明,男性图片和女性图片与较极端的面孔整体印象水平均有显著差异(s < 0.001)。
目标图片的材料来源参考Croft (2016)研究中所使用到的工作和家庭图片,从网络图库中选取与家务活动和职业活动相关的场景图片各12 张(图片中没有人物,只有相关的工作背景和家庭背景),处理标准同启动图片,使所有照片的亮度保持一致,大小均为420 × 380 像素(Croft,2016)。由176 名独立样本对事先选取的24 张图片围绕场景的代表性来进行5 点评分(1“非常不符合”—5“非常符合”)。最后筛选出代表家务活动和职业活动场景的图片各6 张。然后对筛选出的图片进行评分的差异性检验,独立样本检验的结果表明,工作图片与家庭图片在场景代表性水平上不存在显著差异(=3.79,=3.82),(10)=0.295,0.779。单样本检验的结果表明,工作图片和家庭图片的代表性均与图片代表性的中间水平差异显著(s < 0.001)。最后用Adobe Photoshop CSl 软件包将筛选出的图片制作成BMP 格式图片。
采用3 (任务冲突水平:高冲突,基线,低冲突)× 2 (启动刺激:男性图片vs.女性图片) × 2 (目标刺激:工作图片vs.家务图片)的被试内实验设计。这样构成12 种实验处理:每种冲突水平下,男性图片-工作图片、女性图片-家务图片(即目标图片与启动图片所激活的刻板印象一致)和男性图片-家务图片、女性图片-工作图片(即目标图片与启动图片所激活的刻板印象不一致)。因变量指标为图片分类任务中每种实验处理的平均反应时与正确率。
由于个体本身的初始情绪状态与性别角色的观念水平会对刻板印象的认知加工产生影响。使用邱林等(2008)修订的《PANAS 情绪自评量表》测量被试的情绪水平,该情绪量表采用5 点计分的方式,包括积极情绪自评(9 个积极形容词)和消极情绪(9个消极形容词)自评两部分,每种情绪类型的均分越高,表明情绪越强烈。结合中国妇女社会地位调查(CWSSS)和中国综合社会调查(CGSS)中的性别观念的题项形成《性别角色观念量表》,将其区分为传统主义取向和现代主义取向(Rajadhyaksha et al.,2015)。该实验中,《性别角色观念量表》的信度系数为0.83,结构效度为0.67,60 名被试在该量表中的得分为=3.80,=0.51,并且在测量家庭角色分工的题项中,父亲主外母亲主内的比例为53.3%,母亲主外父亲主内为3.3%,父母双方处于均衡状态 的人数为43.3%。采用改进的武器识别范式(Weapons Identification Task,Payne,2001)和操纵任务干扰的方法(Appelbaum et al.,2014)来操控实验流程。实验分成高冲突、基线、低冲突三种条件:在高冲突水平下,不一致试次的呈现比例为80%,一致试次的呈现比例为20%,在基线水平下,不一致试次和一致试次的呈现比例均为50%,在低冲突水平下,不一致试次的呈现比例为20%,一致试次的呈现比例为80%。正式实验由6 个区组组成,每一个冲突水平有两个区组,且这6 个区组采用平衡式拉丁方设计。每个区组有40 个试次,共240个试次。其中高冲突水平中一致16 个试次,不一致64 个试次;基线水平中一致和不一致试次各呈现40 次;低冲突水平中一致64 个试次,不一致16 个试次。利用E-prime 2.0 来呈现实验中出现的刺激,所有刺激均呈现在电脑屏幕中央,试次的顺序在每个区组中随机分配。
实验指导语为:“首先屏幕的中央会出现一个‘+’号注视点,请您将注意力集中在该点上。随后屏幕的中央会呈现一张性别面孔图片,紧接着会呈现一张场景图片,最后会呈现一张椭圆形状的图片。您需要在椭圆形状的图片呈现时,对场景图片的类别进行快速且准确的分类判断:属于家务劳动的图片请按D 键;属于职业活动的图片请按K 键。理解后按空格键进入练习阶段。”练习中的刺激材料和正式实验材料不同,练习阶段总共呈现16 次。如果被试的准确反应率低于70%,则要求被试重新练习,直到准确率达到要求才能进入正式实验。一个试次的流程见图2。
图2 实验1 流程图
2.2 结果
表1 不同冲突水平下和目标刺激下目标分类的正确率及反应时(ms)
对每种冲突条件下刺激类型的反应时均值进行3 (冲突水平:高冲突水平,基线水平,低冲突水平) × 2 (启动刺激:男性图片,女性图片) × 2 (目标刺激:工作图片,家庭图片)的重复测量方差分析,结果并未显示出任何显著的效应(s > 0.05)。
将性别角色观念均分作为协变量,在冲突水平上对被试反应的平均正确率和反应时分别进行重复测量方差分析,结果冲突水平的主效应也不显著(s > 0.05)。
2.3 讨论
从分析结果上来看,我们的假设虽然并没有得到相应的验证,但从反应时和正确率指标代表的含义具体来看(Kidder et al.,2018),即使三种冲突水平下的正确率并没有显著的差异,但正确率和控制的估算值都是相对较高的(如表2),这说明被试对目标刺激的认知准确性在整个任务中并不受冲突水平干扰的影响,三种冲突水平下的反应时没有显著差异,说明被试对目标刺激的加工速度也不受认知冲突干扰的影响,一直持续稳定的维持在同一注意水平。
表2 不同冲突水平下的主动控制与反应控制估算值
通过查阅相关资料,结合实际因素的考虑,我们初步将没有验证假设的原因归为以下几个方面。首先,从实验任务的性质来说,根据呈现的目标图片进行分类判断与其他测量刻板印象的任务(如:启动-靶子一致性判断任务、内隐联想任务)引发的认知冲突并不相同。刻板印象表征的联结模型指出,分布式的循环网络善于对一些图像或模式干扰进行识别,基于特定任务出现的循环联结可以使个体从本质上过滤出各种干扰(van Rooy et al.,2003),所以不强调启动图片/干扰刺激与目标图片的联结判断,使得个体更易获得只关注目标图片的加工模式,其相应的判断会较少受到同一冲突类型但存在冲突水平差异的影响。
其次,从实验材料的外在表现维度来看,启动刺激和目标刺激均为彩色清晰图片,虽然具有很高的生态效度,不过启动刺激和目标刺激的重复配对试次较多,使得被试在习得材料的加工模式后易在不同的冲突任务水平中出现练习效应,并且大量关于启动刺激的研究发现,刺激材料的丰富性对正确率和反应时起到了至关重要的影响(Kidder et al.,2018)。
此外,从实验材料的内在加工形式来思考,关于文字和图像处理区别的理论观点认为:在进入情感判断之前,文字加工包含了比图像加工更多的额外处理。文字的额外处理包括自上而下的加工,并产生心理表征,帮助我们获得情感方面的刺激。由于自我保护的本能,文字的消极心理表征可能通过个体的意识系统被削弱。因此,文字和图片之间的情感偏向可能不同(Yuan et al.,2019)。
3 实验2:词语目标条件下的认知控制对性别刻板印象的影响
3.1 方法
同实验1,最低被试量需要36 名。实际招募62名被试参与实验,其中两名被试未能遵循任务指示被排除在外,3 名被试的数据因无效反应过多被剔除,2 名被试因反应的正确率过低被排除,最终有效被试共55 名(男性26 名),平均年龄19.87 岁(=2.54)。所有被试视力或矫正视力正常,能熟练操作计算机,之前未参加过类似的实验。所有被试均为自愿参加,实验结束后可获得相应的报酬。
采用3 (任务冲突水平:高冲突,基线,低冲突)× 2(启动刺激:男性图片,女性图片) × 2 (目标刺激:工作词语,家务词语)的被试内设计。这样构成12种实验处理:每种冲突水平下,男性图片-工作词语、女性图片-家务词语(即目标词语与启动图片所激活的刻板印象一致)和男性图片-家务词语、女性图片-工作词语(即目标词语与启动图片所激活的刻板印象不一致)。因变量为词语分类任务中每种实验处理的平均反应时与正确率。
实验材料由“启动-目标刺激”对构成,以男性和女性面孔图片为启动刺激,以工作和家务词语为目标刺激。启动图片为:6 张男性图片和6 张女性图片,其中2 张男性图片2 张女性图片作为练习刺激,4 张男性图片4 张女性图片作为正式实验刺激;目标词语为:10 个家务活动词语和10 个职业工作词语,其中2 个家务词语2 个职业词语作为练习刺激,8 个家务词语8 个职业词语作为正式实验刺激。
启动图片从实验1 筛选出的性别图片中选取。目标词语的来源参考吴梦玲(2017)的研究,再通过网络调查的方式获取20 个家务活动和20 个职业工作的词语,然后选取40 名被试(其中男性19 人,=20)对词语的典型性进行5 点评分(从1“非常不典型”—5“非常典型”)。对筛选出的词语做差异性检验,独立样本检验的结果表明,家庭词语与工作词语在典型性上无显著差异(=3.95,=3.97),(38)=-0.288,0.775;单样本检验的结果表明,家庭词语和工作词语均与典型性的中间水平存在显著差异(s < 0.001)。最后选取每组词平均得分靠前的词语作为目标词语。
测量被试的情绪状态和性别角色观念水平的问卷同实验1,该实验中,《性别角色观念量表》的信度系数为0.79,结构效度为0.62,55 名被试在该量表中的得分为=3.89,=0.49,并且在测量家庭角色分工的题项中,父亲主外母亲主内的比例为47.3%,母亲主外父亲主内为0,父母双方处于均衡状态的人数为49.1%,父母均不兼顾的人数为3.6%。实验整体流程与实验1 基本一致,不同之处是实验2 的任务是对目标词语做出属于“家庭”或“职业”的分类判断,具体的试次的流程如图3 所示。
图3 实验2 流程图
3.2 结果
对冲突水平正确率的主效应做进一步的事后多重比较,如表3 结果显示:高冲突水平下四种刺激类型的平均正确率(=0.96,=0.01)高于低冲突水平(=0.94,=0.01,< 0.001)和基线水平(=0.95,=0.01,0.019);但低冲突水平下四种刺激类型的平均正确率(=0.94,=0.01)与基线水平差异不显著(=0.95,=0.01,0.228)。因此,正如预测的那样,被试在高冲突水平上表现最好。
表3 不同冲突水平下对目标刺激进行分类判别的正确率及反应时(ms)
图4 不同冲突水平和启动刺激下目标分类的正确率
相比之下,在高冲突条件下,刻板印象被消除,启动刺激和目标刺激之间不存在显著的交互作用,(1,54)=0.21,0.651。另外,启动刺激和目标刺激的主效应也均不显著(> 0.05)。男性图片后的工作词语(=0.97,=0.01)与男性图片后的家庭词语之间的正确率没有差异(=0.95,=0.01),(1,54)=3.40,0.071,女性图片后的工作词语(=0.97,=0.01)与女性图片后的家庭词语之间的正确率也没有差异(=0.96,=0.01),(1,54)=1.11,0.298。
对冲突水平反应时的主效应做进一步的事后多重比较,如表3 的结果显示:高冲突水平下四种刺激类型的平均反应时(=467.78,=9.77)与低冲突水平(=442.45,=10.17)存在比较显著的差异(< 0.001);基线水平下四种刺激类型的平均反应时(=456.70,=8.13)与低冲突水平(=442.45,=10.17)存在边缘显著(=0.076);不过高冲突水平下四种刺激类型的反应时(=467.78,=9.77)与基线水平之间(=456.70,=8.15)的差异不显著(0.150)。因此,正如预测的那样,被试在高冲突水平上反应时最长,而在低冲突水平上反应时最短。
表4 不同冲突水平下的主动控制与反应控制估算值
最后,我们分析了PDP-A 的估算值,以验证我们的预测。由于PDP-A 公式在PDP-C=1 时无法求解(即,当一个或多个试次类型的准确率为 100%时),会造成有些受试者的PDP-A 的分值缺失。仅有20 名被试在所有试次条件下都有有效的PDP-A分值,将这20 名被试纳入本次分析中。对PDP-A的估算值做3 (冲突水平:高冲突水平,基线水平,低冲突水平) × 2 (启动刺激:男性图片,女性图片)的重复测量方差分析,结果并未出现任何显著的主效应和交互作用(s > 0.05),不过数据显示,PDP-A的估算值在高冲突条件下的自动估算值最高(=0.69,=0.05),基线水平位于中间(=0.63,=0.05),低冲突水平最低(=0.56,=0.06),见表4。这样的模式与冲突效应在不影响内隐联想的情况下调节控制加工的参与是一致的(Hilgard et al.,2015)。
3.3 讨论
从词语分类任务正确率的结果来看,高干扰引发的控制加工优势在任务准确性上得到了很好的检验,即主动控制通过将注意力从与任务无关的干扰物(如性别)转移,以促进对高冲突比例任务的整体目标的处理(Amodio &Swencionis,2018)。在高冲突条件下,当男性图片/女性图片作为启动刺激出现时,被试对代表家庭和工作的词语均能做出正确的判断;而在基线和低冲突条件下则出现了典型的性别刻板印象模式,即当男性图片作为启动刺激出现时,被试表现出了对代表工作的词语更为准确的判断,而当女性图片作为启动刺激出现时,表现出了对代表家务的词语更为准确的判断。此外,高冲突水平和基线水平下的反应时高于低冲突水平条件下的反应时。利用加工分离程序对不同冲突水平下的控制加工进行分析发现,高冲突和基线水平相应的控制加工估算值较高,低冲突水平相应的控制加工估算值较低。因此,我们推测,低冲突水平下可能增加了参与者对反应性控制的依赖,而高冲突水平下被试更依赖于主动控制。不过,双重认知控制理论认为反应性控制和主动控制的认知加工过程可以根据情况发生动态的变化(Braver,2012;Schmid et al.,2015)。但当前的研究发现,高冲突和基线水平的自动加工估算值较高,而低冲突水平相应的控制加工估算值较低,间接证明了反应性控制和主动控制在同一任务中的协同加工的性质(Funes et al.,2010)。
在本研究中,我们对家庭角色分工的调查结果得出,大多数家庭中“父亲更倾向于挣钱养家,母亲更倾向于照顾家庭”,这一角色分工的差异性更符合低冲突任务中的性别刻板印象的呈现方式。而在高冲突任务中,刻板印象一致性刺激出现的比例很低,冲突刺激出现的比例更高,这种反性别刻板印象的呈现方式在现实生活中并不常见。根据刻板印象的混合模型的观点(Sherman,1996),低冲突条件的文字刺激由于认知经济的原则会更倾向于抽象表征,相应的,高冲突条件和基线条件则由于配对刺激的特异性更符合样例表征,而样例表征的特点即是准确且加工速度较慢。
4 实验3:转换任务下的认知控制对性别刻板印象的影响
4.1 方法
同实验1 和实验2,最低被试量需要36 名。实际招募67 名被试参与实验,其中4 名被试未能完成全部实验流程被排除在外,5 名被试的数据因无效反应过多被剔除。最终有效被试共58 名(男性29名),平均年龄22.33 岁(2.67)。所有被试视力或矫正视力正常,能熟练操作计算机,之前未参加过类似的实验。所有被试均为自愿参加,实验结束后可获得相应的报酬。
采用3 (词语分类任务的冲突水平:高冲突,基线,低冲突) × 2 (性别Flanker 任务的目标类别:男性化名字,女性化名字) × 2 (性别Flanker 任务的侧翼类别:男性化特质词,女性化特质词)的被试内实验设计,这样构成12 种实验处理:每种冲突水平下,男性化特质词-男性化名字-男性化特质词、女性化特质词-女性化名字-女性化特质词(即目标名字与侧翼刺激所激活的刻板印象一致)和男性化特质词-女性化名字-男性化特质词、女性化特质词-男性化名字-女性化特质词(即目标名字与侧翼刺激所激活的刻板印象不一致)。因变量为词语分类任务和性别Flanker 任务的平均反应时与正确率。
通过姓名和刻板特质词的组合,进一步形成48 个性别刻板印象一致的刺激(例如,男性化的名字被男性化刻板特征词包围,“阳刚 李军 阳刚”。其中关于男性刻板一致的刺激联结24 个,女性24个)和48 个性别刻板印象不一致的刺激(例如,男性化的名字被女性化刻板特征词包围,“脆弱 李军脆弱”。其中关于男性刻板不一致的刺激联结24 个,女性24 个)。为了减少不同冲突水平下相同的刺激材料产生的练习效应,各冲突水平中采用的均是相对同质但不相同的刺激材料。
测量被试情绪状态和性别角色观念水平的问卷同实验1,该实验中,《性别角色观念量表》的内部一致性信度为0.84,结构效度为0.71,58 名被试在该量表中的得分为=3.76,=0.50,并且在测量家庭角色分工的题项中,父亲主外母亲主内的比例为51.7%,母亲主外父亲主内为5.2%,父母双方处于均衡状态的人数为41.4%,父母均不兼顾的人数为1.7%。
实验材料由“启动-目标刺激”和“性别特质词-人名-性别特质词”对构成,共涉及启动图片、目标词语、性别特质词和人名四种刺激类型。以男性和女性面孔图片为启动刺激,以工作和家务词语为目标刺激,以性别特质词为侧翼刺激,以人名为目标刺激。启动图片和目标词语从实验1 和实验2 筛选出的材料中选取。性别特质词和姓名的选取参考国内刻板印象领域学者的研究(陈莉,2011;刘红豆,2018),再结合网络调查的方式获取60 个男性化刻板特质词、60 个女性化刻板特质词、40 个男性化名字和40 个女性化名字。另选取50 名被试(其中男性20 人,=25.41)对120 个特质词进行性别偏向的7 点评分(1 代表男性化程度最强,即“极具女性化”;2 代表“比较女性化”;依此类推,3 代表的男性化程度更低;4 代表“中性化”,即这一特征对于男女均可;5 代表“一般女性化”;6 代表“比较女性化”;7 代表“极具女性化”);对80 个名字进行性别偏向的5 点评分。从中筛选出明显具有性别偏向的48 个性别刻板特质词和52 个姓名。对筛选出的词语做差异性检验,独立样本检验的结果表明,男性化特质词与女性化特质词在评分上差异显著(=5.37,=2.73,(46)=0.250,< 0.001;且与中性化水平差异显著(s < 0.001)。男性化名字与女性化名字在评分上差异显著(=4.62,=1.37),(50)=98.201,< 0.001;且与中性化水平差异显著(s < 0.001)。
将筛选出的刺激材料做如下分类:
启动图片:8 张男性图片和8 张女性图片,其中练习刺激、每种冲突水平下的男性图片和女性图片各2 张。
目标词语:14 个家务活动词语和14 个职业工作词语,其中练习刺激为2 个家务词语2 个职业词语,每种冲突水平下的家务词语和工作词语各4 个。
性别特质词:24 个男性化特质词和24 个女性化特质词,其中4 个男性化特质词4 个女性化特质词作为练习刺激,其余特质词作为正式实验刺激。
人名:26 个男性化姓名和26 个女性化姓名,其中2 个男性化姓名2 个女性化姓名作为练习刺激,其余姓名作为正式实验刺激。
实验利用改进的试次-试次控制调整范式(trial to trial control adjustment paradigms;Kleiman et al.,2014)来操纵实验的流程。实验中的每个完整试次都由两个连续的试次组成,其中包含着两个不同的行为反应任务(一个完整的试次流程见图5)。首先第一个任务是实验2 中使用到的词语分类任务,为了验证不同冲突水平对后续加工任务的影响,冲突的划分标准方式同实验2,接着第二个任务是性别Flanker 任务。在这个任务中,被试会在屏幕中央看到一个男性名字(如,李军)或者一个女性名字(如,刘婷),同时每个名字的左面和右面会出现与性别相符/不符的刻板特质词,被试必须通过按D 或K键对名字的性别做出判断。被试在明白实验流程之后先进行练习实验,练习试次中的刺激材料在正式实验中不会出现,总共呈现16 个试次。如果被试的准确反应率低于70%,则要求被试重新练习,直到准确率达到要求才能进入正式实验。正式实验由3个区组组成,不同冲突下的词语分类任务和性别Flanker 任务构成不同的区组,且3 个区组之间采用平衡式拉丁方设计。每个区组有80 个完整试次,实验共240 个试次。高冲突水平下,一致的分类16个试次,不一致的分类64 个试次。基线水平中,一致和不一致的分类试次各呈现40 次。低冲突水平中,一致的分类64 个试次,不一致的分类16 个试次。性别Flanker 任务中的冲突试次和相容试次在不同的区组之间始终保持随机出现,且出现比例一致。
图5 实验3 流程图
4.2 结果
对冲突水平的主效应做进一步的事后多重比较,如表5 结果显示:高冲突水平下4 种刺激类型平均正确率(=0.91,=0.01)与低冲突水平(=0.87,=0.01,0.002)和基线水平均差异显著(=0.87,=0.01,0.009);但低冲突水平(=0.87,=0.01)与基线水平(=0.87,=0.01)之间差异不显著,=0.904。
表5 不同冲突水平下对目标刺激进行分类判别的正确率及反应时(ms)
图6 不同冲突水平和启动刺激下目标分类的正确率
与基线条件相比,高冲突条件下的刻板印象模式则被减弱,启动刺激和目标刺激之间不存在显著的交互作用,(1,57)=0.24,0.626,当启动男性图片时,对家庭词语的判断准确率(=0.90,=0.01)与工作词语之间没有显著差异(=0.91,=0.02),(1,57)=0.05,=0.820;而当启动女性图片时,对工作词语(=0.90,=0.01)的判断准确率低于家庭词语(=0.91,=0.02),(1,57)=0.11,0.744。
对冲突水平的主效应做进一步的事后多重比较,如表6 的结果显示:高冲突水平下四种刺激类型的平均反应时(=525.33,=15.81)与低冲突水平(=465.52,=13.22)存在显著差异(< 0.001);基线水平(=513.87,=13.10)与低冲突水平(=465.52,=13.22)差异显著(< 0.001);不过高冲突水平(=525.33,=15.81)与基线水平(=513.87,=13.10)差异不显著(0.244)。被试在高冲突水平上反应时最长,而在低冲突水平上反应时最短。
最后,我们分析了PDP-A 的估算值,以验证我们的预测。由于PDP-A 公式在PDP-C=1 时无法求解(即,当一个或多个试次类型的准确率为 100%时),会造成有些受试者的PDP-A 的分值缺失。有37 名被试在所有试次条件下都有有效的PDP-A 分值,将这42 名被试纳入本次分析中。对PDP-A 的估算值做3 (冲突水平:高冲突,基线,低冲突) × 2(启动刺激:男性图片,女性图片)的重复测量方差分析,结果并未出现显著的主效应和交互作用(s >0.05),不同冲突水平的自动估算值的结果见表6,这一结果与实验2 的结果相一致。
表6 不同冲突水平下的主动控制与反应控制估算值
对先前任务的冲突水平的主效应做进一步的事后多重比较,如表7 结果显示:高冲突水平下4种刺激类型的平均正确率(=0.90,=0.01)与低冲突水平(=0.83,=0.02,0.001)和基线水平之间均存在显著差异(=0.85,=0.02,0.009);但低冲突(=0.83,=0.02)与基线之间(=0.85,=0.02)差异不显著(0.061)。
表7 不同冲突水平下对目标刺激进行分类判别的正确率及反应时(ms)
图7 不同冲突水平和特质词类别下目标分类的正确率
与基线条件相比,高冲突条件下的刻板印象模式则被减弱,启动刺激和目标刺激之间不存在显著的交互作用,(1,57)=3.68,=0.060。当Flanker任务中的特质词类别为男性化时,对男性化名字做出判断的正确率(=0.91,=0.01)与女性化名字之间没有差异(=0.88,=0.02),(1,57)=3.28,0.075;当Flanker 任务中的特质词类别为女性化时,对男性化名字(=0.89,=0.02)做出判断的正确率与女性化名字之间也没有差异(=0.91,=0.01),(1,57)=2.24,=0.140。
对先前任务的冲突水平的主效应做进一步的事后多重比较,如表8 的结果显示:高冲突水平下四种刺激类型的平均反应时(=646.79,=10.21)与低冲突水平之间(=634.94,=9.60)没有显著差异(0.191);基线水平(=658.10,=9.17)与低冲突水平之间(=634.94,=9.60))差异显著(0.003);高冲突水平(=646.79,=10.21)与基线水平之间(=658.10,=9.17)差异不显著(0.159)。
表8 不同冲突水平下的主动控制与反应控制估算值
最后,我们分析了PDP-A 的估算值在不同冲突水平任务下的差异,以验证我们的预测。有38名被试在所有性别Flanker 任务的试次条件下都有有效的PDP-A 分值,将这38 名被试纳入本次分析中。对PDP-A 的估算值做3 (冲突水平:高冲突,基线,低冲突) × 2 (启动刺激:男性图片,女性图片)的重复测量方差分析,结果并未出现显著的主效应和交互作用(s > 0.05),不同冲突水平的自动估算值的结果见表8,这一结果与前一任务的结果相一致。
4.3 讨论
实验3 的主要目的是为了证明不同冲突水平引发的认知控制对性别刻板印象表达的作用的作用是否具有跨任务情境的一致性,因此确保任务转换中前一任务在不同冲突水平下的认知控制差异是验证这一假设的关键前提(Egner,2008;Freitas et al.,2007)。采用试次-试次控制调整范式发现,在前一个试次的词语分类任务中,相较于基线水平,高冲突条件下引发主动控制,正确率更高,因此重复了实验2 的结果。进一步分析不同冲突水平的分类任务对后续性别Flanker 任务的加工模式,我们发现,高冲突水平分类任务中激活的主动控制加工可诱发对后续任务的认知控制调整,即在高冲突分类任务后,被试在性别Flanker 任务的正确率更高;并且,通过加工分离程序计算出的高冲突水平的控制加工估算值比低冲突和基线水平均高。
实验2 中词语分类任务高冲突条件引发的主动控制的加工优势又一次得到了验证,也为跨任务情境的一致性提供了基础(Schmidt,2019),这为内隐刻板印象任务可能会改变冲突监测和认知控制的调整提供了有力的支撑(Amodio et al.,2008;Freitas et al.,2007)。
5 总讨论
不同冲突水平的任务背景和不同条件诱发的认知控制对性别刻板印象表达有着不一样的效果。实验1 的结果表明,无论是何种冲突试次的比例水平,图片分类任务均能抑制性别刻板印象的表达;而对于实验2 的词语分类任务而言,相较于基线水平,高冲突水平下性别刻板印象的表达受到了抑制,低冲突水平下性别刻板印象的表达得到了激活;实验3 的结果则进一步表明高冲突水平下产生的主动控制能够在随后的任务中被持续保持,不受任务类型变化的影响。这些发现暗示更大的冲突试次比例可能会对控制刻板印象的表达更有效,而控制的有效性和刻板印象的具体呈现形式有关,个体可以敏感觉察出冲突大小的精细变化,且高冲突任务引发的冲突适应为后续任务提供了控制准备状态(Bukowski et al.,2019;Schmidt,2019)。
5.1 任务冲突比例对性别刻板印象表达的影响
经典的无社会意义的认知冲突实验研究已表明,冲突试次占比高的实验条件可诱发一种主动控制模式(Gratton et al.,1992)。实验2 和实验3 使用加工分离程序的分析也发现,相对于低冲突条件,高冲突条件下的控制加工值(PDP-C)更大(基线时的控制估计为中间值)。这间接说明了高冲突水平诱发主动控制,而不是更多性别刻板印象的反应性激活。从常识上来看,更强的干扰环境导致判断准确性的提高这一发现可能有违直觉,但确与主动控制的机制以及过去的研究有着直接的相似性(Appelbaum et al.,2014)。通过进一步对自动加工值(PDP-A)的数据处理,我们发现,主动控制和反应控制可以协同作用于内隐刻板印象的行为表达,而不是刻板印象的来源(如自动激活的刻板印象)。另有研究者发现,主动控制与反应控制并非独立存在,在知觉到冲突有所变化时,个体可同时运用两种认知控制策略以形成正确的反应(Bugg &Braver,2016),实验结果也充分论证了主动控制和反应控制能根据情况需求产生一定互补性的观点。
5.2 任务冲突比例下,刻板印象的抑制表达有其限制性
从实验1 的分析结果上来看,不同试次比例的冲突任务并没有使个体的认知加工出现明显的差异,出现这种结果的原因可能与实验材料的外在表现维度及内在加工形式有关。实验2 将图片更换为词语作为目标刺激的呈现形式,结果表明高冲突条件下的性别图片呈现时,抽象文字类型的目标刺激引发的主动控制对性别角色刻板印象的表达有一定的抑制作用。
首先,实验1 中的启动刺激和目标刺激均为彩色高清图片,具有很高的生态效度,但这种形式的图片也相应的具有易辨识、易记忆、易加工的特性(Yuan et al.,2019),并且关于文字和图像处理区别的理论观点认为:图像更倾向于自下而上的具体样例形式加工,而文字加工则包含了比图片加工更多的抽象形式加工(Yuan et al.,2019),图像在认知层面减少了自上而下的转换资源,可直接依据具体情境来做出判断(Sherman,1996),因此可能会出现不同冲突水平对实验结果没有影响的结果,即图片在不同冲突水平下的加工速度和准确性并无优劣之分。实验2 验证了这样一个假设,即相对于弱干扰条件,强干扰的背景下会引起更多的主动控制,进而减少内隐刻板印象的表达(Amodio &Swencionis,2018)。从实验1 和实验2 的结果来说,不同类型的目标刺激材料在高干扰环境下所引发的主动控制和反应性控制加工并不是完全一致的,进一步为不同冲突水平对信息呈现形式的敏感性存在差异提供了有效证据。
5.3 任务冲突比例下,刻板印象的抑制表达具有领域适用性的特点
实验3 在实验2 的结论基础上,利用改进的试次-试次控制调整范式证明先前高冲突比例的性别刻板印象分类任务与后续性别Flanker 任务有着相似的认知控制模式。最近一些研究也充分证明冲突状态能够为后续任务提供控制准备,进而引发认知控制的动态加工中更强的冲突适应(Kleiman et al.,2014;Bukowski et al.,2019;张孟可 等,2021)。Bukowski 等人(2019)为了评估认知灵活性,使用包含社会类别的任务转换程序,在实验1 中,被试按性别或年龄分类,在实验2 和实验3 中,被试按性别或社会角色分类,同样也发现被试的认知灵活性主要表现在引起更多认知冲突的任务情况下,并且认知灵活性在不同的任务冲突比例中体现为控制策略的灵活调整。因此,被试在高冲突背景下的性别 Flanker 任务中,更易引发主动性控制来抑制Flanker 刺激诱发的干扰,将注意力集中在位于中央位置的目标刺激上。低冲突背景下则更依赖于反应性控制,从整个刺激中提取信息并做出反应。
综合而言,以往大量的研究关注了认知控制灵活性的转变,但是都局限在相同的冲突任务背景内进行比较,也常忽略信息表征的特殊表现形式和社会刺激的不同类型之间的控制准备状态。由于我们日常的各类行为活动都是在不同比例的社会冲突环境中进行,因而考虑到任务的冲突比例和社会属性是很有必要的。从现实生活来看,形成传统规范的性别角色观念并不容易被新的社会规范所打破,以群体为基础的性别刻板印象及偏见可能会扎根于人们的思想难以做出改变。在这样的情况下,减少关注性别与刻板信息之间的联结,而是集中于关注任务中的目标信息,可能为削弱性别刻板印象的表达提供了一种有效的方式。不同的任务冲突比例引发的认知控制对内隐偏见或者刻板印象的表达有一定的调节作用。而不同呈现形式的刺激信息和社会意义之间的转换范式,证明了认知层面的抑制性控制可在特定的呈现形式和跨任务之间减少偏见或刻板印象反应的出现,使得内隐偏见或刻板印象的减少和消除不仅仅局限于刻板印象出现后再进行反应性的加工。
尽管本研究有一些重要的发现,但也存在一些不足。首先,认知控制是目标导向行为的基础,个体是如何根据不同的冲突任务感知对当前目标进行认知控制调整的不得而知,由练习效应而诱发的比例效应和基于目标而引发的比例效应有何区别。这些问题仅借助行为分析并不能使得到有效的回答,也不能保证实验结果的充分性。所以观察不同冲突比例的任务过程中的脑电水平,识别冲突监测和控制调整的脑区差异,有助于我们从客观的角度深入探究冲突水平背后的认知神经机制,为我们在不同的冲突环境下进行有效的认知控制提供理论基础。其次,冲突适应效应和比例效应是认知控制的两种表现形式,冲突适应效应强调个体对先前试次冲突的监测导致在当前试次中更好地控制了冲突,而比例效应则更为关注同一冲突任务类型内监测到不同试次冲突水平的差异引发的冲突适应现象。该研究并没有涉及到两种效应的对比分析,也未深入思考两种效应引发的认知控制有何异同之处。
6 结论
不同冲突比例水平的任务引发的认知控制可以抑制性别刻板印象的表达,但会受到信息呈现形式的影响。当所知觉到的目标信息为图像刺激时,不同冲突比例的任务水平对性别刻板印象的表达没有差异;而当知觉到的目标信息为语义刺激时,高冲突比例的任务水平易抑制性别刻板印象的表达,低冲突比例的任务水平易加强性别刻板印象的表达。并且高冲突水平下产生的认知控制加工能够在随后不同的任务中得到保持。