跨期决策中自我控制的加工机制

2018-01-23元何嘉梅2尚俊辰

心理研究 2018年3期

关　元何嘉梅，2尚俊辰

（1 辽宁师范大学心理学院，大连 116029；2 辽宁省儿童青少年健康人格评定与培养协同创新中心，大连 116029）

1　前言

跨期决策（intertemporal decision）是人们对发生在不同时间点的事件或者结果的价值进行的权衡和决策（Frederick，Loewenstein，＆O’donoghue，2002；梁竹苑，刘欢，2011；任天虹，胡志善，孙红月，刘扬，李纾，2015）。比如，在当下能够获得的、利润微薄的即时奖励和等待一段时间才能够获得的、利润相对丰厚的延迟奖励之间进行二择一的决策。在日常生活中，小至个体的信贷行为（Surachita，2017），大到国家的宏观经济政策制定都涉及到跨期决策。比如，党中央提出的“绿水青山就是金山银山”，以及《环境保护法》的施行都蕴含着“不能吃祖宗饭、断子孙路，用破坏性方式搞发展”这种在近期的经济收益和未来长远的、造福子孙后代的环境保护之间的跨期决策。因此，能够做出恰当的跨期决策对人类社会具有十分重要的意义（刘洪志，江程铭，饶俪琳，李纾，2015）。

自我控制（self－control）具有复杂的结构，研究者从不同的角度来研究它。从行为层面来说，自我控制是个体为了实现预定的目标，对自己的心理和行为活动进行自主调节的过程和结果（Vohs＆Baumeister，2004；Inzlicht，Schmeichel，＆Macrae，2014）。从行为经济学的角度来说，自我控制包含了一系列的决策过程，个体对自我控制的成本与收益进行权衡，并且以此来决定是否值得进行自我控制（Botvinick＆Braver，2015；Kotabe＆Hofmann，2015；窦泽南，方圆，周伟，乔志宏，2017）。从人格特点来说，自我控制是一种稳定的特质（Casey et al.，2011）。在实现预定目标的过程中，高、低特质自我控制的个体表现出不同的自我控制能力，相对于低特质自我控制的个体来说，高特质自我控制的个体能够更加熟练地运用自我控制，能够更好地控制冲动行为（Tangney，Baumeister，＆Boone，2004；Cherniawsky＆Holroyd，2013）。

跨期决策的完成需要执行自我控制（Luo，Ainslie，Giragosian，＆Monterosso，2009；Scherbaum，Dshemuchadse，＆Goschke，2012；Banich et al.，2013）。是否能够顺利地执行自我控制影响着人们是为了近期的仨瓜俩枣而舍弃意义重大的长远收益，还是能够为了长远的重大价值而克制住对即时满足的冲动性（索涛，2012；刘雷，苏缇，彭娟，郭逸群，冯廷勇，2014；Figner et al.，2010；Liu，Feng，Wang，＆Li，2012；Cherniawsky＆Holroyd，2013；Schmidt，Holroyd，Debener，＆Hewig，2017）。因此，了解跨期决策中自我控制的加工机制，有助于个体做出恰当的跨期决策。

针对跨期决策中自我控制的作用机制，已有研究分别从三个方面进行了初步解释。在认知加工过程方面，研究者认为跨期决策包含价值估计和价值选择两个认知加工过程，个体在跨期决策任务中偏好即时收益是因为个体在跨期决策的价值选择阶段没有能够成功地进行自我控制（Luo et al.，2009；Figner et al.，2010；Liu＆Feng，2012；Liu et al.，2012）。在大脑加工区域方面，研究者认为扣带回和前额是跨期决策中负责自我控制的主要脑区（van den Bos＆McClure，2013；Koffarnus，Jarmolowicz，Mueller，＆Bickel，2013；Shenhav，Botvinick，＆Cohen，2013；Hare，Hakimi，＆Rangel，2014）。在能量来源方面，研究者认为自我控制资源的充足程度影响了个体能否在跨期决策任务中成功地抑制对即时满足的冲动（Cherniawsky＆Holroyd，2013；窦凯，聂衍刚，王玉洁，黎建斌，沈汪兵，2014；何贵兵，晏祥辉，2015）。然而，这些研究还缺乏深入辨析，比如，跨期决策的价值选择过程包含了自我控制的哪些认知加工过程，哪些大脑区域参与到这些具体的自我控制认知加工过程中，哪些大脑区域更容易受到自我控制资源的影响。由此，本文拟整合已有研究成果，从跨期决策中执行自我控制涉及到的认知加工过程、相应的大脑神经加工以及需要消耗的自我控制资源等三个方面，深入辨析跨期决策中自我控制的加工机制。

2　认知加工过程

自我控制两阶段模型（two－stage model of selfcontrol）认为，自我控制的执行包括了矛盾识别和矛盾解决两个阶段（Myrseth＆Fishbach，2009）。个体首先需要判断选择当下的放纵与预定目标的实现之间是否存在着矛盾，只有当个体察觉到了二者之间存在着矛盾，才会采取相应的自我调节策略来抵制诱惑。两个阶段中的任何一个环节出现了错误都会导致自我控制失败（李琼，黄希庭，2012）。自我控制奖励模型（r eward－b ased m odel）（Shenhav et al.，2013）对两阶段模型进行了补充，提出自我控制的预期价值（e xpected v alue of c ontrol，EVC）是个体决定是否进行矛盾解决的标准，认为能否解决矛盾首先取决于个体预期执行自我控制的收益是否高于成本（窦泽南等，2017）。该模型强调在识别出了需要进行自我控制的信号之后，个体会对进行自我控制需要付出的成本和可能得到的收益进行评估（c ostb enefit a nalysis，CBA），计算出进行自我控制的预期价值，来判断是否有必要进行自我控制。当进行自我控制的收益高于成本时，个体才会执行自我控制（Power＆Petersen，2013；Botvinick＆Braver，2015；窦泽南等，2017）。

跨期决策的完成包含两个过程：（1）负责对奖励的主观价值进行估计的过程，在这个过程中个体将奖励在各个维度上的信息，比如金额大小和等待时间，集中起来估算出奖励的主观价值；（2）选择具有较大主观价值的备选项的过程（Liu＆Feng，2012；Liu et al.，2012）。价值估计过程和选择过程之间的相互作用关系还不清楚。脑成像的研究发现在跨期决策中，对价值的表征是动态进行的。比如，腹内侧前额叶皮层（ventromedial prefrontal cortex，vmPFC）和腹侧纹状体（ventral striatum，VS）在跨期决策的价值估计过程中表征了奖励的主观价值（McClure，Laibson，Loewenstein，＆Cohen，2004；Kable＆Glimcher，2007）。而且腹内侧前额叶皮层还受到了来自执行认知控制的脑区背外侧前额皮层（dorsolateral prefrontal cortex，dlPFC）的调节，使得腹内侧前额叶皮层在价值估计时提高了赋予长远收益的权重（Hare et al.，2014）。在以几十秒为等待时间的延迟满足的研究中，还发现腹内侧前额叶皮层和腹侧纹状体在做出选择，以及做出选择后等待延迟奖励的过程中都参与了对延迟奖励的价值表征（Jimura，Chushak，＆Braver，2013）。所以，价值估计过程和选择过程在时间进程上可能并不是以一次性的先后线性顺序来协作完成跨期决策的，它们之间可能存在着即时的多次相互作用影响。

结合两个领域的研究，在跨期决策选择过程中自我控制至少包含了自我控制矛盾识别、自我控制预期价值计算和执行控制等三种相互影响的认知加工过程。首先，自我控制矛盾识别加工通过对长远收益与即时收益的主观价值，和个体预定的目标、计划、个体需要等等因素之间是否一致进行监控。然后，当探测到跨期决策涉及到的两个主观价值与预定目标不一致时，个体会评估自我控制需要付出的成本和可能的收益，计算出进行自我控制的预期价值。最后，如果个体认为收益高于成本，那么个体就会执行自我控制行为。此时，在自我控制矛盾解决过程中个体采用自上而下的控制加工，来完成在长远收益和即时收益之间的选择。即使在跨期决策的价值估计阶段中即时收益的主观价值高于长远收益的主观价值，但是为了实现预定目标，个体在自我控制的作用下最终可能还是会做出等待长远收益的选择。

3　神经机制

在跨期决策的自我控制矛盾识别和自我控制预期价值计算两个认知加工过程中，前扣带回皮层（anterior cingulate cortex，ACC）是重要的神经基础（Botvinick，Cohen，＆Carter，2004），负责对长远收益与即时收益的主观价值，和个体预定的目标、计划、个体需要等等因素之间是否一致进行监控（Myrseth＆Fishbach，2009；Shenhav et al.，2013），并且评估自我控制需要付出的成本和可能的收益，计算出进行自我控制的预期价值。在跨期决策的执行控制加工过程中，前额叶皮层（prefrontal cortex，PFC）起到了重要的作用，当自我控制的收益大于成本时，前额叶皮层执行自上而下的自我控制加工（Shenhav et al.，2013；Hare et al.，2014），来减少价值估计结果与预定目标之间的偏离（Heatherton＆Wagner，2011）。

3.1　扣带回皮层

前扣带回皮层是自我控制的监控系统的神经基础（Botvinick et al.，2004），负责对矛盾进行识别。在完成跨期决策任务时，相比于主观价值差异悬殊的两笔奖励，个体感到在主观价值大体一致的即时奖励和延迟奖励之间进行的选择更加困难，此时前扣带回皮层和侧前额叶皮层（lateral PFC）有更高程度的激活（Pine et al.，2009；Peters＆Büchel，2011）。

背侧前扣带回（dorsal anterior cingulate cortex，dACC）被认为是跨期决策中自我控制的关键区域（van den Bos＆McClure，2013；Shenhav et al.，2013）。背侧前扣带回通过监控任务的状态（Sheth et al.，2012）和预期结果的收益（Amemori＆Graybiel，2012；Wallis＆Kennerley，2011）等等信息来监控冲突。研究认为与奖励预测误差有关的脑电成分反馈相关负波（feedback－related negativity，FRN）（Jessup，Busemeyer，＆Brown，2010）和背侧前扣带回有关。相比于即时收益，长远收益引起的反馈相关负波波幅更大（Blackburn，Mason，Hoeksma，Zandstra，＆El－Deredy，2012）。而且，背侧前扣带回还参与了对控制可能带来的期望价值和对认知控制的成本进行的估计，其活动强度与任务难度之间呈现正相关（Kouneiher，Charron，＆Koechlin，2009）。随着即时收益和长远收益主观价值的接近，跨期决策任务难度增大，背侧前扣带回的活动增强（Pine et al.，2009）。

3.2　前额叶皮层

前额叶皮层在跨期决策的自我控制中起着自上而下加工的作用（Heatherton＆Wagner，2011），对即时满足冲动进行控制和调节。前额叶对负责编码主观价值的纹状体（Kable＆Glimcher，2007）自上而下的控制越少，个体越倾向于即时满足（Peters＆Büchel，2011）。前额叶和纹状体之间的白质神经束有更强的联结时，个体在跨期决策中有更少的冲动行为（Peper et al.，2013）。前额叶皮层区域活动的受限将导致自上而下调节路径失衡，使得个体在跨期决策中自我控制失败（Figner et al.，2010；Koffarnus et al.，2013）。

背外侧前额皮层是跨期决策中负责自我控制的重要区域（van den Bos＆McClure，2013），对目标导向行为的产生非常重要（Miller＆Cohen，2001）。它的活动与跨期决策中的选择过程有关（Peters＆Büchel，2009；Liu et al.，2012），尤其是与个体对长远收益的偏好选择之间存在着相关（van den Bos＆McClure，2013；van den Bos，Rodriguez，Schweitzer，＆McClure，2014），当被试选择长远收益时，背外侧前额皮层的活动增强（Hare et al.，2014）。当要求个体完成N－back工作记忆任务，使个体的认知加工能力受到限制时，个体背外侧前额皮层的活动强度降低，此时个体更加偏好选择即时奖励（Aranovich，McClure，Fryer，＆Mathalon，2016）。对背外侧前额皮层进行经颅直流电刺激（transcranial direct current stimulation，tDCS）时，发现背外侧前额皮层的左侧部分对于认知控制尤其重要，施加的阳极刺激加强了左侧部分的活动，抑制了跨期决策中的冲动性，施加的阴极刺激减弱了左侧部分的活动，提高了跨期决策中选择即时奖励的冲动性（Shen et al.，2016）。在跨期决策中，背外侧前额皮质的控制功能还表现在它与其它大脑区域的神经联结中。背外侧前额皮层和前额皮质其它区域之间的神经联结活动的增强反映了个体对自我控制的需求。比如，当要求被试在美味的食物和健康的食物之间进行选择时，只有当被试选择了健康食物时，背外侧前额皮层和腹内侧前额叶皮层之间的神经联结活动才会出现增强（Hare，Malmaud，＆Rangel，2011），而且二者之间的神经联结也与偏好选择有关，研究发现背外侧前额皮层和腹内侧前额叶皮层之间的神经联结活动在被试选择长远收益时增强了（Hare et al.，2014）。背侧前额皮质和背侧纹状体（dorsal striatum）之间的结构和功能联结可以预测在跨期决策中的个体差异，联结越强，被试越有耐心（van den Bos et al.，2014）。

4　自我控制资源

4.1　自我控制资源模型的内涵

自我控制资源模型认为，个体在调控行为的过程中需要消耗资源，这种资源具有领域一般性特征，即所有自我控制行为的执行消耗的都是同一种自我控制资源（Baumeister，Vohs，＆Tice，2007；Heatherton＆Wagner，2011；谭树华，许燕，王芳，宋婧，2012；于斌，乐国安，刘惠军，2013）。但是，自我控制资源总量是有限的，如果个体当前没有足够的资源来完成自我控制任务，就会导致自我控制失败（Baumeister，2002）。比如，个体在先前的任务中已经进行过的自我控制操作会在一定程度上消耗自我控制资源，那么当前可用的自我控制资源就会处于暂时性的枯竭状态，使得个体不能很好地完成后续的自我控制任务（Wagner，Altman，Boswell，Kelley，＆Heatherton，2013），即出现自我损耗现象（ego depletion）（Baumeister，Bratslavsky，Muraven，＆Tice，1998；Baumeister＆Vohs，2007）。

4.2　自我控制资源对跨期决策的影响

有研究采用双任务范式，首先要求被试完成其它的自我控制任务来消耗有限的自我控制资源，然后要求被试完成跨期决策任务，发现随着自我控制资源的减少，个体在随后的跨期决策任务中选择即时奖励的比例增加了（窦凯等，2014；何贵兵，晏祥辉，2015）。所以，完成跨期决策任务需要消耗自我控制资源，当剩余的自我控制资源不足以抵制即时奖励的诱惑时，个体选择即时奖励的比例就会增加。

在自我控制资源模型的基础上，研究者根据跨期决策中有关大脑区域消耗自我控制资源的情况，提出了跨期决策的双系统模型。例如，由理智的自我控制冷系统和情绪性、冲动的热系统组成的“冷／热双系统模型（hot／cold system）”（Metcalfe＆Mischel，1999）认为，冷系统遵循实用原则（do it if it makes sense），以目标为导向，需要个体的意志控制，热系统以“觉得好（do it if it feels good）”为原则，主要与低自我控制、冲动行为有关。在fMRI研究基础上，研究者提出了由加工即时收益的β系统和加工长远收益的δ系统组成的 “β－δ双系统模型（β－δ systems）”（McClure et al.，2004）。相互竞争神经行为决策系统模型（the competing neurobehavioral decision systems theory，CNDS）认为β系统和δ系统对应于两个交互的神经生物系统：涉及边缘系统和旁边缘系统（the limbic and paralimbic regions）的冲动系统（impulsive system）和涉及前额叶脑区（the prefrontal cortex）以及与冲动抑制有关的执行系统（executive system）（Koffarnus et al.，2013）。研究发现即时奖励的选择与冲动系统中较大的神经活动有关（Kable＆Glimcher，2007），长远奖励的选择与执行系统中较强的神经活动有关（McClure et al.，2004；Shen et al.，2016）。当个体可以调用的资源充足时，审慎的、以控制加工为主，需要消耗自我控制资源的理性分析系统占优势（Kahneman＆Frederick，2002；Morewedge＆Kahneman，2010），此时，个体能够较好地进行自我控制，选择延迟奖励的可能性较高；当可以调用的资源匮乏时，依赖直觉、追求即时欲望满足的自动化加工系统更占优势（Kahneman＆Frederick，2002；Morewedge＆Kahneman，2010），自我控制失败的可能性较高，更可能选择即时奖励。

4.3　自我控制资源的来源

研究者对自我控制资源的来源还有争议。有研究通过为实验组被试提供不含咖啡因的含糖饮料，给控制组提供不含咖啡因的无糖饮料来操纵被试的血糖水平，进而改变他们可调用的自我控制资源的数量，发现葡萄糖的摄入减轻了自我损耗的程度。有研究采用前后测实验要求被试完成跨期决策任务，发现实验组被试血糖水平的增高使得他们拥有充足的自我控制资源来执行自我控制，从而降低了他们在跨期决策中对即时奖励的偏好；控制组被试由于没有葡萄糖的补充，再加之在前测实验中消耗了一部分的自我控制资源，使得剩余的自我控制资源不足以支持他们完成后测实验，所以他们在跨期决策中更加偏好即时奖励（Wang＆Dvorak，2010）。但是，最近的研究（Dang，2016）通过对已有的文献进行元分析，对自我控制的葡萄糖说（the glucose view of self－control）提出了质疑。已有文献支持自我损耗效应是确实成立的，但是不支持血液中葡萄糖水平的变化和葡萄糖的摄入对自我损耗程度的影响，认为仅从葡萄糖水平的高低变化来解释自我损耗并不恰当，葡萄糖可能并不是自我控制资源的来源。研究者提出葡萄糖的补充可以在损耗发生之后重新激活前扣带回皮层的活动，而且葡萄糖的补充还可能被个体看成是一种奖励刺激，所以应该从与葡萄糖水平变化有关的动机和认知冲突等心理角度来解释自我损耗（Dang，2016）。由此，还需要进一步的研究来探讨自我控制资源的来源问题，自我控制资源到底是来源于葡萄糖等客观的能量资源，还是来源于与客观能量变化有关的一系列动机、认知冲突等心理因素。

5　展望

本研究对跨期决策中自我控制加工的心理机制进行了梳理。在跨期决策中的自我控制矛盾识别、自我控制预期价值计算过程中，扣带回皮质对个体赋予长远奖励和即时奖励的主观价值与预定目标之间的一致性进行监控，并且对进行自我控制所需要付出的认知控制的程度以及认知控制的结果进行权衡，来形成对自我控制的价值预期；在跨期决策中的执行控制过程中负责执行认知控制的前额皮质根据扣带回形成的对自我控制成本和收益的预期，来对价值估计和预定目标之间的不一致进行自上而下的调节。虽然还不清楚自我控制资源的来源，但是跨期决策任务的完成需要自我控制资源的参与。当个体可以调用的自我控制资源充足时，个体更依赖以控制加工为主，需要消耗资源的理性分析系统；当可以调用的资源匮乏时，个体更依赖直觉，追求即时欲望满足的自动化加工系统，自我控制失败的可能性较高。虽然已有研究在探索跨期决策中自我控制的影响作用方面取得了一定的进展，为我们理解自我控制对跨期决策的影响提供了基础，然而还有许多尚待解决的问题。

5.1　跨期决策中自我控制资源和认知资源的作用

除了自我控制资源外，跨期决策任务的完成还需要消耗用于支持个体成功执行认知加工的认知资源（Schmeichel，2007）。比如，N－back 工作记忆任务的完成消耗了认知资源，导致个体更加偏好即时收益（Aranovich et al，2016）。而且个体在跨期决策价值估计阶段，完成对即时收益和长远收益的概率计算也需要消耗认知资源（黎建斌，2013）。虽然自我控制资源的来源还不清楚，但是自我控制资源和认知资源之间存在着相互影响，自我控制与认知的抑制控制功能非常接近，都强调对优势行为的控制（Inzlicht et al.，2014）。自我控制资源和认知资源的整合模型（黎建斌，2013）指出，在自我控制和其它的高级认知加工过程中均有执行功能的参与，并且自我控制和认知加工还有共同的神经基础——前额叶皮层。个体进行自我控制和认知加工都会消耗资源，产生心理疲劳，使得前额叶皮层的活动受限，前额叶皮层激活程度的降低进一步影响了执行功能在后续认知加工任务和自我控制任务中的发挥，进而影响了个体的自我控制和认知控制（黎建斌，2013）。而且，自我控制任务的完成也需要认知资源的参与，比如，识别是否需要进行自我控制（Myrseth＆Fishbach，2009；Shenhav et al.，2013）。所以，跨期决策任务的完成可能需要自我控制资源和认知资源的共同参与。

目前还不清楚资源的充足程度影响个体调用理性分析系统和自动化加工系统的机制，也不清楚在自我控制参与跨期决策的心理加工过程中，资源的充足程度是如何发挥作用的。比如，在跨期决策中的自我控制矛盾识别、自我控制预期价值估算和自我控制执行三个认知加工过程中，哪个过程最容易受到资源不足的影响？另外，由于在跨期决策中对价值的表征是动态进行的，跨期决策价值估计过程可能与上述三个加工过程之间存在着联系，自我控制资源不足是否也影响了跨期决策价值的估计？未来可以通过比较自我控制资源和认知资源在心理和神经机制上的异同，以及它们在跨期决策过程中的作用和调用方法来探讨跨期决策中自我控制的作用。

5.2　特质自控在跨期决策中的认知加工特点

人格特质在决策中起着重要的作用，具有不同特质自我控制水平的个体往往采用不同的决策信息加工方式（Marshall，Smith，＆Kirkpatrick，2014；Smith，Marshall，＆Kirkpatrick，2015；Marshall，＆Kirkpatrick，2016；Peterson，Hill，＆Kirkpatrick，2015）。研究发现，高、低特质自我控制个体在跨期决策任务中存在着个体差异，在自我控制能力上的个体差异使得他们在跨期决策任务中有着不同的行为表现（索涛，2012），相比于对长远收益价值贬值程度较低的个体来说，对长远收益价值贬值程度较高的个体对即时奖励的高估程度更大，更关注即时奖励的信息，而且他们加工即时奖励时还引起了波幅更大的奖励正波（reward positivity）（Cherniawsky＆Holroyd，2013）。因此，未来可以探讨人格特质在自我控制影响跨期决策中的作用。比如，对注意的研究发现，把注意力从即时奖励上脱离开来需要个体执行自我控制（van den Bos et al.，2014）。而且 Schmidt等（2017）发现，在完成跨期决策任务时，个体加工获得奖励的等待时间的方式与他们具有的特质自我控制水平有关，在加工时间信息时前扣带回皮层产生的表征个体对奖励的敏感性的奖励正波（Holroyd＆Umemoto，2016）的波幅可以预测个体的特质自我控制水平。相比于高特质自我控制个体，低特质自我控制个体在面对时间长短的变化时，奖励正波有更大的波幅。因此，注意加工机制的差异可能是导致高、低特质自我控制个体在跨期决策任务的完成中存在差异的原因之一。

另外，自我控制损耗进程模型（t he process model of self－control depletion）强调个体在自我控制中的自主性，认为动机的缺乏是自我控制失败的主要原因（Inzlicht et al.，2014）。把人们对自我控制的放弃看成是个体在认知努力（cognitive labor）和认知安逸（cognitive leisure）之间进行的主动权衡，个体在了解了自己的需求和外在的客观环境之后，将自我控制涉及到的任务区分为外界环境要求完成的“必须（have to）”任务和自主选择完成的“自愿（want to）”任务，个体自己决定了以什么样的动机来实现预订的目标（Ryan＆Deci，2000；Inzlicht et al.，2014；Kotabe＆Hofmann，2015）。目前还不清楚高、低自我控制个体是否在进行自我控制的动机上也具有差异。所以，未来可以深入考察高、低特质自我控制个体在跨期决策中的认知加工差异和动机差异。