结果预期对结果评价影响的事件相关电位研究*

2017-09-15罗跃嘉李晋熙

成都医学院学报 2017年4期

罗跃嘉，李晋熙，袁璐

1.成都医学院养老与老年健康协同创新中心(成都 610500)；2.深圳大学深圳市情绪与社会认知科学重点实验室(深圳 618060)；3.成都医学院四川应用心理学研究中心(成都 610500)；4.成都医学院第一附属医院(成都 610500)

·健康养老校庆专题·

结果预期对结果评价影响的事件相关电位研究*

罗跃嘉1,2,3，李晋熙4，袁璐1,3Δ

目的采用事件相关电位技术探索结果预期对结果评价影响的脑机制。方法采用金钱激励延迟任务探测正常个体在情境线索和反馈结果诱发的N350,反馈负波(feedback-related negativity,FRN)和晚期正成分(late positive complex,LPC)。结果情境线索条件下，奖赏和惩罚线索诱发的N2波幅相同且均小于零值线索，LPC波幅相同且均大于零值线索；反馈结果条件下，负性反馈结果的FRN波幅均大于正性反馈结果，LPC波幅小于正性反馈结果。结论情境线索下正常个体对奖赏和惩罚线索的敏感程度相同，但反馈结果倾向于对未知结果做积极预期。

结果预期；结果评价；反馈负波；事件相关电位

结果评价(outcome evaluation)是指人们将当前事件的评价为“好”或者“坏”。其实，这个评价不仅决定于事件本身的正、负性及其程度，而且决定于被试对事件结果的预期。也就是说，当人们对未知结果做乐观预期，事实结果与期望相符或者不符合时将会影响对事实结果的评价，从而诱发正性或者负性情绪。就目前的研究结果而言，尚不能说明：符合乐观预期的事实结果一定导致积极情绪，不符合乐观预期的事实结果一定导致负性情绪。因此，有必要探索结果预期对结果评价影响的脑机制来进一步说明这个问题。

根据“强化学习理论”对结果评价做出的阐述：在结果反馈形成之前，决策者对具体结果会产生自己的心理预期，随后以这种结果预期为标准，来判断实际结果的好坏[1]。这个理论指出“预期错误信号”，与事件相关电位波幅对应的成分是反馈负波(feedback-related negcltinty,FRN)，表示结果预期与实际结果之间的差异。预期结果与实际结果之间差异越大，FRN波幅越大。这个FRN波幅出现在反馈刺激后200～300ms时间窗内。一些研究认为代表损失的负性结果诱发的FRN总是比正性结果更大。近年来，大量的研究[2-5]结果认为：出乎被试意料的负性结果能够比意料之内的负性结果诱发出波幅更大的FRN。也就是说，被试的结果预期与实际结果的背离程度越显著，FRN的波幅就应该越大[6-7]。因此，当已知反馈结果时，可以根据FRN波幅的大小，反向推测此前被试的预期结果是乐观还是悲观[8]。

比FRN时间上更靠后的晚期正成分(late positive complex,LPC)也是在本研究的考察范围之内。LPC波幅由数个潜伏期、出现时间、持续时间及心理学意义不同的亚成分组成。这些亚成分多出现在刺激后200～600ms的时间范围内，可以孤立出现或在时间及空间上相互重叠，主要包括有P3a、P3b、P300及慢波(slow wave, SW)。其中P3a标志着注意驱动过程，伴随着重新调整不随意的注意；P3b与选择性注意与任务相关刺激有关；P300被认为是与结果所诱发的动机显著性有关，与结果评价活动的联系相对来说比较间接[9]。

以往有研究[10-11]采用金钱激励延迟任务(Monetary Incentive Delay Task，MID)任务考察零值、奖赏和惩罚情境下的FRN波幅来推测正常个体的结果评价和预期。例如，一项研究采用MID任务调查了正常个体在零效价结果时的FRN，发现奖赏和惩罚情境下的结果诱发的FRN波幅相同且均小于零值情境[12]。另外一项研究[13]也同样发现奖赏情境和惩罚情境下的负性反馈结果诱发的FRN波幅没有差异。因此，本研究假设，奖赏和惩罚情境可以增强结果预期，特别是增强避免惩罚和赢得奖赏(正性结果)的预期，当现实结果为惩罚或者是去奖赏(负性反馈)时，FRN的波幅增强。与此相对应，对于线索条件诱发的LPC波幅，本研究认为奖赏和惩罚线索诱发的LPC比零值线索更大。

1 对象与方法

1.1测量工具

抑郁自评量表(SDS)含有20个项目，分为4级评分，标准得分为总分×1.25后取整，标准得分<50 无抑郁，50～59轻度抑郁，60～69中重度抑郁，≥70重度抑郁。焦虑自评量表(SAS)含有21个项目，分为4级评分：标准得分的分界值为50，50～59轻度焦虑，60～69中度焦虑，70以上重度焦虑。

1.2研究对象

本研究采用SDS和SAS对300名在校学生进行问卷测试，并与符合标准的被试预约问卷测试后一周时间内进行脑电实验。

入组标准：SDS 标准得分<50，SAS标准得分<50。年龄18～25岁，智力正常，视力或矫正视力良好，右利手。排除标准：(1)任何医学疾病，包括神经疾病(例如中风，癫痫)，精神疾病(例如抑郁症，精神分裂症)，学习障碍(例如阅读障碍，运动障碍)；(2)脑损伤或脑震荡；(3)使用影响中枢系统的药物；(4)药物滥用史；(5)日常使用尼古丁；(6)怀孕。所有被试均得到一定的实验报酬并签署知情同意书。

按照SDS和SAS量表进行筛选之后，得到符合ERP实验设计要求的被试共20人。最终去掉因坏电极点而致的信噪比过大的被试1人，对19人的结果进行了测量和统计，其中男生9人，女生10人，平均年龄为23.60岁。

1.3实验设计

本研究采用情境类型的被试内设计，3种情境线索为被试内变量，有3个水平，分别为零值情境线索、奖赏情境线索和惩罚情境线索。

1.4实验任务

MID任务由3个情境组成：零值情境、奖赏情境和惩罚情境。每个情境包含线索刺激、靶目标和结果呈现。被试首先看到一个线索刺激信息，之后当屏幕中央出现靶目标“白色方块”时迅速按“空格”键击中白色方块，之后屏幕会给出做对或做错信息的行为结果反馈。

这个任务将在3个独立的情境区组进行，每个区组包含1种情境线索(零值、奖赏和惩罚之一)和1种与金钱无关的填充线索。零值、奖励和惩罚情境线索分别代表3种不同的金钱分配规则，填充线索代表无论是否击中白色方块都不影响金钱得失。零值情境中只出现“六边形”和“梯形”两种线索：“六边形”为零值线索，被试在之后击中或者没有击中白色方块都不得钱也不失钱；“梯形”为填充条件。奖赏情境中只出现“菱形”和“圆形”，“菱形”为奖赏情境线索，表示击中白色方块则得钱，每次两元，未击中不得钱；“圆形”为填充条件。惩罚情境只出现“五边形”和“三角形”，“五边形”为惩罚情境线索，表示未击中白色方块则会被扣钱，每次扣两元，击中则避免扣钱；“三角形”为填充线索。由此，每个情境线索各匹配一个与金钱无关的填充线索，使各情境分别独立成为1个block，每个block只包含1种情境线索和对应的1种填充线索，其中情境线索180个，填充线索720个，一个block共计 900个试次。值得注意的是，情境线索与填充线索出现的比例为1∶4，且情境线索不连续出现，避免了被试对情境线索的预期和练习效应。为了增加被试的信任度，靶刺激(白色方块)的呈现时间依据每个被试的平均反应时和按键正确率进行调整：第一个试次靶刺激呈现时间为被试在练习中的平均反应时，设置反应正确率为60%，正确率大于或小于这个值则下次试次呈现时间缩短或增加10%呈现时间。这种方法可使被试击中和未击中试次接近。线索出现顺序为随机。

1.5实验程序

MID任务采用心理学专业E-Prime 2.0软件编制(如图1)，刺激呈现于17寸纯平显示器上。确保被试清楚实验任务及要求后端坐在屏幕前方100 cm位置，水平和垂直视角均在7°以内，屏幕背景为黑色。正式实验开始前，主试指导被试完成45个练习试次，并记录被试的平均按键反应时。练习试次不计入总金额。每个情境开始前，屏幕将提示被试在接下来进行的情境中出现的线索图形及含义。刺激呈现流程如图2所示，屏幕首先出现“next trail”持续800 ms提醒被试这个试次开始，随后屏幕中央将会出现一个蓝色几何图形，持续1 200 ms，之后出现1 200～2 500 ms的“+”，之后屏幕中央将出现一个白色方块，呈现时间依据被试的平均反应时和正确率调整。若被试在500 ms的反应时间内按键视为有效反应，500 ms的空屏之后，电脑屏幕将给出此次行为结果反馈。若在靶刺激呈现时间范围内按键，则为击中靶目标，红色竖线将落在左边绿色方格；若超出靶刺激呈现时间，则为未击中，红色竖线落在右边3黄色方格；颜色在被试内平衡。若超过500 ms的反应时间未按键或者在白色方块出来之前按键(抢按)则视为无效试次，反馈结果的红色竖线将位于最右侧。500 ms的空屏之后刺激由E-Prime 2.0 软件呈现。

图1 刺激呈现序列图

图2 3种情境线索刺激诱发的N2波形图(FZ点)

被试被告知拥有30元底金参与游戏，并在奖赏情境中尽量去挣钱，在惩罚情境中尽量避免扣钱，使累计总金额达最大。实验开始前被试将进行45个练习试次，并记录被试按键的平均反应时。实验开始后首先进行零值情境、奖赏情境和惩罚情境顺序在被试内平衡。参与者完成MID任务，记录被试的脑电波。

1.6数据采集

使用E-Prime 2.0 软件记录被试的行为表现结果，使用Neuroscan ERP系统记录EEG信号，采用国际脑电图学会标定的10-20扩展电极位置系统的Ag/AgCl 64导电极帽。头皮阻抗小于5 kΩ，参考电极为左侧乳突，离线分析时转参考电极为双侧乳突平均值。双眼外眦安置水平眼电(HEOG)，左眼框上下各1 cm处正中安置垂直眼电(VEOG)。滤波带通为0.05～100 Hz，连续采样，采样频率为500 Hz。

分析线索刺激和反馈结果刺激出现时诱发的ERPs，截取刺激出现前200 ms到刺激出现后2000 ms的分析时程(epoch)，去除眨眼伪迹。叠加前剔除无效试次和波±50 μV之外的试次。对EEG进行分类叠加，分别检测情境线索(零值情境线索、奖赏情境线索、惩罚情境线索)和结果反馈引发的900 ms时间窗内的ERP成分。采用平均波幅进入之后的数据分析。

1.7数据分析

对于线索刺激引发的脑电数据，首先计算中线上(Fz、FCz、Cz、CPz、Pz、POz、Oz)波幅最大电极点。采用最大电极点波幅进行单因素(情境线索：零值线索、奖赏线索、惩罚线索)ANOVA分析。对于结果反馈刺激引发的脑电数据，使用同样的方法：首先计算中线上(Fz、FCz、Cz、CPz、Pz、POz、Oz)波幅最大的电极点，采用最大电极点波幅进行3(情境线索：零值线索、奖赏线索、惩罚线索)× 2(结果效价：正性、负性)ANOVA分析。交互效应采用简单效应分析的方法。主效应事后检验采用LSD法，必要时采用Greenhouse-Geisser方法进行校正。采用SPSS 23.0软件(SPSS, Inc., Chicago, IL)进行统计分析。检验水准α除特别说明外均设定为0.05。

2 结果

2.1线索刺激诱发的N2波幅

2.2线索刺激诱发的LPC波幅

情境线索诱发的LPC波幅，时间窗为350～600 ms，中线上波幅最大电极点为PZ点,平均波幅为6.581 μV，其他电极点均与PZ点差异有统计学意义。采用PZ的平均波幅对情境类型(零值情境、奖赏情境、惩罚情境)进行ANOVA分析。

图3 情境线索诱发的LPC波形图(CPZ电极点)

2.3反馈刺激诱发的FRN波幅

图4 3种情境下，正负性结果反馈诱发的FRN波形图(FZ点)

2.4反馈刺激诱发的LPC波幅

图5 不同情境下正、负性反馈结果LPC波形图(CPZ点)

3 讨论

N2波幅被认为是与早期感觉加工过程、低水平注意分配和晚期刺激评价阶段相关的脑电成分[15]。另外也有研究[16]表明N2成分与抑制执行功能密切相关，反映个体调用抑制执行功能的有效性。也就是说，个体越能够有效地抑制情绪信息,N2波幅越大。彭家欣等[17]认为：个体能够有效地抑制对中性刺激的情绪加工, 表现出更大的N2波幅, 而情绪刺激由于占用了个体比较多的注意资源, 因此削弱了对其情绪的加工的抑制, 所以表现出比较小的N2,进而表现为中性刺激诱发的N2显著大于情绪刺激。同理，对于本研究中线索条件诱发的N2波幅，奖赏和惩罚线索(相当于情绪刺激)诱发的N2波幅相同且比零值线索(相当于中性刺激)更小。这个结果与前人的研究[14]结果相一致，说明个体投入到奖赏和惩罚线索刺激的注意资源更多，削弱了对其情绪的加工抑制，因而诱发的N2波幅比零值线索更小。除此之外，LPC波幅也被认为是与注意资源投入有关的脑电成分。本研究中奖赏和惩罚情境线索诱发的LPC波幅相同且均大于零值线索，这个结果同样说明了被试对于奖赏和惩罚线索更为敏感且增强的程度一致。

对于结果评价阶段诱发的FRN波幅，负性结果FRN波幅均大于正性结果。根据预期错误相关负波理论，预期结果与实际结果的差异越大，FRN波幅越大。负性结果诱发FRN波幅更大，表示负性结果与预期结果的背离程度越大，越不符合预期；相反，正性结果FRN波幅更小，表示正性结果与预期结果更接近，说明被试对未知的结果做正性预期，也就是预期积极的结果[18]。值得一提的是，在零值、奖赏和惩罚3种情境条件下负性结果的FRN波幅均大于正性结果，而负性结果包括了扣钱(惩罚)和不扣钱(奖赏和零值)两种金钱结果，这说明FRN波幅并不受金钱激励的影响，而是反应了被试对于未知结果的行为结果(“做对”或者“做错”)的预期，而不是对未知结果的金钱结果(“得钱”或者“扣钱”)的结果预期[19]。除此之外，3种情境条件下，正性反馈结果的LPC波幅均大于负性结果。同样也证明了被试在意的是“是否做对”的行为结果而不是金钱结果。因为3种情境下正性结果也包括了得钱(奖赏)和不得钱(惩罚和零值)两种金钱结果，而这两种金钱结果的LPC波幅相等。

综上所述，本研究通过MID任务全面的考察了被试在3种情境设置下的线索刺激和反馈结果刺激诱发的脑电成分。本研究认为：情境设置下被试对于奖赏和惩罚情境的敏感程度相同，但在反馈结果下对于未知结果倾向于做积极的结果预期。以往一些研究认为：正常个体在奖赏和惩罚情境线索下的反应时相同且快于零值情境。然而，另外一些研究则得出奖赏线索的反应时快于惩罚线索。除此之外，未来的研究还可以对影响结果预期的其他因素进行探索，例如情绪特质(抑郁、焦虑)和人格维度(自尊、自恋等)。从社会性特质这一热点问题的角度出发，采用MID任务研究不同人格特质群体在零值、奖赏、惩罚3种不同效价情境下的结果评价阶段的脑电和行为反应，探讨上诉的不同人格和情绪特质群体在行为和脑电结果上的差异，可以说明被试对于奖惩的动机，继而研究得失平衡相关问题。

[1]Holroyd C B, Krigolson O E. Reward prediction error signals associated with a modified time estimation task[J]. Psychophysiology, 2007, 44(6): 913-917.

[2]Holroyd C B, Hajcak G, Larsen J T. The good, the bad and the neutral: electrophysiological responses to feedback stimuli[J]. Brain Res, 2006, 1105(1): 93-101.

[3]Holroyd C B, Pakzad-Vaezi K L, Krigolson O E. The feedback correct-related positivity: sensitivity of the event-related brain potential to unexpected positive feedback[J]. Psychophysiology, 2008, 45(5): 688-697.

[4]Gu R, Lei Z, Broster L,etal. Beyond valence and magnitude: a flexible evaluative coding system in the brain[J]. Neuropsychologia, 2011, 49(14): 3891-3897.

[5]Gu R, Huang Y X, Luo Y J. Anxiety and feedback negativity[J]. Psychophysiology, 2010, 47(5): 961-967.

[6]Nieuwenhuis S, Holroyd C B, Mol N,etal. Reinforcement-related brain potentials from medial frontal cortex: origins and functional significance[J]. Neurosci Biobehav Rev, 2004, 28(4): 441-448.

[7]Brown S, Martinez M J, Parsons L M. The neural basis of human dance[J]. Cereb Cortex, 2006, 16(8): 1157-1167.

[8]Hajcak G, Holroyd C B, Moser J S,etal. Brain potentials associated with expected and unexpected good and bad outcomes[J]. Psychophysiology, 2005, 42(2): 161-170.

[9]Nieuwenhuis S, Aston-Jones G, Cohen J D. Decision making, the P3, and the locus coeruleus-norepinephrine system[J]. Psychol Bull, 2005, 131(4): 510-532.

[10] Knutson B, Fong G W, Adams C M,etal. Dissociation of reward anticipation and outcome with event-related fMRI[J]. Neuroreport, 2001, 12(17): 3683-3687.

[11] Knutson B, Westdorp A, Kaiser E,etal. FMRI visualization of brain activity during a monetary incentive delay task[J]. Neuroimage, 2000, 12(1): 20-27.

[12] Pfabigan D M, Seidel E M, Paul K,etal. Context-sensitivity of the feedback-related negativity for zero-value feedback outcomes[J]. Biol Psychol, 2015, 104: 184-192.

[13] Broyd S J, Richards H J, Helps S K,etal. An electrophysiological monetary incentive delay (e-MID) task: a way to decompose the different components of neural response to positive and negative monetary reinforcement[J]. J Neurosci Methods, 2012, 209(1): 40-49.

[14] Santesso D L, Bogdan R, Birk J L,etal. Neural responses to negative feedback are related to negative emotionality in healthy adults[J]. Soc Cogn Affect Neurosci, 2011, 7(7): 794-803..

[15] Hillyard S A, Luck S J, Mangun G R. The Cuing of Attention to Visual Field Locations: Analysis with ERP Recordings[M]// Heinze H J,Münte T F，Mangun G R.Cognitive Electrophysiology. Boston:Birkhäuser,1994：1-15.

[16] Folstein J R, Van Petten C， Rose S A. Novelty and conflict in the categorization of complex stimuli[J]. Psychophysiology, 2008, 45(3):467-479.

[17] 彭家欣, 杨奇伟, 罗跃嘉. 不同特质焦虑水平的选择性注意偏向[J]. 心理学报, 2013, 45(10): 1085-1093.

[18] Cohen M X, Elger C E, Ranganath C. Reward expectation modulates feedback-related negativity and EEG spectra[J]. Neuroimage, 2007, 35(2): 968-978.

[19] 余芬, 袁璐, 罗跃嘉. 行为和金钱的反馈效应比较[J]. 中国临床心理学杂志, 2015, 23(6): 959-962.

TheEffectofOutcomePredictiononOutcomeEvaluation:AStudyofEvent-RelatedPotentials

LuoYuejia1,2,3,LiJinxi4,YuanLu1,3Δ.

1.CollaborativeInnovationCenterofSichuanforElderlyCareandHealth,ChengduMedicalCollege,Chengdu610500,China;2.ShenzhenKeyLaboratoryofAffectiveandSocialCognitiveScience,ShenzhenUniversity,Shenzhen618060,China;3.SichuanResearchCenterofAppliedPsychology,ChengduMedicalCollege,Chengdu610500,China;4.TheFirstAffiliatedHospitalofChengduMedicalCollege,Chengdu610500,China

ObjectiveTo explore the brain mechanism that the outcome prediction affects the outcome evaluation by using the technique of the event-related potentials (ERPs).MethodsMonetary Incentive Delay Task (MID task) was adopted to measure the N350induced by the situational cue and the feedback, the feedback-related negativity (FRN) and the late positive component (LPC) in healthy subjects.ResultsIn the condition of cues, the N2amplitudes induced by the cues of rewards and punishment respectively were the same and smaller than zero, and their LPC amplitudes were the same and greater than zero. In the condition of feedback, the FRN amplitude of the negative feedback was greater than that of the positive feedback, while the LPC amplitude of the negative feedback was smaller than that of the positive feedback.ConclusionHealthy individuals are equally sensitive to the cues of rewards and punishment in the condition of cues, but they tend to make positive prediction for unknown outcomes in the condition of feedback.

Outcome prediction; Outcome evaluation; Feedback-related negativity; Event-related potential

http://kns.cnki.net/kcms/detail/51.1705.R.20170901.0922.004.html

10.3969/j.issn.1674-2257.2017.04.006

国家自然科学基金重点项目(No:31530031)；国家自然科学基金面上项目(No:81471376)；国家973项目(No:2014CB744600)

：袁璐，E-mail: yuan_lu@outlook.com

B845

△