APP下载

当实证主义传统遇到“大脑黑箱”
——神经经济学“生理效用”理论解析

2016-07-09吴逸群

中央财经大学学报 2016年11期

江 晴 吴逸群

当实证主义传统遇到“大脑黑箱”——神经经济学“生理效用”理论解析

江 晴 吴逸群

[摘 要]神经经济学关于人类决策行为的最新研究对实证主义传统讳莫如深的“大脑黑箱”进行了深刻剖析。本文通过对神经经济学“生理效用”理论和DDM模型及其应用价值的深入解读,发现大脑决策过程实则是神经系统对“满意程度”的生物计算和评估过程,即一个对决策价值信号赋值与比较的过程。这些研究第一次系统地在人们的内在神经活动与外在决策行为之间建立起了一种直观的联系,且认为如果决策行为是由大脑对决策价值进行适应性编码产生的,那么无论决策的情境有何差异,其在大脑决策机制中都有着相似的编码过程。因此存在一个对跨情境选择行为和反应时间做出一般预测的可能性,称为共同决策机制。这为解决简单情况下离散选择的样本外预测提供了新思路。显然,神经经济学正在深层次上悄然改变着经典经济学的固有思维模式,为决策理论的微观基础提供了全新的科学诠释。

[关键词]生理效用 DDM模型 大脑黑箱 实证主义传统 决策行为

一、引言

实证主义传统*实证主义传统是以新古典经济学为代表的主流经济学的标志性研究方法。其哲学思想可追溯到19世纪孔德反对形而上学而强调经验证实的“实证哲学”。发展到20世纪上半叶,克里克等人结合逻辑分析方法将实证分为“逻辑实证”和“经验实证”两个环节,创立了“新实证主义”。由于“新实证主义”更加强调前者的重要性,故又被称作“逻辑实证主义”,其研究模式是在建立假设的前提下,通过逻辑推演得到数理模型,强调精密计量检验的结果。本文所论述的实证主义传统是指这里的“逻辑实证主义”。主导下的新古典经济学对决策行为的研究以效用为逻辑起点,认为个体的决策过程就是最大化自身效用的过程。显然,效用的本质是心理学的范畴,而心理又是人脑的功能。然而,新古典经济学却回避了这个原本不容忽视的核心机制,简单牵强地将大脑视为“黑箱”,致使传统经济学决策理论只能用假设出来的外在尺度表示满意程度。基于效用最大化的理性选择模型也不过是“as if”(好像)的模型,即假设个体满足一致性公理的前提下,就“好像”存在着一个能将选择结果与效用相联系的效用函数,且其选择行为“好像”是在最大化这个潜在的效用函数。而更致命的是由此产生的期望效用理论和贴现效用理论成为新古典经济学决策理论的基石,并用精美的数学语言描述个体以自身利益最大化为目标的决策过程。这些理性选择模型忽视了产生决策行为的真实生理过程,而仅把决策行为看作是机械的计算过程。这虽然实现了经济学体系内部的逻辑自洽,却因偏离人类真实的行为逻辑而日益受到不断涌现的“异象”挑战。

神经经济学*Neuroeconomics是Neurology(神经生物学)与Economics(经济学)的合成词,最早于1996年由乔治梅森大学的Kevin McCabe提出。中国关于神经经济学的研究尚处于起步阶段。最初国内学者曾将Neuroeconomics译为“神经元经济学”,近年来随着Neuromanagement(神经管理学)、Neuroethics(神经伦理学)、Neuromarketing(神经营销学)等以Neuro为前缀命名的学科被相继命名为“神经某某学”,国内学界也按惯例将Neuroecomics统称作“神经经济学”。本文沿用“神经经济学”提法。从神经生物学、心理学角度对经济学决策行为进行探讨,借助功能磁共振成像技术(fMRI)、脑电图(EEG)、正电子发射计算机断层扫描(PET)、单光子发射断层扫描(SPECT)、经颅磁刺激(TMS)等先进的脑成像技术将决策研究深入到个体行为的内在神经基础,正视被实证主义传统所忽视的一个重要问题:作为生物人的经济个体其真实的决策过程、基础、规律是什么?更值得关注的是——当这个被视为不可得知的“大脑黑箱”被打开后,以实证主义传统为代表的经典经济学将面临怎样的改写?

在此背景下,本文基于神经经济学生理效用理论和DDM模型的解读,对经济学决策理论的发展做出评述,并对实证主义传统“效用”理论的微观基础进行神经经济学视角的反思。

二、生理效用理论的核心内涵

传统“效用”理论对决策行为的描述采用的是简单的代数形式。而神经经济学认为个体的决策行为源于大脑活动,受到大脑不同的神经结构控制,是神经系统对搜集的信息进行编码和处理的产物。据此,神经经济学家Glimcher等(2005)[1]提出了生理效用理论(physiological utility theory),认为神经系统会对“满意程度”进行真实生物计算和评估。研究者通过对猴子的神经生物学实验发现猴脑侧顶叶的神经元负责对眼睛扫视动作的相对期望效用进行编码。即猴脑中侧顶叶区域神经元细胞的行为方式并非“好像”(as if)某种效用函数,而“确实就是”(as is)某种生理效用函数。这一发现又被进一步推广至人类,Glimcher等人用fMRI研究验证了人脑中与侧顶叶处于相同位置的顶内沟具有同样的活动特征。

这里的“生理效用”函数并不完全等同于实证主义传统决策理论中的“效用”函数,在基于价值的选择(value-based choice)领域,表现为对“决策价值”(decision value)的计算与比较。现有研究对大脑做出简单选择(simple choice)时的这个工作机理已经逐渐达成了共识。一致认为大脑中确实存在着“决策价值”信号,神经系统首先会对选项进行评估赋值,然后通过比较它们的大小做出选择。[2-4]显然,这些研究已经突破实证主义的逻辑框架,从生理变量角度关注决策行为。

近年来在大脑决策神经计算机制的研究方面,神经经济学取得了新的进展,建立了以神经活动为基础的决策模型。这些模型的计算结果具有“生理效用”的特征,是决策过程中大脑活动的真实反映,因而能对个体决策行为做出“as is”(确实就是)的解释。

(一)DDM模型的提出

根据简单选择领域的研究,神经经济学决策模型中的核心变量“决策价值”是神经计算的结果,其编码过程位于腹内侧前额叶皮层(ventral medial prefrontal cortex)(Harris等,2011[5]),该脑区不仅能对简单选择进行编码,而且同样适用于博弈、金钱的延迟支付和慈善捐赠等更加复杂的情形。不同于传统经济理论中决策者事先已知自己的偏好并进行排序的理论假设,神经经济学认为个体会在选择时对选项进行即时评价,且每个选项的决策价值由其多重属性所决定。因此,令di(x)表示选项x的第i维属性,则选项x的决策价值为:

vx=∑widi(x)

(1)

其中wi是第i维属性的权重。

对决策价值进行比较是决策过程的关键步骤,在这方面的研究中尤其值得关注的是漂移扩散模型(drift-diffusion model)*漂移扩散模型(DDM)是序贯抽样模型(sequential sampling models)的一种。序贯抽样模型是被广泛应用于心理和认知科学的动态决策模型,其基本观点是决策者在做出选择时,大脑中选择信息会连续、随机地累积,直至达到一个可以判断选项偏好的阀值。,即DDM模型。DDM最早由心理学家Ratcliff提出并被广泛应用于认知科学的研究,其对二元认知决策和基于价值决策的心理测量数据做出了准确描述(Ratcliff, 1978[6];Raticliff 和 Smith,2004[7];Raticliff 和McKoon,2008[8])。在经济学的决策研究中,DDM模型解决的是简单情况下的随机选择问题,并为随机效用模型(random utility models,RUMs)*随机效用模型(RUMs)是对离散选择行为做出经济学解释的基础,由Daniel McFadden发展并应用于计量经济学。提供了神经生理学基础。[9]DDM模型认为大脑中的噪音会使个体对选项决策效用的评价具有随机性,决策者对x和y两个选项做出选择的过程就是不断计算两者之间相对决策价值(relative decision value,RDV)的动态过程。RDV信号能够衡量两个选项价值评估的差异,并一直演变(evolve)直到达到一个预设的门槛值,即选择屏障(choice barrier)±B。RDV若达到+B,表明决策者选择x选项,而达到-B则表明选择y选项。RDV随时间变化的过程可以由以下方程表示:

Vt=Vt-1+μt+εt

(2)

其中,Vt代表t时刻的相对决策价值(RDV),μt代表达到门槛值的速度的漂移率,εt代表均值为0,方差为σ2的服从独立同分布的高斯白噪声。假设这个过程从V(0)=0处开始(因此对于x、y这两个选项不存在初始偏见),并且观察到的反应时间包括一段不对价值进行计算比较的非决策时间(non-decision time,NDT)。

式(2)中的漂移率μt是两个选项价值差异的函数。假设该函数为线性,则漂移率可以表示为μt=d(vx-vy),其中d为常数,vx、vy分别表示x、y这两个选项的决策价值。从而,式(2)可以重写为

Vt=Vt-1+d(vx-vy)+εt

(3)

根据这一模型,决策者做出决策所用的时间长短即反应时间(response time,RT)取决于选项之间决策价值的差异vx-vy,两者之间的差异越大则RDV变动的斜率越陡峭,做出决策的时间越短,反之则越长,从而在反应时间和选择问题之间建立起了清晰而明确的联系。

DDM所描述的决策过程如图1所示。不同于实证主义传统的纯粹数理模型,上述神经经济学模型的最大特点在于能够模仿脑神经的真实工作机制,展现与大脑进行简单决策时相近的算法。因为神经元传递信息用的是“有或者没有”的信号——动作电位,这一信号只有在对神经元的输入达到一个关键门槛时才会出现。[10]脑神经科学研究也确实发现非人灵长类在进行认知决策时其侧顶叶皮层有着与DDM计算机制类似的神经活动(Shadlen和New Some,1996[11],2001[12]),而人类在进行选择任务时该机制存在于背内侧前额叶皮层(Armel等,2008[13])。

图1 漂移扩散模型(Drift-Diffusion Model)决策机制的图解

DDM对于简单决策过程中选择行为和反应时间的解释力已经得到了神经科学研究的证实。Mormann等(2010)[14]通过真实情境下的食物选择实验,第一次从行为神经科学角度检验了DDM在基于价值的选择领域的应用效果。他们首先让被试者对备选食物的喜好程度评分,用来衡量每个选项的决策价值。然后向被试者随机展示两种食物的图片,让其从中选择更愿意在实验结束后吃掉的那项,并记录反应时间和选择正确率。在之后的模型拟合过程中,他们发现的确可以得到相关参数使DDM模型的预测与观察到的选择行为及反应时间分布之间具有显著的定量匹配度。

(二)DDM模型的扩展

上文介绍的是DDM基本的标准形式。在此基础上,考虑到注视(visual fixations)*注视(visual fixations)这里也即注意力(attention),涉及大脑在不同情境下配置计算资源(computational resources)的能力,这种配置计算资源的能力在决策过程中非常重要,因为大脑的计算资源是稀缺资源,会随能量的消耗而减少。对决策价值比较过程的引导作用,神经经济学家又进一步提出了注视调节下的漂移扩散模型(attentional drift-diffusion model),即aDDM模型(Krajbich等,2010[15])。其核心思想是决策者对某一选项的注视会导致暂时的漂移偏差,从而造成对该选项的选择偏好。aDDM与基本的DDM最大的区别在于每个特定的瞬间RDV变动的斜率都取决于注视的定位,且该斜率与被注视项和未被注视项之间的权重差异成比例。这个权重差异使得未被注视项的价值相对低于被注视项,从而令选择行为偏向于获得更多注视的选项。以对左右两个选项进行的二元选择为例,aDDM的表达式为:

(4)

(5)

随后,Krajbich和Rangel(2011)[17]又成功扩展了aDDM的数学形式,将其应用于三元选择领域。该模型与二元情况下的关键区别在于有三个相对价值信号,每个选项对应一个信号。支持相应选项的证据(evidence)以不同的速率累积,该速率取决于备选项的价值及其是否被注视。例如,当被试者注视左边选项时相应的累积速率可用下式表示:

(6)

(7)

(8)

这里的Et代表t时刻积累的支持相应选项的证据,d为常数,v代表每个选项的决策价值,θ(0<θ<1)是反映对被注视选项偏好的参数,εt是方差为σ2的高斯白噪声。则各选项的相对价值信号可作如下定义:

(9)

(10)

(11)

三、DDM模型的应用价值

在将注视纳入考察后,DDM模型在神经经济学决策理论中的研究已经从二元选择领域扩展到了多元领域,而其应用价值主要得益于独特的模型结构和新变量的引入。

DDM的一大优势是能够结合反应时间和选择数据提高样本外预测*样本外预测(out-of-sample prediction)即根据样本内的观测值建模,再使用该模型预测样本外的值。的精确度,该优势在与二元选择情况下的传统模型——logistic回归模型的对比中得到了验证(Clithero和Rangel,2013[18])。样本外预测效果的检验建立在两个数据集的基础上,数据来自实验室中由相同个体做出的选择。第一个数据集从“是或否”的选择任务(YN-Task)中产生。在该任务中一共有N种不同的零食选项,每种零食都出现T次,此外还有一个固定不变的参照项。每一轮试验中,被试者都面临其中一个零食选项的图片,并决定是愿意选择该零食并在实验结束后吃掉(选择“是”,ct=Yes),还是更愿意吃参照选项所示的零食(选择“不是”,ct=No)。由此,每个被试者都产生一个N×T次决策的数据集。第二个数据集描述的则是“二选一”的强迫选择任务(2AFC-Task)的结果,在该任务中被试者要在YN-Task中出现过的所有可能的非参照选项对中做出选择。每一轮试验中被试者都面临呈现在电脑屏幕左右两边的两种零食图片,并必须从中选择更愿意在实验结束后吃掉的那项(ct=Left或者ct=Right)。由此,每个被试者都产生一个N(N-1)/2次决策的数据集。在实验中第一个任务先于第二个任务完成,并且每个任务中被试者的选择结果(ct)和反应时间(rtt)数据都被记录下来。

样本外预测的基本思想是用第一个数据集中的数据分别建立传统的logistic模型和神经经济学的DDM模型,来分别预测2AFC-Task中的选择情况。

用logistic模型进行预测包括两个步骤。第一步,用来自YN-Task的数据估计以下logistic选择概率:

(12)

第二步,在假设logistic模型同样可以描述2AFC-Task选择过程的前提下,以上所估计的参数就可以用于预测选择行为,如下式:

(13)

用DDM进行预测同样包括类似的两个步骤。第一步,用来自YN-Task的数据估计DDM的三个自由参数:(1)门槛值的大小(B);(2)每个选项i的漂移率(μi,这里的i代表非参照项);(3)非选择时间(NDT)。在这里不失一般性地设定σ2=1,然后利用最大似然估计拟合参数值。令L(ct,brtt|B,μIt,NDT)表示每个被试者在第t轮试验观测值的似然值,其中brtt代表反应时间。则每个被试者全部数据集的对数似然函数可以定义为:

(14)

第二步,假设DDM同样可以描述2AFC-Task选择过程,由于DDM做出的预测符合logistic选择曲线形式,可以用下式预测任务二中的选择行为。

(15)

这两种情况都是用来自于YN-Task中的数据估计每个选项的价值,然后再将估计所得的价值用于logistic形式的选择函数,来预测2AFC-Task中的选择。两者最大的区别在于预测中所用价值的估计方式不同。在传统的logistic模型中,价值是通过对选择数据的logistic回归得到的,而不涉及反应时间。而DDM则同时使用选择数据和反应时间来估计模型的自由参数。

根据以上方法,研究者分别用模拟数据和真实的实验数据进行实证研究,结果表明在任意情况下DDM的预测效果都优于logistic回归模型。虽然在两个选项类似或者差异很大的情况下这一优势并不明显,但在中间状态下,DDM能够大幅提高预测精度(有时达到50%)。此外,在稳健性检验中,他们将反应时间(RT)引入到基本的logistic模型中,并将其样本外预测表现与DDM进行比较。结果发现扩展后的logistic模型仍不能提高预测能力,从而进一步证实了DDM在进行样本外预测时的优势不是仅来自于新数据(反应时间)的引入,而是基于模型自身的结构优势。这项研究为解决简单情况下离散选择的样本外预测提供了新思路。

此外,实证主义传统决策理论的研究模式是针对不同决策情境分别建立数学模型,而以DDM为代表的神经经济学决策模型则试图描述决策行为统一的一般过程。即如果决策行为是由大脑对决策价值进行适应性编码产生的,那么无论不同决策情境下所考虑的选项的实际值如何,其在大脑决策机制中的输入范围都可能非常相似。例如从100美元中得到50美元和从20点中得到10点,都是对于得到总量中二分之一的主观价值评价,有着相同的决策价值编码。因此在外部影响因素一致的情况下可以跨情境地对选择行为和反应时间做出预测。Krajbich等(2015)[19]研究证明最初用于研究食物选择的aDDM的扩展式,同样可以对四个不同社会偏好决策实验中的决策行为和反应时间做出准确预测。他们指出这种跨越了不同实验被试者、决策标的、选择环境的模型稳健性预示着大脑在决策时采用的是一致过程。而且已有研究表明,被试者在做出食物选择和社会偏好决策时都激活了腹内侧前额叶皮层和纹状体这些相同的脑区。[20-23]因此,尽管不同决策情境下的选择有很大差异,我们依然有理由相信其中存在着共同决策机制。

四、对传统“效用”理论的反思

根据神经经济学的生理效用理论,个体决策所依据的“效用”不再是心理上难以测量的感知,或是实证主义传统下抽象的数学概念,而是以真实神经反应为基础的生理计算的结果。这种全新的研究视角不仅促进了新的决策理论模型的发展,而且使我们从神经元层面反思异象对传统“效用”理论的挑战。

(一)风险和不确定决策与期望效用理论

在风险与不确定决策中,期望效用理论假定决策者的偏好服从一系列公理,然后用期望效用函数将各种不同情形下的发生概率与效用相乘并加总,进而得到最终期望效用最大的方案。然而,后续的经济学研究发现人类的行为逻辑与实证主义传统的数学逻辑并不一致。Allais(1952)提出的阿莱斯悖论(Allais paradox)*法国诺贝尔经济学奖得主Allais(1952)提出的阿莱斯悖论,指出人们在决策时对确定性结果的偏好更胜于不确定的结果。和Ellsberg(1961)提出的埃尔斯伯格悖论(Ellsberg paradox)*Ellsberg(1961)提出埃尔斯伯格悖论,发现个体在决策时表现出模糊厌恶,即人们对于已知概率的偏好优于未知概率。都表明现实中个体的决策行为会系统地偏离期望效用理论的效用最大化原则,个体的偏好并不服从经典决策理论的线性假设。为了解释这些异象,行为经济学家Kahneman和Tverksy(1979)[24]提出了前景理论(prospect theory),认为现实经济行为中普遍存在“损失厌恶”*损失厌恶(loss aversion)是指人们面对同样数量的收益和损失时,感到损失令他们产生更大的情绪影响,其反应了人们的风险偏好并不是一致的,当涉及的是收益时,人们表现为风险厌恶;当涉及的是损失时,人们则表现为风险寻求。和“禀赋效应”*禀赋效应(endowment effect)是与损失厌恶相关联的现象,即投资者偏好坚持他们已有的东西而不愿意与别人进行交易以换得更好的替代品。因为放弃一项资产的痛苦程度大于得到一项资产的喜悦程度,所以个体行为者为了得到资产的“支付意愿”(willingness to pay)要小于因为放弃资产的“接受意愿”(willingness to accept)。。个体在决策时依据的不是特定风险状态下可能结果的绝对效用值,而是以某个参照点为基准,把决策结果编码为相对收益或损失。这一行为决策理论的神经基础早在Breiter等(2001)[25]的fMRI研究和Holroyd等(2004)[26]的EEG研究中得到了验证。

近年来,神经经济学的研究进一步从神经机制角度证实了前景理论中一些原理假设的合理性。Sokol-Hessner等(2013)[27]发现在收益情形下被试者杏仁核的血氧水平依赖(BOLD)信号高于损失情形下的水平,说明损失厌恶的产生与杏仁核有关;且被试者在情感上对金融损失反应的调节会减少杏仁核的活动,从而减轻损失厌恶。而De Martino等(2010)[28]的研究发现患有选择性双边杏仁核损坏的自闭症患者并没有表现出损失厌恶,这从侧面证实了杏仁核对损失厌恶的产生具有关键作用。

Chumbley等(2014)[29]的研究则发现损失厌恶程度与下丘脑-垂体-肾上腺轴区的皮质醇激素水平有关,其中慢性皮质醇水平较低的被试者表现出更强的损失厌恶。与此相反,有更高内源性皮质醇水平的被试者则能更加公正地衡量损失和收益,其损失厌恶程度更低。国内学者对损失厌恶的研究也取得了一定进展。黄达强(2014)[30]进行的功能性近红外脑成像(fNIRS)实验结果显示,在收益情境下被试者的左背外侧前额叶皮层被明显抑制,而在损失情境下则是右背外侧前额叶皮层被明显抑制。这一结论与神经科学理论相吻合,通常大脑皮质左前额叶背外侧区参与正面情绪的产生和调节,而右前额叶背外侧区参与负面情绪的产生和调节。可见,损失厌恶是一种人类在长期进化过程中获得的适应性心理本能,并且可以通过模块化大脑结构进行遗传,一直以来都是影响人类决策行为的重要因素。

此外,神经经济学对Ellsberg(1961)提出的模糊厌恶*模糊厌恶(Ambiguity Aversion)是由于信息的不完全和投资者的有限理性而产生的一种心理偏差,指人们面对风险决策和模糊决策时倾向选择已知概率的风险方案而规避模糊方案。的研究也取得了一定进展。Hsu等(2005)[31]和Chew等(2008)[32]的神经成像研究都显示大脑杏仁核活动与模糊厌恶或者熟悉度偏误相关。近年来对于脑神经科学的研究又发现5-羟色胺运转体基因连锁多肽区(5-HTTLPR)具有调节杏仁核活动的作用(Hariri等,2002[33];Roiser等,2009[34])。在此基础上,Chew等(2012)[35]在一项实验室实验中探究了模糊厌恶和熟悉度偏好的神经遗传学基础。研究表明5-羟色胺转运体基因只跟熟悉度偏误有关,这验证了之前的研究结果;而多巴胺D5受体基因和雌激素受体β基因仅与模糊厌恶相关。由此证明熟悉度偏误和模糊厌恶有着不同的神经遗传机制。这一研究成果为解释国际贸易和证券市场上的“本地市场偏误”提供了新视角。

神经经济学的以上研究成果为行为经济学对传统“效用”理论的修正提供了生理依据,证实了个体决策行为受到神经活动等生理因素的调节,而不是代数效用模型所能简单描述的。为了进一步解释损失厌恶、模糊厌恶等现象对决策行为的影响,还需将激素、基因等更多的生理变量纳入到神经经济学决策模型中。

(二)跨期决策与贴现效用理论

准双曲线模型在McClure等(2004)[37]设计的实验中得到了神经经济学的证实。他们利用fMRI考察了与被试者即时或延迟效用决策相关的神经机制。实验中,被试者需要选择是在短期内获得较小金额还是在延期后获得更大金额。研究显示,当被试者选择即期收益或短期延迟收益时,大脑负责控制情绪的边缘系统区域的内侧前额叶皮质、腹侧纹状体、后扣带回被明显激活。而当被试者选择长期延迟较大金额收益时,大脑与控制理性决策相关的背外侧前额叶皮层、眶额叶外侧皮层被更强烈地激活。他们的研究成果一方面为准双曲线贴现模型提供了一定的神经科学证据,另一方面表明人们的跨期决策行为是大脑各神经系统合作与竞争的结果。这也支持了大脑存在二元神经系统的理论*神经经济学领域的双系统理论认为决策行为受大脑的二元系统即系统1和系统2支配。系统1负责情感,可以自动、快速地做出反应,而不需要一点努力或者控制;系统2负责理性,需要脑力活动,包括复杂的计算。,即期收益的选择受大脑情感系统控制,而延期收益的选择则受大脑认知系统的控制,跨期决策取决于两个系统间的相互作用。随后,Finger人(2010)[38]的研究显示在经颅磁刺激扰乱了背外侧前额叶皮层功能的情况下,被试者具有更高的贴现率,更加偏好即期收益。从而验证了背外侧前额叶皮层具有抑制即期收益倾向的功能。

然而,在近期的一些神经经济学研究中准双曲线贴现模型和二元神经系统理论遭到了质疑。Kable和Glimcher(2007)[39]进行了类似的实验却得到了与前述研究相悖的结果。他们用fMRI考察了被试者在一个固定的即期收益和变动的延迟收益间进行反复选择时的BOLD信号。结果发现被试者在选择延迟收益时,大脑的腹侧纹状体、内侧前额叶皮质和后扣带回这些之前被认为与即期收益选择相关的情感控制区域也被显著激活了。由此推测上述边缘区域负责对即期收益与延迟收益的主观评价编码,而不存在β系统或δ系统的鲜明划分。这一研究成果也得到了其他神经经济学家的支持,Ballard和Kutson(2009)[40]、Peters和Büchel(2010)[41]及Sellitto等(2011)[42]在研究跨期决策时均发现决策者的内侧前额叶皮质和后扣带回在即期收益与延迟收益两种选择情形下都会被激活。

从行为经济学对传统贴现效用理论的修正以及神经经济学利用大脑成像技术的研究结果可知,无论是指数贴现模型还是准双曲线贴现模型,它们对跨期决策过程的解释都遭到了质疑。原因在于两者之间的差异仅是模型假设的改变,而本质上仍都沿用逻辑实证主义的范式,没有深入到“大脑黑箱”内部。神经经济学决策模型则直接从神经编码过程出发揭示决策产生的真实机制,为研究个体决策行为提供了统一的新思路。

五、评价与展望

神经经济学将脑科学技术应用于经济学研究不仅是对主流经济学方法论的创新,而且从大脑神经元层面重新诠释了经济学决策行为研究的微观基础。

虽然目前还没有能够充分描述大脑决策过程的系统模型,但神经经济学现有的研究成果已经初具“as is”(确实就是)模型的雏形。不同于实证主义传统将大脑视为“黑箱”的纯代数模型,以DDM为代表的神经经济学模型能够从生理角度出发,在内在神经活动与外在决策行为间建立起直接联系,这种联系必然更接近真实。此外在将注视、反应时间等实证主义传统模型所忽视的因素考虑在内后,神经经济学研究丰富了经济学决策模型的形式,提高了预测精度。

更值得关注的是,现有研究指出大脑在不同情境下的决策机制是相似的,因而基于决策价值信号计算的神经经济学模型能够描述产生决策行为的一般过程。前文所述的腹内侧前额叶皮层能够对简单选择和复杂选择情况下的决策价值编码,及DDM框架下大脑在进行二元和三元选择时有着相似的计算过程的研究成果也在一定程度上支持了这一观点。我们可以预见神经经济学将用共同决策机制代替实证主义传统针对不同情境建立多个决策模型的理论框架。而想要得到充分描述大脑决策过程的可靠模型并解释更复杂的决策行为,需要进一步密切脑科学与经济学之间的衔接,用经济学的思维将神经元活动转换为定量化的研究工具。

相信随着大脑成像技术的日渐成熟和神经经济学家的不懈努力,决策的“大脑黑箱”将被进一步打开。神经经济学将最终以更详细的神经活动描述替代实证主义传统的简单数学思想,从而对决策行为做出更准确的解释和预测。

[1]Glimcher P W, Dorris M C, Bayer H M. Physiological Utility Theory and the Neuroeconomics of Choice [J].Games and Economic Behavior, 2005, 52 (2): 213-256.

[2]Rangel A, Camerer C, Montague P R. A Framework for Studying the Neurobiology of Value-based Decision Making [J].Nature Reviews Neuroscience, 2008, 9 (7): 545-556.

[3]Wallis J D. Orbitofrontal Cortex and its Contribution to Decision-making [J].Annual Review of Neuroscience, 2007, 30 (1): 31-56.

[4]Padoa-Schioppa C, Assad J A. Neurons in the Orbitofrontal Cortex Encode Economic Value [J].Nature, 2006, 441 (7090): 223-226.

[5]Harris A, Adolphs R, Camerer C, Rangel A. Dynamic Construction of Stimulus Values in the Ventromedial Prefrontal Cortex [J].Plos One, 2011, 6 (6): 2235-2239.

[6]Ratcliff R. A Theory of Memory Retrieval [J].Psychological Review, 1978, 85 (2): 59.

[7]Ratcliff R, Smith P L. A Comparison of Sequential Sampling Models for Two-choice Reaction Time [J].Psychological Review, 2004, 111 (2): 333-367.

[8]Ratcliff R, McKoon G. The Diffusion Decision Model: Theory and Data for Two-choice Decision Tasks [J].Neural Computation, 2008, 20 (4): 873-922.

[9]Fehr E, Rangel A. Neuroeconomic Foundations of Economic Choice-Recent Advances [J].The Journal of Economic Perspectives, 2011, 25 (4):3-30.

[10]Krajbich I, Oud B, Fehr E. Benefits of Neuroeconomic Modeling: New Policy Interventions and Predictors of Preference [J].The American Economic Review, 2014, 104 (5): 501-506.

[11]Shadlen M N, Newsome W T. Motion Perception: Seeing and Deciding [J].Proceedings of the National Academy of Sciences, 1996, 93 (2): 628-633.

[12]Shadlen M N, Newsome W T. Neural Basis of a Perceptual Decision in the Parietal Cortex (area LIP) of the Rhesus Monkey [J].Journal of Neurophysiology, 2001, 86 (4): 1916-1936.

[13]Armel K C, Beaumel A, Rangel A. Biasing Simple Choices by Manipulating Relative Visual Attention [J].Judgment and Decision Making, 2008, 3 (5): 396-403.

[14]Mormann M M, Malmaud J, Huth A, et al. The Drift Diffusion Model can Account for the Accuracy and Reaction Times of Value-Based Choice under High and Low Time Pressure [J].Judgement and Decision Making, 2010, 5 (6): 437-449.

[15]Krajbich I, Armel C, Rangel A. Visual Fixations and the Computation and Comparison of Value in Simple Choice [J].Nature Neuroscience, 2010, 13 (10): 1292-1298.

[16]Shimojo S, Simion C, Shimojo E, et al. Gaze Bias Both Reflects and Influences Preference [J].Nature Neuroscience, 2003, 6 (12): 1317-1322.

[17]Krajbich I, Rangel A. Multialternative Drift-Diffusion Model Predicts the Relationship between Visual Fixations and Choice in Value-based Decisions [J].Proceedings of the National Academy of Sciences, 2011, 108 (33): 13852-13857.

[18]Clithero J A, Rangel A. Combining Response Times and Choice Data Using a Neuroeconomic Model of the Decision Process Improves Out-of-Sample Predictions [Z].Unpublished, 2013.

[19]Krajbich I, Hare T, Bartling B, et al. A Common Mechanism Underlying Food Choice and Social Decisions [J].Plos Computational Biology, 2015, 11 (10): e1004371.

[20]Hare T A, Schultz W, Camerer C F, et al. Transformation of Stimulus Value Signals into Motor Commands during Simple Choice [J].Proceedings of the National Academy of Sciences, 2011, 108 (44): 18120-18125.

[21]Levy D J, Glimcher P W. Comparing Apples and Oranges: Using Reward-specific and Reward-general Subjective Value Representation in the Brain [J].The Journal of Neuroscience, 2011, 31 (41): 14693-14707.

[22]Hare T A, Camerer C F, Knoepfle D T, et al. Value Computations in Ventral Medial Prefrontal Cortex during Charitable Decision Making Incorporate Input from Regions Involved in Social Cognition [J].The Journal of Neuroscience, 2010, 30 (2): 583-590.

[23]Chib V S, Rangel A, Shimojo S, et al. Evidence for a Common Representation of Decision Values for Dissimilar Goods in Human Ventromedial Prefrontal Cortex [J].The Journal of Neuroscience, 2009, 29 (39): 12315-12320.

[24]Kahneman D, Tversky A. Prospect Theory: An Analysis of Decision under Risk [J].Econometrica: Journal of the Econometric Society, 1979, 47 (2): 263-291.

[25]Breiter H C, Aharon I, Kahneman D, et al. Functional Imaging of Neural Responses to Expectancy and Experience of Monetary Gains and Losses [J].Neuron, 2001, 30 (2): 619-639.

[26]Holroyd C B, Larsen J T, Cohen J D. Context Dependence of the Event-related Brain Potential Associated with Reward and Punishment [J].Psychophysiology, 2004, 41 (2): 245-253.

[27]Sokol-Hessner P, Camerer C F, Phelps E A. Emotion Regulation Reduces Loss Aversion and Decreases Amygdala Responses to Losses [J].Social Cognitive and Affective Neuroscience, 2013, 8 (3): 341-350.

[28]De Martino B, Camerer C F, Adolphs R. Amygdala Damage Eliminates Monetary Loss Aversion [J].Proceedings of the National Academy of Sciences, 2010, 107 (8): 3788-3792.

[29]Chumbley J R, Krajbich I, Engelmann J B, et al. Endogenous Cortisol Predicts Decreased Loss Aversion in Young Men [J].Psychological Science, 2014, 25 (11): 2102-2105.

[30]黄达强. 损失厌恶与偏好的异质性——来自神经经济学的证据[J].南方经济,2014(7):88-93.

[31]Hsu M, Bhatt M, Adolphs R, et al. Neural Systems Responding to Degrees of Uncertainty in Human Decision-making [J].Science, 2005, 310 (5754): 1680-1683.

[32]Chew S H, Li K K, Chark R, et al. Source Preference and Ambiguity Aversion: Models and Evidence from Behavioral and Neuroimaging Experiments [J].Advances in Health Economics and Health Services Research, 2008, 20 (8): 179-201.

[33]Hariri A R, Mattay V S, Tessitore A, et al. Serotonin Transporter Genetic Variation and the Response of the Human Amygdala [J].Science, 2002, 297 (5580): 400-403.

[34]Roiser J P, de Martino B, Tan G C Y, et al. A Genetically Mediated Bias in Decision Making Driven by Failure of Amygdala Control [J].The Journal of Neuroscience, 2009, 29 (18): 5985-5991.

[35]Chew S H, Ebstein R P, Zhong S. Ambiguity Aversion and Familiarity Bias: Evidence from Behavioral and Gene Association Studies [J].Journal of Risk and Uncertainty, 2012, 44 (1): 1-18.

[36]Laibson D. Golden Eggs and Hyperbolic Discounting [J].Quarterly Journal of Economics, 1997: 112 (2): 443-477.

[37]McClure S M, Laibson D I, Loewenstein G, et al. Separate Neural Systems Value Immediate and Delayed Monetary Rewards [J].Science, 2004, 306 (5695): 503-507.

[38]Figner B, Knoch D, Johnson E J, et al. Lateral Prefrontal Cortex and Self-control in Intertemporal Choice [J].Nature Neuroscience, 2010, 13 (5): 538-539.

[39]Kable J W, Glimcher P W. The Neural Correlates of Subjective Value during Intertemporal Choice [J].Nature Neuroscience, 2007, 10 (12): 1625-1633.

[40]Ballard K, Knutson B. Dissociable Neural Representations of Future Reward Magnitude and Delay during Temporal Discounting [J].Neuroimage, 2009, 45 (1): 143-150.

[41]Peters J, Büchel C. Neural Representations of Subjective Reward Value [J].Behavioural Brain Research, 2010, 213 (2): 135-141.

[42]Sellitto M, Ciaramelli E, di Pellegrino G. The Neurobiology of Intertemporal Choice: Insight from Imaging and Lesion Studies [J].Reviews in the Neurosciences, 2011, 22 (5): 565-574.

When Positivism Tradition Encounters the “Black Box”:A Review on “Physiological Utility” Theory of Neuroeconomics

JIANG Qing WU Yi-qun

Abstract:The latest neuroeconomics researches on decision-making behavior are the efforts of probing into the “black box” of human brain,which is carefully concealed in positivism tradition.Through in-depth interpretation of the “physiological utility” theory and drift-diffusion model(DDM),this paper shows that the decision-making process of the brain is actually the process that nervous system calculates and evaluates the “desirability”,namely a process of assigning and comparing the decision value signals.These studies initiate the systematic connections between individuals’ internal neural activity and external decision-making behavior.Furthermore,if the value coding in the brain is subject to adaptive coding,the decision-making mechanism of the brain has similar coding process no matter how different the contexts are.Therefore,there probably exists a common mechanism that enables people to make the general predictions of choice behavior and reaction time in various domains,called common decision mechanism.These studies provide a new way to solve out-of-sample prediction problem at the scene of simple discrete choice.Obviously,neuroeconomics is gradually changing the inherent thinking mode of classical economics,and it provides a new scientific explanation for the micro-foundation of decision theory.

Key words:Physiological utility DDM Black box Positivism tradition Decision-making behavior

[中图分类号]F016

A

1000-1549(2006)11-0095-09

[收稿日期]2016-05-16

[作者简介]江晴,女,1960年2月生,武汉大学经济与管理学院教授,经济学博士,研究方向为货币经济学、公司金融;吴逸群,女,1991年10月生,武汉大学经济与管理学院研究生,研究方向为货币经济学、公司金融。

[基金项目]国家社科基金项目“货币经济中的实证主义传统与实验经济学思想史解析”(项目编号:13BJL013)。

感谢匿名评审人提出的修改建议,笔者已做了相应修改,本文文责自负。

李 晟 张安平)