跨期选择研究：从单时点结果到多时点结果*

2018-02-22江程铭谢铠杰

心理科学进展 2018年5期

江程铭谢铠杰何铨

(1浙江工业大学经贸管理学院;2浙江工业大学教育科学与技术学院;3浙江工业大学政治与公共管理学院,杭州 310023)

1 前言

跨期选择是人们对不同时间点的损益做出判断和选择的过程(Frederick,Loewenstein,&O’Donoghue,2002;梁竹苑,刘欢,2011)。此类选择涵盖了人们生活和工作的方方面面,比如,是否抽烟(现在生理满足和未来的身体健康之间的权衡)、是储蓄还是消费等等。经济学家亚当斯密(Adam Smith)甚至认为跨期选择会影响一个国家的经济发展和财富积累(Frederick et al.,2002)。基于跨期选择在个人和社会生活的重要性,越来越多的研究者对此主题进行了探讨,发展出了各种不同的模型对人们的跨期选择行为进行描述。

传统跨期选择模型认为：人们会把未来不同时点的结果折扣到现在进行比较,选择现值最大的那个选项。比如,Samuelson (1937)的折扣效用模型(discounted-utility model)认为决策者会把未来时点的结果以一恒定比率(时间折扣率,discounting rate)折扣到现在。

但是,即刻效应(immediacy effect)、共同差异效应(common difference effect)等异象(anomalies)的发现对折扣效用模型提出了挑战(Keren &Roelofsma,1995;Kirby &Herrnstein,1995)。于是研究者发展出双曲线折扣模型(hyperbolic discounting model)、准双曲线折扣模型(quasi-hyperbolic discounting model)等对原有的折扣效用模型进行矫正,以容纳这些异象(Laibson,1997;Loewenstein &Prelec,1992;Mazur,1984)。但不管怎样,这些模型都延续了折扣的思路,认为决策者都先把选项中的各个延迟结果进行折扣,再进行选项间效用的比较。

然而,随着更多异象,比如次可加性(subadditivity)和超可加性(superadditivity)等的发现,近年来一些学者开始背离传统的理论发展路径,提出了基于维度(attribute-based)的决策模型。不同于基于选项(alternative-based)的折扣模型,基于维度的模型认为：选项是基于维度被比较的。决策者把“结果”维度上的差异和“延迟”维度上的差异进行比较,比较中占优势的选项被选择(Dai &Busemeyer,2014;Ericson,White,Laibson,&Cohen,2015;Scholten &Read,2010;江程铭,刘洪志,蔡晓红,李纾,2016)。比如,权衡模型(trade off model)(Scholten &Read,2010)认为,决策者面临如“现在获得210元”和“一星期后获得300元”的选择时,会在结果维度上比较“300元”和“210元”的差异,以及在延迟维度上比较“一星期后”和“现在”的差异,如果他认为“300 元和210元的差异”大于“一星期后和现在的差异”,他会选择“一星期后获得300元”的选项;如果他认为“一星期后和现在的差异”大于“300元和210元的差异”,他会选择“现在获得210元”。

但无论折扣模型还是基于维度的模型的建立和检验,基本上都是来自于单时点结果(single dated outcome)的研究。跨期选择研究的典型范式是在实验室里让被试对众多类似于“现在获得210元还是 3个月后获得 250元”的决策问题进行选择。虽然这种研究范式极大地促进了跨期选择的理论构建,但在我们实际生活中,很多跨期选择涉及多时点结果(multiple dated outcomes)。比如：贷款时选择等额本息还款(将本金总额和利息总额相加后平均分摊到每个月,每月的还款额恒定,比如每月8500元)还是等额本金还款(每月本金一致但利息递减,因而每月还款额递减,比如第一个月 9000元,第二个月 8900元,第三个月8800元......)。即使有时看起来是单时点的结果,其实也是由一系列时点的结果组成。比如一顿法国大餐可以由不同的上菜顺序组成：点餐者可以选择先上美味的菜品,再上平淡的菜品或者相反的顺序。然而,对多时点结果跨期选择的实证研究却相对较少。因为长期以来,研究者假设基于单时点结果建立的折扣模型也适用于多时点结果的跨期选择(Ariely &Loewenstein,2000),认为在多时点结果的跨期选择中决策者把选项内未来多个时点的结果价值折算到现在,然后相加,最后再比较各选项的现值。

研究者近几年来加强了对多时点跨期选择的实证研究。一方面是因为研究者对单时点结果跨期选择的心理过程的认识渐趋一致。越来越多的研究从行为结果、过程或基本假设等不同角度对基于选项和基于维度的模型进行了比较和检验,认为基于维度的模型更符合决策的真实心理过程(见综述,孙红月,江程铭,2016)。另一方面是因为在一些多时点跨期选择的研究中,研究者发现了一些有趣的效应,而这些效应不能被原有的模型所解释。比如,效用折扣模型、双曲线折扣模型等都假设决策者在对多时点结果的跨期选项进行选择时,各时点的结果是独立的(独立性),可以相加(相加性)。然而最近一系列的研究对独立性和可加性的假设提出了质疑(Jiang,Hu,&Zhu,2014;Rao &Li,2011;Read &Scholten,2012)。比如,Rao和Li (2011)提出了跨期决策的艾勒(Allais)悖论,即在配对的单时点跨期选项上同时加上一个相同的成分(结果)后,被试的偏好发生改变,这违背了独立性和可加性所隐含的相消公理(cancelation axiom)。由此我们可以推测：多时点结果跨期选择的心理过程可能不同于单时点结果的跨期选择;因而我们不能简单套用基于单时点结果的跨期选择模型,而需要加强对多时点结果跨期选择的实证研究。

因此,本文尝试对多时点结果跨期选择研究,尤其是近年来发展出的一些理论进行总结,并指出未来可以开展的一些方向。

2 多时点结果跨期选择研究

在多时点结果跨期选择理论和模型发展过程中,既有对折扣模型加以调整而发展出的序列模型(sequences model),也产生了一些背离折扣思路的模型,比如权衡模型等。

2.1 序列模型

Loewenstein和Prelec (1993)发现人们喜欢递增的序列(比如,先拜访烦人的阿姨再拜访令人愉悦的朋友)而非递减的序列(相反的拜访顺序),即使序列的总体效用是一样的。这个现象违背了折扣模型的预测：因为按照折扣模型的预测,人们把未来的各期结果折扣到现在并加和。那么前者的效用应该小于后者的效用;人们应该偏好递减而非递增的序列。因此Loewenstein和Prelec发展出序列模型来对此异象进行解释。序列模型认为人们在对一个序列的价值进行判断时,并不单是集中在组成序列的单个结果的价值,而且还会考虑序列的整体特征。

然而,序列模型的建立是基于对非金钱的质性事件的研究基础上,比如在 Loewenstein和Prelec研究2里,研究者让被试在“这周末拜访烦人的阿姨下周末再拜访令人愉悦的朋友”或是相反的拜访顺序中进行选择,被试的确喜欢递增的序列(即前者)。可是在那些以金钱为结果的序列研究中,却没有确信的证据支持序列模型(Read &Scholten,2012)。甚至在Frederick和Loewenstein(2008)研究 2a里,当研究者以金钱为结果对两时点跨期选项应用匹配法进行研究时发现,被试喜欢递减而非递增的序列。他们让被试在下面的 B选项里填写相应的数字以对 A选项进行匹配,即被试认为在什么数字大小的情况下,B选项的价值可以匹配A选项：

A.签约做一年期研究的被试：现在得到2000元,一年后得到1000元

B.签约做一年期研究的被试：现在得到1000元,一年后得到______元

如果被试喜欢递增的序列,那么相应在空格内填入的数字应该小于2000。然而,Frederick和Loewenstein发现几乎没有人填写小于2000的数字;平均数字超过了2000。

由于Frederick和Loewenstein采用了匹配而非选择的方法,Jiang等(2017)做了一个小规模的调查。他们让学生在“26周后得到200元,52周后得到300元”和“26周后得到300元,52周后得到200元”选项之间进行选择,发现绝大多数的学生选择了后者,即递减的选项。

2.2 基于理由(reason-based)的理论

Urminsky和Kivetz (2011)发现在配对的简单(single dated)跨期收益选项前(比如,“一周后获得210元”vs.“两周后获得 250元”)同时加上一个收益(比如,“3天后获得5元”)变成配对的跨期序列时(比如,“3天后获得 5元,一周后获得 210元”vs.“3天后获得5元,两周后获得 250元”),会使被试更倾向于选择延迟更长的较大收益。Urminsky和Kivetz认为决策者在面临简单跨期收益选择时,会面临两个动机之间的冲突：即尽快地得到收益(如,一周后)和更多地得到收益(如,250元)的冲突。决策者要做出选择,就必须放弃其中的一个内在目标,然而这两个内在目标在决策者心中都占重要的比重。Urminsky和Kivetz推测,在两个简单选项前同时前置一个收益时,前置的收益可以帮助解决两个动机的冲突。比如,“3天后获得5元,两周后获得250元”这个选项既使决策者可以更多地得到了钱(250元相对于210元),又可以尽快地得到钱(3天后获得5元)。

然而,来自两个不同研究的结果反对基于理由的理论。基于理由的理论认为,既然前置收益提供的是理由(性质),那么前置收益的数量大小(不管是5元还是50元)应该不会影响偏好的强度。Urminsky和 Kivetz的研究似乎证实了这个假设,然而当 Read和 Scholten (2012)在 Urminsky和Kivetz的基础上,进一步加大前置金钱的数量后,被试偏好的强度发生了变化。因而 Read和Scholten认为他们的研究不支持基于理由的理论。而 Jiang等人(2014)发现不仅是前置的金钱收益,而且还有前置的金钱损失(比如,3天后损失5元)也会使被试更倾向于选择延迟更长的较大收益。由于前置损失并不能提供被试尽快获得金钱的理由,因而Jiang等人的发现也不支持基于理由的理论。Jiang等人提出了突显性解释(salience account)来说明他们发现的现象。

2.3 突显性解释

突显性解释认为,在单时点的跨期金钱选项中加入另外时点的金钱可以使被试更加关注金钱维度(而相对忽视时间延迟维度),从而减小决策者的折扣率,即在收益的跨期选择中更倾向于选择结果更大(延迟更长)的选项,在损失的跨期选择中更倾向于选择结果更小(延迟更短)的选项。Jiang和同事的发现支持突显性解释(Jiang,Sun,Zheng,Wang,&Qin,2016;Jiang et al.,2014,2017;Sun &Jiang,2015)：另外时点金钱的加入,不论加入的金钱是收益还是损失(Jiang et al.,2014),加入的时点是在两个单时点选项之前、中间或之后(Sun &Jiang,2015),也不论原本的两个单时点选项是收益还是损失(Jiang et al.,2016),被试的折扣率都减小了。如在某一研究(实验1A,Jiang et al.,2014)中,他们让被试对如下的备择选项进行选择：

E.1 年后获得4800 元

F.4 年后获得8000 元

大多数的被试选择了E。而在选项E和F 同时前置较小损失或较小收益(相对于选项E和F的结果)时(见如下选项G和H)：

G.现在损失/获得4250 元,1 年后获得4800 元

H.现在损失/获得4250 元,4 年后获得8000 元

被试更倾向于选择H。

然而,Jiang和同事并没有直接检验突显性解释;另外他们的理论也没有说明跨期选项的不同组成部分是如何整合以及不同的选项是如何比较的。

2.4 权衡模型

多时点跨期选择的权衡模型描述了跨期序列的各部分是如何整合以及不同序列是如何进行比较的(Scholten,Read,&Sanborn,2016)。这个模型是单时点跨期选择权衡模型的延伸(Scholten &Read,2010)。单时点跨期选择权衡模型认为决策者在做选择时,会比较两个配对选项在结果维度间的差异以及在延迟维度间的差异,再将结果维度上的差异和延迟维度差异(转化为共同的心理货币(common currency))进行比较,如果结果维度上的差异大于延迟维度上的差异,决策者会选择收益大而延迟长的选项;反之,如果结果维度上的差异小于延迟维度上的差异,决策者会选择收益小而延迟短的选项。多时点跨期选择的权衡模型保留了这种维度内决策的思路,但是认为决策者先进行选项内的信息处理：加和选项内各个结果的效用从而得到选项总效用以及按累积加和权重的方式得到选项的平均延迟。然后再对不同选项进行维度内的比较。以“M.1周后获得100元,3周后获得200元 vs.N.4周后获得450元”的选择为例,M选项的总效用为300元(100元+200元);M选项的平均延迟则计算如下：

在一周后这个时间点,累积效用为 100元,在 3周后这个时间点,累积效用为：(100+200)=300元,因而整个选项的累积加和效用为：(100元 + (100 + 200)元) = 400元。平均延迟计算如下：1周 × (100元 / (100元 + (100 + 200)元)) + 3周 ×(300元 / (100元 + (100 + 200)元)) = 2.5周。因而M选项相当于“P.2.5周后获得300元”;从而以上选择相应变成“P.2.5周后获得300元 vs N.4周后获得450元”。

在完成选项内的信息处理后,决策者再如简单跨期选择的权衡模型所述那般进行维度内的比较。

多时点跨期选择的权衡模型是基于金钱的收益研究而得到的模型,能否推论到损失犹有疑问。在单时点跨期选择研究中,研究者发现：可能存在与收益领域不一样的心理过程(江程铭,2013);与收益领域一般呈现正的折扣率不同,在损失的跨期选择甚至出现负的折扣率(Hardisty,Appelt,&Weber,2013;Sun et al.,2015;Yates &Watts,1975)。比如,Yates和Watts发现只有一半的被试倾向于晚支付而不是早支付一定数量的金钱(正的折扣率),另一半的被试倾向于早而不是晚支付(负的折扣率)。在多时点的跨期选择中,可能有类似现象出现;因而不能假设基于多时点收益结果的模型也适用于损失结果。

3 未来研究方向

3.1 比较和融合不同的理论

随着多时点跨期选择研究的增加,一些异象相继出现 (Jiang et al.,2014,2016,2017;Magen,Dweck,&Gross,2008;Rao &Li,2011;Read,Olivola,&Hardisty,2016;Read &Scholten,2012;Scholten &Read,2014;Scholten et al.,2016;Sun&Jiang,2015)。有研究者综合比较了不同的描述性模型对这些异象的解释力,发现突显性解释和权衡模型能够说明的异象最多,序列模型其次;但是各自也有一些解释不了的异象：比如突显性解释不能解释非对称隐含零效应(asymmetric hiddenzero effect,Read et al.,2016),而权衡模型不能解释扩展的占优违背效应(extension of violations of dominance)(见 Appendix,Jiang et al.,2017)。亦有研究者从模型拟合的角度比较了模型的优劣,发现权衡模型要优于序列模型(Scholten et al.,2016)。由于突显性解释现在还是一个质性而非量化的模型,还不能在模型拟合的角度与其它模型相互比较。研究者未来需要进一步发展出突显性解释的量化模型,以与其它模型进行比较(Jiang et al.,2017)。

另一方面,突显性解释、权衡模型和序列模型或许不是互斥的(exclusive),其阐述的心理过程可能在不同的条件下发生作用：比如突显性解释适合说明选项内不同时点结果数量差异较大的情况,权衡模型则适合说明不同时点结果数量相似的情况(Jiang et al.,2017);而序列模型更适合说明结果为质性的情况(Jiang et al.,2017;Read &Scholten,2012)。然而这些仅属推测,还需要未来的研究进行检验。

3.2 拓展多时点跨期选择研究的领域

多时点跨期选择的研究大多集中在金钱收益领域。然而,一个稳健(robust)模型的优点之一便是模型的广泛性(generability)。理想的模型不仅需要能够描述决策者在收益领域,也需要能够描述在损失领域的跨期选择过程;不仅能描述数量结果(比如金钱),也需要能够描述质性结果的跨期选择过程。正如单时点跨期选择研究表明,损失的跨期选择心理过程不同于收益的,多时点收益的跨期选择的心理过程也有可能不同于损失的。因而,研究者需要加强损失以及混合得失的多时点跨期选择研究。另外,研究者也需要加强质性结果和数量结果的多时点跨期选择的比较研究。

3.3 加强过程方法的研究

同其它决策领域一样,跨期选择研究对于模型检验也多采用结果预测(outcome prediction)或模型拟合的方法。研究者通过选择结果是否符合某个模型(而非另一模型)的预测来检验模型,或选择拟合度最优的模型。但是有时仅凭行为结果数据难以令人判定跨期选择究竟执行了何种心理过程。即使有些研究者 Suter,Pachur和 Hertwig(2016)应用数据拟合的方法检验并支持了他们倾向的模型,但是他们也承认：不能排除被试采用了对立模型所描述的心理过程。越来越多的研究者建议从过程的角度来检验或建立行为决策模型(张阳阳,饶俪琳,梁竹苑,周媛,李纾,2014)。因为通过对决策过程进行考察,研究者可以获得选择数据背后实际心理过程的证据,从而能够辨别不同决策模型能否对选择数据进行解释。鉴于眼动追踪技术对决策过程的无干扰性,并且推断直接(从眼动推断注意和思考过程),在行为决策的研究中得到了广泛的应用。近年来,眼动追踪技术也开始应用于跨期选择的研究。但是,现其仅见于单时点跨期选择的研究中(Arieli,Ben-Ami,&Rubinstein,2011;Franco-Watkins,Mattson,&Jackson,2016;苏寅,2013),而未见于多时点跨期选择。由于多时点跨期选择心理过程相较于单时点跨期选择更为复杂,数据拟合的方法更难以检验模型,更需要过程的技术(比如眼动追踪技术)来帮助辨别模型。比如,Jiang等人(2014)并没有直接检验突显性解释。如果应用眼动追踪的技术,根据他们模型的一个合理假设是：相对于单时点结果,在多时点结果的跨期选择中,决策者的注视点(以及注视时长)更会集中在金钱结果而不是在时间维度上。

参考文献

江程铭.(2013).跨期选择的心理机制: 基于齐当别的视角(博士学位论文).中国科学院心理研究所,北京.

江程铭,刘洪志,蔡晓红,李纾.(2016).跨期选择单维占优模型的过程检验.心理学报,48(1),59–72.

梁竹苑,刘欢.(2011).跨期选择的性质探索.心理科学进展,19(7),959–966.

苏寅.(2013).人类决策是否遵循补偿性模型所预期的加权求和计算过程? 多属性决策、风险决策、跨期决策的心理机制探索(博士学位论文).中国科学院大学,北京.

孙红月,江程铭.(2016).跨期决策是基于选项还是基于维度? 心理科学进展,24(3),431–437.

张阳阳,饶俪琳,梁竹苑,周媛,李纾.(2014).风险决策过程验证: 补偿/非补偿模型之争的新认识与新证据.心理科学进展,22(2),205–219.

Arieli,A.,Ben-Ami,Y.,&Rubinstein,A.(2011).Tracking decision makers under uncertainty.American Economic Journal: Microeconomics,3(4),68–76.

Ariely,D.,&Loewenstein,G.(2000).When does duration matter in judgment and decision making? Journal of Experimental Psychology: General,129(4),508–523.

Dai,J.,&Busemeyer,J.R.(2014).A probabilistic,dynamic,and attribute-wise model of intertemporal choice.Journal of Experimental Psychology: General,143(4),1489–1514.

Ericson,K.M.M.,White,J.M.,Laibson,D.,&Cohen,J.D.(2015).Money earlier or later? Simple heuristics explain intertemporal choices better than delay discounting does.Psychological Science,26(6),826–833.

Franco-Watkins,A.M.,Mattson,R.E.,&Jackson,M.D.(2016).Now or later? Attentional processing and intertemporal choice.Journal of Behavioral Decision Making,29(2–3),206–217.

Frederick,S.,&Loewenstein,G.F.(2008).Conflicting motives in evaluations of sequences.Journal of Risk and Uncertainty,37(2–3),221–235.

Frederick,S.,Loewenstein,G.F.,&O'Donoghue,T.(2002).Time discounting and time preference: A critical review.Journal of Economic Literature,40(2),351–401.

Hardisty,D.J.,Appelt,K.C.,&Weber,E.U.(2013).Good or bad,we want it now: Fixed-cost present bias for gains and losses explains magnitude asymmetries in intertemporal choice.Journal of Behavioral Decision Making,26(4),348–361.

Jiang,C.M.,Hu,F.P.,&Zhu,L.F.(2014).Introducing upfront losses as well as gains decreases impatience in intertemporal choices with rewards.Judgment and Decision Making,9(4),297–302.

Jiang,C.M.,Sun,H.M.,Zhu,L.F.,Zhao,L.,Liu,H.Z.,&Sun,H.Y.(2017).Better is worse,worse is better:Reexamination of violations of dominance in intertemporal choice.Judgment and Decision Making,12(3),253–259.

Jiang,C.M.,Sun,H.Y.,Zheng,S.H.,Wang,L.J.,&Qin,Y.(2016).Introducing upfront money can decrease discounting in intertemporal choices with losses.Frontiers in psychology,7,1256.

Keren,G.,&Roelofsma,P.(1995).Immediacy and certainty in intertemporal choice.Organizational Behavior and Human Decision Processes,63(3),287–297.

Kirby,K.N.,&Herrnstein,R.J.(1995).Preference reversals due to myopic discounting of delayed reward.Psychological Science,6(2),83–89.

Laibson,D.(1997).Golden eggs and hyperbolic discounting.The Quarterly Journal of Economics,112(2),443–478.

Loewenstein,G.F.,&Prelec,D.(1992).Anomalies in intertemporal choice: Evidence and an interpretation.The Quarterly Journal of Economics,107(2),573–597.

Loewenstein,G.F.,&Prelec,D.(1993).Preferences for sequences of outcomes.Psychological Review,100(1),91–108.

Magen,E.,Dweck,C.S.,&Gross,J.J.(2008).The hidden-zero effect: Representing a single choice as an extended sequence reduces impulsive choice.Psychological Science,19(7),648–649.

Mazur,J.E.(1984).Tests of an equivalence rule for fixed and variable reinforcer delays.Journal of Experimental Psychology: Animal Behavior Processes,10(4),426–436.

Rao,L.L.,&Li,S.(2011).New paradoxes in intertemporal choice.Judgment and Decision Making,6(2),122–129.

Read,D.,Olivola,C.Y.,&Hardisty,D.J.(2016).The value of nothing: Asymmetric attention to opportunity costs drives intertemporal decision making.Management Science,63(12),4277–4297.

Read,D.,&Scholten,M.(2012).Tradeoffs between sequences:Weighing accumulated outcomes against outcome-adjusted delays.Journal of Experimental Psychology: Learning,Memory,and Cognition,38(6),1675–1688.

Samuelson,P.A.(1937).A note on measurement of utility.The Review of Economic Studies,4(2),155–161.

Scholten,M.,&Read,D.(2010).The psychology of intertemporal tradeoffs.Psychological Review,117(3),925–944.

Scholten,M.,&Read,D.(2014).Better is worse,worse is better: Violations of dominance in intertemporal choice.Decision,1(3),215–222.

Scholten,M.,Read,D.,&Sanborn,A.(2016).Cumulative weighing of time in intertemporal tradeoffs.Journal of Experimental Psychology: General,145(9),1177–1205.

Sun,H.Y.,&Jiang,C.M.(2015).Introducing money at any time can reduce discounting in intertemporal choices with rewards: An extension of the upfront money effect.Judgment and Decision Making,10(6),564–570.

Sun,H.Y.,Li,A.M.,Chen,S.,Zhao,D.,Rao,L.L.,Liang,Z.Y.,&Li,S.(2015).Pain now or later: An outgrowth account of pain-minimization.PLoS One,10(3),e0119320.

Suter,R.S.,Pachur,T.,&Hertwig,R.(2016).How affect shapes risky choice: Distorted probability weighting versus probability neglect.Journal of Behavioral Decision Making,29(4),437–449

Urminsky,O.,&Kivetz,R.(2011).Scope insensitivity and the "Mere Token" effect.Journal of Marketing Research,48(2),282–295.

Yates,J.F.,&Watts,R.A.(1975).Preferences for deferred losses.Organizational Behavior and Human Performance,13(2),294–306.