APP下载

理性人选择决策行为及常用的数理模型

2015-07-09诸文娟

经济研究导刊 2015年18期
关键词:决策树

诸文娟

摘 要:西方经济学曾将人类行为视为“黑箱”而较少讨论,但在20世纪末,一些研究者逐渐将分析和研究的目光对准了决策行为本身所面对的选择问题,探讨理性行为人的决策或决策改变受到哪些因素的影响。在阅读国内外大量相关文献的基础上,从生产者(特别是农业生产者)行为选择决策的角度入手,综述已有研究中常用的三种模型——“决策树”模型、“二元选择”模型、“真实选择”模型,并且对三类模型的原理进行较为详细的描写,同时对三类模型的运用及其可能的修正做出述评,以期该领域方法能够得到进一步的研究和创新。

关键词:决策树;二元变量;真实选择

导言

西方经济学,特别是微观部分,其理论的核心实际上是对理性人类行为探讨,人们总是被假定是理性的、在不同的决策方案中进行选择,以期达到追求效用、利润的最大化。回顾经济学的发展,在21世纪之前,经济学家们会更加地关注在追求效用和利润最大化行为假设下资源配置的效率、社会福利、国际贸易对福利的改变、组织内部结构等,将人类行为视为“黑箱”而较少讨论,但在20世纪末,一些研究者逐渐将分析和研究的目光对准了“行为黑箱”——决策行为本身所面对的选择问题,与心理学相结合开始探讨在追求最大化假设下,理性行为人的决策受到哪些因素的影响。曼昆的“十大经济学原理”中就明确地告诉我们,人类面对选择(trade-off)。

近三四年,分析和研究人们决策行为影响因素的文章逐渐增多,文献讨论问题亦逐步趋同,因为行为问题本身涉及“人”这一高级的、有思考逻辑的“动物”有很多的行为本质上就很难分析。而且人类行为的复杂性导致这类问题分析出现“瓶颈”自然文章趋同性渐增。但是,作为一个经济学研究的新领域,如果要继续发展,那么必须是在研究方法、模型设定上的发展。只有更为完善方法和切合实际的模型才能细致、有效地分析人类决策行为的本身。

笔者在阅读国内外大量相关文献的基础上,从农户种植行为选择决策的角度入手,对常用的行为分析方法进行综述和介绍,以期该领域方法能够得到进一步的研究和创新,从而推动人类行为研究领域向前发展。

一、“决策树”模型

“决策树”方法是由Gladwin(1989)在人类决策树模型(ethnographic decision model)基础上发展而来的。早期的行为动机的研究主要是通过访谈或问卷的方式进行,问卷数据的处理主要是一种描述性的统计分析,不同地区、不同作物种植得到的结论可能完全不同。通过决策树的方法,研究者可以了解农户选择的原因和不同作物的种植动机,以及从农户受到刺激程度对农户进行分类等。这种决策树的分析方法被广泛地运用于是否植树、农业与非农就业、新羊种采用以及是否选择种植有机作物等研究中(Walter Schneeberger and Bernhard Freyer(2005),John R.Fairweather(1999),Murray-Prior(1998),Darnhofer et al.(1997),Gladwin(1989b),Franzel(1984),Galdwin(1976))。

决策树的方法是通过了解农户在农场经营管理中的经验来激发农户参与调查,类似于访谈,但是有严格逻辑设计的相关题目。在访谈中更多的注意农户相信什么?他们能在农场上做什么?访谈者接受对相关问题中并不严肃的观点表示接受,访谈的目的是发掘农户的想法,记录他们自己认为的行为原因。结果中可能包含很多农户没有注意到的原因,但他们却起决定性的作用,通过这种方法可以得到农户为什么不关心某种种植方式或新的品种等,因此可以看为时不行动的原因。

在决策树分析方法中,农户认为受到生产行为受到限制的因素是通过具体的问题来确定的,通常情况下每个问题的答案是“同意”和“不同意”或对某一表述的 “对”和“错”进行判断,分析的原则遵循“如果……就”原则,这种决策树必须使得每一个农户的选择能够向下移动,然后通过一系列的准则得到一个结果,而这个结果对于该农户而言是真实的。因为“树”是所有农户的决策的潜在相关原则通过一定的逻辑方式抽象形成的,所以通过“决策树”能够反映某个具体农户的选择结论。

“决策树”通常通过三种原则来对农户行为进行选择——排除原则、激励原则和限制性原则。所谓排除性原则就是对农户行为不相关的决策都要排除;激励原则是农户在做出决策中所受到的刺激因素;限制原则是农户在决策中认为受到的限制性条件。通常情况下,农户列举激励原因的顺序与农户参与访谈的卷入程度有关,但是对于理解农户的决策则并不重要。

在“决策树”的分析方法中数量(频率)并不重要。如果很多的事例都与某一因素相关,同一个因素上出现的五或十个例子,但这并不意味着这个因素比只有一个案例的那个因素重要。决策树中真正重要的是激励决策信念的逻辑结构,即受调查者在接受调查过程中整体逻辑思维所遵循的路径问题。

由于“决策树”是用于测试单个样本基础的,并且是一种描述性的分析方法,所以“决策树”并不适合用于预测性的推导,是一种定性的研究。同时采用“决策树”的方法主要是通过访谈方式进行,对调查问卷设计的逻辑连续性和调查人员素质、访问技巧有较高的要求。

二、“二元选择”模型

这类模型在国内外研究中应用非常的广泛,选择模型常被用于人们选择行为的研究,例如消费者购买决策,消费者是否接受以及生产者是否生产等的研究中,他们有一个共同的特征,行为人可以在一个已知的集合中选择自己的行为:买或不买,种植或不种植等等。在计量经济学中人们通常称为——二值因变量(Berkovec and Stern(1991),Keane and Wolpin(1994),C.F.Pietola and Oude Lansink(2001),钟甫宁、丁玉莲(2004),周应恒、彭晓佳(2004),朱艳、杨万江(2005),黄祖辉、钱峰燕(2006))。

这种分析是基于行为的形式化、理性选择观,该观点是由鲁斯和苏佩斯(Luce and Suppes,1965)等学者初创,麦克法登(McFaden,1973)引入计量经济学的框架内的。在行为科学中,行动者常常面对两个方案进行选择。理性的选择理论认为,行动者由于不同的因素对两个方案的能够选择的程度是不一样的,并选择与自己各方面因素更为匹配和更能符合自己条件的方案。令Wi1表示行为人i选择第一方案,Wi2表示i选择第二方案,若 Wi1>Wi2,i将选择第一方案而不是第二方案,Wi1

假定选择是受到外源变量Xik影响的线性函数,则这个过程的模型是:

Wi1=∑ak1Xik+vi1

Wi2=∑ak2Xik+vi2

vi 是行为的不可测因子,渐进误差和(或)随机误差。若Wi1-Wi2>0,则 Wi1大于Wi2,若Wi1-Wi2<0,则Wi1小于Wi2。令Yi*表示这个差,则:

Yi*=Wi1-Wi2=∑(ak1-ak2)Xik+(vi1-vi2)

令bk=(ai1-ai2),ui=(vi1-vi2),则方程简化为式(1),得:

Yi*=∑bkXik+ui        (1)

作为对选择的初步描述,方程(1)是讨论的起点。

选择理论认为,若Wi1>Wi2或Yi*>0,个体i将选择第一方案而不是第二方案。根据方程(1),这意味了∑bkXik-ui>0,即ui<∑bkXik个体i将选者第一备择。如果Yi*>0,可以观察到Yi*等于1;Yi*<0,Yi*等于0,因此,自然能推导下列的概率表达式:

P(Yi=1)=P(Yi*>0)=P(ui<∑biXi)

至此,若想求解或估计P(Y=1),就必求解ui小于∑biXi的累积概率,这要求ui是一个连续的随机变量,那么,方程(1)就可以写成:

P(ui<∑biXi)=P(ui<Zi)=F(Zi)=■f(u)du     (2)

其中F(·)是随机变量ui的累积分布函数,f(·)是其概率密度函数,假定其概率分布函数服从正态分布或对数概率分布,即:

F(Z)=■■exp(-■)du≡Φ(Z)

F(Z)=■

这两种分布共同的特征在于:在负无穷大时F(Z)=0,而在正无穷大时F(Z)=1,在这两者之间是单调递增的。

这种二值因变量是表示信息的提供是由一个二值变量(binary variable)或一个0~1变量来刻画,在计量经济学中对二值变量最常见的称呼是虚拟变量(dummy variable)。常用的二元选择模型又logit模型和probit模型,这两种模型的值域都是严格的介于0~1之间,而其值域的定义应该是响应概率的分布。两种模型的区别是logit模型的函数形式是对数函数,利用对数函数值域的特征确保选择的概率在0~1之间;而probit模型的函数式为标准正态的累积分布函数,其目标函数式也是标准正态对数函数形式。在二值模型的大多数运用中,主要的目的就是解释自变量x对响应概率的影响。

二元选择模型在农户行为中的运用,通常情况下,农户是追求收益最大化在每期开始都可以具有选择的权利,而这种选择可以表达为:是与非,同时他们可以保留这种选择的权利。在未来收益随机的情况下,具体的选择就成为多期动态最优选择的问题。要解决农户的选择问题等价于解决两个不同的问题:(1)与潜在行为方程结构参数相关的选择概率的估计;(2)决策的基础——随机动态最优。在第一个问题的解决中通常选用probit模型,采用极大似然估计,因为probit模型的优良值域性质保证了选择的概率在0~1之间分布,同时具有可观测性。在每一期中农户都会面对两种相互排斥的选择,并且这种选择能够在一段之间得到保持,因为可能有巨大的沉没成本或调整成本的存在。0和1作为模型的因变量,代表是否选择种植或采用某种技术,而自变量的选择严格按照农户追求收益最大化的假定,选用影响农户采用行为或技术前后的收益差的成本和收益的因素为自变量。

第二个随机动态最优问题的解决,大家知道理性的行为人追求利益的最大化,那么最优问题就是解决他选择某种行为所能带来的利益的最大化问题。在粗略估计的情况下,需要确定其具体价值选择函数,选用Bellman方程定义具体地选择价值函数,采用蒙特卡罗(Monte Carlo)以最后一期为开始向后重复估计Bellman方程,而这个最大的收益决定了下一期的最优选择价值函数,由此可以解决其动态最优问题。

最后通过联立方程——潜在行为方程选择概率和动态最优价值函数的结合,对所有自变量与因变量的影响进行回归分析,得到影响农户生产行为的影响因素。

与“决策树”方法相比,“二元选择模型”更多地注重定量的分析,通过模型的参数估计能够清晰地表达各个因素对选择行为的影响程度,同时也更加适应经济学的基本假设,农户是追求利益的最大化,减少了访谈方式的主观影响同时降低了对调查问卷设计的要求。

三、“真实选择”模型

真实选择(real-option)其本意是与经典的选择相互区别而产生的。将农户看作是一个企业,那么适合分析企业行为的很多理论和方法同样可以被用来分析农户的行为,真实选择方法就是在这种背景中产生的。经典的企业理论认为:(1)一项投资是否可行的判断标准是投资未来的收益的现值与投资成本是否相等,即净现值是否为零;(2)企业时候进入某个新的市场或退出某个市场的决策取决于其收益与变动成本的比较。(3)企业的决策往往是在未来不确定的情况下做出的。这些企业理论同样适合于分析农户的生产行为,种植有机可以看成是一种投资的选择,同时也是农户是否涉足有机市场的选择,有机产品具有生产和市场上的双重不确定性(Oliver Musshoff,Martin Odening(2003),Peter Midmore,Susanne Padel,Heather McCalman,Jon Isherwood,Susan Fowler and Nic Lampkin(2001)Yasunori Ishh(1972))。

理论上的分析是简化的,而正确的,但是在实际的农户投资、进入决策的行为中会存在“滞后现象”。投资成本的全部(或部分)的沉没、投资收益的不确定性、不同投资决策的弹性不同、农户具有选择投资的实践的权利使得真正的投资行为会出现滞后。这种滞后会为保持原有的状态带来一定的收益,或者在真实选择和理论选择之间制造一个“契形”的区域,只有保持原有状态获得收益或 “契形”区域得到弥补后,农户才会真正地选择转变或进入有机农产品市场,换而言之,农户的行为是由获得收益与“契形”大小决定的。

对于真实选择的研究的模型都是建立在农户追求收益最大化前提下,同时在一个无限的时期中,农户的选择应该是最大化收益的净现值,最优的转变决策因该由两种不同种植方式的收益差的微分来决定,即R=RO-RC。而这个收益微分是符合布朗运动的(因为布朗运动完美的随机运动),所以:

dR=μRdt+σRdz

μ,σ:代表心益变动的随机过程(漂移和波动)

dz:维纳过程

R>r*SO时,从普通转向有机种植是有利可图的,相反r*SC则是反向运动的动机

SO:从普通种植向有机种植放式转变所需要的成本

SC:转回普通种植需要的成本

r:折现率

Dixit(1989)证明在动态背景下,在两种技术的选择中移动符合以下两个方程:

普通转向有机种植:■σ2R2■+μR■-rVC=R

从有机向普通转变■σ2R2■+μR■-rVO=-R

VC,VO:代表普通和有机种植的利润现值。

上面两个等式实践上是一个标准的边界条件,表达了农户在有机和普通之间选择的临界条件,也可以表示为下面的简化形式:RO*>rSO≡CO ,RC*<-rSC≡CC

这个简化形式说明,真实地选择动机RO*和RC*是分布在经典的决策动机与不采取行动(即保持现有状态不变)区域中,两种动机之间的范围是增加的,这也就是选择的滞后或“契形”,强调了生产的惯性。在一些更为严格的假设条件下,Dixit定义了这两个“门槛”的具体形式:

RO*=■■CO

RC*=■■CC

-α和β是前面微分方程的特征方程的根:

β=■>1

-α=■<0

其中■和■被称为选择乘数,它揭示了选择动机的价值,特别地,与静态相比,很容易地看出不确定性增加了经典与真实动机间的“契形”,同时扩大了保持现有种植的惯性区域。换而言之,在研究农户是否会选择有机种植时,实际上就是对控制乘数的估计和确定,所有的政策变量都要通过影响乘数才能改变农户的决策行为。

真实选择模型与前面的决策树模型和二元选择模型相比较,有很强的理论性,但是实证过程中会存在很多的问题,因为这种方法的实证估计往往不能直接采用常见的估计方法,必须对数据进行很多的限制,而这种限制条件的存在也影响了模型对现实情况的解释。但也正是因为这个模型理论推导逻辑严密,所以在变化不同的假设后,模型可以用于研究很多的问题,例如,政府对农户种植有机的补贴、农业保险的补贴等。

总结

综上三类模型是基本的决策模型,也是决策分析中最常用的实证方法。“决策树”模型较为简单,分析人们特定行为发生或者改变可能受到的因素,定性的分析这些因素可能作用的方向。通过访谈形式进行,回答通常是与否,非常容易为受调查者接受,调查的结果不需要复杂的计量模型分析,所以不能对结果进行定量的分析,但这种模型关键的难点在于问卷的逻辑如何真实反映受调查者的思维逻辑,同时又不能影响受调查者的逻辑,只有这样才能客观实际地反(下转46页)(上接8页)映人们行为。

“二元变量”模型其在选择行为分析中运用非常的广泛,通常用于测定人们特定的行为模式或行为改变受到影响因素,不仅能反映各种因素可能作用的方向,同时还可以定量地测度各种因素影响的程度。因为其良好的计量统计性质和较为实际地刻画人们面对决策过程的“两难”抉择而运用广泛,但是正是由于其优势,又使得这类模型使用出现偏差,最主要体现在研究者运用这类模型过程中就“意愿”和“实际购买行为”的混淆,很多的分析结果实际上体现的是对意愿选择的分析,而不是实际行为或即成实际的分析,对于结论的探讨自然也就会出现误差,但无论怎样这类模型经过必要的修正后其运用的领域仍然广泛。例如,在这类模型中加入预期或风险的测定,补充和限制人们的意愿,使得意愿和现实之间更容易接近,从而达到分析人们行为的目的。

“真实选择”模型,对于人们行为的分析贯彻经济学中“最大化利益的原则”,对预期收益的随机性进行假定,然后引入行为方程进行计量模型分析,最终测试人们的行为。这种模型从理论上看更符合于经济学的思维,同时强调了人们特定行为或行为变化中利益的重要性,模型的结论数量化收益、预期收益对人们行为决策的影响。但是自认为,这种方法对数据的获取和要求会更高,至少在“panel data”(面板数据)的情况下才能使用,它需要一段连续时间数据来回归预测收益预期,需要截面数据来做行为分析,这就对数据收集带来一定难度,所以这种方法运用非常有限,在国内文献中几乎没有涉及。

参考文献:

[1]  丁玉莲,钟甫宁.消费者对转基因食品的态度研究[D].南京:南京农业大学硕士学位论文,2004.

[2]  周应恒,彭晓佳.安全食品消费者态度、购买意愿及信息的影响——对南京市超市消费者的调查分析[J].中国农村经济,2004,(11).

[3]  黄祖辉,钱峰燕.茶农行为对茶叶安全性的影响分析[J].南京农业大学学报:社会科学版,2006,(1).

[4]  张云华,马九杰,孔祥智,朱勇.农户采用无公害和绿色农药行为的影响因素分析——对山西、陕西和山东 15 县(市)的实证分

析[J].中国农村经济,2004,(1).

[5]  朱艳.基于农产品质量安全与农业产业化组织的农户生产行为研究——以浙江省为例[D].杭州:浙江大学硕士学位论文,2004.

猜你喜欢

决策树
基于决策树和神经网络的高血压病危险因素研究
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
面向分布式数据流大数据分类的多变量决策树
基于改进决策树的故障诊断方法研究
决策树多元分类模型预测森林植被覆盖
基于决策树的出租车乘客出行目的识别
基于决策树的复杂电网多谐波源监管
基于模糊关联规则和决策树的图像自动标注
基于肺癌CT的决策树模型在肺癌诊断中的应用