演进视觉下的Logistic模型、Probit模型、Tobit模型研究进展
2016-04-26宋振江
【摘要】研究目的:为了探究Logistic模型、Probit模型、Tobit模型的渊源、基本原理、基本定义与区别。研究方法:通过文献法探索模型基本原理,基于数理手段对模型加以推导、验证,进而得出模型的一般式。研究结果:三个模型属于同一模型体系,是随着时间推移、问题暴露而对模型的暴露出的某一问题进行修补性研究而实现的模型演进,三个模型具有内在渊源。与此同时,三个模型依旧存在一定的内在缺陷。研究结论:Logistic模型、Probit模型、Tobit模型的演进过程是以问题为导向,沿着这一研究思路,这一模型体系将继续演进发展,进而实现模型的优化,为日益复杂的自然、社会科学新问题服务。
【关键词】Logistic模型 Probit模型 Tobit模型 正态分布
【基金项目】测绘地理信息江西省研究生创新教育基地资助。
【中图分类号】G64 【文献标识码】A 【文章编号】2095-3089(2016)06-0236-02
2.Probit模型的基本原理
2.1 Probit模型溯源与基本原理
Probit模型是为解决二值响应问题而产生的,通常认为Gaddum(1933年)和Bliss(1934年)发明了Probit模型,而实际上此二人仅仅实现二值响应变量成功的概率向对应的正态偏差的转化思想,而这一思想是德国学者Fechner在心理物理学领域率先提出的,Fechner率先提出将概率转换为正态偏差的方法而开创出Probit方法。
在迭代过程中,初值在很大程度上影响迭代的收敛性与收敛度。经过实验证明,初值选取得离真值越近,越有利于算法的收敛。因此,可以利用观测到的频率p的Probit值yu*与xu进行粗略的最小二乘拟合,然后利用拟合的结果,估计出一组Yu*作为迭代的初值。
2.2 Probit模型基本定义
设Y是一个二值的响应变量,取值为0,1。
3.Tobit模型的基本原理
3.1 Tobit模型溯源与基本原理
Tobit模型是由Tobin于1958年率先提出,用于研究被解释变量有上限、下限、或者存在极值等问题,因此Tobit模型研究被解释变量取值有限制、存在选择行为的一类问题 。
4.Logistic模型、Probit模型、Tobit模型的区别
4.1 Logistic模型与Probit模型的区别
从分布角度,Logistic函数与Probit函数几乎重叠,虽然二者都服从0-1分布,但Logistic函数服从累积正态分布(即服从Logistic分布),Probit函数服从标准正态分布。
从变量解释的角度,对于Logistic函数,其所等于的p/(1-p)即为odds,两个odds相比即为odds ratio(OR值),所得结果亦十分直观。
当因变量是名义变量时,Logistic模型和Probit模型没有本质的区别,二者的区别在于所采用的分布函数不同,Logistic模型假设随机变量服从逻辑概率分布,而Probit模型假设随机变量服从正态分布。单从公式、函数值角度分析,二者相差无几,唯一的区别在于裸机概率分布图像“尾部”比正态分布粗些。当因变量为序次变量时,回归时只能采用有序Probit模型,有序Probit可以看作是Probit的扩展 。
4.2 Probit模型与Tobit模型的区别
Probit模型成立的条件是:if y*>0 then yi=1 else yi=0。
Tobit模型成立的条件是 :if y*>0 then yi=yi* else yi=0。
显然,二者在成立条件上存在差异。Tobit模型是线性概率模型,但当概率p=1时,其现实意义为事件未发生。Tobit模型估计本身无偏,但预测结果却有偏。Probit是采用累积概率分布函数,用正态分布的累积概率作为Probit的预测概率。可以克服这个缺点,本质基本上一样。为解决Tobit模型这一缺陷,可以采用如下变换方法:
① 使解释变量xi所对应的所有预测值(概率值)都落在(0,1)之间。
② 同时对于所有的xi,当xi增加时,希望yi也单调增加或单调减少。
4.3 Logistic模型、Probit模型、Tobit模型的区别
Logistic模型、Probit模型、Tobit模型都是为了解决因变量为定性变量的问题。Logistic模型、Probit模型主要是为了解决线性概率模型(LPM模型)的不足;Logistic模型是对数单位模型,Probit模型是概率单位模型;Logistic模型服从累积正态分布,Probit模型服从标准正态分布;Logistic模型是为改进Malthus模型而出现的,Probit模型解决二值响应问题而产生的。而Tobit模型专门研究被解释变量取值有限制、存在选择行为的一类问题,其属于线性概率模型,亦具有先天不足。
从模型产生的先后顺序角度,Logistic模型产生于18世纪末,Probit模型诞生于20世纪30年代,而Tobit模型诞生于1958年。从问题解决角度,Logistic模型的出现是为了解决实证研究模型的不足而出现,Probit模型与Tobit模型出于对同一模型体系不同问题的专项研究解答。从模型运算解决角度,SPSS、SAS、Eviews、Excel皆可用于Logistic模型研究,SPSS、Stata、Eviews等可用于Probit模型分析,SPSS、Stata、Eviews等软件可用于Tobit模型分析。
5.总结
Logistic模型、Probit模型、Tobit模型是以问题为导向的模型,在土地科学、生态学、环境科学、经济学领域广为应用,自该模型体系诞生200余年来,国内外诸多学者对其进行研究,其模型演进就是该模型完善的成果。本文结合国内外诸多研究者已有的研究成果,从模型的渊源、基本原理、基本定义角度进行详细介绍与推导,其中涉及到对模型优缺点的评述。沿着这一研究思路,这一模型体系将继续演进发展,进而实现模型的优化,为日益复杂的自然、社会科学新问题服务。
参考文献:
[1]余爱华. Logistic模型的研究[D]. 南京林业大学,2003:5-6.
作者简介:
宋振江(1991-),男,辽宁鞍山人,硕士研究生,主要研究方向为土地利用与管理、土地经济管理、数量经济学。