随机解释变量问题的预测与控制方法
2018-12-03王义闹
王义闹
(温州大学数理与电子信息工程学院,浙江温州, 325035)
文[1]例4.3.2考虑劳动经济学领域中,劳动者的工资wage主要由劳动者的受教育程度educ、工作经验exper、个人能力abil等诸多因素决定:
但在具体估计该模型时,由于劳动者个人能力的大小很难测度,因此该解释变量无法真正引入到模型中,于是它只能进入到随机干扰项中,即实际用于回归的模型为:
而个人能力的大小往往与其所受教育程度有较为密切的联系,这就导致了实际用于回归的模型(2)中劳动者个人的受教育程度与随机干扰项间出现同期相关性,这也是文[2]模型的一个简化.
我们容易得到wage、educ、exper的简单随机样本进而由工具变量法可以得到educ对wage的净影响1β的一致估计.
当我们要预测劳动者受教育年限为educ=c时工资的平均值:
一般地,本文考虑随机解释变量问题:
在经济学中常常作实证分析与边际分析.我们求得(4)中参数的满意估计,就满意地证实了变量y与之间具有规律(4),进而可作出满意的边际分析.除此之外,线性回归模型还被广泛用于预测与控制,这时充分利用随机解释变量与u线性相关的信息,可以用解释变量更好地解释被解释变量.本文定理5证明了:存在常数和随机变量v使
由于(4)式中有随机解释变量与随机误差项u线性相关,所以解释变量是确定性变量或解释变量是与随机误差项u同期不线性相关的随机变量条件下,u的条件期望为 0的假设不再成立.因为若有则
为严格证明(5)式的存在性,先讨论两个随机变量线性相关与一元线性回归之间的关系.
1 线性相关与线性回归的关系
定理1 当变量x,y都是随机变量,且二者线性相关系数时,必存在唯一一组常数以及随机变量使
使
特别,如果将定理1中的x,y限定为服从正态分布的随机变量,则有下面的定理2.
定理2 当变量x,y都是服从正态分布的随机变量,且二者相关系数时,必存在唯一一组常数以及与y相互独立的服从正态分布的随机变量u,使
定理3 设被解释变量y与随机解释变量x及随机误差项u之间有如下总体规律:
其中x,u线性无关,则其中常数b0,b1及随机变量u是唯一的,且y,x线性相关,y,u线性相关,相关系数为:
证明:若存在常数c0,c1及零均值随机变量v,使且x与v线性无关,则两式相减得求x与上式两端的协方差得于是上式成为两边取数学期望,由进而得u=v.
定理3表明解释变量是随机变量的一元线性回归问题中,在随机误差项均值为0,解释变量方差大于0且与随机误差项线性无关的条件下,总体规律的表达式是唯一的,且x,y必线性相关.
特别,如果将定理3中的x,y限定为服从正态分布的随机变量,则有下面的定理4.
定理1、2表明,线性相关的随机变量x,y之间一定有形如(8)式的唯一线性表示;定理3、4表明随机被解释变量y与随机解释变量x满足关系式(9)且随机解释变量x与随机误差项线性无关时,x,y之间的关系式(9)是唯一的,且随机变量x,y之间一定线性相关,相关系数由(10)式给出.这就是线性回归分析与线性相关分析的联系.
线性回归分析与线性相关分析的区别是,如果线性回归分析中的解释变量是确定性变量,线性相关分析(以下简称为相关分析)与线性回归分析(以下简称为回归分析)就没有任何关系;线性回归分析中解释变量与被解释变量之间是因果关系,而线性相关分析中两个变量都是随机的、且地位是可换的,两个变量之间不一定有单向因果关系.
2 变量之间数量关系的不同表达式
为把引言中的问题叙述清楚,再进一步讨论具有多元线性回归规律(4)的变量之间的数量关系的不同表达式.
定理5 考虑随机解释变量问题:
证明:根据定理1,由x1与u线性相关知,存在常数和0均值随机变量u1使
定理6 设总体规律为:
3 随机解释变量问题的预测方法
考虑随机解释变量问题:
在增加任意取定解释变量一组值的条件下,v的条件期望为 0的假设,并已知随机变量的容量为n的简单随机样本时,(21)式中的OLS估计量在随机向量取值的条件下是的有效估计、一致估计.
作为观察值
和随机变量y的条件期望
4 随机解释变量问题的控制方法
仍然考虑随机解释变量问题(19),并且假定被解释变量y、解释变量随机误差项u都服从正态分布.我们的目标是通过控制随机解释变量的值,以最大置信度将目标值y控制在之中.当然控制的前提是,我们对随机解释变量的控制,不改变随机解释变量的分布律,不改变随机被解释变量y与随机解释变量之间的关系(19),或者说,我们对不断干预、控制的结果呈现出统计规律性(19).
就可以实现对被解释变量y的较好控制.