APP下载

基于变量选择的异方差G-Q检验

2023-06-05张晓琴李阔辰杨年喜

关键词:样本容量方差扰动

张晓琴,李阔辰,杨年喜

(山西财经大学 统计学院,山西 太原 030006)

0 引言

在经典线性回归模型中,考察随机误差项的基本假定是一个重要内容,尤其是对其同方差的假定。当随机误差项不满足同方差时,称模型具有异方差性。若忽略同方差假定,则参数的显著性检验将失去意义,从而可能作出错误的判断,造成严重的后果,因此异方差检验具有十分重要的意义。

目前较为常用的异方差检验方法有图示法、Park 检验、Glejser 检验、Goldfeld-Quandt (GQ)检验、Breusch-Pagan(B-P)检验和White 检验[1-5]等。其中G-Q 检验一般用于一元线性回归模型,在多元模型中,G-Q 检验无法直接对样本点进行排序,因此一些学者在此方面做了大量的工作。龚秀芳[6]通过主成分分析法(PCA)将观测值按照第一主成分的顺序进行由小到大的顺序排列,然后对观测值进行G-Q检验。郑红艳等[7]将多元回归模型分解为多个一元模型,依次对其进行G-Q 检验,若有一个回归模型存在异方差,则认为该多元模型存在异方差。刘明等[8]提出以被解释变量拟合值作为排序标准,将观测值按照由小到大的顺序排列,然后进行G-Q 检验。上述几种方法都针对G-Q 检验无法直接应用于多元模型的问题进行了改进,几种方法各有其优势,但也存在着一些不足,例如准确性不高、适用性不广等问题。为解决这些问题,本文借鉴White 检验[5]的思想,提出了一种新的改进的G-Q 检验方法,并通过数值模拟分析与案例分析论证了其优良的特性。

1 基本知识

1.1 线性回归模型异方差定义

考虑一元线性回归模型[9]:

其中yi为被解释变量,xi为解释变量,β0为截距项,β1为解释变量xi的系数,εi为随机扰动项,n为样本容量。若∀x1,x2,…,xn,(1)中的每个εi的方差均相等,即Var(εi|xi) =σ2,则称模型(1)具有同方差性,反之则称模型具有异方差性[10]。对异方差性的检验,即考虑如下的假设检验问题:

1.2 G-Q检验[3]

G-Q 检验是检验一元线性回归模型是否存在随解释变量递增的异方差的常用方法,有着步骤简单、准确度高等优点[11]。对一元线性回归模型(1)进行G-Q 检验的步骤如下:

(i)将样本点按照解释变量xi由小到大排列。

(ii)将序列中间的c(c≈n/4)个样本点删去,将序列两端样本点各自作为一组子样本。

(iii)分别对两组子样本进行OLS 回归,计算出各自的残差平方和,将xi较小组的残差平方和记为SSR1,xi较大组的残差平方和记为SSR2。

(iv)构造如下在原假设成立下服从F分布的统计量:

(v)给定显著性水平α,确定相应的临界值Fα。若F>Fα,则拒绝原假设,认为模型存在异方差;若F<Fα,则不拒绝原假设。

2 改进的G-Q检验

由上节可知虽然传统的G-Q 检验优点众多,但其一般情况下仅能应用于一元回归模型,而无法应对多元情形。要在多元回归模型中使用G-Q 检验,关键在于如何选择排序的标准。龚秀芳[6]提出了使用主成分分析法计算出样本的第一主成分来代表所有解释变量,使用第一主成分作为排序标准进行G-Q 检验。但在实际应用中发现,使用该方法进行检验的准确度并不够高,尤其在第一主成分的贡献率较低的情况下。与龚秀芳[6]改进的G-Q 检验的思想类似,本文考虑找出一个能代表所有解释变量对随机扰动项方差的影响的解释变量进行排序。在变量选择的方法上,借鉴White 检验的思想,通过对残差平方与所有解释变量或其平方项进行OLS 回归,找出参数p值最小的解释变量,该解释变量即为所有解释变量中对随机扰动项方差影响最大的解释变量,以该解释变量为排序标准进行G-Q 检验。

考虑多元回归模型:

其中α0,α1,…,αk为回归模型的参数,νi(i=1,2,…,n)为随机扰动项。

若使用样本残差平方与解释变量的平方进行回归,则将模型(4)中的解释变量替换为解释变量的平方,即:

对模型(4)或(5)中α0,α1,…,αk进行t检验,找出检验p值最小的参数对应的解释变量,记为xim(1 ≤m≤k,i=1,2,…,n)。即在所有解释变量中,xim对随机扰动项方差的影响最大,即最有可能引起随机扰动项产生异方差的解释变量是xim。将所有样本点按照xim由小到大的顺序排列,相当于样本点根据随机扰动项方差的影响因素进行排序,这与G-Q 检验在一元回归模型中的思想一致,之后进行G-Q 检验。将该方法称为基于变量选择的G-Q 检验(将使用样本残差平方与解释变量进行回归的方法简记为M-G-Q 检验,使用样本残差平方与解释变量平方进行回归的方法简记为M-G-Qs 检验)。具体步骤为:

(i)按照最优解释变量xim由小到大的顺序对样本点进行排序,得到对应的观察值数列为,i=1,2,…,n。

观 测 值xim较 小 的 样 本 数 列 :,其中i=1,2,…,l。

观 测 值xim较 大 的 样 本 数 列 :,其中i=l+c+1,l+c+2,…,n。

为方便区分,两组样本数列的样本容量分别用n1与n2表示,其中:n1=n2=(n-c)/2,且n1+n2+c=n。

(iii)由模型(3)假设这两部分样本数列的回归模型矩阵形式分别为:

其中,Σ1,Σ2分别是n1,n2阶的对角矩阵,Y1,ε1与Y2,ε2分别是n1维与n2维列向量,β1,β2均是k+1 维列向量,X1,X2分别是n1×(k+1) 和n2×(k+1)的列满秩矩阵。

(iv)分别对模型(6),(7)进行普通最小二乘回归,得出其各自的残差平方和:

构造检验统计量F:

在(2)的原假设成立的情况下,F统计量服从自由度为(n2-k-1,n1-k-1)的F分布[12]。

(v)给定显著性水平α,得到临界值Fα/2,F1-α/2,若F>F1-α/2或F<Fα/2,则拒绝原假设,认为样本数据存在异方差;否则不拒绝原假设。

本文所提出的M-G-Q 检验通过类似White检验的t检验从多个解释变量中挑选出对随机扰动项方差影响最大的解释变量作为G-Q 检验的排序标准,进而进行G-Q 异方差检验。与龚秀芳[6]改进的G-Q 检验相比,新方法选择的排序标准本身就是解释变量,能够更好地反映对随机扰动项方差的影响。在White 检验中,需要存在某个解释变量、二次项或交叉项参数的p值低于给定的显著性水平才能拒绝原假设,认为存在异方差。而在新方法中,不必拘泥于给定的显著性水平,只需找出参数p值最小的解释变量,然后再以该解释变量作为排序标准进行G-Q 检验,提高了检验的灵敏度,使检验结果更加准确。本文的F检验使用了双侧检验,这样可以同时检验随解释变量递增和随解释变量递减的异方差[8],提高了检验的适用性与准确性。

本文提出的改进方法基于随机误差项的方差与模型中的自变量存在某种关联的假定,也有学者提出了不依赖于上述假定的异方差检验方法[13]。本文基于上述假定的原因是在实际情况中随机扰动项的方差与模型中的自变量有关的情况更为常见。

3 数值模拟和实证分析

3.1 数值模拟

本小节从数值模拟分析的角度对龚秀芳[6]改进的G-Q 检验(记为PAC-G-Q 检验)、刘明等[6]改进的G-Q 检验(记为Yhat-G-Q 检验)、White 检验和本文提出的M-G-Q 检验与M-G-Q-s 检验进行比较。本文的数值模拟分析通过Python 实现。

使用如下线性回归模型:

其中样本容量n为50,100 或200,β0=β1=β2=β3=β4=1,解释变量xi1,xi2,xi3,xi4相互独立且产生自正态分布N(0,1),εi产生自正态分布,为了详细对比上述各方法的检验效果,本文模拟了多种不同的异方差,的取值有以下六种情况:。其中,情况(a)模拟的是随某个解释变量递增的情况,情况(b)模拟的是随某个解释变量递减的情况,情况(c)模拟的是同时受两个解释变量的影响且方向相反的情况,情况(d)模拟的是同时受四个解释变量同方向的影响的情况。情况(e)和(f)模拟了两种较为复杂的异方差情况。

模拟实验中原假设为模型不存在异方差,给定显著性水平α=0.05,对每种不同的异方差情况在不同的样本容量情况下生成的数据分别进行PCA-G-Q 检验、Yhat-G-Q 检验、White检验及M-G-Q 检验。每种情况重复10 000 次实验,统计各方法拒绝原假设的次数,结果如表1 所示。

表1 异方差检验结果Table 1 Results of the heteroskedastic test

图1 到图6 展示了六种异方差情况下不同方法随样本容量变化的拒绝频率(拒绝次数与实验次数的比率)变化情况,如图所示,通过数值模拟可以得出如下结论:

图1 时各方法的拒绝频率(拒绝次数与实验次数的比率)Fig.1 Rejection frequency(the ratio of the number of rejections to the number of experiments) of each method at

图2 时各方法的拒绝频率(拒绝次数与实验次数的比率)Fig.2 Rejection frequency(the ratio of the number of rejections to the number of experiments) of each method at

图3 时各方法的拒绝频率(拒绝次数与实验次数的比率)Fig.3 Rejection frequency(the ratio of the number of rejections to the number of experiments) of each method at

图4 时各方法的拒绝频率(拒绝次数与实验次数的比率)Fig.4 Rejection frequency(the ratio of the number of rejections to the number of experiments) of each method at

图5 时各方法的拒绝频率(拒绝次数与实验次数的比率)Fig.5 Rejection frequency(the ratio of the number of rejections to the number of experiments) of each method at

图6 时各方法的拒绝频率(拒绝次数与实验次数的比率)Fig.6 Rejection frequency (the ratio of the number of rejections to the number of experiments) of each method at

(i)在六种不同的异方差情况下,M-G-Q检验的异方差检出率均高于PCA-G-Q 检验,例如,在情况(a)中,样本容量为50 的情况下,相比之前性能最好的PCA-G-Q 方法45.9%的拒绝频率,本文提出的M-G-Q 方法的拒绝频率提升到了90.2%,可以说明通过M-G-Q 检验选择出的最优解释变量比PCA-G-Q 检验的第一主成分更能反映随机扰动项的方差情况。

(ii)Yhat-G-Q 检验在情况(a)和(b)中表现尚可,说明用样本的拟合值i进行排序具有一定的合理性,但远不如用M-G-Q 检验中选择出的最优解释变量效果好。在情况(d)中Yhat-G-Q 检验表现最佳,因为在情况(d)中,四个解释变量协同影响随机扰动项的方差,此时用样本的拟合值i进行排序效果很好,而本文提出的M-G-Q 检验仅在样本容量为50 时的拒绝频率比Yhat-G-Q 检验略低,在样本容量为100 或200 时检验效果与Yhat-G-Q 检验不相上下。在情况(c)中,使用Yhat-G-Q 检验的效果较差,因为此时两个解释变量对随机扰动项方差的影响可能会相互抵消,用i排序并不合理,但使用M-G-Q 检验依然可以很好地识别出异方差。在情况(e)和(f)中,本文提出的M-G-Q 检验效果均比Yhat-G-Q 检验要好,例如,在情况(f)中,样本容量为200 的情况下,相比之前性能最好的Yhat-G-Q 方法19.3%的拒绝频率,本文提出的M-G-Q 方法的拒绝频率提升到了43.2%。因此M-G-Q 检验比Yhat-G-Q 检验更具有合理性与泛用性。

(iii)White 检验是多元线性回归中最常用的异方差检验方法之一,但它的缺陷也显而易见,即在解释变量较多时,自由度损失严重,所以White检验要求的样本容量较大,这一点也在模拟结果中得以体现,当n=50 时,White 检验的效果是极差的。M-G-Q 检验要求的样本容量远小于White检验,在情况(a)到(d)中,样本容量为200 时,White 检验效果很好,拒绝频率达到99.5%以上,此时本文提出的M-G-Q 检验的拒绝频率与White检验十分接近,在情况(e)和(f)中,M-G-Q 检验的表现均优于White 检验。

(iv)通过对比可以发现在各种情形下使用M-G-Q-s 检验的效果相较于M-G-Q 检验较差,说明使用样本残差平方与解释变量的一次项进行回归是合理的。

(v)在相对复杂且其他方法较难识别的异方差情况(e)和(f)中,M-G-Q 的检验效果仍远比其他几种方法要好。因此,M-G-Q 在异方差检验中的灵敏性更高。

3.2 实证分析

本小节将通过实例来验证本文方法的可行性。从各地区的统计局官网上获取2020 年31个省份(不含港澳台)的人均生产总值(y),人均消费支出(x1),人均第三产业增加值(x2),人均对外进出口总值(x3),该数据由该项经济指标总值除以当地总人口得到,单位为万元。分别使用White 检验以及M-G-Q 检验对该组数据进行异方差检验,模型设定如下:

使用31 省份的数据估计出的模型为:

首先使用White检验对数据进行异方差检验,检验的统计量为,故不拒绝原假设,认为该模型不存在异方差。

然后使用M-G-Q 检验对数据进行异方差检验,其检验统计量为F=38.954 7>F0.975(8,8)=4.433 3,因此拒绝原假设,认为该模型存在异方差。

通过对比M-G-Q 检验与White 检验的结果,可以看出,M-G-Q 检验可以顺利实施且比White检验的结果更灵敏,因此M-G-Q 检验具有可行性。

4 结论

G-Q 检验是一元线性模型中常用的异方差检验方法,本文提出的M-G-Q 检验是G-Q 检验与White 检验的结合,将G-Q 检验推广至多元线性模型,并且与前人提出的几种G-Q 检验的推广进行了详细的对比,论证了M-G-Q 检验的灵敏度优于其他几种推广。

猜你喜欢

样本容量方差扰动
Bernoulli泛函上典则酉对合的扰动
概率与统计(2)——离散型随机变量的期望与方差
采用无核密度仪检测压实度的样本容量确定方法
(h)性质及其扰动
方差越小越好?
计算方差用哪个公式
方差生活秀
小噪声扰动的二维扩散的极大似然估计
用于光伏MPPT中的模糊控制占空比扰动法
广义高斯分布参数估值与样本容量关系