APP下载

半相依回归模型中回归系数的广义p值检验

2016-12-14范永辉

关键词:相依回归系数广义

刘 洋,范永辉

(天津师范大学数学科学学院,天津 300387)

半相依回归模型中回归系数的广义p值检验

刘 洋,范永辉

(天津师范大学数学科学学院,天津 300387)

研究半相依回归模型中回归系数的精确检验问题.针对含有2个相依线性方程的回归系统中回归系数的假设检验问题,利用广义p值的方法建立了精确的检验.对检验的功效进行了模拟,模拟结果表明,本研究的检验方法能有效控制第一类错误出现的概率,具有较好的检验效果.

半相依回归模型;回归系数;广义p值;广义检验变量

由m个相依线性回归方程组成的线性回归系统形式如下

其中:yi为n×1观测向量;Xi为n×pi列满秩设计阵;βi为pi×1未知回归系数;εi为随机误差向量.若随机误差向量ε1,ε2,…,εm具有相关性,即满足

这里,“⊗”表示矩阵的Kronecker乘积,In为n阶单位阵,Σ=(σij)m×m为非对角正定矩阵,则这样的系统称为半相依回归系统[1].

半相依回归系统模型在国民经济、计量经济、生物、工业及计量地理学等相关领域有着广泛的应用,同时也适用于销售预测[2]、经济预测、通货膨胀研究等有关领域[3].自该类模型参数的一类两步估计被提出以来[4],关于此类模型的研究一直受到很多学者的关注.

与一般的线性模型类似,对于半相依模型(1),常常要检验如下假设:

其中:β′=(β1′,β2′,…,βm′)为k×(p1+p2+…+pm)的行满秩矩阵,H为q×k矩阵.由于多余参数(Σ中的元素)的影响,假设(2)不存在精确检验.

假设检验是统计推断中的一个重要内容,进行检验决策的重要依据之一就是p值.在半相依模型中,由于协方差矩阵中多余参数的影响,导致无法获取传统意义上的精确的p值检验.为了克服检验中多余参数带来的困难,文献[5]提出了广义p值检验.文献[6]分别对单向分类模型方差分量的单边假设和多向分类模型中方差分量的单边假设问题给出了基于广义p值的精确检验,文献[7]将这种方法应用到混合效应模

型中,分别对单个方差分量的显著性和2个独立平衡模型方差分量的比较建立了精确检验,并将部分结果推广到非平衡的情况.文献[8-9]利用广义p值对协方差具有组内相关结构的简单生长曲线模型中的回归系数建立了精确检验,文献[10]将其结果推广到具有相关结构的简单生长曲线模型.文献[11-12]利用广义p值和广义置信区间对Panel数据模型中回归系数的假设检验问题建立了精确检验,并构造了回归系数的几个广义置信区间.文献[13]利用一个有用的矩阵不等式,构造了一般的含2个方差分量混合模型中方差分量复杂假设下的广义p值检验,并拓展到某些含多个方差分量模型中的方差分量检验.

本研究对于含有2个相依线性方程的回归系统中回归系数的假设检验,利用广义p值的方法建立了精确的检验,并对检验的功效进行了模拟.

令X是一个可观测的随机变量,具有分布函数F(x|θ,η).需要考虑的是检验假设H0:θ<θ0,θ0是已知量,而η是由多余参数组成的参数向量.为了引入广义p值,首先引入广义检验变量.广义检验变量是指满足以下条件的随机变量T(X,x,θ,η)(x是随机变量X的观测值):

(1)T是θ的随机单调函数;

(2)T的观测值T(x,x,θ,η)与未知参数无关;

(3)当θ=θ0时,T的分布与未知参数无关.

广义p值定义为P(T>t|θ=θ0).对于给定的显著性水平α,如果广义p值小于α,则拒绝H0.关于广义p值的详细内容见文献[5].

为方便,记rank(A)、R(A)、tr(A)分别为矩阵A的秩、A的列向量张成的线性子空间和A的迹.

1 广义p值的构造

含2个相依线性回归方程的线性回归系统为:

其中:yi为n×1观测向量;Xi为n×pi列满秩设计阵;βi为pi×1未知回归系数;εi为随机误差向量.假定(ε1,ε2)的行独立同分布,每行服从二维正态分布N2(0,Σ),其中Σ=(σij)为2阶未知正定阵,并且σ12≠0.

记y′=(y1′,y2′),X′=diag(X1′,X2′),β′=(β1′,β2′),ε′=(ε1′,ε2′).由模型(3)的假设可知ε服从2n维正态分布N(0,Σ⊗In).

对矩阵(X1,X2)作QR分解

将(Q1,Q2)补全成正交阵Q=(Q1,Q2,Q3),则由QR分解的性质可知,R(Q1,Q2)=R(X2,X1)=R(X1,X2),R(Q3)=R(X2,X1).

用Q′对半相依模型作变换

将zi适当分块,记作zi′=(zi1′,zi2′),i=1、2,其中zi1、zi2分别是r×1、(n-r)×1的向量,在模型(7)中适当交换zi1、zi2,i=1、2在向量z中的位置,得到如下等价模型

由该模型可知β=(β1′,β2′)′的最佳线性无偏估计[14]为

在实际应用中,Σ往往是未知的,因此需寻求一种兼顾误差向量间相关性和可行性的估计.

由于 (z12,z22)′~N(0,Σ⊗In-r),随机矩阵 (z12,z22)行独立,且每一行服从分布N(0,Σ),故可看作从二维正态总体N(0,Σ)中抽取的一个容量为n-r的样本,令

由于S只是z12、z22的函数,故S与z11、z21独立,也与相互独立.在式(8)中将Σ用它的估计代替,得到的两步估计为

其中:z′=(z11′,z21′),z~N(Rβ,Σ⊗Ir),且由S与z的独立性可知

那么有(HVH′)-1/2H((S)-β)|S~N(0,I),这个条件分布与S无关,故(HVH′)-1/2H((S)-β)的无条件分布也是N(0,I),并且与S独立.

记TS为S的Cholesky因子,即S=TSTS′,TS=(Tij)是下三角矩阵,并且对角线元素都为正数.令θ为Σ的Cholesky因子,设M=θ-1TS,则有显然M也是下三角矩阵.根据文献[15]的定理3.2.14, M的元素mij,i≥j都是独立的,并且,i= 1、2,mij~N(0,1),i>j.令s是S的观测值,tS是TS的观测值,则tStS′=s.

由以上讨论可构造广义检验变量

其中:s是S的观测值;tS是TS的观测值;

且MM′~W(n-r,I).令t是广义检验变量T的观测值,则t=(H(S)-d)′(H(S)-d)与未知参数无关.当H0成立时,T的分布与位置参数无关,故广义p值可定义为

如果广义p值p1小于给定的显著性水平α,则拒绝原假设,认为Hβ和d有显著性差异.

由于广义检验变量T中包含的变量的分布已知,但分布函数难以计算,故广义p值p1很难计算,可以利用文献[16]使用的Monte-Carlo模拟方法来给出p1的值,模拟过程如下:

计算出t的值,令p1=0;

For i=1 to m

从ξ、η的分布随机抽取它们的观测值;

计算广义检验变量T的值t1;

如果t1>t,则p1=p1+1;

end(i);

计算广义p值p1=p1/m.

2 功效模拟

针对假设问题H0:Hβ=d⇔H1:Hβ≠d,本节给出基于T的广义p值检验功效的模拟.模拟过程中取

表1 检验功效的模拟结果Tab.1 Results of simulation for effects of test

由表1的模拟结果可以看出,当(Hβ-d)′(Hβd)=0时,原假设H0:Hβ=d成立.模拟结果显示,所有检验功效都是(Hβ-d)′(Hβ-d)的增函数,即Hβ与d的距离越远,否定H0的概率就越大.模拟结果同时显示,当H0成立时,T的功效(犯第一类错误的概率或真实的检验水平)和给定的检验水平α= 0.05相差不大.由这些数据可以看出,广义p值检验要比似然比检验具有优越性.

3 结论

对于含有2个相依线性方程的回归模型,本研究给出了关于回归系数假设检验问题的一种广义p值方法,构造了广义检验变量,进一步通过随机模拟的方法,考察了检验的功效.模拟结果表明,本研究的检验方法能有效控制第一类错误出现的概率,具有较好的检验效果.

[1]马铁丰.线性混合模型与多元分布中的统计推断问题[D].北京:北京工业大学,2008. MA T F.Problems of statistic inference in linear mixture models and multivariate distributions[D].Beijing:Beijing University of Technology,2008(in Chinese).

[2] 高荣兴.半相依线性回归模型在耐用消费品销售预测中的应用[J].系统工程学报,1992,7(2):71-78. GAO R X.The application of seemingly unrelated linear regression models in forecasting sales of durable consumer goods[J].Journal of Systems Engineering,1992,7(2):71-78(in Chinese).

[3]黄克明,胡瑞平,张国忠.我国通货膨胀与对外经济的半相依自回归模型的研究[J].系统工程理论与实践,2003(4):56-58. HUANG K M,HU R P,ZHANG G Z.The seemingly unrelated autoregression model of Chinese inflation and foreign economy[J].Systems Engineering-Theory and Practice,2003(4):56-58(in Chinese).

[4]王松桂.线性回归系统回归系数的一种新估计[J].中国科学:A辑,1988(10):1033-1040. WANG S G.A new estimation of regression coefficients in linear regression system[J].Science China:Ser A,1988(10):1033-1040(in Chinese).

[5] TUSI K W,WEERAHANDI S.Generalized p-values in significance testing of hypotheses in the presence of nuisance parameter[J].Journal of the American Statistical Association,1989,84:602-607.

[6] WEERAHANDI S.Testing variance components in mixed models with generalized p-values[J].Journal of the American Statistical Association,1991,86:151-153.

[7] ZHOU L P,MATHEW T.Some tests for variance components using generalized p-values models[J].Technometrics,1994,36:394-402.

[8] WEERAHANDI S,BERGER V W.Exact inference for growth curves with intraclass correlation structure[J].Biometrics,1999,55:921-924.

[9]CHI E M,WEERAHANDI S.Comparing treatments under growth curve models:Exact tests using generlized p-values[J].Journal Statistical Planning and Inference,1998,71:179-189.

[10]LIN S H,LEE J C.Exact tests in simple growth curve models and oneway ANOVA with equicorrelation error structure[J].Journal of Multi-variate Analysis,2003,84:351-368.

[11]范永辉,王松桂.广义p-值与Panel数据模型的精确检验[J].应用数学学报,2008,31(2):367-373. FAN Y H,WANG S G.Generalized p-value and exact test in Panel data model[J].Acta Mathematicae Applicatae Sinica,2008,31(2):367-373(in Chinese).

[12]程靖,王松桂,岳容先.Panel数据模型中回归系数的广义p值检验[J].工程数学学报,2009,26(5):836-844. CHENG J,WANG S G,YUE R X.Generalized p-value test for regression coefficients in Panel data model[J].Chinese Journal of Engineering Mathematics,2009,26(5):836-844(in Chinese).

[13]郭红霞.混合效应模型的广义p值检验[D].北京:北方工业大学,2014. GUO H X.Generalized p-value tests for mixed effect models[D].Beijing:North China University of Technology,2014(in Chinese).

[14]王松桂,史建红,伊素菊,等.线性模型引论[M].北京:科学出版社,2004. WANG S G,SHI J H,YIN S J,et al.Introduction of Linear Model[M]. Beijing:Science Press,2004(in Chinese).

[15]MUIRHEAD R J.Aspects of Multivariate Statistical Theory[M].New York:John Wiley and Sons,2005.

[16]KRISHNAMOORTHY K,MATHEW T.Inferences on the means of lognormal distributions using generalized p-values and generalized confidence intervals[J].Journal Statistical Planning and Inference,2003,115:103-121.

(责任编校 马新光)

Generalized p-value test for regression coefficients in seemingly unrelated regressions

LIU Yang,FAN Yonghui
(College of Mathematical Science,Tianjin Normal University,Tianjin 300387,China)

The problem of exactly testing regression coefficients in seemingly unrelated regression equations is studied.By using the method of generalized p-value,the exact tests of regression coefficients in the seemingly unrelated regressions equations with two linear equations are established.The effects of the tests are simulated,and the simulation results show that the tests can control the probability of typeⅠerror and have good effects.

seemingly unrelated regressions;regression coefficients;generalized p-value;generalized test variables

O212.7

A

1671-1114(2016)06-0001-04

2016-06-20

刘 洋(1992—),女,硕士研究生.

范永辉(1972—),男,教授,主要从事概率统计方面的研究.

猜你喜欢

相依回归系数广义
Rn中的广义逆Bonnesen型不等式
相守相依
血肉相依
从广义心肾不交论治慢性心力衰竭
多元线性回归的估值漂移及其判定方法
王夫之《说文广义》考订《说文》析论
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
广义RAMS解读与启迪
相依相随