失拟检验在社会物流总额函数的应用

2016-12-10张学新

统计与决策 2016年22期

关键词：总额羊肉显著性

张学新

（湖北工程学院数学与统计学院,湖北孝感 432000）

失拟检验在社会物流总额函数的应用

张学新

（湖北工程学院数学与统计学院,湖北孝感 432000）

文章讨论了多元线性回归模型异方差情形的失拟检验问题，实例模拟研究了失拟检验的效率，给出了失拟检验在社会物流总额关于GDP一次函数的应用。

失拟检验；势分析；蒙特卡洛模拟；异方差；社会物流总额函数

0　引言

回归方程常用于研究变量之间的联系，常假设它能对所有可能的因变量、自变量及不可观测的误差项成立，它可能会包含不必要的或无关的变量，或忽视某些变量。如果设定的函数形式真实地反映了那些感兴趣变量的关系，相应的估计或推断过程将是可靠并有效的；如果回归模型的设定是错误的，那么统计推断可能是误导的、甚至是灾难性的。因此，评估回归函数参数形式的充分性将是回归建模不可缺少的部分。虽然拉格朗日乘子检验、各种残差图等几何工具经常用来检验设定的回归函数的适当性，但是没有利用组内变异的信息，而失拟检验具有一定的优势，因为它是利用重复观测数据。对失拟检验的研究逐步得到重视[1，2]，主要在试验性学科领域，国内研究也只见工业实际应用及试验设计方面[3～7]，在经济学领域似乎不多见[8]，本文对此作了有益尝试。本文首先研究多元线性回归模型中的失拟检验，通过一个真实的羊肉需求模型分析失拟检验的势。然后利用199l—2014年样本数据检验GDP是社会物流总额的单向Granger原因，通过一元线性回归方程，以GDP的历史值预测社会物流总额本期值，并使用失拟检验佐证了社会物流总额关于GDP的线性模型。本文方法为失拟检验在宏观经济中的应用提供了参考。

1　失拟检验

在研究线性回归函数变量之间的关系时，利用重复试验或观察的数据，检验回归模型是否可以接受，称为失拟检验。失拟检验很直观，将模型残差视为随机误差加上失拟误差。随机误差与模型无关，但失拟误差却与模型相关，如果模型合适，失拟误差的值就小，否则失拟误差的值就会很大。因此，可以把残差平方和分解为纯误差平方和与失拟平方和，以失拟误差对纯误差的相对大小来做判断。如果失拟误差会显著地大于纯误差，应该放弃模型。

通常，失拟检验用于比较一个分类模型是否比一个线型模型更显著性的拟合了数据。现在考虑p-1元线性回归模型Y=Xβ+ε，其中Y=(y1，y2，···，yn)T，X=(x1，···xi，···xn)T，xTi=(1，

xi，1···xi，p-1)，β=(β0，β1，···，βp-1)T，ε=(ε1，ε2，···，εn)T～N(0，σ2In)，i=1，···n。在重复观测情形下，假设每个自变量重复水平数均为m，把因变量y在第i个水平组合处的第j个观测表示为是总观测值数。需要检验：

整个检验过程结果用一张方差分析表给出，见表1所示。

表1　多元回归情形失拟检验方差分析

在一元多项式回归情形，最常见的失拟检验是H0:E(y|x)=(1，x，···xp-1)β对 H1:E(y|x)≠(1，x，···xk-1)β(k)，β(k)=(β0，β1，···βk-1)T，1≤p＜k≤c，其中c是变量x的水平数。设总观测值个数n，则检验统计量：

特别的，失拟检验 H0:E(y|x)=(1，x)β(2)对 H1:E(y|x)≠(1，x)β(2)的统计量：

2　失拟检验的势分析

假设检验的势（Power）是指当零假设H0错误时，正确拒绝它的概率，也叫统计检验的灵敏性。当存在一个真实的效应需要检测时，检验的势反映了某个研究将证实这个统计效应的可能性。势越高，认可效应的可信度越大。检验的势受显著性水平α，样本容量n及效应ES大小的影响，对给定显著性水平α，检验的势越大越好。

刘锐，王莉[9]提出羊肉需求模型：

其中，MPC为羊肉人均消费量，pdi为城乡居民可支配收入，pb为牛肉价格，pm为羊肉价格。模型估计结果是：

现有意在H0:lnMPC=-0.7652+0.1484lnpdi-0.1434 lnpm+0.1484lnMPCt-1中忽视牛肉价格 pb，即让H1:lnMPC=-0.7652+0.1484lnpdi-0.1434lnpm+clnpb +0.1484lnMPCt-1正确，本文分析失拟检验的势。

设计如下模拟方案：对各个解释变量，按照由样本获得的各自最小值与最大值等间距划分水平，在每种水平组合上均重复测量4次，取因变量每次对应的误差项εt～N(0，1)。分别取参数c=0，0.08，0.15，0.5，1，2，水平数l=5，10，20，30，50，80。在每种(c，l)组合上均模拟1000次，取显著性水平α=0.05，研究失拟检验势随c，样本容量n=4l变化情况，见表2及图1所示。

表2　羊肉需求模型失拟检验势

这个模拟研究表明，随着备择假设越来越偏离零假设的模型，失拟检验的效率越来越大，样本容量越大，检验效率越高，对于备择假设的模型很接近于零假设的时候（c= 0，0.08，0.15），可能会做出错误的决策，但是随着备择假设偏离零假设模型很大时（c=0.5，1，2），失拟检验有较好的效率，能够做出较好的模型。

图1　拟检验势随参数c，样本容量变化趋势

玉米的价格pma与MPC有无关系呢？玉米可以饲养猪或鸡，有理由认为pma对羊肉消费有负影响，在H0中加入-clnpma项，仿照上述模拟方案，得到图2。

图2拟检验势随样本容量变小

图2显示，失拟检验的势在小样本情形急剧下降，而对大样本情形则一致平稳，低于10%，故不能认为玉米的价格是个无关变量。当玉米的价格剧烈增长时，它对羊肉消费有影响，可能体现在它与猪肉（鸡肉）产量的关系上，猪肉（鸡肉）产量的增长间接降低了羊肉消费。可见该羊肉需求模型还有改进的余地。

3　异方差情形的失拟检验

这里wi是某个回归因子或其他变量，而α和δ都是待估未知参数。由，得其中可以认为[10]对做普通最小二乘法就得到α和δ的一致的渐进有效估计。

4　社会物流总额函数的失拟检验

作为失拟检验在宏观经济中的一个应用，现在研究杨琳，刘忠波[11]提出的全社会物流总额与GDP之间一元二次模型与一元一次模型设定问题。

本文选取1991—2014年中国国内生产总值GDP与全社会物流总额TVSL的数据（单位：万亿元）：

GDP=[2.16,2.66,3.46,4.68,5.85,6.79,7.45,7.83,8.19,9.00, 9.73,10.52,11.69,13.65,18.23,20.94,24.66,31.40,33.50,39.80, 47.16,51.93,56.80,63.65]；

TLV=[3.02,3.91,5.43,7.92,10.20,11.03,12.37,12.87,13.89, 17.06,19.45,23.26,29.55,38.38,48.01,59.60,75.23,89.89,96.65, 125.40,158.40,177.30,197.80,213.50]；（来源：1991—2014年《中国第三产业统计年鉴》、全国物流运行情况通报（中华人民共和国国家发展和改革委员会）、《中国统计年鉴》及中国物流采购与联合会网站等。）

首先拟合全社会物流总额TVSL与国内生产总值GDP间的简单回归方程，得：

模型估计结果见表5所示，表明方程拟合较好。

其次进行异方差检验，同时采用Breusch-Pagan检验、White检验、及White与Wooldridge特别情形检验。

在White检验的辅助回归方程中最小二乘估计的残差平方需在所有原始自变量及它们的平方项、交叉乘积项上回归；Breusch-Pagan检验是White检验的特殊情形，残差平方只在原始自变量上回归；而White与Wooldridge特别情形检验是残差平方在因变量的拟合值及拟合值平方项上回归。

三种检验的p-值是，White检验的pValW=0.4002，Breusch-Pagan检验的pVal BPK=0.2162，Breusch-Pagan检验的pValWs=0.4002，说明没有异方差。

最后模型适定性检验：

为了获得自变量上的重复观测值，把GDP数据每连续三年求平均，并以该平均值代替原值，得到点(GDP, TLV)18个重复观测值：(4.12,2.16)，(4.12,2.66)，(4.12,3.46)，(9.72,4.68)，(9.72,5.85)，(9.72,6.79)，(13.04,7.45)，(13.04, 7.83)，(13.04,8.19)，(19.92,9.00)，(19.92,9.73)，(19.92, 10.52)，(38.65,11.69)，(38.65,13.65)，(38.65,18.23)，(74.91, 20.94)，(74.91,24.66)，(74.91,31.4)。据此做失拟检验，结果见表3所示。

表3　自变量重复观测的回归模型失拟检验

表3表明，在0.01，0.05显著性水平下，均接受H0:E(TLV|GDP)=-12.281+3.548GDP的假设，说明社会物流总额作为GDP一次函数是合适的。

如果选择把GDP数据每连续五年求平均，失拟检验的结果仍是接受原假设。把变量观测值调整为重复观测值，原则上要求它们相差不显著，也不应定要求每个重复观测值是等重复的。

贾国强[12]利用199l—2010年样本数据证实社会物流总额与GDP互为Granger因果关系，本文把样本数据扩展为199l—2014年后发现，无论是滞后1期，还是滞后2期，在5%显著性水平下，结果都是：GDP是TLV的Granger原因，但TLV不是GDP的Granger原因。GDP2期对TLV的预测能力似乎比其1期的强(0.0079＜0.0282)，参见表4。

表4　成对Granger因果检验

这个结果是可以接受、可以解释的。从TLV的构成及GDP的定义看，TLV只是GDP的小部分，从我国社会物流发展历程看，是国内生产总值发展到一定程度后，才有物流发展，这与方程(9)的常数项为负值是吻合的。通常GDP数据发布滞后1～2年，实际上不可能用当年GDP预测同年的TLV。因而，预测本年TLV应该是利用GDP的前年值或上前年值，在实际应用时可灵活选择。使用不同滞后期GDP预测TLV的模型信息见表5，其中模型的调整-R2=都很高，模型显著性检验的p-值及回归系数显著性检验的p-值均接近0，表明各个方程拟合也好。

表5　TLV对不同滞后期GDP的回归结果

5　结语

失拟检验本质上是利用来自于组内变异的额外信息，因变量在至少自变量的一个水平上有重复观测值，纯误差源于这些重复。失拟检验可以给出独立于模型之外的参数σ2的估计，是一种数据驱动检验方法。由于失拟检验要求有重复试验的数据，不及某些模型设定准则及模型选择准则应用普遍。但是，本文对失拟检验的势函数模拟分析表明失拟检验能有效优化模型，只要对经济数据适当归为重复观测的情形，失拟检验就能更多地应用于经济数据拟合研究中。

[1]Aerts M,Claeskens G,Hart J.Testing Lack of Fit in Multiple Regres⁃sion[J].Biometrika.2000,87.

[2]Baraud Y,Huet S,Laurent B.Adaptive Tests of Linear Model Hypoth⁃eses by Model Selection[J].Annals of Statistics,2003,31.

[3]郭东星,何大卫.失拟分析在曲线拟合中的应用[J].中国卫生统计, 1999,16(6).

[4]张宣昊,岳荣先.均匀设计在多响应线性模型失拟检验中的最优性[J].上海师范大学学报(自然科学版),2007,36(2).

[5]刘德成.小型船舶摩擦模型的研究[J].造船技术，2009,(5).

[6]王明亮,李希菲.非线性树高曲线模型的研究[J].林业科学研究, 2000,13(1).

[7]胡国兵,刘渝.BPSK信号盲处理结果的可靠性检验算法[J].数据采集与处理,2011,26(6).

[8]Doran H E,Kmenta J.A Lack-of-Fit Test for Econometric Applica⁃tions to Cross-Section Data[J].Review of Economics and Statis⁃tics.1992,74(2).

[9]刘锐,王莉.中国牛羊肉消费情况及展望[J].农业展望，2014,(10).

[10]Bartlett M S,Kendall D G.The Statistical Analysis of Variance Het⁃erogeneity and the Logarithmic Transformation[J].Journal of the Roy⁃al Statistical Society,SeriesB,1946，(8).

[11]杨琳，刘忠波.一元线性回归模型在预测物流需求的应用[J].商业文化（学术探讨）,2007,(10).

[12]贾国强.物流业发展与经济增长关系研究——基于中国的实证分析[D].北京：北京交通大学,2011.

（责任编辑/浩天）

F224.7

1002-6487（2016）22-0073-03

张学新（1966—），男，湖北宜城人，博士，副教授，研究方向：概率论与数理统计方法应用。