常用回归模型的A-最优设计
2014-02-14张宣昊
张宣昊
(上海第二工业大学理学院,上海201209)
常用回归模型的A-最优设计
张宣昊
(上海第二工业大学理学院,上海201209)
介绍回归模型的最优试验设计方法,给出最优设计准则及其统计意义。基于考虑参数估计精度的A-最优设计准则,利用MATLAB数学计算软件对常用的3种回归模型——一元一次、一元二次和指数模型分别构造其相应的A-最优设计,从而对常用回归模型的应用给出试验点选择的依据。
常用回归模型;设计准则;A-最优设计
0 引言
回归分析是确定两个或两个以上变量间相互依赖定量关系的一种统计分析方法,应用十分广泛。建立回归模型需根据实测数据来求解模型的各个参数。不同的试验点对应不同的响应值,从而在固定的参数估计方法下将得到不同的估计值[1]。因此,试验者必须事先给出合理的试验点及其比例才能保证优良的回归效果。
针对线性回归模型,最优设计即是为了保证估计量在精确性方面具有某种优良性而提出的设计方法。它以某个试验目的作为试验设计的出发点,通过建立能恰当地反映试验目的的设计准则,来选取最优方案安排试验。
A-最优设计准则是最常用的设计准则之一,其统计意义在于使未知参数各分量估计值的方差之和达到最小,因此A-最优设计能最大地提高参数估计的精度,使回归模型有很好的拟合效果[2]。本文对常用的3种回归模型——一元一次、一元二次和指数模型分别构造试验点最少的A-最优设计。
1 最优回归设计
1.1 线性回归模型
设X是因子区域(又称试验点集),且是一个有界闭集,试验时在X内选取试验点。当考虑一个变量的回归时,X是一维点集;当考虑p个自变量的回归时,X是p维点集。设f1(x),···,fk(x)是X上已知的k个连续函数,且线性独立,记f(x)=[f1(x)···fk(x)]T。自变量与响应变量之间满足线性模型:y(x)=fT(x)β+ε。其中: ε~N(0,σ2)是随机误差项;β=[β1···βk]T是未知参数向量;y(x)表示在点x∈X处的响应观测值,且一般不同试验点的观测值相互独立。模型可表示为回归方程:Ey=f'(x)β,E为随机变量的数学期望。
通过在设计域X中选取试验点x1,···,xN,获得响应变量的观测值y1,···,yN,由此估计参数向量β,即可得回归方程。
1.2 最优设计准则
称ξN=[x1···xN]为一个精确设计,在有重复的情况下,不妨设不同的试验点为x1,···,xn,重复次数分别为v1,···,vn,设计ξN即为:ξN=其概率分布形式为对于一般的概率分布称为近似设计,而Ξ={ξ:ξ是X上的概率分布}构成了设计全体,其信息阵即为
设Φ是定义在M(ξ)上的一个准则函数,若设计ξ∗∈Ξ满足则称设计ξ∗为Φ最优设计,而设计的优良性准则即为信息阵的函数Φ(M(ξ))。以下是几类经典最优设计的准则函数及其意义。
D-最优准测:Φ(M(ξ))=det(M-1(ξ)),统计意义为D-最优设计下,参数估计值ˆβ的广义方差达到最小[4]。
A-最优准则:Φ(M(ξ))=tr(M-1(ξ)),统计意义为A-最优设计下,未知参数各分量估计值的方差之和达到最小[4]。
本文重点研究A-最优设计。若设计ξ∈Ξ的信息矩阵M(ξ)是非退化的,则tr(M-1(ξ))为β的最小二乘估计各分量的方差之和。tr(M-1(ξ))越小,则估计量的方差之和(或方差之平均)越小,故认为使tr(M-1(ξ))最小的设计为最优[5]。
2 几个常用模型的A-最优设计
2.1 一元一次模型
考虑一元一次回归模型y=β0+β1x+ε, f(x)=[1 x]T,X=[-1,1]的试验设计[6],注意到试验点至少为2个,构造其相应的A-最优设计。
由MATLAB软件[7]计算得:当p=0.5,q=0时,tr(M-1(ξ0))达到最小值2,即一元一次回归模型的A-最优设计为
2.2 一元二次模型
考虑一元二次回归模型y=β0+β1x+β2x2+ε, f(x)=[1 x x2]T,X=[-1,1]的试验设计[6],注意到试验点至少为3个,构造其相应的A-最优设计。
由MATLAB软件[7]计算得:当p=0.17, q=0.5时,tr(M-1(ξ0))达到最小值13.9441,即一元二次回归模型的A-最优设计为ξ0=
2.3 指数模型
考虑指数回归模型y=β0+β1ex+ε,f(x)= [1 ex]T,X=[-1,1]的试验设计[6],注意到试验点至少为2个,构造其相应的A-最优设计。
由MATLAB软件[7]计算得:当p=0.73,q=0时,tr(M-1(ξ0))达到最小值2.841 4,即指数回归模型的A-最优设计为
[1]王万中,茆诗松.试验的设计与分析[M].上海:华东师范大学出版社,1997.
[2]ATKINSON A C,DONEV A N.Optimum experimental design[M].New York:Clarendon.Oxford,1992.
[3]任露泉.回归设计及其优化[M].北京:科学出版社, 2009.
[4]顾原.多响应线性模型的复合最优设计[D].上海:上海师范大学,2010.
[5]张宣昊,岳荣先.均匀设计在多响应线性模型失拟检验中的最优性[J].上海师范大学学报,2007,36(2):12-16.
[6]张宣昊.多响应模型判别的试验设计[J].上海第二工业大学学报,2007,24(2):91-97.
[7]苏金明,阮沈勇.MATLAB6.1实用指南[M].北京:电子工业出版社,2002.
A-Optimal Designs for the Commonly Used Regression Models
ZHANG Xuan-hao
(School of Science,Shanghai Second Polytechnic University,Shanghai 201209,P.R.China)
The optimal experiment design method for regression models is described.The optimal design criteria and the statistical meaning is given.Based on considering parameter estimation precision A-optimal design criteria,three commonly used regression models:linear,quadratic and exponential models are constructed its corresponding A-optimal design by using of mathematical computing software MATLAB.The applications for commonly used regression models are given for the selection of the experiment points.
commonly used regression models;design criterion;A-optimal designs
O212.6
A
1001-4543(2014)03-0220-03
2014-03-12
张宣昊(1981–),男,上海人,讲师,硕士,主要研究方向为概率统计、最优试验设计。电子邮箱xhzhang@sspu.edu.cn。
上海第二工业大学重点学科建设项目(No.XXKZD1304)资助