APP下载

岭参数K的选择方法

2020-04-10王飞沈丹孙嘉聪

数学学习与研究 2020年6期

王飞 沈丹 孙嘉聪

【摘要】岭估计是一種应用最为广泛的有偏估计,其目的是减小均方误差,即选择使MES(β^(k))达到最小的岭参数k.k的选取不仅取决于模型的未知参数β,σ2,并且这种取决没有明确的关系表达式,这使k的选取变得很困难.现在关于k值的选取方法有很多,下面我们就介绍两种方法.

【关键词】岭估计,有偏估计,均方误差,岭参数

一、方差扩大因子法

从岭迹图上看,当k=0.20时岭迹大体上达到稳定.依岭迹法应取k=0.20.如果采用方差扩大因子法,因k=0.18时,方差扩大因子接近于1,当k∈(0.02,0.08)时,方差扩大因子小于10,故应建议在此范围选取k.

至于变量选择,因为自变量x4,x7,x10,x11和x15有较稳定且绝对值比较小的岭回归系数,根据前面的原则,它们是可以去掉的.又自变量x12和x13的岭回归系数不是很稳定,并且它们随着k的增加很快趋近于零,根据前面原则可知,这些自变量也应该被去掉.再根据前面原则去掉变量x3和x5,于是这些最后剩下的自变量是x1,x2,x6,x8,x9,x14.

三结 论

因此,通过方差扩大因子法和岭迹法可以确定一个相对精确的k的取值范围.

【参考文献】

[1]陈希孺.王松桂.近代回归分析——原理方法及应用[M].合肥:安徽教育出版社,1987.

[2]夏道行.吴卓人.严邵宗等.实变函数与泛函分析[M].北京:高等教育出版社,2010.

[3]鲁国斌.广义岭回归估计中关于k值选取的Q(c)准则[J].数理统计与应用概率,1989(2):110-117.

[4]Draper NR and Smith H.Applied regression analysis[M].New York:John Wiley &Sons Inc.,1981.