响应变量缺失下线性模型的模型平均

2020-07-23王秀丽

山东师范大学学报（自然科学版） 2020年2期

张翊王秀丽

( 山东师范大学数学与统计学院，250358，济南 )

1 引言

现代统计实践中，模型选择的问题已经得到了广泛的关注，为了选择最优模型，许多学者已经提出了大量的准则，例如AIC,BIC和FIC准则.然而，提前给定模型，往往忽略了额外的不确定性，从而可能低估了标准误差，因此对多个模型进行加权估计，而不依赖于单个模型的模型平均受到了广泛的关注，例如：文献[1]考虑了线性模型的FIC模型平均方法，文献[2]和[3]将FIC模型平均扩展到了一系列非参模型，文献[4]研究了模型平均估计的置信区间，文献[5]对可加部分线性模型(APLM)的模型平均进行了研究.数据缺失也是在处理数据时经常遇到的问题，文献[6]提出了缺失数据下变系数部分线性模型的模型平均，文献[7]利用借补的思想研究了线性模型缺失响应变量下的模型平均.本文参考了文献[5]利用扩张的逆概率加权方法填补数据的思想，考虑了线性模型在响应变量缺失下的模型选择和模型平均.因此本文在假设响应变量Y是随机缺失(MAR)的前提下，利用聚焦信息准则(FIC)和频率模型平均(FMA)对线性模型的模型平均进行了研究，其中对于缺失数据的填补利用了扩张的逆概率加权(AIPW)方法.