带测量误差的非参数众数回归模型的模拟外推估计

2020-06-17张宇靖史建红

山西师范大学学报（自然科学版） 2020年2期

张宇靖，史建红

山西师范大学数学与计算机科学学院，山西临汾 041000

众数回归在近几年里受到了广泛的关注，它是一个稳健的估计方法.该方法不仅能较“真实”地反映数据取值的中心，还能获得更好地预测效果.Parzen[1]最早提出了众数估计，他指出当Y在给定条件X下的分布是非对称时，分布的众数比均值和分位数更能提供有意义的信息.近些年来, Yao和Li[2]、Khardani[3]、Chen[4]、Yao 和Xiang[5]分别研究了线性众数回归模型、非线性众数回归模型、非参数众数回归模型和变系数众数回归模型.非参数回归模型是参数回归模型(如:线性模型、非线性模型及广义线性模型等)的一种自然推广.对于非参数回归函数的估计问题, 在很多文献中已经给出了估计方法，具体可见文献Nadaraya[6]，Fan等[7].在许多实践中,由于实验条件或成本等因素的影响常常导致样本中的真实数据带有测量误差. 自20世纪80年代以来,文献中对非参数测量误差模型的研究取得了许多重要的进展，可参考文献Carroll[8]、Fan等[9]. 其中Carroll[8]利用模拟外推方法构造了非参数均值回归模型中非参数函数的估计.本文受模拟外推方法的启发, 将该方法推广到带测量误差的非参数众数回归模型中.

1 估计方法

考虑如下带测量误差的非参数众数回归模型:

Yi=m(Xi)+εiWi=Xi+ui

(1)

我们假设εi的密度函数为g(ε), 那么g(ε)有唯一的众数是0. 如果Xi能被直接观测到, Yao和Xiang[5]基于核密度估计的方法给出下面的目标函数

(2)

(3)

Cook和Stefanski[10]针对参数测量误差模型,假设测量误差的分布是正态分布时,首次提出了模拟外推方法.模拟外推方法包括模拟步、估计步和外推步. 模拟步是用再抽样的方法，用原始数据加上模拟误差数据产生新数据；估计步是将模拟步产生的新的数据看作是真实观测值来得到估计；外推步是利用上一步得到的估计,找出估计的变化规律, 进而拟合出变化曲线,再外推到λ=-1时估计的值, 即得到所求的估计.在本节中我们利用了局部线性光滑的思想来估计非参数函数，具体过程如下：