指数分布族的一致最优检验及样本容量的确定
2014-10-10赵丽棉黄基廷
赵丽棉,黄基廷
(河池学院 数学与统计学院,广西 宜州 546300)
0 引言
设X=(X1,…,Xn)是从总体{Fθ(x),θ∈Θ}中抽取的简单样本,其中Θ为参数空间,检验问题为H0∶θ∈Θ0↔H1∶θ∈Θ1=Θ-Θ0.我们通过一个统计量在一个子样中的观察值来检验H0,则当观察到点X属于拒绝域 W 时,拒绝假设H0,否则接受H0,称称为非随机化检验。在实际问题中,有些检验函数φ(x)除了0,1外还能取(0,1)内的值,如设X=(X1,…,Xn)是从一大批产品中抽得的样本,记G(X)为其中的次品数,当G(X)<c时认为这批产品合格;当G(X)>c时认为不合格;而当G(X)=c时可以定下(0,1)内的一个数r,作一次成功概率为r的随机试验,根据试验结果来决定这批产品是否合格,这种检验称为随机化检验。由于子样观察值的出现带有随机性,因此判断会发生两种错误:第一,假设H0本来是对的,但由于观察值落入拒绝域W,错误地将H0否定了,这时犯的错误称为第一类错误;第二,假设H0本来是不对的,但由于观察值落入接受域,错误地将H0接受了,这时犯的错误称为第二类错误。一个好的检验当然是使犯两种错误的概率尽可能小,最好全为零,但实际上这是不可能的,通常只能通过限制第一类错误的概率使第二类错误的概率达到最小。用βφ(θ)=Pθ{用检验φ否定了H0}=Eθ[φ(X)](θ∈Θ)表示 φ(x)的功效函数,则当 θ∈Θ0时,βφ(θ)是犯第一类错误的概率;θ∈Θ1时,1 - βφ(θ)是犯第二类错误的概率。我们要做的是在 Eθ[φ(X)]≤α,θ∈Θ0的条件下,使 βφ(θ),θ∈Θ1达到最大值。这种检验称为水平为α的一致最优检验(简称UMP检验)。UMP检验不一定存在,但对相当广泛的指数分布族却能找出这种检验来。为检验函数,这里φ(x)只取0,1两个值,这种检验
1 指数分布族的UMP检验的存在性
定义:设{f(x,θ)∶θ∈Θ}是定义在样本空间R上的分布族,其中Θ为参数空间。若其概率密度函数f(x,θ)可表示成如下形式:
其中,k为自然数,C(θ)>0和 Qi(θ)(i=1,2,…,k)都是定义在 Θ 上的函数,h(x)>0和 Ti(x)(i=1,2,…,k)都是定义在R上的函数,则称此分布族为指数分布族。
NP基本引理:设样本X有概率函数f(x,θ),参数θ只有两个可能的值θ0和θ1,检验问题为:
则存在非负常数c和0≤r≤1,使得检验问题(1)的水平为α的一致最优检验函数为:
证明参见文献[1]。
定理:设样本X=(X1,…,Xn)的分布为指数分布族:
其中c(θ),Q(θ)为θ的函数且c(θ)>0,T(x)和h(x)是样本x的函数。参数空间Θ为R1的子集,θ0为Θ的一个内点且Q(θ)为θ的严格增函数,则检验问题:
的水平为α的一致最优检验存在,且具有形式:
其中 c和 r(0≤r≤1)满足条件 Eθ0[φ(X)]=α.
证:①先考虑检验问题:
易知λ(x)是T(x)的严格增函数,由引理知检验问题(5)的一致最优检验函数为(4)式,其中c和r满足:
由于c和r与θ1无关,所以(4)式确定的φ(x)也是检验问题:
的水平为α的一致最优检验。
②证由(4)式确定的φ(x)也是检验问题(3)的水平为α的检验,即证
当 θ≤θ0时,
对任意的 θ≤θ0,显然
似然比
是T(x)的严格减函数。由
其中R为样本空间知,存在t0使
由(4)式知φ(x)只与T(x)有关,且是T(x)的非降函数,故有
2 确定指数分布族的UMP检验的方法步骤
由定理可知UMP检验函数φ(x)主要由r和c确定,所以确定指数分布族的UMP检验的步骤可分为以下几步:
(1)写出样本 X=(X1,…,Xn)的密度:f(x,θ)=c(θ)exp{Q(θ)T(x)}h(x),并确定统计量 T(X)的分布;
(2)由 Eθ0[φ(X)]=α 即 Pθ0(T(X)>c)+rPθ0(T(X)=c)=α 确定 r;
(3)由0≤r≤1及T(X)的分布确定c.
注:当总体为连续分布时,由于 Pθ0(T(X)=c)=0,所以直接由 Eθ0[φ(X)]=Pθ0(T(X)> c)= α 及统计量T(x)的分布即可确定c.此时
3 常见分布的UMP检验
不难看出,统计上常用的正态分布族、二项分布族、Poisson分布族等都是指数分布族,它们的一致最优检验都是存在的。
例1:设X1,…,Xn是从分布为Fθ的总体中抽取的简单样本,其中θ为未知参数。求检验问题H0∶θ≤θ0↔H1∶θ>θ0)的水平为α的UMP检验函数φ(x),其中θ0,α给定。下面几种常见分布均满足定理条件,故它们的UMP检验函数φ(x)为(4)或(6)式。
1° 当 Fθ~N(θ,σ2),σ2已知时
其中
从而
得
其中Φ(u1-α)=1-α,Φ为标准正态分布函数。UMP检验函数φ(x)为(6)式。
2° 当 Fθ~N(a,θ2),a已知,θ>0 时
得 c= θ20χ2n(α),一致最优检验函数 φ(x)为 (6)式。3° 当 Fθ为指数分布 θ-1e-x/θ,θ>0 时
因此f(y)是自由度为2的χ2密度,即分布。再利用分布的可加性知,
UMP检验函数φ(x)为 (6)式。
所以c由下列不等式确定:
UMP检验函数φ(x)为 (4)式。
所以c由下列不等式确定:
UMP检验函数φ(x)为 (4)式。
4 样本容量的确定
前面讨论的问题,都是根据样本容量及第一类错误的概率(即显著水平),确定一致最优检验使其犯第二类错误的概率到最小。在实际应用中,有时会提出检验问题(1),且给出第一、第二类错误的概率α、β,要确定样本容量并找出UMP检验。要解决这类问题,可先按前面方法确定最优检验函数φ(x),再由第一、第二类错误的概率的定义,联立关于α、β方程组,从中求出样本容量及c。下面只举一例说明解决这类问题的具体方法。
例2:设总体服从正态分布N(θ,σ2),其中θ为未知参数,σ2为已知。要在第一、第二类错误的概率分别为 α、β 条件下用 UMP 检验问题 H0∶θ=θ0↔H1∶θ=θ1(θ1>θ0),样本容量 n必须多大?
解:由例1知此问题的UMP检验函数为:
其中当H0为真时);当 H1为真时
依题意得:
[1]韦来生.数理统计[M].北京:科学出版社,2008.
[2](波兰)M.费史.概率论及数理统计[M].上海:上海科学技术出版社,1978.
[3]复旦大学.概率论(第二册)数理统计(第二分册)[M].北京:人民教育出版社,1983.
[4]陈希孺.高等数理统计学[M].合肥:中国科学技术大学出版社,2009.
[5]孙荣恒.应用数理统计[M].北京:科学出版社,2003.