指数分布族的一致最优检验及样本容量的确定

2014-10-10赵丽棉黄基廷

河池学院学报 2014年2期

赵丽棉，黄基廷

(河池学院数学与统计学院，广西宜州 546300)

0 引言

设X=(X1，…，Xn)是从总体{Fθ(x)，θ∈Θ}中抽取的简单样本，其中Θ为参数空间，检验问题为H0∶θ∈Θ0↔H1∶θ∈Θ1=Θ－Θ0.我们通过一个统计量在一个子样中的观察值来检验H0，则当观察到点X属于拒绝域 W 时，拒绝假设H0，否则接受H0，称称为非随机化检验。在实际问题中，有些检验函数φ(x)除了0，1外还能取(0，1)内的值，如设X=(X1，…，Xn)是从一大批产品中抽得的样本，记G(X)为其中的次品数，当G(X)＜c时认为这批产品合格;当G(X)＞c时认为不合格;而当G(X)=c时可以定下(0，1)内的一个数r，作一次成功概率为r的随机试验，根据试验结果来决定这批产品是否合格，这种检验称为随机化检验。由于子样观察值的出现带有随机性，因此判断会发生两种错误:第一，假设H0本来是对的，但由于观察值落入拒绝域W，错误地将H0否定了，这时犯的错误称为第一类错误;第二，假设H0本来是不对的，但由于观察值落入接受域，错误地将H0接受了，这时犯的错误称为第二类错误。一个好的检验当然是使犯两种错误的概率尽可能小，最好全为零，但实际上这是不可能的，通常只能通过限制第一类错误的概率使第二类错误的概率达到最小。用βφ(θ)=Pθ{用检验φ否定了H0}=Eθ[φ(X)](θ∈Θ)表示 φ(x)的功效函数，则当 θ∈Θ0时，βφ(θ)是犯第一类错误的概率;θ∈Θ1时，1 － βφ(θ)是犯第二类错误的概率。我们要做的是在 Eθ[φ(X)]≤α，θ∈Θ0的条件下，使 βφ(θ)，θ∈Θ1达到最大值。这种检验称为水平为α的一致最优检验(简称UMP检验)。UMP检验不一定存在，但对相当广泛的指数分布族却能找出这种检验来。为检验函数，这里φ(x)只取0，1两个值，这种检验

1 指数分布族的UMP检验的存在性

定义:设{f(x，θ)∶θ∈Θ}是定义在样本空间R上的分布族，其中Θ为参数空间。若其概率密度函数f(x，θ)可表示成如下形式:

其中，k为自然数，C(θ)＞0和 Qi(θ)(i=1，2，…，k)都是定义在 Θ 上的函数，h(x)＞0和 Ti(x)(i=1，2，…，k)都是定义在R上的函数，则称此分布族为指数分布族。

NP基本引理:设样本X有概率函数f(x，θ)，参数θ只有两个可能的值θ0和θ1，检验问题为:

则存在非负常数c和0≤r≤1，使得检验问题(1)的水平为α的一致最优检验函数为:

证明参见文献[1]。

定理:设样本X=(X1，…，Xn)的分布为指数分布族:

其中c(θ)，Q(θ)为θ的函数且c(θ)＞0，T(x)和h(x)是样本x的函数。参数空间Θ为R1的子集，θ0为Θ的一个内点且Q(θ)为θ的严格增函数，则检验问题:

的水平为α的一致最优检验存在，且具有形式:

其中 c和 r(0≤r≤1)满足条件 Eθ0[φ(X)]=α.

证:①先考虑检验问题:

易知λ(x)是T(x)的严格增函数，由引理知检验问题(5)的一致最优检验函数为(4)式，其中c和r满足:

由于c和r与θ1无关，所以(4)式确定的φ(x)也是检验问题:

的水平为α的一致最优检验。

②证由(4)式确定的φ(x)也是检验问题(3)的水平为α的检验，即证

当 θ≤θ0时，

对任意的 θ≤θ0，显然

似然比

是T(x)的严格减函数。由

其中R为样本空间知，存在t0使

由(4)式知φ(x)只与T(x)有关，且是T(x)的非降函数，故有

2 确定指数分布族的UMP检验的方法步骤

由定理可知UMP检验函数φ(x)主要由r和c确定，所以确定指数分布族的UMP检验的步骤可分为以下几步:

(1)写出样本 X=(X1，…，Xn)的密度:f(x，θ)=c(θ)exp{Q(θ)T(x)}h(x)，并确定统计量 T(X)的分布;

(2)由 Eθ0[φ(X)]=α 即 Pθ0(T(X)＞c)+rPθ0(T(X)=c)=α 确定 r;

(3)由0≤r≤1及T(X)的分布确定c.

注:当总体为连续分布时，由于 Pθ0(T(X)=c)=0，所以直接由 Eθ0[φ(X)]=Pθ0(T(X)＞ c)= α 及统计量T(x)的分布即可确定c.此时

3 常见分布的UMP检验

不难看出，统计上常用的正态分布族、二项分布族、Poisson分布族等都是指数分布族，它们的一致最优检验都是存在的。

例1:设X1，…，Xn是从分布为Fθ的总体中抽取的简单样本，其中θ为未知参数。求检验问题H0∶θ≤θ0↔H1∶θ＞θ0)的水平为α的UMP检验函数φ(x)，其中θ0，α给定。下面几种常见分布均满足定理条件，故它们的UMP检验函数φ(x)为(4)或(6)式。

1° 当 Fθ～N(θ，σ2)，σ2已知时

其中

从而

得

其中Φ(u1－α)=1－α，Φ为标准正态分布函数。UMP检验函数φ(x)为(6)式。

2° 当 Fθ～N(a，θ2)，a已知，θ＞0 时

得 c= θ20χ2n(α)，一致最优检验函数 φ(x)为 (6)式。3° 当 Fθ为指数分布 θ－1e－x/θ，θ＞0 时

因此f(y)是自由度为2的χ2密度，即分布。再利用分布的可加性知，

UMP检验函数φ(x)为 (6)式。

所以c由下列不等式确定:

UMP检验函数φ(x)为 (4)式。

所以c由下列不等式确定:

UMP检验函数φ(x)为 (4)式。

4 样本容量的确定

前面讨论的问题，都是根据样本容量及第一类错误的概率(即显著水平)，确定一致最优检验使其犯第二类错误的概率到最小。在实际应用中，有时会提出检验问题(1)，且给出第一、第二类错误的概率α、β，要确定样本容量并找出UMP检验。要解决这类问题，可先按前面方法确定最优检验函数φ(x)，再由第一、第二类错误的概率的定义，联立关于α、β方程组，从中求出样本容量及c。下面只举一例说明解决这类问题的具体方法。

例2:设总体服从正态分布N(θ，σ2)，其中θ为未知参数，σ2为已知。要在第一、第二类错误的概率分别为 α、β 条件下用 UMP 检验问题 H0∶θ=θ0↔H1∶θ=θ1(θ1＞θ0)，样本容量 n必须多大?

解:由例1知此问题的UMP检验函数为: