APP下载

指数分布族的一致最优检验及样本容量的确定

2014-10-10赵丽棉黄基廷

河池学院学报 2014年2期
关键词:样本容量指数分布数理统计

赵丽棉,黄基廷

(河池学院 数学与统计学院,广西 宜州 546300)

0 引言

设X=(X1,…,Xn)是从总体{Fθ(x),θ∈Θ}中抽取的简单样本,其中Θ为参数空间,检验问题为H0∶θ∈Θ0↔H1∶θ∈Θ1=Θ-Θ0.我们通过一个统计量在一个子样中的观察值来检验H0,则当观察到点X属于拒绝域 W 时,拒绝假设H0,否则接受H0,称称为非随机化检验。在实际问题中,有些检验函数φ(x)除了0,1外还能取(0,1)内的值,如设X=(X1,…,Xn)是从一大批产品中抽得的样本,记G(X)为其中的次品数,当G(X)<c时认为这批产品合格;当G(X)>c时认为不合格;而当G(X)=c时可以定下(0,1)内的一个数r,作一次成功概率为r的随机试验,根据试验结果来决定这批产品是否合格,这种检验称为随机化检验。由于子样观察值的出现带有随机性,因此判断会发生两种错误:第一,假设H0本来是对的,但由于观察值落入拒绝域W,错误地将H0否定了,这时犯的错误称为第一类错误;第二,假设H0本来是不对的,但由于观察值落入接受域,错误地将H0接受了,这时犯的错误称为第二类错误。一个好的检验当然是使犯两种错误的概率尽可能小,最好全为零,但实际上这是不可能的,通常只能通过限制第一类错误的概率使第二类错误的概率达到最小。用βφ(θ)=Pθ{用检验φ否定了H0}=Eθ[φ(X)](θ∈Θ)表示 φ(x)的功效函数,则当 θ∈Θ0时,βφ(θ)是犯第一类错误的概率;θ∈Θ1时,1 - βφ(θ)是犯第二类错误的概率。我们要做的是在 Eθ[φ(X)]≤α,θ∈Θ0的条件下,使 βφ(θ),θ∈Θ1达到最大值。这种检验称为水平为α的一致最优检验(简称UMP检验)。UMP检验不一定存在,但对相当广泛的指数分布族却能找出这种检验来。为检验函数,这里φ(x)只取0,1两个值,这种检验

1 指数分布族的UMP检验的存在性

定义:设{f(x,θ)∶θ∈Θ}是定义在样本空间R上的分布族,其中Θ为参数空间。若其概率密度函数f(x,θ)可表示成如下形式:

其中,k为自然数,C(θ)>0和 Qi(θ)(i=1,2,…,k)都是定义在 Θ 上的函数,h(x)>0和 Ti(x)(i=1,2,…,k)都是定义在R上的函数,则称此分布族为指数分布族。

NP基本引理:设样本X有概率函数f(x,θ),参数θ只有两个可能的值θ0和θ1,检验问题为:

则存在非负常数c和0≤r≤1,使得检验问题(1)的水平为α的一致最优检验函数为:

证明参见文献[1]。

定理:设样本X=(X1,…,Xn)的分布为指数分布族:

其中c(θ),Q(θ)为θ的函数且c(θ)>0,T(x)和h(x)是样本x的函数。参数空间Θ为R1的子集,θ0为Θ的一个内点且Q(θ)为θ的严格增函数,则检验问题:

的水平为α的一致最优检验存在,且具有形式:

其中 c和 r(0≤r≤1)满足条件 Eθ0[φ(X)]=α.

证:①先考虑检验问题:

易知λ(x)是T(x)的严格增函数,由引理知检验问题(5)的一致最优检验函数为(4)式,其中c和r满足:

由于c和r与θ1无关,所以(4)式确定的φ(x)也是检验问题:

的水平为α的一致最优检验。

②证由(4)式确定的φ(x)也是检验问题(3)的水平为α的检验,即证

当 θ≤θ0时,

对任意的 θ≤θ0,显然

似然比

是T(x)的严格减函数。由

其中R为样本空间知,存在t0使

由(4)式知φ(x)只与T(x)有关,且是T(x)的非降函数,故有

2 确定指数分布族的UMP检验的方法步骤

由定理可知UMP检验函数φ(x)主要由r和c确定,所以确定指数分布族的UMP检验的步骤可分为以下几步:

(1)写出样本 X=(X1,…,Xn)的密度:f(x,θ)=c(θ)exp{Q(θ)T(x)}h(x),并确定统计量 T(X)的分布;

(2)由 Eθ0[φ(X)]=α 即 Pθ0(T(X)>c)+rPθ0(T(X)=c)=α 确定 r;

(3)由0≤r≤1及T(X)的分布确定c.

注:当总体为连续分布时,由于 Pθ0(T(X)=c)=0,所以直接由 Eθ0[φ(X)]=Pθ0(T(X)> c)= α 及统计量T(x)的分布即可确定c.此时

3 常见分布的UMP检验

不难看出,统计上常用的正态分布族、二项分布族、Poisson分布族等都是指数分布族,它们的一致最优检验都是存在的。

例1:设X1,…,Xn是从分布为Fθ的总体中抽取的简单样本,其中θ为未知参数。求检验问题H0∶θ≤θ0↔H1∶θ>θ0)的水平为α的UMP检验函数φ(x),其中θ0,α给定。下面几种常见分布均满足定理条件,故它们的UMP检验函数φ(x)为(4)或(6)式。

1° 当 Fθ~N(θ,σ2),σ2已知时

其中

从而

其中Φ(u1-α)=1-α,Φ为标准正态分布函数。UMP检验函数φ(x)为(6)式。

2° 当 Fθ~N(a,θ2),a已知,θ>0 时

得 c= θ20χ2n(α),一致最优检验函数 φ(x)为 (6)式。3° 当 Fθ为指数分布 θ-1e-x/θ,θ>0 时

因此f(y)是自由度为2的χ2密度,即分布。再利用分布的可加性知,

UMP检验函数φ(x)为 (6)式。

所以c由下列不等式确定:

UMP检验函数φ(x)为 (4)式。

所以c由下列不等式确定:

UMP检验函数φ(x)为 (4)式。

4 样本容量的确定

前面讨论的问题,都是根据样本容量及第一类错误的概率(即显著水平),确定一致最优检验使其犯第二类错误的概率到最小。在实际应用中,有时会提出检验问题(1),且给出第一、第二类错误的概率α、β,要确定样本容量并找出UMP检验。要解决这类问题,可先按前面方法确定最优检验函数φ(x),再由第一、第二类错误的概率的定义,联立关于α、β方程组,从中求出样本容量及c。下面只举一例说明解决这类问题的具体方法。

例2:设总体服从正态分布N(θ,σ2),其中θ为未知参数,σ2为已知。要在第一、第二类错误的概率分别为 α、β 条件下用 UMP 检验问题 H0∶θ=θ0↔H1∶θ=θ1(θ1>θ0),样本容量 n必须多大?

解:由例1知此问题的UMP检验函数为:

其中当H0为真时);当 H1为真时

依题意得:

[1]韦来生.数理统计[M].北京:科学出版社,2008.

[2](波兰)M.费史.概率论及数理统计[M].上海:上海科学技术出版社,1978.

[3]复旦大学.概率论(第二册)数理统计(第二分册)[M].北京:人民教育出版社,1983.

[4]陈希孺.高等数理统计学[M].合肥:中国科学技术大学出版社,2009.

[5]孙荣恒.应用数理统计[M].北京:科学出版社,2003.

猜你喜欢

样本容量指数分布数理统计
采用无核密度仪检测压实度的样本容量确定方法
浅谈《概率论与数理统计》课程的教学改革
指数分布抽样基本定理及在指数分布参数统计推断中的应用
二元Weinman型指数分布随机变量之和、差、积、商及比率的分布
论《概率论与数理统计》教学改革与学生应用能力的培养
财经类院校概率论与数理统计教学改革的探索
多媒体技术在《概率论与数理统计》教学中的应用
广义高斯分布参数估值与样本容量关系
多种检测目标下样本容量设计的比较
两类错误条件下方差检验中样本容量的确定