两个具有名义指标总体分布相等的检验
2011-12-26王宏仁宋立新
王宏仁,宋立新,陈 鲲
(1.吉林师范大学数学学院,吉林 四平 136000;
2.吉林师范大学环境工程学院,吉林 四平 136000)
两个具有名义指标总体分布相等的检验
王宏仁1,宋立新1,陈 鲲2
(1.吉林师范大学数学学院,吉林 四平 136000;
2.吉林师范大学环境工程学院,吉林 四平 136000)
根据Ridit检验思想方法进行数据变换,并利用K-S检验原理给出了检验两个名义指标总体概率分布相等的检验方法.其本质是存在两个具有名义指标的统计总体,且通过抽样得到两个频率直方图,再通过频率直方图来检验这两个总体分布是否相等的问题.
名义指标;Ridit检验;K-S检验;经验分布函数;检验方法
在生物学、医学、农业和其他学科领域经常会遇到这样一类问题:两个群落,都含有相同的k个成分,各个成分有一定的比例,且成分比例之和为1.关键是两个群落成分比例是否相同需要检验.其本质[1-2]是存在两个具有名义指标的统计总体,且通过抽样得到两个频率直方图,通过频率直方图来检验这两个总体分布是否相等的问题.
本文应用Ridit检验[3]的思想方法将数据进行变换,使这个问题转化成检验两个总体分布函数是否相等的问题.并利用K-S检验原理[4-9]给出了这个问题的检验方法.
1 问题的提出
设总体A和B都考虑不可计量的一个名义指标a,分为k类.则A和B的概率分布分别为:
2 Ridit变换
一组属性资料a1,a2,…,ak经过上述这一特定的变换转化成一组计量资料(f1,f2,…,fk).现在进一步证明这组计量数据服从均匀分布.
要证明f值服从均匀分布,只要证明它的概率密度恒为1即可.如果把f的k个取值标在[0,1]之内,不难看出fi是第i组概率pi范围的中值.显然每组的概率就是自身的组距.概率密度曲线与f轴所围的面积表示概率.所以,在k个子区间上都是1.如果将分类加细,则逐渐演变为一个服从[0,1]上均匀分布的随机变量,这就证明了f服从[0,1]上的均匀分布.
同理,对于B总体也有相同的结论,令
则h服从[0,1]上的均匀分布.
3 检验统计量的确立
通过Ridit变换,将检验两个名义总体分布相等的问题,转化成检验两个总体是否都服从[0,1]上均匀分布的问题,由于[0,1]上均匀分布的分布函数是连续的,故而满足使用K-S检验的条件.
首先对fi和hi进行估计,根据fi和hi的定义以及Bernoulli大数定律,有
4 检验方法的建立
这样,我们就给出了一种检验两个具有名义指标总体分布是否相等的方法.
5 案例
某学校有6门新设的体育选修课,下面的数据分别记录了520名男生(m)和450名女生(n)分别选修每门课程的情况,取水平α=0.05,检验“m,n对这6门课程的选择倾向性是否相同”.
表1 某校新设体育选修课选择人数统计 人
现在有两个总体:m,n.每个总体都分为6类,每一类都有一定的比例,且比例之和为1,欲检验H0对H1的假设检验问题,其中H0:m,n对这6门课程的选择倾向性相同;H1:m,n对这6门课程的选择倾向性有差异.
数据列表如表2.
表2 m,n对6门体育课程的选择倾向性差异统计
[1] 宋立新,王德辉.具有名义尺度的两个总体概率分布相等的检验[J].吉林大学自然科学学报,1997,35(3):14-16.
[2] 宋立新,赵力.两个总体相等的广义似然比检验[J].大学数学,2005(2):91-94.
[3] 宋俊杰.统计信息分析:上册[M].天津:南开大学出版社,1986:299-304.
[4] 陈希孺,方兆本,李国英,等.非参数统计[M].上海:上海科学技术出版社,1989:123-136.
[5] 陈希孺,柴根象.非参数统计教程[M].上海:华东师范大学出版社,1993:124.
[6] 张尧庭.定性资料的统计分析[M].桂林:广西师范大学出版社,1991:189-193.
[7] 孙山泽.非参数统计讲义[M].北京:北京大学出版社,2000:34-42.
[8] 宋立新,张平.K个单参数指数总体相等的假设检验[J].东北师大学报:自然科学版,2009,41(2):50-52.
[9] 刘银萍,杨晓莹.截断情形下几何分布的参数估计[J].东北师大学报:自然科学版,2009,41(3):14-16.
The test for the equality of the probability distribution of two populations with nominal scales
WANG Hong-ren1,SONG Li-xin1,CHEN Kun2
(1.School of Mathematics,Jilin Normal University,Siping 136000,China;
2.School of Environment Engineering,Jilin Normal University,Siping 136000,China)
This paper makes data transformation on the method of Ridit test and provides a method for testing of equaling on the overall distribution of two indicators with name index using the principle ofK-Stest.The nature of this problem is that two overall statistics with index name are needed,and a frequency histogram is get from statistical sampling.Through the frequency histogram the equaling on the overall distribution is tested.
index name;Ridit test;K-Stest;empirical distribution function;test methods
O 212
110·67
A
1000-1832(2011)04-0029-04
2010-09-22
国家自然科学基金资助项目(10971084).
王宏仁(1976—),男,博士研究生,讲师;通讯作者:宋立新,(1954—),男,教授,主要从事数理统计研究.
陶 理)