有关非参数统计教学中两独立样本位置的非参数检验的分析
2015-06-15张云霞兰凌
张云霞 兰凌
【摘要】在生物医学以及质量测评等领域中,时常会遇到两独立样本的对比问题,而经常会用到的参数检验方式就是通过u检验和t检验。若所掌控的数据没有达到u检验或是t检验的要求,那么采取非参数检验的方式就能更好的解决此类问题。本文是通过教学案例以及R软件对两独立样本位置的非参数检验进行分析、说明。
【关键词】非参数统计 非参数检验 R软件 Mann-Whit-ney-Wilcoxon检验
【中图分类号】G64 【文献标识码】A 【文章编号】2095-3089(2015)05-0253-02
1.前言
在生物医学以及质量测评等领域中,时常会遇到两独立样本的对比问题,而经常会用到的参数检验方式就是通过u检验和t检验。u检验和t检验都是假设整体分布为正态分布,并且u检验需要事先知晓总体的方差,而t检验则需要满足相同的总体方差。在進行实际操作的过程中,因为种种原因,所要进行分析的数据常常不能达到u检验抑或是t检验的标准,从而导致了无法使用u检验或者t检验进行参数检验对比。如若依旧使用u检验或t检验的方法,那么将会得到错误的判断数据。因此在尚未得知数据的整体分布或整体分布是非正态分布的时候,应怎么解决两独立样本的对比问题呢?非参数检验即是解决此类问题的最科学有效的办法。
2.通过案例分析R软件在非参数检验的实用性
通过观察到的样本数据去估算出整体的分布数据,这是统计推理的重点问题。比如整体的平均数的有关系数与回归系数、区间估计或者是点估计的假设检验等。统计推断是为了对未知的参数进行检验或是估计。对统计分析方法来说,非参数检验属于其重要的形成部分。参数检验与非参数检验共同形成了统计分析的基础。参数检验是在整体分列已经明确的状况下,对整体分列的数据进行分析,但在实际操作的过程中,常常会因种种原因无法对整体分列的形态作出假设,这时候就需要非参数检验运用样本数据对整体分列的形态作出判断,从而解决问题。R软件里的Wilcox.test( )函数能够运用在Wilcoxon符号秩检验,在R软件中输进help(Wilcox.tes)就能够详细了解它的使用方法和功能。接下来笔者将结合案例来说明R软件在两独立样本位置的非参数检验中的实用性。例:甲公司有9名员工,乙公司有11名员工,他们的工资(单位:千元)如下表:
问:哪家公司的员工工资较高?
解法1:运用t检验,假设甲公司(X)和乙公司(Y)的员工工资分别符合正态分布N(μ1,σ2)和N(μ2,σ2),假设检验问题:H0∶μ1=μ2;H1∶μ1≠μ2,运用R软件中的函数t.test( )进行以下分析:
X=c(2,3,4,5,6,7,8,9,25)
Y=c(9,10,11,12,13,14,15,16,18,36,54)
t.test(X,Y,var.equal=TRUE)
从而运算得出p值为0.2315>0.05,无法拒绝原假设,因此认为两公司的员工工资基本无差异。
解法2:运用Mann-Whitney-Wilcoxon检验,不对甲公司(X)和乙公司(Y)的分布进行假设,假设检验问题:H0∶MX=MY;H1∶MX≠MY,运用R软件中的函数Wilcox.test( )进行以下分析:
wilcox.test(X,Y)
从而运算得出p值为 0.009016<0.05, 拒绝原假设,因此认为两公司的员工工资有着明显差异。
通过运用t检验和Mann-Whitney-Wilcoxon检验对该组数剧进行分析,得出了不同的结果。根据数据来看,甲公司的员工工资明显要比乙公司的低,t检验得到的结果与数据不相符,根本原因就在于运用t检验的时候假设了整体的分布是正态分布,但是两个企业的员工工资并不属于正态分布。所以当假设违逆了实际数据的时候,运用t检验得出的分析结论是不正确的。由于Mann-Whitney-Wilcoxon检验没有对数据进行任何的假设,从而得出了更加科学合理的分析结果。
3.结束语
在解决问题的过程中,想要选择出准确的方案来对比分析两独立样本,值得关注的是要分析的数据有没有满足所选择的检验方法的假设要求,比如在选用t检验方法的时候,运用柯尔莫哥洛夫检验方法对数据进行分析它是否为正态分布,两样本的正态整体的方差相不相等,唯有满足了这些条件,才能够使用t检验方法。如若完全不知晓两样本的整体分列,那就不妨运用非参数检验方式来进行分析数据。值得一提的是,如果所要分析的数据可以运用参数检验方式进行检验的时候,仍旧采取非参数检验方式解析该数据,会造成检验成果的丢失,这是因为非参数检验没有将数据信息充分使用。
参考文献:
[1]吴喜之,赵博娟.非参数统计[M].北京:中国统计出版社.2010:350-461.