大学生群体调查中的抽样样本量讨论
2018-02-26周富林胡小丽谢兆俊
周富林 胡小丽 谢兆俊
摘 要:抽样调查是一种常用的调查方式,论文以大学生群体的身高和体重为调查对象,对有较大差异的抽样量进行了比较,利用数理统计方法,从均值和标准偏差的角度来判断不同样本量的差异显著性。
关键词:假设检验;抽样调查;样本量
一、引言
抽样调查的一个关键问题就是样本量的科学确定。样本量的大小直接影响抽样误差、调查的费用、调查所需的时间、调查访员的数量以及其他一些重要的现场操作的限制条件。样本量过大,会造成人力、物力和财力的浪费;样本量过小,会造成抽样误差增大,影响抽样推断的可靠程度。
二、问题提出和解决
本文以大学生群体为案例,拟通过实际案例,对这种样本量的差异性带来的均值和标准差的异同,进行比较。通过不同的抽样量分布计算其对应的均值和标准差,与设定总体进行假设检验,比较异同。
(一)抽样量的改变对结果的影响
在误差d较小的时候,约是标准差的十分之一左右,两种样本量估计值的差异是最大的。本文根据这种差异来进行统计学意义上的对比计算。上表1中,序号1对应的等量大小的误差,根据经验样本量的公式估算抽样量n1=256,根据GB/T8054查表所得的抽样量n2=36。当误差的变化达到一定量时,即时标准差的1倍时,两种方法所取得的样本量一样,都是11。我们将之分别与n=1150时的均值和标准差做假设检验。需要说明的是,在比较过程中,取的n1=256个值采用的是整群抽样。取得的n1=36和n3=11个值,采用的是简单随机抽样。下表1是在取三个样本量的三种情况下,分别计算其均值和标准差。
表1:抽样量改变均值和方差比较
所有调查数据符合正态分布的前提条件,可采用假设检验,比较两种抽样量的均值和标准差有无显著性差异。从而判断抽样量较小的取值是否可取。若是可取,对将来的类似调查可以节省大量经费。
(二)假设检验
分别假设检验样本n1、n2和n3与假设总体n0=1150的均值做假设检验,n1用如下公式
H0:μ1=μ0,H1:μ1≠μ0此时
对应n1的假设检验,δ=0,若t>tα/2(n-1),则拒绝原假设。
按照GB/T8053的推荐,取α=0.05,用公式
和判断公式
,若其小于等于判定数k,则认为可以接受原假设,两者之间无显著性差异。依次对n2和n3重复上述步骤。
查表可得判定数k分别是t0.025(36)=2.0281和t0.025(11)=2.2010,n=256时,由于表中无法提供自由度大于45的t值来进行比较,数值只能提供参考。
根据身高的数据由计算得:t1=1.6284,由体重的均值代入上式,t1=3.9577此时可以参考表中判断数,但无法直接比较。
下表2中,对应n=36和n=11的判断数均小于判断数,接受原假设。
下表2是假设检验的判断数
表2:均值的假设检验判断数
由此可见,在均值的比较上,样本量n2=36和n3=11对应的抽样调查结果都是在可接受范围内,与对照的n=1150对应的均值没有显著性差异。根据判断数的显示和对应规则,可以发现,n2=36的抽样量对应的结果与对照样本的差异性是最小的。
用卡方分布进行方差的比较,用公式:(n-1)s2/σ02≤χ1-α/2(n-1)或(n-1)s2/σ02≥χα/2(n-1) 作為拒绝域的判断。分别用n2=36和11代入,计算结果如下表3:
表3:方差的假设检验判断数
两者比较下来都是n2=36,和n=11的抽样量其方差的假设检验都在可接受范围内。由此可见抽样量的大小对结果的影响并不大,只要抽样方法是合适的。
三、结论
根据数理统计规律,样本量增加呈直线递增的情况下而抽样误差只是样本量相对增长速度的平方根递减。若样本量过大,调查单位增多,不仅增加人力、财力和物力的耗费,增加调查费用,而且还影响到抽样调查的时效性,从而不能充分发挥抽样调查的优越性。因此,为节省调查费用,体现出抽样的优越性,在确定样本容量时,应在满足抽样对估计数据的精确度的前提下,尽量取小一些的样本量。