统计中的一朵“玫瑰花”
——分层抽样
2019-01-11张祎冰
■张祎冰
在样本抽样时,将总体按其属性特征分成若干类型(也称为层),然后在每个类型中按照所占比例随机抽取一定的样本,这种抽样方法叫分层抽样,也叫类型抽样。分层抽样的适用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样。若样本容量为n,总体的个体数为N,则每个个体被抽到的可能性都是
一、分层抽样的判断
例1(1)某地区为了解居民家庭生活状况,先把居民按所在行业分为几类,然后每个行业抽的居民家庭进行调查,这种抽样方法是
(2)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层抽样为保证每个个体等可能抽样,必须进行( )。
A.每层等可能抽样
B.每层可以不等可能抽样
C.所有层按同一抽样比等可能抽样
D.所有层抽取个体数量相同
解:(1)由于居民按行业可分为不同的几类,符合分层抽样的特点,所以这种抽样方法是分层抽样。
(2)保证每个个体等可能地被抽取是三种基本抽样方法的共同特征,为了保证这一点,分层抽样时必须在所有层都按同一抽样比等可能抽取。应选C。
评析:分层抽样的适用条件是总体可以分层,层与层之间有明显区别,而层内个体间的差异较小。
二、求总体容量
例2交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲,乙,丙,丁四个社区进行分层抽样调查。假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人。若在甲,乙,丙,丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为
解:由题意可知,甲社区驾驶员的抽样比为四个社区驾驶员总人数的抽样比为由分层抽样可得解得N=808。
评析:对于分层抽样,总体容量等于各层容量之和。解题时要注意区分样本容量与总体容量。
三、求样本容量
例3某工厂甲,乙,丙三个车间生产了同一种产品,其产品数量分别为120件,80件,60件。为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则
解:由分层抽样的特征,可得解得n=13。
评析:理解分层抽样的抽样比是解答本题的关键。
四、求每层应抽取的个体数
例4某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组。在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%,登山组的职工占参加活动总人数的且该组中,青年人占50%,中年人占40%,老年人占10%。为了解各组不同的年龄层的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取容量为200的样本。
试求:(1)游泳组中,青年人,中年人,老年人分别所占的比例。
(2)游泳组中,青年人,中年人,老年人分别应抽取的人数。
解:(1)设登山组人数为x,设游泳组中,青年人,中年人,老年人各占比例分别为a,b,c,则由题意可得由此解得b=50%,c=10%。所以a=1-50%-10%=40%。故游泳组中,青年人,中年人,老年人所占的比例分别为40%,50%,10%。
评析:在分层抽样中,若各层个体数之比为m1∶m2∶…∶mk,样本容量为n,则每层抽取的个体数为(i=1,2,…,k)。
五、分层抽样的实际应用
例5一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人。为了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
解:用分层抽样法抽取样本,步骤如下。
①分层,按年龄将500名职工分成三层,即不到35岁的职工,35岁至49岁的职工,50岁及50岁以上的职工。②确定每层抽取的个体数,各层分别按简单随机抽样法抽取样本。抽样比为,则在不到35岁的职工中抽取125×=25(人),在35岁至49岁的职工中抽取280×=56(人),在50岁及50岁以上的职工中抽取95×=19(人)。③汇总每层抽样,组成容量为100的样本。
评析:分层抽样的步骤:①计算样本容量与总体个数之比。②将总体分成互不交叉的层,按比例确定各层要抽取的个体数。③用简单随机抽样或系统抽样在各层中抽取相应数量的个体。④将各层抽取的个体合在一起,就得所需样本。
为了评估某学校的教学水平,将抽取这个学校高三年级的部分学生本学年的考试成绩进行考察。为全面反映实际情况,采取以下三种方式进行抽查(已知该学校高三年级共有20个班,并且每个班内的学生按随机方式编好了学号,假定该校每班学生人数都相同):①从全年级20个班中任意抽取一个班,再从该班任意抽取20人,考察他们的学习成绩;②每个班都抽取1人,共计20人,考察这20个学生的学习成绩;③把学生按成绩分成优秀,良好,普通三个级别,从中共抽取100名学生进行考察(若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人)。
(1)上面三种抽取方式中,其总体,个体,样本分别指什么?按每一种抽取方式抽取的样本中,其样本容量分别是多少?
(2)上面三种抽取方式中,各采用何种抽样方法?
提示:(1)上面三种抽取方式中,其总体都是高三全体学生本学年的考试成绩,个体都是指高三年级每个学生本学年的考试成绩。第一种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20。第二种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20。第三种抽取方式中,样本为所抽取的100名学生本学年的考试成绩,样本容量为100。
(2)第一种抽取方式采用的是简单随机抽样法,第二种抽取方式采用的是系统抽样法和简单随机抽样法,第三种抽取方式采用的是分层抽样法和简单随机抽样法。