分层抽样——统计中的一朵“玫瑰花”
2022-05-23冉亚利
冉亚利
分层抽样是历年高考的重要考点之一,高考常把分层抽样与频率分布、分层抽样与概率结合起来进行考查,也反映了高考的命题方向。这类问题,难度不大,但考查的知识面较广,值得同学们重视。
一、分层随机抽样的概念
例1 下列问题中,最适合用分层随机抽样抽取样本的是()。
A.从20名同学中抽取5人参加座谈会
B.某社区有500个家庭,其中高收入的家庭125户,中等收入的家庭280户,低收入的家庭95户,为了解生活购买力的某项指标,要从中抽取一个容量为100的样本
C.从1000名工人中,抽取100人调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量
解析A中总体所含个体无差异,且个数较少,适合用简单随机抽样。C和D中总体所含个体无差异,但个数较多,不适合用分层随机抽样。B中总体所含个体差异明显,适合用分层随机抽样。应选B。
评注:分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时,可采用简单随机抽样或系统抽样。分层抽样中分层的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠;所有层中每个个体被抽到的可能性相同。
二、求样本容量
例2 某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层随机抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n=()。
A.80
B.100
C.120
D.140
解析
评注:对于分层随机抽样,,总体中某两层的个体数该层的个数之比等于样本中这两层抽取的个体数之比。
三、求总体容量
例3 交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲,乙,丙,丁四个社区做分层抽样调查。假設四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人。若在甲,乙,丙,丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为()。
A.101
B.808
C.1 212
D.2 012
解析
评注:解决分层抽样问题,关键是求出抽样比。求解此类问题的难点为注意分析是否需要剔除个体。
四、求层中样本容量
例4 某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为120份,180份,240份,x份。因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为()。
A.60
B.80
C.120
D.180
解析
评注:
五、分层抽样的设计
例5 一个地区共有5个乡镇,人口3万人,其人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法。写出具体过程。
解析因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层随机抽样的方法。
具体抽取过程如下:第1步,将3万人分为5层,一个乡镇为一层。第2步,按照抽样比求得各乡镇应抽取的人数分别为60,40,100,40,60。第3步,采用简单随机抽样的方法,按照各层抽取的人数抽取各乡镇的样本。第4步,将300人合到一起,即得所需样本。
评注:分层抽样法也叫类型抽样法。它是从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样本(个体)的方法。这种方法的优点是样本的代表性比较好,抽样误差比较小;缺点是抽样手续较简单随机抽样还要繁杂些。
六、分层随机抽样的均值
例6 某学校高一年级在校人数为600,其中男生320人,女生280人,为了解学生的身高信息,按分层随机抽样的方法抽取50名男生身高为一个样本,其样本平均数为170.2cm,抽取50名女生身高为一个样本,其样本平均数为162cm,则该校高一学生的平均身高的估计值为。
解析
评注:
作者单位:湖北省巴东县第一高级中学
(责任编辑郭正华)