APP下载

大数据时代如何“以偏概全”

2018-03-06黄磊

新高考·高一数学 2017年6期
关键词:流水线总体容量

黄磊

我们知道收集数据是统计的首要任务.当研究对象(全体)的容量很大或检测过程具有一定破坏性时,通常采用抽样调查的方法,即从调查对象中按照一定的方法抽取一部分(样本)进行调查.样本抽取是否合理,样本数据是否具有代表性,将直接影响对全体所作出的推断的合理性,那么如何科学、合理地进行抽样呢?

一、简单随机抽样——所有抽样方法的基础

一般地,从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取時各个个体被抽到的概率相等,那么这样的抽样方法被称为简单随机抽样.

最常见的简单随机抽样的方法就是我们日常生活中经常采用的“抓阄”法.例如,某学校高一年级数学兴趣小组有12名组员,现要从中选出2名组员参加区级数学竞赛活动.就可以采取“抓阄”的方法进行抽样.“抓阄”法,我们又称为抽签法.一般地用抽签法从个体数为N的总体中抽取一个容量为k的样本的步骤如下:①对总体中的每一个个体进行编号,即从1编到N;②制作号签,即制作N个形状、大小相同的号签(号签可用小球、卡片、纸条等制作);③将号签放在同一个箱子中,并均匀搅拌;④从中每次抽出~个号签,连续抽取k次,就得到一个容量为k的样本;⑤将总体中与号签的编号一致的样本抽出.

当遇到总体的个体数比较多的时候,我们可以通过制作一个数表来代替号签,表中的每一个数都是用随机方法产生的,这样的表称为随机数表.

例如,为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,在利用随机数表抽取这个样本时,可以按下面的步骤进行:

第一步,先将40件产品编号,可以编为00,01,02,---,38,39.

第二步,在随机数表中任选一个数作为开始,例如从第8行第9列数5开始,为便于说明,我们将某随机数表中的第7行至第9行摘录如下,

第三步,从选定的数5开始向有读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到1 6,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34.至此,10个样本号码已经取满,于是,所要抽取的样本号码是16,19,10,12,07,39,38,33,21,34.

简单随机抽样其具体作法有抽签法、随机数表法等,简单随机抽样是其他抽样方法的基础,当总体的个体数N不太大时,常采用简单随机抽样.

二、分层抽样——总体由差异明显的几部分组成

一般地,当总体由差别明显的几个部分组成时,为了保证每一个个体被抽到的可能性相同,从而使样本更客观地反映总体情况,可先将总体中各个个体按差别特征,分成层次分明且互不重叠的几部分,然后按各部分在总体中所占比例进行抽样,这种抽样方法叫作分层抽样,其中所分成的各个部分称为“层”.

例如,一个单位的职T有500人,其中不到35岁有125人,35岁至49岁的有280人,50岁以上的有95人,为了了解这个单位职T与身体状况有关的某项指标,要从中抽取一个容量为100的样本,由于这项指标与职T的年龄有关,因而需要按年龄段分层,不同的年龄段构成不同的层次,采用分层抽样.

“不到35岁”,“35岁到49岁”,“50岁以上”这三类人所占单位职T的比倒分别为125 280 1500'500'500,所以在被抽取的样本中分别有“不到35岁”鸶吾×100人,“35岁到49岁”器罟×100人,“50岁以上”甍去×100人.

分层抽样的步骤是:①将总体按一定标准分层;②计算各层的个体数与总体的个体数的比;③按各层个体数占总体的个体数的比确定各层应抽取的样本容量;④在每一层进行抽样(一般采用简单随机抽样或系统抽样).

三、系统抽样——总体中的个体数较多

当总体中的个体数比较多,不便于采用简单随机抽样时,可以先将总体平均分成几个部分,然后按照一定的规则,从每个部分中抽取一个个体作为样本,这样的抽样方法称为系统抽样(义称为机械抽样或等距抽样).

例如,某T厂车间要对一批流水线上的产品进行检测,若流水线上每1 5分钟能生产Jm 10件产品,现在要在1小时内对该流水线上的所有产品进行抽取样本.因为1个小时内流水线上能生产m 4组产品,每组有10件,所以我们可以在第一个1 5分钟内的这组中采用简单随机抽样抽取一个样本,并记下此刻的时间,然后每隔相同的时间(1 5分钟)再抽取一个样本,如此下去直至从最后一组中取得样本,这样一来我们就完成了对总体的抽样.不难发现每组之间抽取的耐间间隔刚好是每组的(时间)长度,那么组与组之间是等距的.若将总体中的40件产品进行编号01,02,…,40,假设我们在第一组抽取得到编号为06的产品,那么后面三组中抽样结果可以根据系统抽样的等距性直接获取相应编号的产品,依次为06 +10,06+2×10,06+3×10.

从容量为N的总体中,用系统抽样抽取容量为”的样本步骤如下:①编号,将总体的N个个体编号;②分段,将整个编号按顺序平均分段,当N除以77的余数为,,(0<,,

猜你喜欢

流水线总体容量
水瓶的容量
熨烫女工
奇思妙想
宪法修改的重大意义总体要求和原则
流水线
流水线上的神奇转换
直击高考中的用样本估计总体
水下爆炸载荷作用下圆柱壳总体动态响应分析
鼹鼠牌游乐场
坦克的组成和总体布置