利用“乱数表”抽样调查确保样本抽取质量
2012-04-29胡成江
[摘 要]抽样调查是用样本指标推断总体指标,其样本的质量直接影响到抽样调查的结果。要保证样本质量,利用“乱数表”抽取样本是种行之有效的方法。本文结合一个案例详细阐述了如何利用“乱数表”,确保抽样调查的样本抽取质量。
[关键词]乱数表;抽样调查;样本;质量
[中图分类号]R195 [文献标识码]A [文章编号]1005-6432(2012)5-00107-01
1 前 言
抽样调查是指依据随机原则,从全部调查研究对象(总体)中,任意抽取一部分单位组成样本进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方式。由于采用抽样调查是用样本指标推断总体指标,其样本的质量如何就直接影响到抽样调查的结果。若抽取的样本能够很好地代表总体,反映总体情况,则抽样调查的结果就比较准确,抽样误差就比较小;反之,若抽取的样本不是总体的真实缩影,不能很好地反映总体情况,则调查结果的准确性就比较差,抽样误差就比较大。那如何才能保证抽样调查中样本的抽取质量呢,利用“乱数表”是种行之有效的方法。 2 “乱数表”的制作
“乱数表”又称“随机数表”,它是将0~9的10个数字随机排列成表,以备查用。其特点是,可以根据编码要求将其编制成所需要的任意位数一组(如二位数一组、三位数一组、四位数一组等)的数码,并且无论横行、竖行或隔行读取均无规律,表内任何数码的出现,都有同等的可能性。因此,利用此表进行抽样,可以保证随机原则的实现,并与抽签法相比较能够大大简化抽样的烦琐工作,特别适用于总体单位数较多并且可以对总体各单位逐个编号的样本的抽取。
“乱数表”的制作可以采用特制的摇码器自动地逐个摇出,也可以采用计算机自动生成。当然,最简便的方法是采用抽签法,即将0~9的10个数字写在相同的纸片上裹成模样相同的纸团放进抽取箱并搅拌均匀,随机抽取1个纸团并按抽取的顺序登记后再将抽取的纸团放回抽取箱并搅拌均匀,再随机抽取1个纸团并按抽取的顺序登记后再将抽取的纸团放回抽取箱并搅拌均匀,再随机抽取1个纸团并按抽取的顺序登记,就这样反复的抽取、登记,一直抽到生成一个满足其抽样要求的“乱数表”为止。下面就是制作的一个小型“乱数表”。
3 采用“乱数表”的抽样程序
云化厂为了检验A产品的质量,决定从600件产品中抽取10件进行检查,问利用“乱数表”如何抽取?采用“乱数表”的抽样程序如下:
3.1 根据总体范围,给总体各单位编号
在给总体各单位编号时,每一个总体单位的号码(或称编码)位数要一致,每一个编码的位数要与总体单位最大编码的位数相同,少于最大编码位数的号码要在前加“0”。在进行具体编号时,可以将总体中的玁个个体从0开始编号,例如若总体单位数玁=100时,编码可以是00,01,02,……,99,这样总体中所有个体均可以用两位数字的编码表示,便于运用“乱数表”。案例的总体单位数玁=600,其总体各单位的编码可以编为000,001,002,……,598,599(每一个总体单位的编码为3位数)。
3.2 根据总体各单位编码位数确定“乱数表”的数码
案例中,由于总体各单位的编码为三位数,故将“乱数表”编成为三位数一组的数码,即上述“乱数表”从左到右第一行的数码分别为:254、093、863、800、676、501、910、847、424、595。若总体各单位的编码为四位数,则将“乱数表”编成为四位数一组的数码,则上面“乱数表”从左到右第一行的数码分别为:2540、9386、3800、6765、0191、0847、4245;从左到右第二行的数码分别为:4685、7401、6803、7940、8490、4903、4622。
3.3 确定起抽数码
起抽数码的确定可以根据“乱数表”表的行数和已确定的“乱数表”的数码的列数采用抽签法确定。如上述“乱数表”共有15行10列(三位数一组,即三位数为一列),可以将1至15的15个数字写在相同的纸片上裹成模样相同的纸团搅拌均匀随机抽取1个纸团确定其起抽行,假定抽取的是5,说明起抽数码的行为第5行;同样将1至10的10个数字写在相同的纸片上裹成模样相同的纸团搅拌均匀随机抽取1个纸团确定其起抽列,假定抽取的是2,说明起抽数码的列为第2列。起抽行(第5行)与起抽列(第2列)相交的数码即为起抽数码,此“乱数表”为478。
3.4 确定抽样方向
确定抽样方向就是要确定从起抽数码开始,行是从左到右,还是从右向左抽取;列是从上往下,还是从下往上抽取。其方法是将写上“往上、往下、”“往左、往右” 相同的纸片上裹成模样相同的纸团分别抽取。若本案例,抽到的是“往下”与“往右”,则说明抽样方向是从起抽数码开始从上往下,从左到右抽取。
3.5 抽选样本
抽选样本就是按照确定的抽样方向,从起抽数码开始读数(读数根据要求可以连续读数,可以间隔读数),选取与总体各单位编码具有相同位数的数码,超出范围的数码不选,重复的数码不再选,直至达到预定的样本容量为止。案例采用间隔1个数码读数,其抽选的样本编码分别为:478、318、278、240、757(由于757>599,舍去)、950(舍去)、016、115、240(重复、不再选)、308、213、165、977(舍去)、800(舍去)、064。即所要抽取的样本编码是:478、318、278、240、016、115、308、213、165、064。
3.6 找出相应样本名称,进行调查
即按照中选数码,找出编码为478、318、278、240、016、115、308、213、165、064的10件A产品进行调查。
严格按照上述抽样程序,采用“乱数表”抽取样本,完全排除主观挑选样本的可能性,使抽样调查具有较强的科学性,从而保证样本的抽取质量。
参考文献:
[1]邬适融.现代企业管理[M].北京:清华大学出版社,2005.
[2]杜家龙.市场调查与预测[M].北京:高等教育出版社,2009.
[3]梁前德.基础统计[M].北京:高等教育出版社,2009.
[作者简介]胡成江(1962—),男,汉族,云南盐津人,副教授,研究方向:企业管理、管理会计、市场调查与预测、统计学基础等。