调查研究Excel抽样模板制作及其应用
2017-03-27张建斌
张建斌
摘要:在科学研究研究中,经常会遇到随机抽样的问题,利用专业的统计软件虽可很好的实现,但需要购买专业软件和具备专业知识人员来完成,对基层科研人员难以做到。Excel软件是一基础软件,内嵌许多函数,笔者利用Excel函数编制了单纯随机抽样模板,很好解决了随机抽样问题,为非统计专业人员提供了一种操作简单,易学易用方法。现介绍模板制作的了具体方法,并举例指出使用方法和注意问题,为今后进一步改进指出方向。
关键词:抽样;Excel;总体;样本
中图分类号:TP317 文献标识码:A 文章编号:1009-3044(2017)03-0091-02
单纯随机抽样也称简单随机抽样,是最简单、最基本的抽样方法。从总体N个对象中,通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个对象被抽到的概率相等,则这样的抽样方法叫做简单随机抽样。常用的抽样形式利用抓阄、随机数字表,也可以利用统计软件来实现。但前者操作简单,但总体含量大,不太容易实现;而后者操作起来简单,但必须拥有专业统计软件及掌握相应操作技能。本人利用Excel编制了随机抽样模板,并在流行病学调查中得到应用。现介绍如下:
1 简单随机抽样模板制作原理:
1)对N条研究总体记录,从1到N编号;2)利用随机函数给对应标号赋给随机数字;3)对随机数从高到低排序生成相应的序号;4)根据需要样本的多少,从总体记录中从排序中由高到低的原则依次取出相应的记录。
2 简单随机抽样模板的制作:
本模板主要由三张工作表组成:分别定义为抽样表、总体表和样本表,下面按总体为1000条记录内,介绍每张表的编制方法和作用。
1)抽样表,在A1写出“总体记录数”,A2空出备填总体记录个数;B2填编号,在B3填入函数“=IF((ROW(B3)-2)<=$A$2,(ROW(B3)-2)," ")”,把B3公式拷贝到B4到B1002,根据总体个数自动生成1000之内的编碼;在C2填随机数字,在C3单元格填入公式” =IF(B3<>" ",RAND()," ")” ,把C3公式拷贝到C4到C1002,实现在C3:C1002自动生成0-1间的随机数;在D2输入“随机数位次”,在D3填入公式“=IF(C3<>" ",RANK(C3,$C$3:$C$1002)," "),把D3公式拷贝到D4到D1002,实现对C3:C1002单元格的随机数自动排序,排序结果在D列显示;再在E2填编号,在E3填入函数“=IF((ROW(E3)-2)<=$A$2,(ROW(E3)-2)," ")”,便于看样本编码;在F2单元格键入“=IF(ISBLANK(总体!A1)," ",总体!A1)”,将此公式向右拖放至IV2,向下拖放致IV1002,能使F2:IV1002存放字段在250以内1000条记录。
2)总体表:本表存放总体记录,要求第一行存放字段名称,从第二行开始放第一条记录,以便由抽样表调用数据。
3)样本表编制:在在A1输入“样本记录数”;A2空出备填样本记录数; B2键入样本编号,B3键入公式“=IF((ROW(B3)-2)<=$A$2,MATCH(抽样表!E3,抽样表!$D$3:$D$1002,0)," "),把此公式向下拖至B1002,实现根据样本大小,抽出相应随机数大的记录编号;在C2键入编号排序,在C3录入公式” =IF(B3=" "," ",SMALL($B$3:$B$1002,ROW(B3)-2))” ,下拉至C1003,实现抽到样本编号由小到大排序;在D1键入样本,D2键入公式“=IF(ISBLANK(抽样表!F2)," ",抽样表!F2)”,向右拖至IT2,用来存放样本记录字段。D3键入“=IF(D$2=" "," ",IF(C3<>" ",OFFSET(抽样表!F$2,样本!$C3,0)," "))”,把公式向右和向下拖复制到D3:IT1002
实现完整显示样本记录信息。
3 实例
例如 现要从住院号为2008001-2008030妊娠分娩数据30条记录中,利用简单随机抽取3条进行研究。如何实现。
3.1 把总体原始数据复制到总体表1中。
3.2 切换到抽样表,在A2键入30,即可见到如下表。
表2 抽样表调用总体表数据及抽样赋值
3.3 切换到样本表,在A2键入“3”,即得到如下样本信息。
4 结束语
1)本模板利用传统软件制作,操作简单,易学易用,特别适用于没用正版专业统计软件,抽样总体有不太大的情况使用。避免了利用抓阄等原始方法抽样,需要重新整理数据库的繁琐工作,在本单位科学研究中得到很好的应用。
2)对于Excel操作不够熟练的人员,对模板中含公式和函数的单元格锁定和隐藏,只需把总体按要求放入总体sheet,在抽样sheet中填好总体数,样本sheet中填好样本量,即可得到所抽样本信息。
3)本模板在相同的抽样比例多次抽样,不能得到相同的样本信息,也就是样本信息不可重现;同时抽到样本时,需要利用复制和选择性粘贴固定信息,这一值得今后改进的地方。
参考文献:
[1] 于传华. Excel统计分析与电脑实验[M]. 北京:电子工业出版社,2009: 60-61.
[2] 李立明. 流行病学[M]. 7版.北京:人民卫生出版社,2007: 46-47.
[3] 陈青山, 钟倩红, 林佩贤, 等. 在Excel中完成实验对象的随机化分组[J]. 中国卫生统计, 2009, 26(3): 296.