巧用常用软件实现快速数据统计
2018-12-03姚丽娜无锡市惠山区统计局江苏无锡214174
姚丽娜(无锡市惠山区统计局 江苏 无锡 214174)
1 EpiData软件实现数据录入
EpiData是一款采用Pascal开发,既可以用于创建数据结构文档,也可以用于数据定量分析一组应用工具的集合,包括调查表设计、数据录入和管理、数据调查等主要功能。因其“简单易学、数据录入功能实用”等特点,在数据管理领域被广泛使用。
EpiData的基本使用方法是基于文本编辑窗口下,先书写一些简单的文本行,并使它自动转换成数据数据格式命令,然后再添加数据输入控制功能,即可实现问卷输入界面的编程。该录入软件可处理简单的表格或相关系统优化文档,以及识别错误。例如双录入核查,在几个文档中的ID号的列表,数据统计表格概述,加日期备份和加密程序。
1.1下载软件:压缩包文件,进行默认安装即可
1.2软件界面:简洁友好,基本工作流程主要分为六个步骤
(1)制作调查表描述文件:建立数据录入源程序(.qes),主要包括:确定变量、内容提示、确定录入格式等;
(2)生成数据文件(.rec):由数据描述文件自动生成数据文件,从而可使用本文件进行数据录入;
(3)建立数据质量控制文件:编写检验程序,从而实现自动审核、过程控制等功能;
(4)数据输入:利用上面自动生成的数据文件进行数据录入;
(5)浏览数据及统计资料;
(6)输出及转换数据:可将录入的数据转换成各种软件能够使用的数据文件(如 SPAA、SAS、EXCEL 等)
1.3编辑录入表,打开EpiData软件,根据纸质调查问卷,生成调查文件(QES文件)。其中#:代表一个字符。
评议表表号 ####
评价意见:满意1基本满意2不满意3不了解4弃权5废票6
评价意见(只能填1-6)
01区委办公室 #
02人大办公室 #
03政府办公室 #
1.4建立CHK文件,根据每个字段的要求,设置文本框属性,如字段名、可输入范围、是否必须输入。在这个案例中,因总票数为1470张,因此主要用到可输入范围这个属性:Range,Legal(限制在1-1470,)
1.5数据录入,选择“EpiData文件 1.rec”文件,其中ae栏录入表号(系统设置表号范围1-1470,录入其他数据跳错),评价意见录入1-6(系统设置评价意见范围1-6,录入其他数据跳错)。
1.6数据处理——一致性检验(对调查表双录入后的对比),保存两个文件,输入两遍,确保前后输入有核对功能,建好双录入文件,数据录入时选择EpiData文件1_dbl,即可实现两编录入校对
1.7文件导出,该软件能导出多种格式文件,如DBF、XLS、DAT等方便后期运算、处理。为了后续处理简单,我们导出.xls格式,利用大家常用的EXCEL软件进行数据分析。
2 EXCEL软件实现数据统计
根据统计要求,需要得出编号为1-60的部门中满意、基本满意、不满意、不了解、弃权、废票各有多少张?分别代表1-6不同身份的人对1-60的部门的具体评价等第情况。
数据导出EXCEL格式文件,该表格是一个1471行*61列的较大表格。EXCEL2013电子表格软件具有强大的数据处理和数据分析功能,完全可满足各类调查统计表的生成。
2.1利用Countif函数,统计每个部门各个等第的具体票数。在对表格的ae列做升序排序操作后,利用Countif函数,统计每个部门各个等第的具体票数。Countif函数的功能是对指定区域中符合指定条件的单元格计数。
Countif函数的语法为:COUNTIF(range,criteria),其中Range参数:是为需要计算其中满足条件的单元格数目的单元格区域,Criteria参数:为确定哪些单元格将被计算在内的条件,其形式可以为数字、表达式或文本。
得出每个部门的具体票数后,再根据编号的范围,分别统计得出身份给出的具体票数。
2.2利用SUMPRODUCT函数,统计每个部门的最满意票数。函数名词解释:返回相应的数组或区域乘积的和,SUMPRODUCT函数语法为:SUMPRODUCT(array1,array2,array3,...)
2.3利用数据透视表,实现函数功能。数据透视表数据透视表是一种交互式的表,可以进行某些计算,如求和与计数等。可以动态地改变它们的版面布置,按照不同方式分析数据,也可以重新安排行号、列标和页字段。每一次改变版面布置时,数据透视表会立即按照新的布置重新计算数据。另外,如果原始数据发生更改,则可以更新数据透视表。
3 结束语
统计工作千头万绪,如何利用现有的知识结构,丰富的网络资源,较为成熟的常用工具软件,实现数据统计分析工作,是每个统计人应该研究和学习的。
没有好的软件,只有适合的软件。希望在统计道路上行走的统计人,能摸索到适合自己的软件,为统计工作带来便利。