APP下载

基于SPSS软件 对调查问卷进行频率分析的研究

2018-09-10赵晓娜

电子商务 2018年2期
关键词:数据

摘要:使用spss23.0对调查问卷进行数据分析的研究包括变量的定义、数据的录入和数据的分析的步骤和具体操作方法进行了比较详细的分析。

关键词:SPSS;频率分析;数据

中图分类号:F2

问卷调查法是广泛应用的科研手段,运用问卷调查法可以清楚明了的获得想要的数据,从而得到真实的信息,在对数据进行统计分析的过程中,运用SPSS对数据进行处理,从而为项目顺利完成提供科学基础。调查问卷的设计中以选择题和填空题为主,在实际应用中,对调查问卷进行频率分析是数据处理常用的分析手段。

1、变量的定义

定义变量是用SPSS进行数据分析的第一步,打开SPSS23.0,会看到类似于EXCEL的界面,在界面的左下方有数据视图和变量视图两个按钮,用鼠标单击变量视图就可以看到一个最上面一行从左到右依次是(变量)“名称”“类型”“宽度”“小数位数”“标签”“值”“缺失”“列”“对齐”“测量”“角色”的按钮,这个界面就是进行变量定义的界面。在SPSS中,调查问卷中的每一个问题作为一个变量进行分析,这样问卷有多少问题就有多少变量,变量名是给每一个变量赋予的名字,比如调查问卷的第一题,变量名称可以为P1或者Q1,相应的调查问卷的第二题就是P2或者Q2,变量类型。“变量类型”包括数字、逗号、点、科学记数法等,一般调查问卷的类型都是数字型。“变量宽度”的定义是根据变量视图里面“值”的大小来定义的,为了便于说明,我们以某个问卷的问题来进行说明,此题为:您2015年家庭人均纯收入为( )元,如果被调查对象填的是2400元,那么变量宽度就是4,如果填的是240元,那么变量宽度就是3。“小数位数”指的是“值”的具体数值包括不包括小数位数,上面的例子中,小数位数就为0。“标签”指的是调查问卷中每一道题的题干,比如前面的例子,变量的“标签”就是“您2015年家庭人均纯收入为”。“值”对于上面例子中的填空题,在赋值的时候选择“无”。对于单项選择题,我们以例子来说明“您家庭的主要收入来源( )A 畜牧业 B 各类政府补贴 C 务工收入 ”对于这道题,我们给选择项进行赋值,比如用1=“畜牧业”、2=“各类政府补贴”、3=“务工收入”。对于多项选择题,我们依旧举例子来说明“您家庭的主要致贫原因( )多选题

A 缺技术 B缺资金 C 缺劳力 D 家庭成员残疾重病

E 赡养老人或者抚养未成年人压力 F 草场退化严重 G 牲畜少 H 缺土地”

对于多选题,定义的方法主要有二分法和多重分类法,二分法指的是把多选题的每一个选项定义为一个变量,每一个变量值都定义成——“1”代表选中,“0”代表未选中,多重分类法指的是事先定义录入的数值,因为二分法在实际中应用最广,在本文中,我们定义多项选择题时以二分法进行介绍。我们首先在变量名称中就跟填空题和单选题不一样,对于这道题,假设是调查问卷的第10题,如果是单选题,变量名称是P10,因为是多选题,变量名称就不能这么定义,因为这道题有8个选择项,所以对于这道多选题的变量名称就包括8个变量,从“P10_1、P10_2……P10_8”,在给变量赋值时,要分别给8个变量赋值,这八个变量,在定义变量时“值”都是0=“未选”、1=“选中”。相应的标签是每个选择项,比如P10_1这个变量的标签是“P10_1,缺技术”,相应的变量P10_2的标签是“P10_2,缺资金”。“缺失”在赋值时,直接定义为“无”。 “列”指的是输入变量的显示宽度,默认为8,用默认值即可。“对齐”指的是输入值在单元格的对齐方式,一般选择左对齐。“测量”包括标度、有序、名义三个选择项,填空题填入具体数值的就选择“标度”,选择题就选择“名义”。角色一般选择“输入”即可。调查问卷中的变量赋值后如下图所示:(注:在变量视图页面)

2、数据录入

变量定义完,要做的就是把调查问卷里面的数据录入SPSS文件里,录入数据的方法主要有两种,一种是先把调查问卷的数据录入比如EXCEL文件里面,然后从EXCEL文件里面把数据导入SPSS文件里面,另外一种是直接在SPSS文件里面把调查问卷的数据录入,本文介绍的是后一种。要直接录入数据,首先打开变量定义好的数据文件,点击SPSS数据文件里面左下角的数据视图页面,你会看到你之前定义好的变量。其中,数据视图里面的每一列代表一个变量,每一行代表一份调查问卷,为了说明问题,假设这次调查问卷一共有9份,为了更好说明这个问题,如下图所示:(注:在数据视图页面)

从这个图上可以看出,对于问题“您2015年家庭人均纯收入为( )元”这样的题型,直接录入相应的数据即可,如2400元。对于多选题,从图中可以看出,第一份调查问卷的被调查对象选择的“ABDEHI”,因为根据之前的定义,对于多选题下面的多个选项,根据之前对这个变量的定义,如果选择了这个选项,录入“1”,未选择录入“0”。对于单选题,根据之前对变量的定义,每个被调查对象都选择了“A”,所以录入的时候录入“1”,如果某一个被调查对象,选择的是“C”,那么录入的时候应该录入“3”。

3、对数据进行频率分析

频率分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征,以便我们对数据的分布特征形成初步的认识,才能发现隐含在数据背后的信息。频率分析主要包括分类变量的频率分析和连续变量的频率分析。而就具体的调查问卷而言,分类变量的分析主要指的是单选题和多选题的分析。而连续变量的频率分析主要指的是对填数值类型的填空题进行分析。我们还用上面的例子分别进行介绍。

3.1 对连续变量的频率分析

我们还以“2015年家庭人均可支配收入[P9]”这个变量为例进行介绍,首先打开之前录入的数据文件,进入“数据视图”页面,单击【分析】菜单,选择菜单栏中【描述统计】菜单,然后选择【描述统计】菜单中的【频率】菜单,将“2015年家庭人均纯收入[P9]”这个变量移入右边的变量框里。然后单击变量框右边的“统计”按钮,然后对弹出的统计对话框进行设置,设置完成之后,单击【继续】,在弹出的【频率】对话框中单击【图表】按钮,在弹出的频率:图表对话框中的图表类型里勾选【直方图】和在直方图中显示【正态曲线】这两项,因为是连续数据,所以勾选直方图,如果要了解这些数据的机构,就勾选饼图。然后单击【继续】回到频率对话框,因为我们要分析的是数据的离散趋势和集中趋势,所以我们要把【显示频率表】勾选掉,然后单击【确定】,就完成了。

3.2 对分类变量进行频率分析

对调查问卷的分类变量而言,主要指的是问卷中的单选题和多选题,我们分别举例进行介绍。单选题我们还是以“您家庭的主要收入来源,P10”为例进行介绍。首先还是打开之前录入的SPSS数据文件,进入数据视图页面,选择【分析】菜单栏里的【描述统计】,然后单击【描述统计】菜单栏里的【频率】,就会出现频率对话框,把“您家庭的主要收入来源,P11”移入右边的变量框里。单击【确定】按钮,输出结果就会出现。对于多选题的频率分析,我们还是以“您家庭的主要致贫原因( )多选题

A 缺技术 B缺资金 C 缺劳力 D 家庭成员残疾重病 E 赡养老人或者抚养未成年人压力 F 草场退化严重 G 牲畜少 H 缺土地”为例进行分析,首先进入数据视图页面,单击【分析】按钮,然后单击【分析】菜单栏里的【定制表】,然后单击【定制表】菜单栏里面的【定制表】按钮,进入定制表对话框,同时选定P10_1到P10_8变量,然后把这些变量一起拖动到右侧的【行】区域上,等到【行】区域出现红色方框后,松开鼠标,就完成了拖动,然后右边的框里就出现了这些变量。单击【定义】下面的【摘要统计】按钮,就出现了摘要统计对话框,把【统计】按钮下面的“未加权计数”、“列数”、“有效列数”移到【显示】按钮下面的框里,单击“摘要统计”对话框里面的【应用于所选项】按钮,单击【确定】按钮,就出现了如下的输出结果:

这样就完成了多选题的数据分析。即完成了对分类变量的频率分析。

作者简介:赵晓娜,青海师范大学经管学院副教授,青海师范大学生地学院在读博士,研究方向为区域经济、区域金融。

猜你喜欢

数据
公路工程试验检测存在的问题及措施
一种借助数据处理构建的智能食堂管理系统
浅谈计量自动化系统实现预购电管理应用