基于SPSS软件对市场调查问卷数据的统计描述方法
2019-09-10刘玲琳岛宁
刘玲琳 岛宁
摘要:本文阐述了基于SPSS软件对调查问卷的数据分析方法,文内从数据录入、数据管理、问卷分析三个方面分别阐述了对市场调查问卷的分析过程与方法。
关键词:SPSS;数据录入;数据管理;问卷分析
1.引言
本篇论文的研究目的是对市场调查问卷利用SPSS23.0软件进行更加直观和客观的数据管理与分析,从而掌握基于SPSS软件进行问卷分析的方法。此次研究的过程分为调查问卷网创建问卷链接、问卷发放收集、问卷筛选、数据录入、数据管理以及数据分析等步骤。市场调查问卷是针对成都信息工程大学银杏酒店管理学院师生对奶茶店及周围休闲场所需求情况的调查,在乐调查问卷网上创建链接进行微博、微信、QQ等平台发放问卷及收集问卷数据。
2.数据录入
首先,需要将通过调查网采集的问卷数据录入SPSS软件。数据录入的过程为:先对市场问卷的内容定义变量,再将收集到的问卷数据通过直接输入或间接导入到SPSS软件中。
2.1定义变量
SPSS数据文件是一种结构性数据文件,变量是可以被定义为不同的属性来储存不同类型的数据。一般来讲,调查问卷中有填空题,单选题、多选题、半开放问题、半開放多选问题等五类题型。针对这五类题型,定义变量时主要采用以下方法:
(1)对于填空题,属于开放型问题。定义一个变量来存储问卷答案,变量属性与答案的内容类型一致。例如你的年龄是(),填写年龄,则变量类型为数值型。
(2)对于单选题,则直接按照常规设置变量。需要定义一个变量来录入被调查者的选项序号,变量的值标签内容是选项。值标签用1、2、3表示A、B、C。
(3)对于多选题,调查问卷大多选择二分法录入。二分法适合任何多选题,录入方法是首先设置变量数量等于选项数量,将多选题的每一个选项都定义为一个变量,设置值标签1代表是,2代表否来表示被调查者是否选择这个选项。值标签的设定要与问卷平台提供的数据一致。
(4)半开放问题由一个开放问题和一个单选题构成。录入方式为当成两个变量来对待,一个变量存选项序号,变量属性是数值型,标签内容是选项,一个变量存答案,变量属性看答案。
(5)半开放多选问题由一个多选题加一个开放题构成,录入方式为上述的多选题录入方式加开放题录入方式。
2.2数据录入
数据录入则是利用SPSS分析的第二步。数据录入的方法分为两种,一种是直接法即上述五种题型的数据录入方式,直接将Excel里的问卷数据手动录入SPSS软件,另一种是间接法。这里主要采用间接导入法,从问卷平台导出问卷数据,再将问卷数据导入SPSS软件,导出数据可选中Excel类型文件或SPSS类型文件。
以此次问卷调查的前15条数据为例,从下图可以明确看到,对于问题“您的年龄是()岁”这类题目,可以直接将受访者回答的数据录入即可,例如18。我们可以看到,多选题中,第一位受访者第九题的回答是AB。根据上一步骤的定义变量,对于多选题,若选择了这个选项,录入“1”,如果未选择录入“2”,对于单选题,依据前一步骤定义的变量,某个受访者选择了“A”,则录入的时候录入“1”,如果某一个受访者,选择的是“D”,那么录入的时候应该录入“4”。
3.数据管理
数据清理与转换的工作成为数据管理。在市场调查问卷的数据管理过程中最重要的就是处理问卷的缺失值。
缺失值产生的原因有以下三种:
(1)在数据收集阶段,收集者没有收到相应的数据;
(2)应答者拒绝回答该问题;
(3)该问题对该问答者不适用。
缺失值填补的方法有:
(1)删除;
(2)设置为缺失(0,99);
(3)序列均值:取整列数据的均值;
(4)临近点均值:取该缺失值相邻点的平均值,具体点数由相邻点的跨度来确定;
(5)邻近值的中位数:取缺失值相邻点的中位数,具体点数由相邻点的跨度来确定。
4.数据分析
此次调查问卷的数据分析主要从调查问卷的甄别、调查问卷的主体、基本信息三部分来说明使用的数据分析方法。由于此次问卷的大多是以选择题的形式出现,且多数是多选题,所以我们主要选择采用交叉表功能和频率功能分析此次问卷,其中交叉表主要分析两个及两个以上数据之间存在的关系,频率功能用于单变量分析。
4.1甄别问卷数据分析
甄别问卷一般设置在调查问卷的第一部分,用于甄别被调查者是否符合问卷的调查要求。对甄别问题的数据进行频率分析,可以得出符合与不符合甄别条件的调查者的频数与百分比。然后再采用交叉表功能,将甄别问卷数据与年龄、性别、学历等基本特征数据关联分析,来了解两类被调查者的特征差异。
4.2主体问卷数据分析
此次调查问卷的数据主要采用的是交叉表分析,辅之以频率分析。
4.2.1交叉分析法
交叉表分析包括单选题之间的交叉分析、单选题与多选题之间的交叉分析以及多选题之间的交叉分析。单选题的交叉分析使用【分析】-【描述统计】-【交叉表】功能即可分析变量之间的关系。多选题的交叉表分析,需要将多选题的多个变量进行变量集的定义。定义方法使用【分析】-【多重响应】-【定义变量集】来完成。变量集定义完成后,使用【分析】-【多重响应】-【交叉表】/【频率】来进行多选题的数据分析。
4.2.2频率分析法
频率分析主要以直方图、饼图、条形图的形式表现,通过数据集散趋势的统计量对调查数据的分布特征进行具体的描述,以此来挖掘隐藏在数据背后的深层信息及现实意义。而频率分析既可以分析该调查问卷的单选题,也可以分析该调查问卷的多选题。下面就具体的案例进行更加直观的说明。若我们要对受访者最喜欢的奶茶类型进行频率分析,就需要进行如下操作:首先打开已经整理好的SPSS数据视图界面,在【分析】按钮里找到【描述统计】中的【频率】,然后选择需要频率分析的选项,在【图表】中选择数据表达方式,单击【确定】即可。同样的,多选题也需要在【分析】的【多重响应】中的【交叉表】定义新的变量名称,然后选择与单选题相同的频率分析操作。
4.3基本信息数据分析
调查问卷的基本信息包括性别、年龄、学历、收入状况以及职位情况等等。基本信息是对调查问卷的补充和说明,可以对调查问卷进行不同性质的分类,使得数据分析结果更加清晰。对于基本信息的分析,主要采用频率表进行单项分析。如果需要分析两两之间的关系,则采用交叉表进行分析。
5.结束语
综上所述,相对于传统的问卷分析方法,利用SPSS软件对调查问卷进行数据分析,可以更加科学化的反映受访者的一系列行为。同时,也可以利用频率表和交叉表更加直观、清晰的展示数据分析结果。
参考文献:
[1] SPSS统计分析方法及应用(第3版),2019.7.29
[2] 统计分析与SPSS的应用(第4版),2019.7.29
[3] 赵晓娜,基于SPSS软件对对调查问卷进行频率分析的研究,技术应用,2019.7.29
作者简介:
刘玲琳(1998.01)女,研究方向:数据营销
岛宁(1978.05)研究方向:数据营销;职称:中级经济师
(作者单位:成都信息工程大学银杏酒店管理学院)