调查问卷数据统计列联表分析在SPSS中的实现
2018-10-20曹玉婵左映龙
曹玉婵 左映龙
摘 要:教育统计测量在教育科研中占有很大比重,其中一个重要的统计方式就是教育问卷调查,有针对教师设计的,有针对学生设计的。但调查问卷回收之后就需要对所回收数据进行统计分析,统计的工作相对容易,而分析的好坏却往往能够左右着该问卷的作用能否正确发挥,能否对教育方针政策的制定和改革起到作用。文章中,作者以昆明市某区中小学教师应用农村现代远程教育工程模式一的调查问卷作为案例,论述列联表分析在调查问卷数据分析中的应用,所应用工具为SPSS 15.0。
关键词:教育统计;问卷;定类型变量;列联表;spss;Crosstabs
中图分类号:O212.1 文献标志码:A 文章编号:2095-2945(2018)26-0009-03
Abstract: Educational statistical measurement occupies a large proportion in educational scientific research. One of the important statistical methods is educational questionnaire survey, which is designed for teachers and students. However, after the questionnaire is recovered, it is necessary to carry out statistical analysis of the recovered data. The statistical work is relatively easy, and the quality of the analysis can often determine whether the function of the questionnaire can be correctly brought into play. Whether it can play a role in the formulation and reform of educational policies and policies. In this paper, the author discusses the application of contingency table analysis in questionnaire data analysis with SPSS 15.0, taking the questionnaire of middle and primary school teachers in a certain district of Kunming as an example of the application of rural modern distance education project model one.
Keywords: education statistics; questionnaires; type-specific variables; tabular tables; SPSS; Crosstabs
1 列联表分析及应用简介
当一个调查问卷收回来进行数据统计之后,紧接着的工作就是数据的分析工作,在数据的分析中,在考虑变量之間的关系时,我们通常分析变量之间的相关程度。对于数值型变量,一般是采用计算相关系数再进行回归分析,而对于调查问卷中常见的定类型数据一般采用列联表过程进行分析。列联表可以算出多个变量在不同取值下的数据分布,进而分析出这些变量之间的关系。
在一个问卷中,通常会有数值型变量(身高、体重、血压、收入等)和定类型变量(如男和女、好和不好、会和不会等),并且在问卷中定类型变量的题目一般较多,我们经常需要研究离散变量的名义变量和有序变量有无相关,在实际处理中最常用的检验办法就是列联表独立检验。
2 项目问卷数据的列联表处理过程
在笔者所参与的一个项目中,项目前期进行了问卷调查,以掌握昆明市某区的中小学教师利用农村现代远程教育工程模式一(以下简称“模式一”)的情况,其中希望掌握的信息比较多,其中包括“模式一”的使用基本情况,使用的基本情况包含了20条“模式一”使用情况的考察指标,即需要考察这20条基本指标与“模式一”使用与教师性别的相关性、与教龄的相关性、与学历的相关性、与年龄的相关性以及与所教科目的相关性。
该问卷主要针对教师设计,所设计主要包含以下信息,sex、age、teacher、education、course、dvd、p7……p27,1-5项分别收集教师信息,其余项目用于收集教师对“模式一”的使用方法和使用的态度等信息。最终发出问卷160份,回收问卷134份,对回收问卷的数据进行统计,然后需要对数据进行分析,文章中主要介绍用列联表分析定类型数据。在该问卷中,定类型数据主要有性别、学历和所教课程。
在SPSS中调用列联表分析过程可进行计数资料和某些等级资料的列表分析,一个行变量和一个列变量形成一个二维列联表。在分析中,笔者对二维和多维列联表(RC表)进行统计描述和X检验,同时计算相应的百分数指标。在SPSS中,在数据文件打开后就可以进行列联表分析,首先选择主菜单中Analyze\Descriptive\Crosstabs命令,即可打开Crosstabs对话框,如图1所示。
其次,在Crosstabs对话框右侧的Row(s)文本框中分布表中的列变量,列变量必须是数值型或字符型等分类变量,即拉入Row(s)文本框中的变量如果开始不是这类变量必须事先处理为符合条件的变量。Column(s)文本框在Row(s)文本框下方,该文本框中的变量作为分布表中的行变量,变量要求和Row(s)文本框一样,必须为数值型或字符型等分类变量。Layer 1 for 1选项组中文本框中的变量是作为控制变量,来决定频数分布表中的层,这里可以有多个层,可以使分析更为细致和复杂。
在图1Crosstabs对话框的设置中,Row(s)文本框中的变量设置为sex(性别)作为列变量,Column(s)文本框中的变量设置为dvd作为行变量,并在图2 Crosstabs:Cell Display 对话框中Percentages选项组的Row项打勾,表示需要显示Row 项,即列变量的百分数值,点击Continue后返回Crosstabs对话框,点击Crosstabs对话框中的ok按钮即可得到表1所示的教师性别与是否使用“模式一”的分析表。
3 问卷数据的列联表分析解释
表1是一个二维的列联表,从表中数据可以分析出男性教师和女性教师在“模式一”的应用上是否有差异,或者差异是不是很大,上节已经说明,sex 维度的1表示男教师,2表示女教师,dvd维度的1表示经常使用,2表示偶尔使用,3表示从来不使用。由表1中的数据可以得到,男教师经常使用“模式一”教学的有3人,占男教师的6.3%,女教师经常使用“模式一”教学的有3人,占女教师的3.5%;男教师偶尔使用“模式一”的有27人,占男教师的56.3,女教师偶尔使用“模式一”的有43人,占女教师的50.0%;男教师从来不使用“模式一”的有18个人,占男教师的38.5%,女教师从来不使用“模式一”的有40人,占女教师的47.5%。从以上数据中,可以分析出无论在人数还是在百分比例上女教师使用“模式一”情况都略低于男教师,相关主管部门和领导就应该更关注和关心女教师的相关技能培训。
在图1Crosstabs对话框中,选中Display clustered bar charts复选框,可以将上述数据生成为分类条形图,如图3所示,这样可以更加直观的表达出数据所反映出来的情况。
4 进一步应用列联表分析问卷
上述列联表分析了教师性别与应用“模式一”的关系,下面将尝试分析教师学历与使用“模式一”的关系,不区分教师的性别将dvd(即教师是否使用“模式一”)设为列变量Row(s),数值与上述分析中的一致。将行变量设为education,在问卷中,education的数值1表示大学本科及以上,2表示大专,3表示中师或中专,4表示高中及以下。得到学历与使用“模式一”情况表如表2、表3和图4所示。
表2描述数据基本信息,报告可用信息和丢失信息的比例和数量;表3学历与使用“模式一”情况表描述的数据信息则非常重要,通过列联表分析后,列变量中“模式一”使用的三个值分别对应行变量(学历)的四个值,在经常使用“模式一”的教师全部为大专以上学历教师,本科以上占了16.3%,大专以上为83.7%,分析显示大专以下学历的教师没有任何一人经常使用“模式一”授课。对于偶尔使用“模式一”的教师中,本科以上学历教师占37.1%,大专以上学历占42.9%,两者共占80%,大专以下学历的教师只占20%。对于从不使用“模式一”的教师的学历构成比例中,大专以上学历的教师比重降低,而大专以下学历教师的比重升高。从表3中的分析中,该区教育主管部门和相关单位领导可以发现,大专以上学历的教师使用“模式一”的积极性明显较高,而学历低于大专的教师的使用情况则不理想,那么在今后的方针政策制定和教师培训过程中,则应该更加关注学历较低教师的“模式一”使用技能培训和思想观念上和先进教育理念上的指导。将该结果直观描述出来,笔者用图4学历与使用“模式一”情况表分类条形图来描述,制作方法与图3一致。
5 结束语
以上举例只是对列联表在调查问卷数据统计分析中的应用的粗略介绍,所使用分析工具为SPSS 15.0英文版,列联表的使用非常灵活,也非常实用,分析的目的是为了更好找出问卷中所反映的情况,以期在下一步的工作中做到合理的解决,可以通过分析拿出有针对性的方案,所以利用SPSS分析的过程也需要做不断的尝试,以得出更能暴露问题的数据和分析结果。
参考文献:
[1]刘大海,李宁,晁阳.SPSS15.0统计分析[M].北京:清华大学出版社,2008,5.
[2]陈雪东.列联表分析及在SPSS中的实现[J].数理统计与管理,2002(1).
[3]贺前龙,王兆雄.列联表分析在市场调查中的深入应用[J].浙江统计,2004(8).
[4]黎婉玲.运用SPSS10.0进行列联表频数数据的统计分析[J].中国热带医学,2003(4).
[5]王孝玲.教育測量[M].华东师范大学出版社,2005.
[6]郭显光.如何用SPSS软件进行主成分分析[J].统计与信息论坛,2002(2).
[7]胡明伟.统计方法和软件在ITS项目评价数据分析中的应用[J].交通与计算机,2005(2).