基于多重对应分析的大学生心理调查研究
2021-03-24肖明魁
肖明魁
摘要:随着大数据时代的来临,计算机及相关数据分析专业软件被广泛运用于数据分析,建模及数据挖掘等领域。在当今社会生产经营活动中,对于诸如产品定位,客户细分,社会调研,工程管理等各行业研究,经常会采用多重对应分析法,用于揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。本文以某高校大学生心理调查数据作为依据,研究和分析多重对应法在现实中的具体应用,对于开展大学生心理指导和教育工作具有一定借鉴意义。
关键词:大数据;SPSS;对应分析
中图分类号:TP311 文献标识码: A
文章编号:1009-3044(2021)02-0202-02
1 基本概念介绍
对应分析法又称关联分析,R-Q因子分析,对应分析是在传统因子分析基础上发展起来的一种新型多元统计分析法,相对于传统因子分析,对应分析可将研究对象的样本和变量联系在一起,综合处理,不仅降低了因子选择和因子旋转等计算过程的复杂度,而且便于直观,高效,简单地展示分析结果,适合于多分类变量数据研究。
对应分析可分为简单对应分析(只有两个分类变量)和多重对应分析(样本多于两个变量),简单对应分析是分析两个分类变量间的关系,而多重对应分析则是分析一组属性变量之间的相关性,二者均是以散点在低维空间中的行列位置表示相关强度。简单对应分析中的变量通常为分类频数,而多重对应分析中变量除分类变量外还可使用数值型变量。
2 多重对应分析的条件和步骤
2.1 多重对应分析的条件
首先,多重对应分析法不能自动筛选变量,需要用户手动操作;其次,该方法对于数据样本量要求较大,尤其对少数极端值变化较为敏感;再次,其分析结果通常以图形方式展现,对缺乏经验的用户而言容易造成误判;最后,当数据样本变量增减变换后,处理结果会产生很大差异。
2.2 多重对应分析的步骤
1)将原始数据样本经规格化和最优尺度变换处理后,得到样本概率列联表。
2)计算Z矩阵。
3)根据变量相关系数矩阵Σr和样本斜方差矩阵Σc进行多维变量因子分析和样本因子分析,并推导出结果。
4)以散点或线条在二维图上展示样本变量状态并分析其相关性。
3 具体案例分析
这里以某高校大学生心理调查问卷数据为例,共计555个有效样本,从中提取九个变量,分别从九个方面表示大学生不同的心理状态和兴趣爱好,如幸福度,自我感觉,精力水平,孤独感,情绪控制力,易怒性,户外活动,体育活动,交友等,每个变量依据程度,由低到高分为五级。案例研究的目标是探索大学生心理状态和兴趣爱好之间的相关性,分析软件采用IBM SPSS statistics,分析结果以图表方式展现,结果如下。
首先需要对原始数据九个变量作相关分析,如表1和表2的行列阵所示,经过软的后的不同变量之间相关度也有所不同,数值越大,相关度越高。表3是数据模型摘要表,反映了样本变量的信度系数,特征值及惯量等统计信息,多重对应分析将原始数据九个变量经过最优尺度变换后,得到两个维度,信度系数分别为0.718和0.591,惯量即方差贡献率分别为0.307和0.234。表3展示了各变量区分测量的结果,以坐标轴分别代表两个不同维度, 原始变量在图中不同的位置反映出该变量在不同维度上所携带的信息量,变量的某个坐标值越高,说明该变量在某个维度上关联度越强,如果变量的两个坐标值都很高,说明该变量和两个维度均有强相关性。如图中所示,变量“energylevels”和“happiness”和两个维度都有很强的相关性,而变量“loneliness”和维度1相关性较强,“moodswings”则和维度2相关度更强,至于“countrysideoutdoors”“funwithfriends”“activesport”三个变量在两个维度上的相关性均相对较弱。
图2是类别点联合图,以散点图的形式向用户展示数据样本各变量之间的相关性强弱,联合图用不同颜色的散点代表不同原始变量,标签则标注了变量频数和数值等信息,和区分测量图一样,以坐标轴表示两个不同维度,用户通过观察各个散点的坐标分布,可以分析出数据变量之间相关性。本图中增加了两根十字交叉的辅助线,将联合图分为四个象限,有助于更清楚地观察分析统计结果。首先,在第一象限中,有一些散点大体沿相同方向有规律地分布,说明这些散点所代表的变量具有较强的相关性,因而可以认为这些变量代表了一部分特征人群,尤其是“happiness”“personality”这两个变量的维度坐标值都相对较高,说明这些变量所代表的属性在相关特征人群中表现更为明显。此外,这两个变量在四个象限中的坐标分布又相当分散,则说明这两种属性在不同特征人群中区别较为明显。在第二象限中,发现另一些散点沿某个方向呈现类似规律的分布状态,同样可以理解为这部分变量代表了另一部分特征人群,并且通过进一步观察,发现这些散点变量的频数值与第一象限变量值成反比,由此说明,这两种特征人群属于截然不同的类型。第三和第四象限中,各个散点距离原点较近,并且分布较为集中,变量值也较为居中,可以认为,这部分人群属于差异相对较小,没有明显的特征属性,并且在各个方面表现较为“平均”的类型。
4 案例分析总结
通过以上多重对应分析法对高校大学生调研问卷的分析和理解,可以得出以下几个判断和结论:
1) 被调查样本依据性格爱好大体可分为三类:自信开朗型,消极自卑型,“平均”型;
2)自信开朗型人群的性格特征表现为以下几个特点:自信心十足,情绪控制力强,积极开朗,精力旺盛,乐善合群等;
3)与之对应,消极自卑型人群则表现出:自信心不足,悲观消极,性格孤僻,精神不振,易怒易躁等特点;
4)自信开朗型人群更爱好户外运动、社交、体育活动等,消极自卑型人群则正好相反;
5) 大多数“平均”型人群性格爱好位于二者之间;
6)社交,体育活动及户外运动等兴趣爱好与学生性格塑造和完善有着较强的相关性,因而在学生培养过程中应当予以重视和引导。
参考文献:
[1] 关炯晖,杨振杰.偏最小二乘回归法在海洋初级生产力影响因子分析中的应用[J].渔业科学进展,2014,35(5):19-25.
[2] 阎丽萍,余姝纬,崔超英.基于因子分析法的二级学院绩效考评研究[J].商业会计,2014(18).
[3] 李燕华,路立敏.基于因子分析的水泥行业上市公司财务绩效研究[J].现代商貿工业,2020(26).
[4] 陈媛媛.基于解释结构模型的高校辅导员职业能力因子分析[J].兵团教育学院学报,2020,30(4):30-34.
[5] 李丽媚.基于因子分析的高校阅读推广之影响因子实证研究[J].科技视界,2020(21):107-110.
【通联编辑:梁书】