基于多元统计分析的大学生消费调查
2012-07-06兰德新
赵 萌,兰德新
(武夷学院数学与计算机系,福建武夷山 354300)
多元线性回归分析方法[1-3]是多元统计分析的一种重要的分析方法,主要思想是寻求研究对象对各指标的线性依赖程度。该方法被广泛应用于大规模数据与多指标数据的处理。李子奈[1]在计量经济学模型方法论中对多元线性回归模型进行了深入分析,并对多个解释变量间可能出现的异方差、序列相关以及多重共线性进行了总结与探讨。彭欣[2]探讨大学生健康相关行为与学业成绩的关系,采取整群抽样的方法,抽取某综合性大学医学院177名本科生,用自行设计的大学生健康行为调查表进行调查,并查阅其必修课的学习成绩,采用多元统计分析方法对数据进行处理。潘建平[3]利用多元回归分析方法对我国近期通货膨胀的形成原因及对策进行了研究。主成分分析[4-5]是利用降维的思想将具有较强相关性的多个变量利用少数几个综合变量来代替,抓住问题的本质,尽可能减少数据的信息损失。该方法被广泛应用于多指标的数据处理问题。何晓群[4]在多元统计分析中对总体主成分分析与样本主成分分析及其性质进行了深入研究。为了了解在校大学生的消费心理和消费结构,正确引导大学生合理消费,使大学生树立正确的消费观念,本研究对武夷学院不同院系、不同年级的大学生展开调查,共调查了186名受访对象,设置了6个消费指标,对调查数据运用多元线性回归分析与主成分分析方法,并借助 SPSS统计软件[6-7]建立了数学模型。对2种分析方法所得模型进行分析,得出了相同的结论。最后对如何正确引导大学生的消费提出了建议。
1 调查设计
1)调查方案设计。以不同院系与不同年级的200名在校大学生为调查对象。采用“分层随机抽样”[8]得到数据,再利用SPSS进行分析和数据处理,得到调查结果[9-13]。
2)调查问卷设计与访谈情况。①问卷设计:通过提问来了解同学们的消费心理和消费状态;②调查问卷的发放、回收:本次调查以200名在校大学生为对象,共发放200份问卷调查表,收回186份。
2 数学模型
对186组数据进行预处理,发现数据中娱乐消费和学习用品消费有数据缺失,但作为大学生在校学习生活,一般不可能没有娱乐方面的消费,也不可能没有学习用品,故对所采集来的数据运用SPSS Statistics数据编辑器中的转换-替换缺失值功能把数据补全。所有数据处理都用补全后的完整数据。利用SPSS统计软件对所有数据进行主成分分析[14-19],结果见表1 ~3。
表1 KMO和Bartlett的检验
从KMO和Bartlett球形检验结果可以看出,显著性水平远远小于0.05,说明数据适合作主成分分析。
表2 解释的总方差
从解释的总方差结果可以看出,提取4个主成分的累计方差贡献率达到88.379%,所以,提取4个主成分对消费结构进行分析。
表3 成分矩阵
从成分矩阵可以得到各消费变量在每一主成分中所占比重。4个主成分分别设为y1、y2、y3、y4。设饮食消费为x1,生活用品消费为x2,娱乐消费为x3,学习用品消费为 x4,电话费用为 x5,总消费为x6。由表3得4个主成分的线性组合:
主成分的意义由各线性组合中权数较大的几个指标的综合意义来确定。综合因子y1中x1、x6的系数远大于其他变量的系数,所以y1主要是总消费与饮食消费这2个指标的综合反映,它代表学生消费的主要方面,刻画了学生消费的主要方向。y2主要是生活用品,它代表着学生生活用品的消费水平。y3主要是学习用品,它代表着学生在购买学习用品上的消费水平。y4中x3与x5的系数远大于其他变量的系数,所以y4主要是学生在社交方面的消费水平。这4个综合因子从4个影响学生消费的主要方面刻画了学生的消费结构和消费水平,用它们来分析学生的消费结构与消费水平具有88.379%的可靠性。y是4个主成分影响学生整体消费水平的线性组合,反映了学生的消费结构,y1系数最大,说明影响学生的消费水平中总消费以及用于饮食方面的消费占据主要方面,y2、y3、y4系数依次较小幅度地递减,说明学生购买生活用品与学习用品在除饮食消费外占据主导地位,也说明了学生对日常生活与学习的态度是认真的,学生消费中的极少部分用于社会交往。作为大学生,社会交往是必要的,但不是主要的,数据分析表明,武夷学院学生用于社交方面的消费比例是适当的。
利用SPSS统计软件对所有数据进行多元线性回归分析,结果见表4~6。
表4 Model Summary
表5 Anova
表6 Coefficients
由表4得出拟合优度为0.93,说明利用多元回归模型拟合效果很好。
F检验显著通过,说明回归模型总体线性关系显著成立。
表6表明总消费与各消费水平间的线性关系显著成立。
被解释变量:总消费y;解释变量:饮食消费x1,生活用品x2,娱乐消费 x3,学习消费x4,电话费用x5。从而得出多元线性回归模型:
从该模型可以看出,学生的饮食消费为最主要因素,其次是生活用品消费以及社交消费,得出了与主成分分析相同的结论,进一步说明了本文建立的多元线性回归模型与主成分分析法对分析在校大学生的消费结构与消费水平的有效性。
4 结论与建议
1)消费结构。目前大学生生活消费的主要组成部分是生活费用和学习消费,在生活费用中,饮食消费又是重中之重。
2)生活资金主要来源。在调查中发现90%以上的被调查者生活费是由父母提供,这是当代大学生的一种普遍状况。
3)经济独立意识较差。在调查中,很少人愿意自己兼职赚钱。显然,大家的经济独立意识较差。有部分学生还要借钱过日子,即使有剩余的钱也想着如何把剩余的钱花完。
根据分析情况对大学生消费提出建议:
1)增强独立意识,培养理财观念。理财不是一个简单的问题,需要长期培养正确运用金钱及金钱规律的能力。
2)形成良好的消费风气。形成大学生良好消费风气。学生的消费心理和行为是体现学生生活作风的重要部分,一旦良好的消费习惯得到培养和加强,就会对校风的塑造起促进作用。
[1]李子奈.计量经济学模型方法论[M].北京:清华大学出版社,2011.
[2]彭欣.大学生健康相关行为与学业成绩的关系研究[J].中国健康心理学杂志,2012(4):7-9.
[3]潘建平.我国近期通货膨胀的形成原因及对策[J].经济研究导刊,2012(8):3-6.
[4]何晓群.多元统计分析[M].北京:中国人民大学出版社,2008.
[5]Jolliffe I T.Principal Component Analysis[M].New York:Springer-Verlag Inc.,1986.
[6]朱星宇,陈勇强.SPSS多元统计分析方法及应用[M].北京:清华大学出版社,2011.
[7]吴明隆.问卷统计分析实务—SPSS操作与应用[M].重庆:重庆大学出版社,2010.
[8]陈嗣成.新编统计学原理[M].北京:首都经济贸易大学出版社,2008.
[9]郭琼.基于SPSS软件的主成分分析法探析——榆次区土地生态系统健康评价[J].山西农业大学学报:自然科学版,2012,32(1):58-62.
[10]张玉.SPSS软件和主成分分析法在牧草营养价值评价中的应用[J].安徽农业科学,40(12):7186-7188.
[11]王春枝.SPSS软件中主成分分析的计算技术解析[J].现代计算机:专业版,2011(16):6.
[12]常盛,朱亚玲.基于spss的多元线性回归算法建模的实例研究[J].数字技术与应用,2011(10):120.
[13]何琳.SPSS软件在广西教育科学研究领域的应用分析[J].广西教育,2011(27):99-101.
[14]彭书凤,田盈.基于改进主成分分析法的全国城市化水平研究[J].重庆师范大学学报:自然科学版,2007(3):69-73.
[15]张水清,黄绍敏,郭斗斗,等.基于主成分分析法的土壤肥力评价[J].安徽农业科学,2011,39(2):1096-1097,1165.
[16]吕佳.基于主成分分析的短期负荷预测模型[J].重庆师范大学学报:自然科学版,2007(3):33-36.
[17]李勇,李俊民.基于主成分分析法的周口市各县投资环境综合评价[J].安徽农业科学,2011,39(3):1612-1614.
[18]敖星,吕俊峰,赵孟娜.基于主成分分析和多元支持向量的旋转机械故障诊断方法[J].四川兵工学报,2010(9):83-86.
[19]柏家平,丁伟,李玲琴,等.基于主成分分析的曲靖市生态安全评价研究[J].安徽农业科学,2011,39(7):4158-4161.