因子分析在唐山市居民住房消费中的应用
2010-10-26朱艳伟张永利
朱艳伟,张永利
(1.唐山师范学院 数学与信息科学系,河北 唐山 063000;2.河北理工大学 轻工学院,河北 唐山063000)
1 引言
近年来,我国国民经济不断增长,唐山人口的人均收入在国家大好局势的带动下飞速增长,尤其是房地产行业发展迅猛,房价已从十年前几百元每平米飙升至7000元每平米。而且人民对住房的要求也由原来的五六十平米扩大至一二百平米。如今的房产市场存在着商机同时也存在着危机,为了满足人们日益增长的住房需求,开发商不加分析的盲目开发会给市场带来结构性的供不应求和供过于求。在人们日趋理智的住房消费中,影响消费者购房的主要因素是什么?哪些人需要购买大面积的住房?哪些人需要购买小面积的住房?他们的比例分别是多少?市场上需求量最大的是多大的户型?这些都是开发商和社会应该重视的问题。房价作为房地产商利润的直接来源和商品房购买者的直接付出,带动着房地产市场上买卖双方的神经,尤其是在中国住房制度实施商品化改革之后,它更加成为一个社会广泛关注的问题。现今,低收入阶层的收入水平低且在此水平下很难获得住房贷款,住房消费难以实现。中等收入家庭主要用于自住,还未将购房作为投资,对其而言,住房是一种满足生活基本需要的消费品。而高收入的家庭不再把住房仅仅当作是遮风避雨和休息的场所,而更多的是利用它来实现舒适的生活,现实地位和财富以及获取投资收益[9]。文章针对改善住房购买群体及潜在购买群体,采用实际调研的方法对数据进行了收集,应用多元统计中的因子分析和相应分析,对收集的数据进行分析处理,并得出相关结论。
2 因子分析
因子分析法[1]是把一些错综复杂关系的变量归纳为少数的几个无关的新的综合因子的一种多变量统计分析法。20世纪初斯皮尔曼(Charles Spearman)对学生智力测验成绩的统计分析被认为是因子分析的开始,其主要应用有两个方面,一是寻求变量的基本结构,简化变量系统;二是用于分类,根据因子得分值,在因子轴所构成的空间中将变量或者样本进行分类。对于多指标问题 X= (X1,X2,… ,Xp)′ ,形成背景原因是各种各样的,其共同原因称为公共因子,每一个分量Xi又有其特定的原因,称为特殊因子。设因子分析模型为:
简记为:X=AF+ε,其中 F =F1, F2…,Fm(m ≤p)为X各分量的公共因子,各 Fi的均值为0方差为1,相互独立;εi为Xi的特殊因子,只对Xi起作用;各εi均值为0且相互独立,F与ε独立,X均值为0协方差矩阵
矩阵A为因子载荷矩阵。
为了使Xi与Fj的相关关系更醒目、突出,可进一步进行因子旋转,使得Xi与Fj中某些因子相关性更强,而与Fj中的其他因子相关更弱。根据与某个因子相关关系更强的几个原始指标给该因子赋予综合的实际意义,并计算各因子Fj的得分Zj,得分函数为:
3 相应分析
相应分析[2](correspondence analysis)也称对应分析,又称R-Q型分析,它是Q型和R型因子分析基础上发展起来的一种多元统计方法,是由法国统计学家 J.P.Beozecri于1970年提出来的。相应分析把R型和Q型因子分析统一起来处理,不仅能同时反映出变量之间的结构和样本之间的结构,而且更重要的是它能反映出变量结构和样本结构之间的关系,给分析结果的解释带来很大的方便。设原始数据矩阵X = (Xij)n×p,首先对原始数据矩阵进行变换,得到过渡矩阵 Z = (Zij)n×p,其中
则可以证明p阶方阵Σc= Z ′Z就是χ距离意义下p个变量点的协差阵,而n阶方阵 Σr= ZZ′就是χ距离意义下n个样品点的协差阵,且Σr和Σc具有完全相同的非零特征根λ1, λ2,… ,λk(k ≤ min{n, p} -1)。同时可以证明,若uj为特征根λj关于Σc的特征向量,则特征根λj关于Σr的特征向量 Vj=Zuj。
这样就建立了对应分析中R型因子分析和Q型因子分析的关系,也就是说,不再需要对n阶方阵Σr求特征根和特征向量,而可以从p阶方阵Σc出发直接得到R型因子载荷阵,以及Q型因子载荷阵从而解决了Q型因子分析运算速度上的瓶颈(在实际应用中,人们常常直接利用对应分析的结果,将样品点和变量点共同画在一张二维散点图上,通过观察各散点的相对位置来判断样品之间的亲疏程度,从而达到聚类的目的。这种方法至少存在两大缺陷:一是通过主观观察得出结论,缺乏客观的分类标准;二是将k维因子载荷投影到2 维空间中,经常导致严重的信息损失)。
4 居民住房消费的相关分析
4.1 影响消费者购房的因子分析
影响住房消费的因素很多,综合考虑后,在因子分析中本文选择了以下指标构成了影响消费者购房的指标体系:X1:家庭年平均收入;X2:住房价格;X3:住房面积;X4:人口因素;X5:地段;X6:住房环境[4]。
调用SPSS统计分析软件的因子分析功能得到计算结果[3,5,7],见表1。
表1 旋转后的总体方差解释
由表1可知,第1至第6公因子的累计方差贡献率达到85.212%,其方差贡献率依次是33.322%、21.163%、12.573%、7.032%、5.996%、5.156%,这说明消费者在购房时对这六方面的考虑程度是不一样的,主要是受家庭年平均收入、住房价格的影响,其次是住房面积等。
4.2 居民住房消费的相应分析
4.2.1 对比数据
在居民的住房消费中,家庭年平均收入和住房价格是影响其消费决策的主要原因,那么我国城镇居民家庭人均可支配收入、住房消费支出情况如何(参见表2、表3)。
表2 城镇居民家庭人均可支配收入情况(单位:元)
表3 住宅平均销售价格 (单位:元/平米)
4.2.2 相关分析模型
设家庭年平均收入为行变量(用X表示),分类值在1-6之间。具体分类如下:X1为3.5万~4.5万、X2为4.5万~7.5万、X3为7.5万~9.5万、X4为9.5万~14.5万、X5为14.5万~20万、X6为20万以上。设计划购房面积为列变量(用Y表示),分类值在1-9之间。具体分类如下:Y1为80 m2以下、Y2为 80 m2~90 m2、Y3为 90 m2~100 m2、Y4为100 m2~120 m2、Y5为 120 m2~140 m2、Y6为 140 m2~160 m2、Y7为160 m2~180 m2、Y8为180 m2~ 200 m2、Y9为200 m2以上[6]。
调用SPSS统计分析软件中的相关分析过程,对行、列变量各分类的降维处理,得到结果如表4所示。
表4 总体方差矩阵
由表 4可知,前两个特征根的累计方差贡献率已达到81%,这说明用两个公因子已能解释各类别差异的主要信息。
表5 行变量各分类的因子载荷
表5表明了行变量各分类的因子载荷,从行变量的百分比看,X2(家庭年平均收入 4.5万~7.5万)占第一位,占家庭总数的45.5%,但从两个公因子贡献之和与变量对特征值的贡献来看,X5(家庭年平均收入14.5万~20万)的至最大,这说明家庭年收入在14.5万~20万的家庭在住房消费中起到非常重要的作用(可作为购房主体),在全部家庭中占有非常重要的地位。
表6 列变量各分类的因子载荷
表6表明了列变量各分类的因子载荷,从变量的百分比看,Y6(购房面积在 140 m2~160 m2)占第一位,占家庭总数的29.7%。两个公因子在Y5、Y6、Y7上的贡献率都较大,但Y5的特征值最大,说明面积在120 m2~140 m2的户型市场需求量最大。
4.2.3 结果分析
通过对表5、表6中的数据做相关分析,可得出相关结果,即家庭年收入在14.5万~20万的家庭对住房的需求最大,且面积在120 m2~140 m2的户型最受市场偏爱;家庭年收入在 7.5万~9.5万的家庭偏爱 90 m2~100 m2和100 m2~120 m2的户型,家庭年收入在9.5万~14.5万的家庭偏爱120 m2~140 m2的户型。
5 结论
在影响居民住房消费的众多因素中,家庭年收入和住房价格是影响购房标准的主要因素,在整个数据的搜集和分析过程中可以看出中收入家庭的住房需求应在 60 m2~90 m2,而中高收入的家庭对住房面积在100 m2~140 m2的户型需求量最大,因此,政府及开发商应合理分配户型比例,目前,唐山中高收入家庭基本上已经拥有了自己满意的生活住房,而低收入家庭虽然对住房有需求,但是苦于房价太高无力购买太大的户型,因此在合理分配户型的同时应当注意小户型的开发,以吸引更多的潜在购买群体。