基于主成分回归的居民消费价格指数分析
2015-01-13冯文娟
冯文娟
摘 要:该文以主成分回归模型为理论基础,研究了1994—2012年全国31个地区的食品、烟酒及用品、居住、交通通讯、医疗保健个人用品、衣着、家庭设备及维修服务和娱乐教育文化用品及服务等居民消费价格分类指数对居民消费价格总指数的影响。通过分析发现,食品和居住指数对居民消费价格总指数的影响最大。
关键词:居民消费价格指数 主成分分析 线性回归
中图分类号:F323 文献标识码:A 文章编号:1674-098X(2014)12(a)-0211-01
居民消费价格指数也叫消费物价指数,简称CPI。它是一个反映居民家庭一般所购买的消费商品和服务价格水平变动情况的宏观经济指标。居民消费价格指数一方面同人民群众的生活密切相关,同时在整个国民经济价格体系中也具有重要的地位。它是进行经济分析和决策、价格总水平监测和调控及国民经济核算的重要指标。
该文主要运用主成分回归分析的方法,找出影响居民消费价格总指数的主要分类指数,进而提出控制物价指数的可行方案,为促进经济健康发展提供有益的参考。
1 变量的选取
该文数据全部来自《中国统计年鉴一2013》,选取了1994—2012年全国31个地区的居民消费价格总指数及分类指数的相关数据。以居民消费价格总指数为因变量,分类指数食品x1、烟酒及用品x2、居住x3、交通通讯x4、医疗保健个人用品x5、衣着x6、家庭设备及维修服务x7、娱乐教育文化用品及服务x8为自变量,来建立模型。
2 实证分析
2.1 相关分析
对因变量与所有自变量作相关分析,由SPSS软件计算得因变量与自变量的相关系数依次为0.942,0.970,0.935,0.946,0.884,0.796,0.766,0.899,说明所选自变量与因变量均高度线性相关,适合作线性回归。
2.2 共线性诊断
由于自变量的个数较多,自变量间可能存在多重共线性,这样在建立模型时就会出现严重的共线性。下面使用特征根判定法中的条件数法来诊断变量之间是否存在多重共线性,用SPSS软件计算出特征根与条件数的结果见表1。
从表1可看到,最大的条件数是800.479,说明自变量间存在严重共线性,表1中第九行x1,x2,x3的系数分别为0.62,0.96,0.65,说明x1,x2,x3之间存在严重多重共线性。该文采用主成分回归分析法来消除变量间的多重共线性。
2.3 主成分回归建模
先将原始数据标准化,标准化的变量用zy,表示。
利用SPSS软件的Factor Reduction模块对这七个变量进行主成分分析[3],经计算得第一主成分的特征跟为6.628,贡献率为82.844%,第二主成分的特征根为0.541,贡献率为6.761%,前两个主成分累计含有原始变量近90%的信息量,因此选取前两个主成分就足够了。
第一主成分Factor1和第二主成分Factor2由原始变量表示的表达式为:
以变量zy作为因变量,以主成分Factor1和Factor2作为自变量,得主成分回归方程为:
将第一主成分Factor1和第二主成分Factor2的表达式代入上式,可得到标准化的主成分回归方程为:
3 结论
从主成分回归方程可以看出8个分类指数对居民消费价格总指数均为正的影响,其中食品和居住指数对居民消费价格总指数的权数比较大。食品指数的变化与人民生活息息相关的食物支出紧密联系,粮油价格的上涨会导致与粮食关系密切的食品类工业品出厂价格上涨,从而导致食品价格指数上扬,居住价格的上涨会导致居住指数的上扬,因此为抑制CPI的快速增长,政府应加大控制在食品和居住上的价格。如在食品价格的控制上,政府应尽量减少农产品流通的中间环节;在居住价格的控制上,政府应持续加大经济试用房及廉租房的建设力度。
参考文献
[1] 何晓群,刘文卿.应用回归分析[M].2版.北京:中国人民大学出版社,2007.
[2] 阮桂海.数据统计与分析-SPSS教程[M].北京:北京大学出版社,2005.
[3] 何晓群.多元统计分析[M].北京:中国人民大学出版社,2008.endprint
摘 要:该文以主成分回归模型为理论基础,研究了1994—2012年全国31个地区的食品、烟酒及用品、居住、交通通讯、医疗保健个人用品、衣着、家庭设备及维修服务和娱乐教育文化用品及服务等居民消费价格分类指数对居民消费价格总指数的影响。通过分析发现,食品和居住指数对居民消费价格总指数的影响最大。
关键词:居民消费价格指数 主成分分析 线性回归
中图分类号:F323 文献标识码:A 文章编号:1674-098X(2014)12(a)-0211-01
居民消费价格指数也叫消费物价指数,简称CPI。它是一个反映居民家庭一般所购买的消费商品和服务价格水平变动情况的宏观经济指标。居民消费价格指数一方面同人民群众的生活密切相关,同时在整个国民经济价格体系中也具有重要的地位。它是进行经济分析和决策、价格总水平监测和调控及国民经济核算的重要指标。
该文主要运用主成分回归分析的方法,找出影响居民消费价格总指数的主要分类指数,进而提出控制物价指数的可行方案,为促进经济健康发展提供有益的参考。
1 变量的选取
该文数据全部来自《中国统计年鉴一2013》,选取了1994—2012年全国31个地区的居民消费价格总指数及分类指数的相关数据。以居民消费价格总指数为因变量,分类指数食品x1、烟酒及用品x2、居住x3、交通通讯x4、医疗保健个人用品x5、衣着x6、家庭设备及维修服务x7、娱乐教育文化用品及服务x8为自变量,来建立模型。
2 实证分析
2.1 相关分析
对因变量与所有自变量作相关分析,由SPSS软件计算得因变量与自变量的相关系数依次为0.942,0.970,0.935,0.946,0.884,0.796,0.766,0.899,说明所选自变量与因变量均高度线性相关,适合作线性回归。
2.2 共线性诊断
由于自变量的个数较多,自变量间可能存在多重共线性,这样在建立模型时就会出现严重的共线性。下面使用特征根判定法中的条件数法来诊断变量之间是否存在多重共线性,用SPSS软件计算出特征根与条件数的结果见表1。
从表1可看到,最大的条件数是800.479,说明自变量间存在严重共线性,表1中第九行x1,x2,x3的系数分别为0.62,0.96,0.65,说明x1,x2,x3之间存在严重多重共线性。该文采用主成分回归分析法来消除变量间的多重共线性。
2.3 主成分回归建模
先将原始数据标准化,标准化的变量用zy,表示。
利用SPSS软件的Factor Reduction模块对这七个变量进行主成分分析[3],经计算得第一主成分的特征跟为6.628,贡献率为82.844%,第二主成分的特征根为0.541,贡献率为6.761%,前两个主成分累计含有原始变量近90%的信息量,因此选取前两个主成分就足够了。
第一主成分Factor1和第二主成分Factor2由原始变量表示的表达式为:
以变量zy作为因变量,以主成分Factor1和Factor2作为自变量,得主成分回归方程为:
将第一主成分Factor1和第二主成分Factor2的表达式代入上式,可得到标准化的主成分回归方程为:
3 结论
从主成分回归方程可以看出8个分类指数对居民消费价格总指数均为正的影响,其中食品和居住指数对居民消费价格总指数的权数比较大。食品指数的变化与人民生活息息相关的食物支出紧密联系,粮油价格的上涨会导致与粮食关系密切的食品类工业品出厂价格上涨,从而导致食品价格指数上扬,居住价格的上涨会导致居住指数的上扬,因此为抑制CPI的快速增长,政府应加大控制在食品和居住上的价格。如在食品价格的控制上,政府应尽量减少农产品流通的中间环节;在居住价格的控制上,政府应持续加大经济试用房及廉租房的建设力度。
参考文献
[1] 何晓群,刘文卿.应用回归分析[M].2版.北京:中国人民大学出版社,2007.
[2] 阮桂海.数据统计与分析-SPSS教程[M].北京:北京大学出版社,2005.
[3] 何晓群.多元统计分析[M].北京:中国人民大学出版社,2008.endprint
摘 要:该文以主成分回归模型为理论基础,研究了1994—2012年全国31个地区的食品、烟酒及用品、居住、交通通讯、医疗保健个人用品、衣着、家庭设备及维修服务和娱乐教育文化用品及服务等居民消费价格分类指数对居民消费价格总指数的影响。通过分析发现,食品和居住指数对居民消费价格总指数的影响最大。
关键词:居民消费价格指数 主成分分析 线性回归
中图分类号:F323 文献标识码:A 文章编号:1674-098X(2014)12(a)-0211-01
居民消费价格指数也叫消费物价指数,简称CPI。它是一个反映居民家庭一般所购买的消费商品和服务价格水平变动情况的宏观经济指标。居民消费价格指数一方面同人民群众的生活密切相关,同时在整个国民经济价格体系中也具有重要的地位。它是进行经济分析和决策、价格总水平监测和调控及国民经济核算的重要指标。
该文主要运用主成分回归分析的方法,找出影响居民消费价格总指数的主要分类指数,进而提出控制物价指数的可行方案,为促进经济健康发展提供有益的参考。
1 变量的选取
该文数据全部来自《中国统计年鉴一2013》,选取了1994—2012年全国31个地区的居民消费价格总指数及分类指数的相关数据。以居民消费价格总指数为因变量,分类指数食品x1、烟酒及用品x2、居住x3、交通通讯x4、医疗保健个人用品x5、衣着x6、家庭设备及维修服务x7、娱乐教育文化用品及服务x8为自变量,来建立模型。
2 实证分析
2.1 相关分析
对因变量与所有自变量作相关分析,由SPSS软件计算得因变量与自变量的相关系数依次为0.942,0.970,0.935,0.946,0.884,0.796,0.766,0.899,说明所选自变量与因变量均高度线性相关,适合作线性回归。
2.2 共线性诊断
由于自变量的个数较多,自变量间可能存在多重共线性,这样在建立模型时就会出现严重的共线性。下面使用特征根判定法中的条件数法来诊断变量之间是否存在多重共线性,用SPSS软件计算出特征根与条件数的结果见表1。
从表1可看到,最大的条件数是800.479,说明自变量间存在严重共线性,表1中第九行x1,x2,x3的系数分别为0.62,0.96,0.65,说明x1,x2,x3之间存在严重多重共线性。该文采用主成分回归分析法来消除变量间的多重共线性。
2.3 主成分回归建模
先将原始数据标准化,标准化的变量用zy,表示。
利用SPSS软件的Factor Reduction模块对这七个变量进行主成分分析[3],经计算得第一主成分的特征跟为6.628,贡献率为82.844%,第二主成分的特征根为0.541,贡献率为6.761%,前两个主成分累计含有原始变量近90%的信息量,因此选取前两个主成分就足够了。
第一主成分Factor1和第二主成分Factor2由原始变量表示的表达式为:
以变量zy作为因变量,以主成分Factor1和Factor2作为自变量,得主成分回归方程为:
将第一主成分Factor1和第二主成分Factor2的表达式代入上式,可得到标准化的主成分回归方程为:
3 结论
从主成分回归方程可以看出8个分类指数对居民消费价格总指数均为正的影响,其中食品和居住指数对居民消费价格总指数的权数比较大。食品指数的变化与人民生活息息相关的食物支出紧密联系,粮油价格的上涨会导致与粮食关系密切的食品类工业品出厂价格上涨,从而导致食品价格指数上扬,居住价格的上涨会导致居住指数的上扬,因此为抑制CPI的快速增长,政府应加大控制在食品和居住上的价格。如在食品价格的控制上,政府应尽量减少农产品流通的中间环节;在居住价格的控制上,政府应持续加大经济试用房及廉租房的建设力度。
参考文献
[1] 何晓群,刘文卿.应用回归分析[M].2版.北京:中国人民大学出版社,2007.
[2] 阮桂海.数据统计与分析-SPSS教程[M].北京:北京大学出版社,2005.
[3] 何晓群.多元统计分析[M].北京:中国人民大学出版社,2008.endprint