基于距离判别法的中国经济社会发展水平研究*
2012-05-26李晋燕
李晋燕
(重庆师范大学数学学院,重庆 401331)
人文发展指数是经济社会发展水平的一项综合指标,对于衡量地区发展状况具有重要意义。随着市场经济的不断深化与发展,我国各省市的经济社会发展水平在不同程度上发生了变化,运用多元统计的距离判别法对经济社会发展水平进行评价。经济社会水平由3个指标构成:预期寿命、成人识字率和人均GDP的对数,这3个指标分别反映了人的长寿水平、知识水平和生活水平。
1 数据的处理
从2011年中国人类发展指数报告[1]中选取高发展水平5个、中等发展水平5个作为两组样品,另选6个省份作为待判样品作距离判别分析。
表1 中国人类发展指数统计报告
变量个数p=3,两类总体分别有5个样品,另有6个待判样品,假定两总体协差阵相等。
2 距离判别法
距离判别法是多元统计中判别分析[2]的一种统计方法。首先根据已知分类的数据,分别计算各类的重心,判别准则对任给的一次观测通过它与第几类的重心距离最近来认定它属哪类。
(1)计算两类样本均值。
(2)计算样本协差阵。
从而得
类似地
经计算
(3)求线性判别函数 W(X)[4]。
解线性方程组
(4)判别函数的检验。
①对已知类别的样品判别分类。对已知类别的样品(通常称为训练样品)用线性判别函数进行判别归类,结果如表2,全部判对。
表2 原类和判别类比较
②对判别效果作检验[5]。所谓判别效果的检验就是检验两个正态总体的均值向量是否相等,如果不存在显著差异,则判别意义不大。
检验统计量[6]为:
其中
将上边计算结果代入统计量后可得:
故在检验水平下,两个总体间差异显著,判别函数有效。
(5)对判别样品判别归类[7],结果如表3。
表3 判别样品归类表
待判结果表明:山东为高发展水平省份即第一类,重庆、陕西、四川、江西、安徽为中等发展水平省份即第二类,这与统计资料相符。
3 结论
多元统计分析方法已经越来越多地为人们广泛应用,而对各种多元统计分析方法的适用性及应用效果的检验重视不够。此处基于10个省市的指标,运用多元统计中的距离判别法得到了判别2011年我国各省市经济社会发展水平的判别函数,并经过判别函数有效性的检验,判别了3个省市的经济社会发展水平,同样将其他各省的指数分别代入判别函数可判别其经济社会发展水平,该方法科学有效且简单易行。但还存在不足之处:只选取了10个省市的指标得到的判别函数,并且只对中国其他城市中选取了6个省市进行判别归类,至于其他省市判别归类是否与统计资料相符还有待研究考证。
[1]国家统计局.中国人类发展指数统计报告[DB].国家统计局,2010
[2]李小亮,刘新平.基于多元统计分析的旅游决策研究[J].重庆工商大学学报:自然科学版,2006,23(4):354-356
[3]于秀林,任雪松.多元统计分析[M].北京:中国统计出版社,2003
[4]郭志刚.社会统计分析方法SPSS软件应用[M].北京:中国人民大学出版社,1999
[5]聂海燕.多样本距离判别检验方法应用研究[J].商业时代,2011:124-125
[6]盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社,2005
[7]余锦华,杨维权.多元统计分析与应用[M].广州:中山大学出版社,2005