基于收入分组数据拟合洛伦兹曲线新模型
2016-12-21侯宏涛
侯宏涛
(郑州工业应用技术学院基础教学部,河南郑州 451150)
基于收入分组数据拟合洛伦兹曲线新模型
侯宏涛
(郑州工业应用技术学院基础教学部,河南郑州 451150)
洛伦兹曲线的准确度关系到基尼系数的精度,结合2006年湖北省农村和城镇的收入分组数据,分别针对性地提出一个洛伦兹曲线新模型。通过对2种新模型的初次分析,从拟合度上可以表明拟合效果很好。新模型拟合效果从全部模型来看还是相当好的。
洛伦兹曲线;Matlab;曲线拟合;误差分析;模型对比
随着经济的发展,国家之间、国内社会成员之间收入分配差距日益扩大,贫富差距问题已成为人们日益关心和争论的热门话题[1]。
洛仑兹曲线与基尼系数分别是国际上用来衡量一个国家或地区经济部门专门化(集中化)程度及国民收入分配不平等(贫富分化)程度的坐标图形和分析指标。不仅可以用来静态地刻画一个国家或地区的财富分配情况及社会稳定性,而且可以用于检验政府政策在调节收入分配上的作用。基尼系数可以把分析结果用一束精确的具体数据表示出来,具有可量化性和确切性。然而,这一精确的数字是建立在拥有准确的洛伦兹曲线之上的。由此可见,洛伦兹曲线和基尼系数存在着密切的内在联系。
1 洛伦兹曲线新模型
本文通过2006年湖北省农村、城镇的收入分组数据(见表1),分别针对性地拟合出适合农村的洛伦兹曲线模型和适合城镇的洛伦兹曲线模型。
1.1 农村收入分组数据的洛伦兹曲线模型
2006年湖北省农村收入分组数据如表1所示。表1中,[xi,xi+1]为收入区间,单位为元;fi是该区间内的人口比例;IUi(Income Uunits)是所调查收入区间在[xi,xi+1]的单位数目;CAi(Class Average)是这些单位在区间[xi,xi+1]的平均收入;pi是[0,xi+1]中人口比例;Li是[0,xi+1]中人口拥有的总收入比例,因此(pi,Li)是洛伦兹曲线上的点。首先画出数据散点图,如图1所示。
表1 农村收入分组数据
图1 农村收入数据散点图
结合表1的数据,用最小二乘法Matlab实现,可以分别求出α、β、γ、η的值:
将所建立的新模型应用于表1的数据,绘制出农村收入数据模型拟合曲线,如图2所示。然后再通过Excel运用回归分析法做回归统计,结果如表2所示。
表2 农村收入数据模型曲线回归统计值
图2 农村收入数据模型拟合曲线图
从图2拟合曲线可以直观看出,拟合曲线非常接近数值点;从表2回归统计值可以看出,拟合度R2=0.999 999 13,拟合效果很好。
1)基于ACP100S直流蒸汽发生器(once-through steam generator,OTSG)最低稳定运行功率的要求,ACP100S反应堆功率控制和给水控制系统自动控制范围为20%满功率(full power,FP)~100%FP.
1.2 城镇收入分组数据的洛伦兹曲线模型2006年湖北省城镇收入分组数据如表3所示。
表3 城镇收入分组数据
将农村收入分组数据稍作修正,建立城镇收入分组数据的模型为:
用同样的方法求出:
将所建立的新模型应用于表3的数据,绘制出城镇收入数据模型拟合曲线如图3所示。然后再通过Excel运用回归分析法做回归统计,结果如表4所示。
图3 城镇收入数据模型拟合曲线图
表4 城镇收入数据模型曲线回归统计值
从图3拟合曲线可以直观看出,拟合曲线非常接近数值点;从表4回归统计值可以看出,拟合度R2=0.999 998 504,拟合效果很好。
2 模型对比
第3种模型,
第5种模型,
第6种模型,
第7种模型,
第8种模型,
第9种模型,
3 结论
分析表5数据,可以得出如下结论:①第2种模型的城镇收入分组数据的最大绝对误差、平均绝对误差、均方误差均大于本文模型,农村收入分组数据的平均绝对误差小于新模型,然而最大绝对误差、均方误差却大于新模型,从其拟合度0.999 998 882小于新模型可以看出,第2种模型拟合效果不如新模型;②第9种模型的农村收入分组数据的最大绝大误差虽然小于新模型,但是平均绝对误差、均方误差却大于新模型,这说明新模型的拟合效果还是要好些,从其拟合度0.999 998 117小于新模型可以看出;③第10种模型的城镇收入分组数据最大绝大误差虽然小于新模型,但是平均绝对误差、均方误差却大于新模型,这说明新模型的拟合效果较好些,从其拟合度0.999 998 437小于新模型可以看出;④第11、12、13种模型的城镇收入分组数据最大绝对误差、平均绝对误差、均方误差均大于本文模型,但是农村收入分组数据最大绝对误差、平均绝对误差、均方误差均小于本文模型,尽管如此,二者误差数据数值很接近,这可能是因为农村收入的离散性比城镇要大,故此产生一些偏差。
结合上述分析,第1种模型到第10种模型的拟合精度没有新模型效果好,第11种模型到第13模型的农村收入分组数据最大绝对误差、平均绝对误差、均方误差均小于本文模型,但是城镇收入分组数据最大绝对误差、平均绝对误差、均方误差均大于本文模型。从整体效果来看,本文对农村和城镇收入分组数据各提出的一个新模型,拟合效果较好。
表5 模型误差数据对比
[1]李聪睿.计算基尼系数的算法研究及其应用[J].广东工业大学学报,2005(2):125-128.
The Fitting New Model of Lorenz Curve Based on Revenue Packet Data
Hou Hongtao
(The Department of Fundamental Education,Zhengzhou University of Industrial Technology,Zhengzhou Henan 451150)
Accuracy of Gini Coefficient is closely related to the accuracy of the lorenz curve,combined with 2006 revenue of Hubei rural and urban packet data,a new model of lorenz curve was respectively proposed.Through the analysis of the two new models,from the fitting degree,it could be shown that the fitting effect was very good.comparative results showed that new model fitting effect among all models was still quite good.
lorenz curve;Matlab;curve-fitting;error analysis;model compare
F126.2
A
1003-5168(2016)11-0045-03
2016-10-08
侯宏涛(1988-),男,硕士,助教,研究方向:物理教学与实验。