APP下载

线性回归分析法在工资预测中的应用

2014-07-12魏正曦邱玲

关键词:平均工资四川省工资

魏正曦,邱玲

(四川理工学院计算机学院,四川自贡643000)

线性回归分析法在工资预测中的应用

魏正曦,邱玲

(四川理工学院计算机学院,四川自贡643000)

以线性回归分析方法为基础,采集由四川省政府和省统计局于1991~2012年发布的城镇在岗职工平均工资数据,研究并建立了科学的预测模型。结合我国的经济发展战略目标,预测出四川省城镇在岗职工2013~2020年的平均工资值及其截止2050年的增长趋势。最后对预测数据进行了具体分析,从实际层面评估了预测模型的建模方法和预测数据的可信度。

线性回归;数学建模;Logistic模型;工资预测

近年来,由于信息技术的迅速发展,产生了大量的数据,这些数据里面往往隐藏着许多重要的信息。但目前的数据库系统无法发现其内在的联系,无法根据现有的数据预测未来的发展趋势,导致了“大数据、小信息”的现象。随着计算机在各行业的广泛应用,数据挖掘[1]技术应运而生。数据挖掘就是从大量、随机的数据中,提取隐含在其中、人们未知但又潜在有用的信息过程。

中国经济自改革开放以来GDP每年高速增长,国民的工资收入也相应得到大幅度的提高。中国经济以这样的趋势在未来几十年内还会持续上升,城镇在岗职工的工资水平也会随之大幅提升。将数据挖掘技术应用到中国城镇在岗职工年平均工资收入的经济预测中[2],可以借鉴先进发达国家人民的工资收入水平的发展状况,选取适当的数学模型进行建模,从短期和长期的时间范围内对经济收入状况进行合理的预测,对制定地区发展规划和促进地区经济的持续、快速发展具有重要的意义。

1 平均工资的数据分析

2010年《四川省中长期人才发展规划纲要(2010~ 2020年)》正式出炉,根据这一规划纲,到2020年,四川省主要劳动年龄人口受过高等教育比例将达到20%,全省全部单位职工年平均工资将上升到S0 444元。纲要提出的发展目标是针对离退休人员在内的整个社会平均工资而言,而本文研究的对象是四川省城镇的在岗职工,他们的平均工资的期望值将比上述目标值高。

数据分析工作从省平均工资的数据采集开始。首先,将1991年~2012年四川省政府和统计局历年发布的年平均工资数据,采集到Excel软件的电子表格中,然后运用Excel的数据分析功能将数据进行图像模拟,得到四川省历年平均工资的平滑线散点图,如图1所示,据此观察22年来四川省平均工资的变化趋势。

研究发现:年平均工资的增长率在1991~1999年间增长变化率较小趋于缓慢,平均工资长幅不大;在2000~2012年间变化率急速增大趋于快速增长,平均工资增幅较大。图1对四川省年平均工资数据的这一变化规律有很直观的体现,此外,如果从宏观上进行分析,这是由于近十几年来我国经济发展迅速,平均工资变化率也随之快速增长的因素所致。

图1四川省城镇职工1991~2012年平均工资

2 Logistic预测模型

我国经济发展的战略目标是要在21世纪中叶使我国人均国民生产总值达到中等发达国家水平。而发达国家的经济和工资增长率出现初始发展,然后增长率逐步降低,直到趋于平稳和饱和的状况。这一规律很符合Logistic模型的特点,该模型比较广泛地应用于经济、生态环境等各个领域。本文建立Logistic模型[3],测算四川省城镇在岗职工2013至2020年平均工资的预测值及其截止到2050年的工资增长趋势。

Logistic模型的一般形式为:

式中的y为模型的输出,即历年的平均工资值,K、a、b为模型的参数,其中K称为饱和参数,b称为相对增长速率,a表示系数,e约为2.71S3,t表示时间,是以1990年为起点的相对年度值(例如2001减去1990)。将式(1)变形后,等式两边取自然对数可得

这里先要确定饱和参数K,K是工资增长的上限。经过比较分析将K值设置为305 S75,依据是到本世纪中叶,四川省在岗职工年平均工资不超过5万美金(约人民币305 S75元)。然后将历年平均工资数据y带入ln(K/y-1),将所得数据进行线性拟合,用Excel软件构造趋势线[4],求得线性回归函数[5]y=-0.1444x+ 5.0394,如图2所示。

其中,R2=0.9944表示趋势线的估计值与对应实际数据之间的拟合程度,由此推算得线性相关系数R= 0.9972,该数值表明线性方程的因变量ln(K/y-1)和自变量t显著相关,预测函数能建立起平均工资与年度之间的显著相关性。由线性回归函数y和式(2)求出a、b值分别等于154.3774和0.1444。Logistic模型为:

图2线性回归函数

3年平均工资的预测

影响四川省年平均工资的因素非常多,而且不同时期的影响程度也不相同,因此这里预测今后几年的平均工资水平基于两个前提条件:(1)经济的增长不受通货膨胀、自然灾害等的影响;(2)工资的增长与经济增长成正相关。这样才能从历史统计数据出发,采用Logistic模型自动挖掘内在联系与规律,科学、客观地预测年平均工资值。

3.1 预测数据图表

使用式(3)测算1991年~2020年的四川省在岗职工的年平均工资(表1)。

表1平均工资的实际值与预测值

如果从更长远的时间跨度来测算,可以从预测模型中得到1991年至2050年在岗职工的年平均工资预测值平滑线,它反映出四川省的年平均工资水平及总体增长趋势,如图3所示。

3.2 预测数据分析

依照上述方法建立起来的Logistic工资预测模型,从它测算出的1991~2012年工资数据与已知发布的实际数据相比,误差相对较小,正常情况下的误差不超过5%,个别年份因为四川省工资水平的急剧变化使得预测值与实际值之间相差13%。而且从变化率来看,今后S年内四川省在岗职工的年平均工资预测值基本符合过去十几年来的增长变化率。

从更长远的时间区间、宏观的角度来观察年平均工资的增长趋势,发现其宏观增长模式基本满足经济发展规律[6],即处于发展中的国家,在初期同发达国家相比,经济和平均工资增长一般较快,今后的20年我国仍将处在这样的高速增长时期;但增长达到一定程度后,随后的增长率就会逐步降低,直到趋于平稳。这意味着平均工资不会一直无限制的增长下去,随着经济增长的减速其增长率也会逐渐降低,整个增长趋势从图形上看呈S形曲线形状。

当然,影响年平均工资增长的因素很多,本文采用的方法只是在已有数据的基础上进行经济简单模拟,故可能存在一定的误差。短期内在基本政策不变的情况下,这个模型可以较好地预测工资增长的水平。由于年平均工资最终与经济发展直接相关,例如产业结构的调整、GDP增速的放缓、消费环境的改变等等因素都可能造成预测数据在某些年份出现一定程度的偏差,但是年平均工资增长的总体趋势不会有大的改变。

图3四川省平均工资增长趋势图

4 结束语

本模型根据线性回归分析法建立Logistic工资预测模型,建模过程中综合运用了宏观经济分析、数理推导以及计算机辅助软件等多种手段。经过公式推导,测算出四川省在岗职工未来几年内平均工资的具体数值和总体增长趋势,从而达到从微观和宏观层面预测平均工资水平及总体增长趋势的目的。

从数据分析可以看出,预测模型测算的数据与实际收入情况总体上比较吻合。即,与四川省政府和统计局历年发布的年平均工资值比,预测数据的偏差小、增长变化率十分接近,因此具有一定的参考价值。另一方面,模型中没有考虑除了时间以外的其它变化,这需要数据的观察者和使用者综合各种因素科学地判断和分析,使相关的决策更加合理、达到更令人满意的效果。

[1]Kantardzic M.数据挖掘:概念,模型,方法和算法[M].王晓海,吴志刚,译.北京:清华大学出版社,2013.

[2]穆肇南,张健.数据挖掘技术在经济预测中的应用[J].计算机仿真,2012,29(6):347_350.

[3]范国兵.一种估计Logistic模型参数的方法及应用实例[J].经济数学,2010,27(1):105_110.

[4]马丽君,孙根年,王洁洁.基于本底趋势线与小波函数的中国旅游成长及多周期分析[J].旅游科学,2009,23(6):21_27.

[5]马本江,谭春桥,陈晓红,等.大型群体多属性决策的目标函数线性回归法[J].控制与决策,2010,25(4): 546_550.

[6]何国安.社会,企业及个人工资增长率的研究[J].中外企业家,2013(16):71_73.

Application of Linear Regression Analysis in Wages Prediction

WEIZhengxi,QIU Ling
(School of ComPuter Science,Sichuan University of Science&Engineering,Zigong 643000,China)

Based on linear regression analysis,the data about the average wage of staff and workers in cities and towns released by the Sichuan Provincial Government and the Provincial Bureau of Statistics in 1991-2012,is collected and a sci_ entific Prediction model is established after a lot of research.Combined with China's strategic objective of economic develoP_ ment,the average wage of staff and workers in cities and towns of Sichuan Province from 2013 to 2020 is Predicted and its growth trend till 2050 is Pointed out.Finally,the Predicted data is analysed sPecifically.From a Practical asPect,both the modelingmethod of the Prediction model and the credibility of its Predicted data are evaluated.

linear regression;mathematicalmodeling;logistic model;wages Prediction

TP391

A

1673_1549(2014)02_0056_03

10.11863/j.suse.2014.02.12

2013_10_1S

人工智能四川省高校重点实验室开放基金项目(2009RY012)

魏正曦(1976_),男,四川自贡人,副教授,硕士,主要从事计算机应用方面的研究,(E_mail)4137S9256@qq.com

猜你喜欢

平均工资四川省工资
No.6 2021年平均工资出炉
这种情况下未续订劳动合同是否应当支付二倍工资
前三季度四川省五大支柱产业保持平稳较快增长
四川省土木建筑学会
四川省 多举措增强2500万 农民工获得感
说说索要工资那些事
不用干活,照领工资
四川省2009年主导品种集萃
让绩效工资“阳光”起来