基于GA-SVR的江苏省社会消费品零售总额预测
2015-03-05江苏经贸职业技术学院韩彦林
江苏经贸职业技术学院 韩彦林
社会消费品零售总额是指各种经济类型的批发和零售业、住宿和餐饮业及其他行业对城乡居民和社会集团的消费品零售额总和。反映了一个地区消费需求能力以及零售市场的规模,也体现出一定时期内人们的物质文化生活水平,是衡量一个地区经济发展水平的重要经济指标,所以对社会消费品零售总额进行预测研究有重要的理论意义和现实意义。本文在现有研究的基础上,利用遗传算法优化支持向量回归机中的参数,建立GA-SVR模型对江苏省社会消费品零售总额进行预测。
1 遗传算法
遗传算法(GA)是由Holland教授最早提出的[1],是模拟生物在自然环境中遗传和进化过程而形成的一种自适应全局优化的搜索算法。该算法使用群体搜索技术,它通过对当前群体施加选择、交叉、变异等一系列遗传操作从而产生出新一代的群体并逐步使群体进化到包含或接近最优解的状态。遗传算法的基本操作步骤包括:编码、初始化种群、计算适应度函数、选择、交叉和变异[2]。
2 支持向量回归机
支持向量机(SVM)是Vapnik等在1995年首先提出的,它是基于统计学理论,以结构风险最小化为原则,能够很好地解决小样本、非线性、高维数等问题。SVM广泛地应用于分类问题和回归问题,用于回归问题就是支持向量回归机(SVR)。SVR是通过已知训练样本点数据构造一个回归函数。对于非线性回归问题是利用一个非线性映射将输入数据映射到高维特征空间,并在这个高维空间进行线性回归。
约束条件为:
式中,为惩罚因子,为不敏感损失函数系数,和 为松弛变量。
对上述最优化问题直接求解比较复杂,而是通过它的对偶问题进行求解,为此需引入拉格朗日函数:
将上式结果代入拉格朗日函数计算可得:
从而可得原优化问题的对偶问题为:
对上述问题进行求解[3],可求得和,进而得出和,于是支持向量机的回归函数:
常用到的核函数有:多项式函数、Gauss径向基核函数(RBF)。本文选取Gauss径向基核函数。
3 基于GA-SVR的江苏省社会消费品零售总额预测模型的建立
3.1 数据选取
根据相关性分析研究[4,5],确定影响江苏省社会消费品零售总额的主要因素。将当年地区GDP、城镇居民家庭人均收入、农村居民家庭人均收入、年末常住人口、商品零售价格指数数据作为支持向量回归机的输入向量,下一年度社会消费品零售总额作为输出。本文以江苏省1990~2012年各年度社会消费品零售总额以及影响因素数据作为研究对象(数据来自《江苏省统计年鉴》,见表1),其中前20个数据作为训练数据,后3个数据作为测试数据。
表1 江苏省社会消费品零售总额相关数据
3.2 数据归一化处理
社会消费品零售总额受到多种因素的影响,影响因素往往量纲不同、数据数量级不同,需对数据进行无量纲化处理,提高预测精度。本文采用最大最小值归一化法:
将样本数据归一化到[0,1]范围内。其中,表示归一化后的数据,表示原始数据, , 表示原始数据的最大值与最小值。
3.3 SVR参数优化
由于本文采用Gauss径向基核函数,SVR模型中有3个参数需要确定,分别是惩罚因子 、核函数参数 ,不敏感损失函数系数。它们的取值对模型的预测精度有着很大的影响,惩罚因子 越大,“过拟合”现象就越明显,越小,“欠拟合”现象就越明显。为了提高预测精度,本文利用GA算法对SVR模型中的3个参数进行寻优,通过matlab软件编程运行得到SVR模型的3个参数分别为。
3.4 结果分析与说明
利用matlab软件通过训练好的GA-SVR模型对江苏省1991~2010年和2011~2013年的社会消费品零售总额进行拟合和预测,结果见图1和表2。
图1 1991~2013年江苏省社会消费品零售总额拟合和预测结果
表2 2011~2013年江苏省社会消费品零售总额预测值与实际值对比
从图1和表2可以看出基于GA-SVR模型的预测值与实际值相当吻合,相对误差较小,结果表明GA-SVR模型能够有效地对江苏省社会消费品零售总额进行预测。最后,根据2013年各个影响因素数据,利用GA-SVR模型预测出江苏省2014年社会消费品零售总额为22637亿元。
4 结语
由于社会消费品零售总额受多因素影响,以及非线性等特点,本文提出GA-SVR模型进行预测。利用遗传算法的全局搜索功能,确定SVR模型中的参数,构建SVR模型对江苏省社会消费品零售总额进行预测。结果表明,GA-SVR模型预测精度较高,为江苏省社会消费品零售总额预测提供了一种新的方法。
[1] 周明,孙树栋.遗传算法原理及应用[M].北京:国防工业出版社,1999.
[2] 杨淑莹.模式识别与智能计算—Matlab技术实现[M].北京:电子工业出版社,2011.
[3] 邓乃杨,田英杰.数据挖掘中的新方法—支持向量机[M].北京:科学出版社,2005.
[4] 郭慧敏,韩少将.浙江社会消费品零售总额增长因素分析[J].浙江统计,2009(8).
[5] 陈斌,张卫华.我国社会消费品零售总额的影响因素分析[J].广西师范学院学报(哲社会科学版),2010(31).
[6] 查进道.一种改进的基于DE-SVR 的上证指数预测模型[J].统计与决策,2012(23).
[7] 唐山,张现刚.遗传支持向量机在城市节假日电力负荷预测中的应用[J].产业与科技坛,2012(11).
[8] 赵辉,成立芹.企业人力资源结构的GA-SVM预测[J].统计与决策,2010(02).