基于GA-SVM的三峡大坝过坝货运量预测
2018-09-20
(武汉理工大学 交通学院,湖北 武汉 430063)
1 引言
货运量是货物出行交通量的派生需求,不仅与最终产品的重量或体积相关,而且与中间产品生产和销售的组织、运输方式的选择以及运输组织效率等多种因素有关。而区域经济发展水平与最终产品的产品结构、中间产品的生产和销售组织、运输组织效率等因素有着密切的关系。因此,区域经济发展与域内货运量密切相关。对于货运量的准确预测,不仅有利于中央及各省市交通主管部门对公路客货市场的发展趋势进行宏观的把握,而且有利于运输企业决策者的决策行为[1]。
2 长江流域经济发展及产业结构
长江是我国空间开发最重要的通道之一,货运量位居全球内河第一,被誉为“黄金水道”,在我国总体发展格局中具有重要战略地位。长江干线连接我国西南、华中以及华东三大城市群和经济区,沿岸从上而下依次设有重庆、武汉、南京和上海等经济中心及航运枢纽,长江干线流域内“七省二市”(云南省、四川省、重庆市、湖北省、湖南省、江西省、安徽省、江苏省和上海市)经济发展迅速且前景良好,是我国综合实力最雄厚、生产互动最频繁的区域之一。三峡枢纽[2]工程建成后极大地改善了库区上游的通航条件,进一步发挥了水运成本低廉的优势,为长江航运发展提供了新的契机。随着国家“长江经济带”战略的实施,三峡枢纽的战略地位将更加突出。在国家战略和经济发展的推动下,三峡过坝整体仍呈现增长趋势。2004-2016年三峡过坝货运量、长江流域经济发展相关历史数据见表1。由表1可以看出,2004年三峡大坝完成货运量4 308.5万t,而2016年完成过坝货运量为12 761.74万t,同比增长6.1%,相比于2004年增长了196.2%,年均增长率为25.5%。其中上行完成货运量6 900.19万t,下行完成货运量5 861.55万t,分别占总量的54.1%和45.9%。经济数据方面,近15年来区域各项数据均呈现增长趋势,经济增长速度稳定,GDP13年内增长约4倍,三大产业发展迅速,产业结构趋于合理。进出口贸易额总体上呈现稳定增长趋势,人民生活水平持续提高,居民收入不断攀升,推动消费市场运行,增幅呈现逐年提高态势。长江流域经济产业结构的发展态势对三峡枢纽中长期综合交通规划具有重要的指导作用。
表1 2004-2016年长江干线流域基础数据统计
3 三峡过坝货运量预测
3.1 基于GA-SVM的模型构建
GA-SVM是结合遗传算法和统计学习理论的合称[4]。利用遗传算法全局最优性及其自身潜在并行性的优势对支持向量机进行改进,构造出遗传算法优化支持向量机模型。支持向量机的性能很大程度上取决于参数C和σ,合理地选择参数能提高其性能,传统的参数选取方式具有一定的缺陷,而利用遗传算法进行支持向量机参数的选择能克服这种缺陷,从而改进支持向量机的性能。其基本思路是:首先对支持向量机模型参数编码,然后根据设计好的遗传算法适应度函数进行遗传操作,完成计算后将最优参数代入第一步支持向量回归机程序,并建立模型预测数据组,从而达到预测目的。
3.2 过坝货运量预测
为证明指标数据的定量分析对预测具有现实意义,采用经遗传算法改进后的支持向量机模型预测货运量。利用构建好的gaSVMcgForRegress函数来实现遗传算法的参数寻优迭代,函数接口为:其中支持向量机采用3-e-SVM,核函数采用RBF函数,惩罚参数C的取值范围为[2-5,25],RBF核函数参数σ的取值范围为[2-5,25],遗传算法的最大进化代数为200,种群最大数量取20,交叉概率取0.4,变异概率取0.01。
为了能定量分析选取的指标对于预测具有现实意义,从相关性的角度来进行计算。将表1中数据导入到SPSS软件中,对货运量与其他指标做相关性分析,得到的结果见表2。
表2 过坝货运量与其他指标相关系数表
根据表2所得数据来看,所有的相关性系数r均大于0.9,表明三峡过坝货运量与其他经济产业结构指标之间存在显著相关性。由于各数据指标之间存在巨大差异,在运用模型预测前,需要对原始数据进行归一化处理,结果见表3。
根据不同的预测目标,表3由9个影响因素和1个预测目标构成。预测目标:三峡过坝货运总量(Y0);预测的主要影响因素:GDP(X1)、第一产业产值(X2)、第二产业产值(X3)、第三产业产值(X4)、进出口贸易总额(X5)、城镇居民人均可支配收入(X6)、农村居民家庭人均纯收入(X7)、社会消费品零售总额(X8)以及固定资产投资额(X9)。首先前9行数据作为libsvm-mat工具箱中训练函数svmtrain的输入向量,而将第10行数据作为输入向量所对应的输出向量;利用这种思路对三峡过坝货运量及主要货类运量进行模型的拟合训练,得到相应的训练模型之后,再将前9行数据输入到工具箱中svmpredit函数中去,得到三峡过坝货运量的预测情况。反归一化数据见表4。
表3 归一化数据
表4 GA-SVM模型预测值及其误差
GA-SVM模型利用遗传算法的全局寻优能力搜索最优惩罚参数C和核函数参数σ,而传统的SVM模型仅依靠经验确定其值[5]。支持向量机的高维分类及映射能力的关键靠两个参数C和σ实现,仅依靠经验对其赋值存在一定的主观性,很难得到最优结构。因此利用遗传算法的全局寻优能力弥补这一“短处”,取得较好效果。GA-SVM模型原始值和预测值拟合曲线如图1所示。从图1可以看出预测值和实际值之间基本重合,误差较小。传统SVM和GA-SVM模型预测相关结果对比见表5。
表5 传统SVM和GA-SVM模型预测相关结果对比
基于表5中GA-SVM预测模型所提供的最优参数C和σ对2017-2021年的三峡过坝货运总量进行预测,基础数据通过灰色模型预测,归一化后代入程序,预测结果及反归一化数值见表6。
表6 GA-SVM模型预测值及其误差
表6反归一化数值表示2017-2021年预测货运总量分别为:13 125万t,13 652万t,14 029万t,15 589万t,15 765万t。
4 长江流域产业经济发展对三峡过坝货运量的影响
三峡过坝货运量的预测受很多因素的影响,其中最主要的就是区域经济发展和产业结构调整等因素。对表1中长江流域共9个省、直辖市的GDP、第一产业、第二产业、第三产业和同期过坝货运量作对数处理后(如图2所示),从宏观方面分析长江流域经济结构变化对货运量的影响。
从图2可以看出,2004年以来,第一产业、第二产业、第三产业总值以及货运量呈现稳定上升的趋势,货运量与GDP二者的变化趋势相关程度很高。
图2 长江流域经济发展与货运量趋势
三产业占比趋势如图3所示。从图3可以看出,三大产业呈现非均衡增长,就增速而言,第二产业平均增速较大,第一产业最小。整个长江流域仍以第二产业为主导产业,占比维持在50%左右。然而随着产业优化升级等调整政策的实行,第三产业迅猛发展,并于2015年首次占比超过50%,首次超过第二产业产值。不难发现,长江干线流域第三产业逐渐取代第二产业的主导地位,侧面上说明政府产业优化升级等调整政策取得良好的成效。
图3 三产业占比趋势
长江流域单位GDP的货运量趋势如图4所示。由图4可知,长江干线流域单位GDP货运量(即货运量与GDP的比值,单位:万t/亿元)总体处在下降趋势。原因在于,一方面长江干线流域省份加快产业结构调整步伐,在发展工业的同时,带动现代物流、信息、旅游、金融等服务业迅速发展,增加居民收入,促进社会消费;另一方面大力培育战略性新兴产业,减少高能耗高物耗的产业,导致单位GDP产生货运量逐年下降。
图4 长江流域单位GDP的货运量趋势
5 结语
本文根据搜集的9个影响因素近13年的历史数据,以及作为预测指标的三峡过坝货运总量近13年的统计数据,运用建立的GA-SVM模型进行训练和预测,经实证此模型具有高精度性,证明经济发展与货运量之间存在一定的内在联系。通过分析长江流域货运量、GDP和产业结构变化趋势,得到两个结论:一是经济总量与货运量呈现正相关;二是货运量受到内部结构即产业结构的影响。长江干线流域第三产业比重逐步增大,单位GDP产生的货运量持续下落,反映产业结构调整带来的货物附加值提高,改善过去粗放式发展忽视经济质量的情况,提高了经济质量。
本文运用该模型对未来五年过坝货运总量进行预测,为以后三峡过坝货运量预测提供了一种新思路和方法,具有一定的参考作用。