基于支持向量机的区域物流需求预测研究
2018-01-23吕雅丽
吕雅丽
[摘 要]基于支持向量机的区域物流需求预测是在追求更高的预测精度下提出的,首先选取非线性回归方法筛选影响区域物流需求的主要因子,然后用支持向量机模型对原始数据进行处理,并通过“影响区域物流需求因素”求解最优化的支持向量机核函数,最后构建影响区域物流需求的影响因子的非线性数据模型。结论表明,支持向量机模型相对多元线性回归、BP神经网络等,提高了区域物流需求的精确度,在之后的区域需求预测中将会有更加广泛的应用。
[关键词]支持向量机;区域物流需求;预测
[DOI]10.13939/j.cnki.zgsc.2018.02.144
1 引 言
在国家大力倡导物流政策的前提下,区域物流的需求数量将大幅上升,做到准确地预测区域物流需求数量就显得格外重要,其准确度将决定区域物流的规划是否合理。所以对区域物流规模的预测是所属地区政府和企业都相当关心的问题。因此对区域物流的预测需求量进行研究具有十分重要的理论和现实意义,同时为当地政府建设物流基础设施及制定物流产业规划策略提供指导建议和理论的依据。
国外学者较早地对区域物流需求进行了预测,主要从预测运输量入手对物流需求量进行估量。例如:Mudit Kulshreshtha等(2001)利用印度近35年的铁路时间序列样本构建了多元向量回归模型对印度货物需求的运输量进行了估量,实证结果表明印度的铁路运输量极大地影响着当地的经济发展。国内学者在21世纪初开始对物流预测的方法进行探究,其大多找寻物流需求量的原始数据带入物流需求的预测模型中模拟未来的物流需求变化情况。[1]从区域物流的影响因素入手对区域物流需求量的多少做出预测的研究还很少,学者陈黎(2006)从影响物流需求变化的影响因素入手,选取了物流需求指标体系,采用灰色预测模型、回归模型以及加权的组合模型,以湖北省为例对其物流需求量进行预测,实证结果表明,多种预测模型的结合可以较客观描述物流需求量的变化趋势[2]。综上所述,可以发现各种方法均有优势和缺陷。
支持向量机SVM能够有效地克服以上传统预测模型的种种问题,并且目前已成功地在函数逼近、模式的分类等实际问题中得到了广泛的应用。[3]因此本文采用支持向量机的预测模型,从影响区域物流需求的影响因素入手,利用影响区域经济的各项因素指标来计算区域物流的需求数量。
2 建模——物流需求预测的数学原理
物流需求预测采用一定的方法,借助于科学技术工具通过对以往历史物流需求量的资料了解和对市场情况的估算,对将来物流需求量的多少进行相对科学以及准确的预估、分析、测算。物流需求预测对于物流的规划、区域的发展有着极为重要的意义,它不仅有利于企业实时地了解市场需求的动态趋势,而且为企业准确地把握市场动向提供了依据,以便企业在制订计划时可以选取适当的战略和方法,从而达到利益的最大化。物流需求内涵很多种因素,是各种因素综合的效果。
物流与各种影响因素之间潜在一种隐含的、存在于内部的数学映射关系,这种映射关系不是单纯的多元线性关系,而是一种错综复杂的非线性关系,基本没有简单、准确的数学模型与之完全匹配,这就需要选用抽象、复杂的数学模型来描述影响因素及物流需求量之间的关系。
Y=X1X2,…,Xn(1)
其中,Y是物流需求,Xi是物流需求影响因素n,内含经济、政治、科技、环境等多种影响因素。
从式(1)可以看出,影响物流的需求因素是很多因素的综合结果,每种因素都有可能对Y物流的需求因素产生结果的变化,而且每一种因素的作用大小各不相同,所以综上,这种交叉、复杂的潜在关系形成了物流需求量及其影响因素之间是一种非线性、多元的映射状态,所以选取传统的单纯数学线性预测方法已经无法对其科学的预估和预测。[4]而支持向量机对于潜在非线性的关系预测较准确,满足了本论文这种无法准确获得影响因素信息,以及难度较大的区域物流需求的预测问题。所以本文选取支持向量机对未来物流需求进行预估。
3 预测模型的应用
3.1 指标选取及数据来源
鉴于收集数据的可行性,以推测山东省的区域物流需求为案例,选择货物运输量为区域物流需求指标。通过对影响山东物流需求的各因素进行研究,加之环境及行业的指标难以衡量,而且经济因素又是推测区域物流多少的最根源因素,基于数据的可行性原则,对于物流需求量的预测本文选择各经济指标进行衡量,如人均消费水平,第一、二、三产业的产值,区域外贸总额,区域零售总额等。特别地,对于山东省三大产业的产值量从两个方面进行讨论,一方面是经济结构对物流需求量的作用;另一方面是区域经济的总量情况;同时,区域物流需求量的重要组成部分还有商业流通的多少,由于山东是东部沿海地区,有对外贸易港口,港口物流占了物流需求很大的比例,所以区域外贸总额也是必不可少的(资料来自2000-2015年山东省的统计年鉴)。
3.2 数据处理
便于对SVM中的各系数进行准确的选择同时考虑到计算的难易程度,对文章的每一指标数据均采用X′ij=Xij/Xmaxj的方法进行归一化变形。其中:X′ij为第i个指标的第j个数据归一化后的结果;Xij是第i个指标的第j个数据的原始数据;Xmaxj是第i个指标里所有数据中的最大数值。下面把2000—2010年的数据指标为训练样本,2010—2015年的数据指标是测试样本,进行结果的模拟。
上面已经对“影响因素区域物流需求”的SVM预测模型进行了基本的阐述,针对模型,在MATLAB环境下在DOS窗口中进行试验的模拟与仿真测试。本文采取ε-SVM,对于核函数用。由于SVM模型需要设定参数,因为参数不同导致的结果也不尽相同,通常采用的方法是经过锁定参数空间中的一定范围,借此寻找和优化参数的定值,因此寻找最佳参数也成了SVM试验中最浪费时间的一步。通常SVM的参数选定与核函数的确定是经过交叉试验法进行选择优化的,实验结果总体上说,推测的结果满足了试验的需求,拟合程度较高。
4 结论及其展望
通过以上对区域物流需求影响因素的综述表明,区域物流的影响因素不止受到单一因素的影响,其实质是一种多元非线性的复杂结构,传统的数据模型不能对实际各区域的物流需求量进行准确的预测,由于BP神经网络的原理是经验风险的最低原则,虽然其对非线性的数据推算能力较强,对于样本量不足的原始數据,计算机的学习算法的泛化能力也会变弱。
本文根据支持向量机模型的特点,将其用到区域物流需求预测的研究中去,找到影响区域经济的因素指标与区域物流需求预测之间的联系,构建“影响区域物流需求因素”的支持向量机模型,将多项式核函数以及损失函数应用到其中,对于预测区域物流的需求量有很大的成效,取得了较为理想的成果。实证结果表明支持向量机的“影响区域物流需求因素”模型具备传统模型无法比拟的优势,它能够很快收敛于一个狭窄的范围,学习性能强,精确度较高,且对于不同样本的适应性强,证明了该模型是科学客观的。但是从未来支持向量机的学术领域来看,在参数的选择以及核函数和损失函数的确定比例上存在较大的不确定性,主要靠人为的主观经验性,而且不能求得整个问题的最优解,只能找到满意解,以后还要对此问题进行深度探究。
参考文献:
[1]耿立艳,赵鹏,张占福.基于二阶振荡微粒群最小二乘支持向量机的物流需求预测[J].计算机应用究,2012,7(1):2-11.
[2]陈黎.我国区域物流发展预测[J].统计与决策,2006(12):127-129.
[3]陈海英,张萍,柳合龙.人工鱼群算法优化支持向量机的物流需求预测模型研究[J].数学的实践与认识,2016(2):69-75.
[4]Adrangi B, Chatrath A, Raffiee K.The Demand for US Air Transport Service:A Chaos and Nonlinearity Investigation[J].Transportation Research Part E Logistics & Transportation Review, 2015,37(5): 37-53.endprint