APP下载

基于樽海鞘群算法与快速学习网的旅游客流量预测研究

2021-08-12李霞刘建平纪佳琪

赤峰学院学报·自然科学版 2021年6期

李霞 刘建平 纪佳琪

摘 要:为了达到准确预测河北省旅游客流量的目标,首先利用量子Bloch球面坐标和逻辑自映射混沌对樽海鞘群算法(SSA)进行修正,得到改良的樽海鞘群算法(ISSA)。然后利用ISSA对快速学习网(FLN)的输入权值和阈值进行寻优,建立泛化能力更好的混合智能模型(ISSA-FLN)。利用建立的ISSA-FLN模型预测河北省旅游客流量,并与其他模型进行比较,结果表明,ISSA-FLN比其他模型更能准确地预测旅游客流量,为旅游客流量预测提供一种方法。

关键词:旅游客流量;樽海鞘群算法;快速学习网;Bloch球面坐标;逻辑自映射混沌

中图分类号:TP399;F59  文献标识码:A  文章编号:1673-260X(2021)06-0033-05

旅游业在21世纪已经成为许多地区新兴的经济增长点。旅游客流量预测是旅游经济学中常研究的课题之一。准确地预测旅游客流量,便于对基础设施改建、交通工具选择和住宿地点规划等任务做出明智的选择,能够预防突发事件的发生,是政府和旅游部门制定旅游有关决策的一个重要依据,同时为游客制定出行计划提供必要参考。因此,开发有效的模型来预测旅游需求成为关键问题。

国际上对旅游客流量的研究始于20世纪80年代初期,主要采用的是计量经济学模型和时间序列模型。近些年,基于人工智能(AI)的预测模型引起了越来越多的关注[1]。AI模型有三个优点:首先,考虑到旅游客流量序列的内在复杂性和旅游市场的演化性质,旅游客流量序列往往是嘈杂的、条件非平稳的。这些特点对用于分析平稳时间序列的传统预測技术,如计量经济模型和时间序列模型构成了巨大的障碍。其次,基于人工智能的模型具有强大的可行性和灵活性,这使得它们对不完美的数据具有鲁棒性。这类模型能够解释非线性复杂的数据,即使在没有输入和输出变量之间关系的先验知识的情况下,依据它们强大的可行性和灵活性同样能够处理非平稳和不完美的数据。再次,基于人工智能的模型泛化能力强,可以识别和学习输入和输出数据间的相关模式。一旦经过训练,就可以用来预测新数据集的输出。这些优点使它们非常适合解决多元非线性的复杂分析与预测问题。

考虑到这些优点,越来越多的AI技术被应用于旅游客流量预测,包括支持向量机回归[2]、模糊时间序列[3]、人工神经网络[4]等。大量的实验验证表明,这些模型通常预测性能表现良好。作为最常用的AI技术,人工神经网络模型已证明在处理数据中具有强大的可行性和灵活性,可以用于处理几乎任何类型的非线性数据。

快速学习网(FLN)[5]是最近几年提出的一种新型并行前馈神经网络。FLN在训练过程中,输入权重和隐藏层阈值随机生成,输出权值不用迭代计算,极大地减少了训练时间。而且,由于该网络是并行结构,输出层既可以接受隐藏层传输的信息,又可以直接接受输入层传输的信息,提高了对未知样本的泛化性能。目前,FLN已经被广泛应用于污染物排放[6]、汽轮机热耗率[7]、高炉铁水硅含量[8]等各种工程预测中,且取得了良好的预测效果。因此,本文利用FLN建立河北省旅游客流量预测模型。

樽海鞘群算法(SSA)[9]是一种新提出的元启发式智能优化算法。樽海鞘在觅食期间形成樽海鞘链,SSA是从这种群智能行为中抽象出来的一种优化方法,具有鲁棒性强、参数少、操作简便、速度快等优点。因此被用于许多领域。如垃圾邮件分类[10]、机器人路径规划[11]等。然而,基于群体的智能优化算法在求解多模态问题时,容易出现早熟现象,陷入局部极小,SSA也是如此。因此,对SSA进行改进提高,显得非常有必要。

为了进一步提高SSA收敛精度,加快收敛速度,防止过早收敛,本论文利用量子比特的Bloch球面坐标编码生成高质量的初始种群,然后利用逻辑自映射混沌替代原算法均匀分布生成SSA重要的参数,提高迭代过程中解的多样性,增强探索能力,从而提出改良的樽海鞘群算法(ISSA)。另一方面,随机生成的FLN输入权值和阈值,可能不是最优的网络参数,导致泛化性能降低,故本论文采用ISSA对FLN参数进行寻优,找到最优的模型参数,从而建立更加精确的旅游客流量预测ISSA-FLN模型,并与FLN、SCA[12]-FLN和ISSA-FLN三种模型进行比较。

1 FLN网络

FLN是一种单隐藏层前馈并行神经网络结构,如图1所示。

假设有任意M个不同的样本,(xs,ys)∈Rn×M×Rl×M,s=1,2,…,M,FLN的隐藏层神经元设置为m个,隐藏层的阈值向量=[b1,b2,…,bm]T,隐藏层激励函数为可微函数g(·),输入权值矩阵为W=(wji)m×n,输出层与隐藏层之间的输出权值矩阵为U=(ukj)l×m,输出层与输入层之间的输出权值矩阵为V=(vk×i)l×n。FLN输出可用公式(1)得到。

在FLN中,W和b在区间[-1,1]上随机产生,U和V根据最小二乘原理,利用矩阵的广义逆解析得到[5]。

2 樽海鞘群算法

SSA是受到深海中的樽海鞘游行和觅食行为启发提出的。多个樽海鞘在群体活动中形成许多个樽海鞘链,每个链的前端都有一个领导者,其余作为追随者。领导者指导链中每个樽海鞘的活动,跟随者遵循领导者以及链中的每个成员的行为。

假设由食物源F构成的d维搜索空间,领导者根据公式(2)更新其位置。

x1j=Fj+r1[(ubj-lbj)r2+lbj],r3≥0.5Fj-r1[(ubj-lbj)r2+lbj],r3<0.5  (2)

其中,Fj是食物源的第j维位置;x1j表示第一个樽海鞘的第j维位置,即为领导者;ubj与lbj分别代表搜索空间第j维的最大值和最小值;r2和r3为[0,1]上服从均匀分布的随机数,r1由下面(3)确定。

其中t为当前迭代次数,T为最大迭代次数。由(3)可知,r1随着迭代次数自适应递减,用来平衡算法的探索能力和开采性能。

领导者位置更新后,跟随者也随之移动,其位置更新的公式如下:

其中xij表示第i个跟随者的第j维位置,N为樽海鞘链的个数。

3 改良的樽海鞘群算法

SSA原理简单,控制参数少,鲁棒性强。然而,由于SSA中随机产生初始种群,有可能影响初始解的质量和算法的收敛速度。为此,本论文提出基于量子比特的Bloch球面坐标生成初始种群。

3.1 利用量子比特的Bloch球面坐标生成初始种群

最后,根据适应度值选出最优的N个樽海鞘链作为ISSA的初始种群。这种生成解的方式扩大了最优解的选择范围,能更大概率地找到性能更优良的初始解,从而提高算法的性能。

3.2 逻辑自映射混沌替代均匀分布产生

混沌是一种现象,它不仅有与随机性相同的特性,而且有更好的动态和统计特性以及对初始条件的敏感性和遍历性。这些特性可以保证生成解的多样性,这种多样性就足以达到多模态问题的每一个模态[14]。结合这些特性可知,混沌可以显著提高群智能优化算法的性能。

逻辑自映射混沌结构简单,生成的轨迹有很好的遍历性和均匀性[15],因此本论文使用该混沌替代SSA算法中的均匀分布产生参数r2,嵌入到领导者更新位置(2)中帮助SSA跳出局部极小,增加找到全局最优解的概率。逻辑自映射混沌的迭代公式如下:

wt+1=1-2wt2,-1≤wt≤1,t=0,1,2,…  (10)

本论文把基于量子Bloch球面坐标产生初始种群和逻辑自映射混沌产生参数r2的SSA称为ISSA。综上所述,ISSA伪代码如表1所示。

5 ISSA-FLN预测河北省旅游客流量

5.1 数据描绘

旅游数据为从1990年至2019年共30年的河北省旅游人次,如表2所示,数据来源于河北省统计年鉴。由表2可以看出河北省旅游人数从1990年的1541.8万人次到2019年的78188.0万人次,上升趋势非常明显。本文选取1990-2018年河北省游客数量构成的输入变量作为训练数据,以2018年、2019年客流量作为测试数据用于验证模型的性能。在FLN中,输入变量为依次三个年份的客流量,输出变量为输入变量对应的下一个年份的客流量,激励函数为g(x)=1/(1+e-x)。

5.2 ISSA-FLN模型的建立

为了增强FLN的逼近能力和泛化性能,利用ISSA调整FLN的输入权值和阈值,得到最优的模型参数,然后建立河北省旅游客流量混合预测SSA-FLN模型。为建立ISSA-FLN模型,优化目标函数为

其中M为训练样本的个数,wji∈[-1,1],?着=[w11,w12,…,w1n,…,wm1,wm2…,wmn,b1,…,bm]T和bj∈[-1,1],j=1,2,…,m。通过多次仿真实验,FLN隐藏层神经元的个数设置为10,所有优化算法的种群个数为30。为了防止FLN过拟合,所有优化算法的最大迭代次数设置为20。ISSA-FLN建模过程如图3所示。

5.3 仿真结果分析

为了说明ISSA-FLN模型的预测效果,本文使用均方根误差RMSE,平均绝对误差MAE和平均绝对百分比误差MAPE 3个指标来评价模型性能。

表3和表4给出了四种模型预测的河北省旅游客流量的精度比较。从表3可以看出,ISSA-FLN模型在预测样本上的RMSE为0.6751×103,MAE为0.4940×103,MAPE为7.4%,3个性能评价指标均小于其他3种模型,表明ISSA-FLN逼近能力在四种方法上是最好的。从表4可以看出,ISSA-FLN模型在预测样本上的RMSE为1.2591×103,MAE为1.0792×103,MAPE为1.4%,与其他模型相比,ISSA-FLN模型的3个性能指标明显下降。因此ISSA-FLN模型泛化性能优于其他3种模型。

图4和图5清晰地展示了ISSA-FLN的逼近性能和泛化能力。可见ISSA-FLN较为准确的跟踪客流量变化趋势,误差较小,为准确预测河北省旅游客流量提供一种方法。

6 结论

以近些年河北省旅游客流量为研究对象,利用基于量子比特的Bloch球面坐标编码和逻辑自映射混沌的ISSA优化FLN的模型参数,建立了河北省旅游客流量预测ISSA-FLN混合模型。为了验证提出模型的预测性能,本论文比较了FLN、SCA-FLN和SSA-FLN模型的预测结果。结果表明ISSA-FLN比其他模型预测旅游客流量精度更高,预测结果更加准确。

参考文献:

〔1〕Tang L A, Wang J B, Zhao C B. Mode decomposition method integrating mode reconstruction, feature extraction, and ELM for tourist arrival forecasting[J]. Chaos, Solitons & Fractals, 2021, 143: 110423.

〔2〕王兰梅,陈崇成,叶晓燕,等.网络搜索数据和GWO-SVR模型的旅游短期客流量預测[J].福州大学学报(自然科学版),2019,47(05):598-603.

〔3〕赵娟,江立辉.旅游客流量预测的模糊时间序列模型——以黄山风景区为例[J].合肥学院学报(自然科学版),2014,31(04):26-31.

〔4〕宫园园,艾宏志.RBF神经网络的境外旅游人数预测模型研究[J].计算技术与自动化,2020,39(04):159-162.

〔5〕Li G Q, Niu P F, Duan X H, et al. Fast learning network: a novel artificial neural network with a fast learning speed[J]. Neural Computing & Applications, 2014, 24 (7-8): 1683-1695.

〔6〕李霞,牛培峰,馬云鹏,等.基于改良的鸡群优化算法优化锅炉NOx排放质量浓度[J].动力工程学报,2017,37(04):293-300.

〔7〕牛培峰,吴志良,马云鹏,等.基于鲸鱼优化算法的汽轮机热耗率模型预测[J].化工学报,2017,95(03):1049-1057.

〔8〕Zhao X D, Fang Y M, Lu L, et al. Ameliorated moth-flame algorithm and its application for modeling of silicon content in liquid iron of blast furnace based fast learning network[J]. Applied Soft Computing, 2020, 94: 106418.

〔9〕Mirjalili S, AMIR H. G, Mirjalili S Z, et al. Salp Swarm Algorithm: A bio-inspired optimizer for engineering design problems [J]. Advances in Engineering Software, 2017, 114: 163-191.

〔10〕刘芳瑞,陈宏伟.基于改进樽海鞘群算法的垃圾邮件分类[J].湖北工业大学学报,2021,36(01):61 -64.

〔11〕王秋萍,王彦军,戴芳.多策略集成的樽海鞘群算法的机器人路径规划[J].电子学报,2020,48(11):2101-2113.

〔12〕Bhadoria A, Marwaha S, Kamboj V K. An optimum forceful generation scheduling and unit commitment of thermal power system using sine cosine algorithm[J]. Neural Computing and Applications, 2020, 32(01): 1-30.

〔13〕Li P C. A quantum-behaved evolutionary algorithm based on the Bloch spherical search [J]. Communications in Nonlinear Science & Numerical Simulation, 2014, 19(04): 763-771.

〔14〕Wang G G, Guo L, Gandomi A H, et al. Chaotic Krill Herd algorithm[J]. Information Sciences, 2014, 274: 17-34.

〔15〕Li X, Niu P F, Liu J P. Combustion optimization of a boiler based on the chaos and lévy flight vortex search algorithm[J]. Applied Mathematical Modelling, 2018: 58: 3:18.