基于百度指数的旅游景区游客量预测研究
——对黄先开模型的改进
2017-01-17何一夫
何一夫
(重庆市育才中学校,重庆 400050)
【经济与管理】
基于百度指数的旅游景区游客量预测研究
——对黄先开模型的改进
何一夫
(重庆市育才中学校,重庆 400050)
节假日游客井喷已经威胁到景区的生态环境。精准的预测节假日游客量能够为景区管理提供科学的支撑。黄先开等将网络搜索数据引入时间序列游客量预测研究,构建了基于百度指数的景区游客量预测模型,实现了对景区日接待游客量的有效预测,具有很高的实用价值。但该模型存在使用无法获取的预测当天网络检索变量和节假日景区接待游客量预测误差等缺陷。本文在修正变量问题的基础上,探讨了引入节假日变量提升模型预测精度的可能性,构建了新的预测模型,并以九寨沟为例进行了测算。结果表明:加入节假日变量后,百度指数游客量预测模型的整体预测精度比修正后的黄先开模型高了12%,节日预测精度高了21.5%。
游客量预测;百度指数;黄先开模型;节假日变量
游客量的骤然增加给当地带来经济和社会效益的同时,也对景区的生态环境造成破坏[1]。如何保持生态环境的可持续性和游客体验质量是景区管理亟待解决的问题。科学精准地预测节假日游客量能够让景区对游客的增加幅度有更为清晰的认识,进而合理地调配资源,安排旅游线路,实现生态保护的目的[2]。因此,寻找更为科学、精准的节假日景区游客量预测方法具有重要的现实意义。
一、黄先开游客量预测模型及其不足
(一)黄先开游客量预测模型
2013年,国内学者黄先开等发现网络检索数据与景区实际游客量之间存在显著的正相关,并提出了基于百度指数的景区游客量预测模型,通过加入反映当天游客对景区关注程度的关键词网络日检索变量(St)及其滞后项(St-j),来提升模型的预测精度[3]。黄先开模型的结构如下:
(1)
预测模型由表示前i天景区实际日接待游客量的Pt-i,反映游客对景区关注度的关键词日检索变量(St)及其滞后项(St-j),常数项(C)及误差项(μt)构成。
(二)黄先开游客量预测模型的不足
虽然加入网络检索变量提升了模型的整体预测效果,但是黄先开模型还存在以下两点不足:
(1)使用预测当天的网络检索变量降低了模型的预测精度。
Pt=3 390.9+26.5×GPt+4.3×BJt-2+0.1×
GGt-1+1.1×Pt-1+0.3×Pt-2
(2)
(2)模型的节假日游客量预测精度远远低于对工作日的游客量预测。
二、黄先开游客量预测模型的改进
(一)黄先开模型的修正
黄先开构建的百度指数游客量预测模型中使用了当期的关键词百度指数,而该数据需要到次日才能生成,降低了实证结论的说服力。笔者对黄先开游客量预测模型中使用不可获取的当期关键词百度指数问题进行了修正,去除了模型设定中的当期关键词百度指数变量。修正后的黄先开游客量预测模型结构如式(3)所示。
(3)
(二)节假日变量
构建新的预测模型之前,需要对新变量进行明确的界定,并考虑数据能否获取,以及获取数据的完整性等问题。为了保证研究的严谨性,文本给出如下关于节假日变量的说明:
节假日变量具体分为节日变量(H)和周末变量(W),并且两个变量的性质均为虚拟变量。相应的计算公式如下:
(4)
将节假日变量以调节变量的形式引入到黄先开模型中,构建了如下的预测模型:
Ht+Wt+μt
(5)
三、改进后景区游客量预测模型的实证分析
(一)数据来源及误差评价指标
利用预测方程对2014年1月9日至2014年12月31日期间四川九寨沟景区日接待游客量进行了静态预测。图1为加入节假日变量模型的预测值(PF)与真实值(P)的对比图,从中可以发现预测曲线对实际接待游客量曲线的拟合程度较高,模型的整体预测效果良好工作日的均方根误差最低,只有1 926.990,说明模型对工作日景区接待游客量的预测效果最好,其次是周末,均方根误差等于3 487.701,预测效果最差的是节日期间,均方根误差高达4 188.369。均方根误差的比较结果表明加入节假日变量的预测模型对工作日的预测效果最好,对节日景区接待游客量的预测效果最差,但是相比较黄先开模型节日比工作日的均方根误差比值已经由2.5降至2左右。
图1 加入节假日变量的模型预测人数与九寨沟景区2014年实际日接待游客数的对比
(二)加入节假日变量的预测模型与修正后的黄先开模型预测精度的对比分析
对2014年1月9日至2014年12月31日四川九寨沟接待游客量进行静态预测。根据预测结果分别计算出黄先开模型和加入节假日变量的游客量预测模型在整体、工作日、周末和节日四个时期的均方根误差值(RMSE)和平均绝对误差值(MAE)。
表1 加入节假日变量的模型与修正后的黄先开模型预测精度比较
综合而言,加入节假日变量的百度指数景区游客量预测模型比修正后的黄先开模型预测精度高出12%。节假日变量的引入对景区节日接待游客量的预测效果提升最为明显,预测精度比修正后的黄先开模型高出21.5%;对工作日接待游客量的预测效果提升次之,预测精度提升了11.7%;预测效果提升最低的是对周末游客量的预测,预测精度提高只有6.1%(预测精度提升幅度参照均方根误差变化)。加入节假日变量后,模型预测精度的提升,尤其是节日预测精度的提升,对于四川九寨沟景区管理方预测节日期间游客量,提前合理配置资源,保护景区生态环境有着重要的现实意义。
四、 结论与讨论
(一)结论
文章探讨了黄先开等提出的基于百度指数的景区游客量预测模型的缺陷,论证了引入节假日变量提升黄先开模型预测精度的可能性,建立了加入节假日变量的景区游客量预测模型,并以四川九寨沟为例,比较加入节假日变量前后的模型预测精度变化,得出以下主要结论:
第一,网络搜索数据的引入实现了对景区日接待游客量的精准预测。
第二,节假日变量的引入显著提升了黄先开模型的预测效果,尤其是对节日期间景区接待游客量的预测。
第三,需要额外就模型对节假日期间景区接待游客量的预测效果进行评估。
(二)讨论
加入节假日变量的基于百度指数的景区游客量预测模型对于节假日游客量的预测误差依旧高于对工作日接待游客量的预测。如何继续提高模型对于节假日游客量的预测精度是研究所需要持续关注的问题。
改进后的黄先开模型对5A级的景区四川九寨沟的日接待游客量有很好的预测效果,但是我们并不清楚改进后的黄先开模型对其他景区是否还有同样的预测效果。
网络检索数据已经被用于预测景区接待游客量,而签到、酒店预定等行为所产生的网络数据是否同样能够被用来预测景区游客量尚需研究。
[1] 熊鹰.生态旅游承载力研究进展及其展望[J].经济地理,2013(5).
[2] 刘柱胜,卿芳雅,戈鹏,等.九寨沟风景区日游客量预测研究[J].旅游科学,2012,26(2):59-66.
[3] 黄先开,张丽峰,丁于思.百度指数与旅游景区游客量的关系及预测研究[J].旅游学刊,2013,28(11):93-100.
(责任编辑张佑法)
何一夫(2000—),男,研究方向:互联网大数据。
10.13769/j.cnki.cn50-1011/d.2016.12.018
何一夫.基于百度指数的旅游景区游客量预测研究——对黄先开模型的改进[J].重庆与世界,2016(12):54-55.
F592
A
1007-7111(2016)12-0054-02