陕甘宁5A 级景区网络关注度时空特征研究
2022-01-07王新民张登新
王新民,张登新,安 爽
(1.天水师范学院 资源与环境工程学院,甘肃 天水 741001;2.海南师范大学 地理与环境学院,海南 海口 5711583;3.兰州大学 资源环境学院,甘肃 兰州 730000)
中国互联网络信息中心(CNNIC)2021年8月发布的第48次《中国互联网络发展状况统计报告》显示,截至2021年6月,我国总体网民规模达10.11亿,其中搜索引擎用户规模7.95亿,我国在线旅行预订用户规模3.67亿,占网民整体的36.3%。由此可见,互联网作为信息传播的主要媒介,已经成为旅游者根据自己的需求与爱好,通过搜索引擎感知并获取目的地相关信息,确定旅游计划和行程的首选平台。与此同时,旅游者在搜索引擎中产生的行为数据也成为学者研究和分析相关景区网络关注度的工具。
百度指数是以行为数据为基础的数据共享平台。当前,百度搜索高达90.9%的市场占有率决定了百度指数成为网民行为数据分析的首选平台。李山等通过分析中国首批66个5A级景区网络关注度数据,发现旅游景区网络关注度变化具有时间规律性,并成为预测游客量的前兆,显示出日前兆及旬前兆效应。[1]马丽君对客流量与网络关注度进行相关分析,结果显示,气候舒适度与节假日是影响景区网络关注度的首要因素。[2]琚胜利运用耦合协调度及核密度测算法,测出乡村旅游景区网络关注度与景区引力耦合协调度呈现四种状态,耦合协调性在空间上呈现等级性、集聚性及洼地性特征。[3]孙烨等人结合协调整理论和格兰杰因果检验法,分析了实际客流量与网民搜索量之间的关系,建立ARMA模型和VAR模型,对客流量进行高精度预测。[4]曾可盈等利用GIS 空间分析法及泰尔指数,分析了全国31个省市对东北地区5A级和4A 级旅游景区网络关注度的时空特征。[5]王芳构建了省域旅游信息流网络,分析景区网络关注度空间特征,这对加强景区网络营销,促进客源市场开拓具有引导作用。[6]以上学者多以短时间尺度的百度指数为基础数据,研究对象也选定为具体某一景区或小区域的景区集群,不利于充分体现网络关注度的动态性和空间差异性。陕甘宁三省区无论地理分区还是经济文化上都存在着密切的联系,将陕甘宁三省区作为一个整体,研究2011~2019年全国31省(自治区、直辖市)对陕甘宁5A 级景区的网络关注度,有利于促进区域旅游经济的统筹发展。基于此,选用全国31省区对陕甘宁5A级景区网络关注度的百度指数,从大数据角度定量分析陕甘宁5A级景区网络关注度的时空特征。
一、数据来源与研究方法
(一)数据来源
根据文化和旅游部最新公告,陕甘宁5A级景区共20个。在拟定各个景区的搜索关键词后,利用Python 爬虫数据采集法,在百度指数查询网站(www.index.baidu.com)获取各省区2011~2019年对陕甘宁5A 级景区网络日关注度数据,科学分析并计算基于不同时空尺度各个关键词的搜索频次,从而建立基础数据库。
(二)研究方法
1.年际变动指数
年际变动指数是以2011~2019年总网络关注度的平均值去除各年的网络关注度所得的商,其数学表达式为:
式中,Q 表示年际变动指数;Yn表示第n年度景区网络关注度;i表示年度数。
2.周内分布偏度指数
其数学表达式为:
式中:Vn为第n 日网络关注度与节假日总关注度的比值,n 为网络日关注度从大到小的排列序号。Z 的取值范围是[-85.714,85.714],若Z<0,说明对景区的网络关注集中于节假日前期;若Z=0,说明景区网络关注度在节假日内对称分布;若Z>0,说明对景区的网络关注集中于节假日后期。
3.空间分布集中指数
其数学表达式为:
式中,K表示陕甘宁5A 级景区网络关注度的空间分布集中指数;Cn表示第n 个省区的景区网络关注度;L表示全国31省(市、区)的网络关注度总量;n 表示省区序数。
K 的理想取值范围在[0,100],K值愈趋近于100,说明景区网络关注度越集中于某一省区;K值愈趋近于0,说明景区网络关注度在全国范围内分布越分散。K值越接近17.96,则表明景区网络关注度稳定分散于31省(市、区)。
4.GIS空间分析法
运用ArcGIS10.6软件对隐含空间属性的数据进行可视化分析,以图像形式表现出复杂的空间信息,探究陕甘宁5A 级景区网络关注度及人均网络关注度,得出陕甘宁5A 级景区网络关注度的空间特征。
二、陕甘宁5A 级景区网络关注度的时间特征
(一)年际数据变化特征
整理2011~2019年全国对陕甘宁5A级景区网络年关注度总量数据,结果如图1,全国31个省(区)对景区的网络关注度呈现先增后降趋势。2011~2016年景区网络关注度逐年递增,但增长幅度逐渐减小,年增长率由2011年的34%降至2016年的5%,2016~2019年景区网络关注度总体呈现缓慢下降趋势。同时,基于不同终端设备,景区网络关注度也呈现规律性变化。2011~2012年,PC 端网络关注度数量高于移动端关注度,2013年PC 端和移动端网络关注度数量总体一致。2013年后移动端网络关注度高于PC 端网络关注度并快速增长,且不同客户端网络关注度的差值逐年增大。
图1 基于不同客户端陕甘宁5A级景区网络年关注度变化图
通过计算网络关注度年际变动指数,进一步分析景区网络关注度的年际变化特征,年际变动指数可以直观反映出网络关注度的年际差异。当Q值越趋近于1时,说明网络关注度的年际变化幅度越轻微,关注度越稳定;反之,当Q值越趋远于1,说明网络关注度变化幅度越剧烈,关注度越不稳定。。
通过表1可知,2011~2014年年际变动指数Q 值逐渐趋近于1,说明全国对陕甘宁5A级景区网络关注度的年际变化幅度趋于减小,关注度趋于稳定;2014~2015年年际变动指数Q值最趋近于1,网络关注度的年际变化幅度较小,关注度稳定;其余年份对景区网络关注度的年际变化幅度较大,呈不稳定且波动变化趋势。
表1 2011~2019年陕甘宁5A 级景区网络关注度年际变动指数Q统计表
(二)月际数据变化特征
季节性是旅游业的突出特点。以统计分析法计算各月网络关注度与该年网络关注度的比值,,获得景区网络关注度分月比重指数曲线图,从总体上呈现景区网络月关注度的变化特征。由图2可知,2011~2019年全国对陕甘宁5A级景区网络关注度呈现“三峰”的变化趋势,网络月关注度高峰期为3~4月、7~8月以及10月,而5~6月、9月及11月至次年1月为网络月关注度的低谷期。
图2 2011~2019年陕甘宁5A 级景区网络关注度各月比重指数曲线图
为进一步探究陕甘宁5A 级景区网络关注度的季节特征,得出2011~2019年陕甘宁5A级景区网络关注度季节分布饼状图(图3),由图可知,秋季网络关注度全年最高,占关注度总量的31.1%,夏季和春季次之,冬季最低,仅占关注度总量的19.4%。
图3 2011~2019年网络关注度季节分布比例图年网络关注度季节分布比例图
(三)节假日数据变化特征
节假日作为我国公民出行旅游的高峰期,也是景区网络关注度波动变化最为显著的特殊时期。随着社会的发展,越来越多的人习惯在春节期间陪同家人旅游,春节旅游热增温现象显著。劳动节虽然受政策影响调整为3天,但民众受传统观念影响,旅游消费需求旺盛。国庆节假期时间长,气候舒适度高,民众出行欲望强烈。因此特选取春节、劳动节和国庆节三个具有高度代表性的节假日,并分假期初期、假期中期、假期后期分析节假日网络日关注度的变化特征。
由图4、5、6可知,劳动节和国庆节期间陕甘宁5A级景区网络日关注度变化趋势具有一定的相似性,表现为节前网络关注度较低,随后持续上升,在假期中期达到顶峰之后开始逐渐回落并趋于稳定。而春节期间陕甘宁5A级景区网络日关注度呈现非规律性变化,2011~2019年景区网络日关注度在春节第二天开始急剧上升,第四天或第五天达到关注度最高值,此后逐渐回落。
图4 春节假期网络关注度变化图
图5 劳动节假期网络关注变化图
图6 国庆节假期网络关注度变化图
通过分布偏度指数进一步分析景区网络关注度在2011~2019年春节与2011~2019年国庆节的集中分布特征。计算得出(表2),春节假期网络关注度的Z值都小于0,说明景区网络关注度更多地集中在春节假期前期;国庆节假期网络关注度的Z值除2011年与2016年为负值外,其余年份都为正值,说明景区的网络关注度除2011年与2016年集中于假期前期,其余年份都集中于国庆节后期。
表2 2011~2020年陕西甘宁5A级景区网络关注度周内分布偏度指数表
三、陕甘宁5A 级景区网络关注度的空间特征
(一)网络关注度的区域分布
基于百度指数,统计出全国31省区对陕甘宁5A级景区2011~2019年份省网络关注度总量和景区人均网络关注度数据,然后利用ArcGIS可视化技术,将各省的搜索总量划分为五类,并进行分级显示。对甘肃省5A 级景区网络关注度总量最高的省份为甘肃省,其次为山西省、河南省,最低的有四川、重庆、黑龙江、吉林、辽宁等省(市);根据人均网络关注度数据,甘肃及青海、宁夏等相邻省区对甘肃5A 级景区人均网络关注度最高,其次为北京、天津、上海等经济发达地区。对宁夏5A 级景区最为关注的是广东、山东、河南等人口大省,而海南、青海、西藏等人口较少的省区对宁夏5A 级景区网络关注度总量最低;从人均数据来看,宁夏及青海、甘肃等地最为关注宁夏5A级景区,其次为内蒙古、山西等北方省份,而四川、云南、广西等西南省份人均关注度最低。陕西省5A级景区网络关注度空间分布与甘肃省具有一定的相似性,都集中于秦岭—淮河线以北的省区,而西南和东北地区的省份网络关注度总量最低;从人均数据来看,陕西、宁夏、青海及北京、天津等北部省区较为关注陕西5A级景区,而云南、广西等西南省区关注度最低。
总体来看,对陕甘宁5A 级景区最为关注的是陕甘宁本省区及粤、沪、浙等经济较为发达的省(市),其次为中部地区。从人均数据来看,甘、浙及京、津等华北部分省份对陕甘宁5A级景区人均网络关注度较高,而华南及西南省区人均网络关注度较低。究其原因,一是按照旅行距离决策模式,陕甘宁5A 级景区网络关注度因距离增加而衰减,距离近的目的地在出行上拥有较低时间成本及经济成本;二是东南部个别省份如粤、沪、浙,经济更为发达,人们拥有更多时间和资本进行长途旅游,因此人均网络关注度和总网络关注度都较高。
(二)空间分布集中度
研究特引入地理集中指数,进一步探究全国31省区对陕甘宁5A 级景区网络关注度的空间特征。由表3所示,2011~2016年K值呈现不断递增的趋势,说明31个省份对陕甘宁5A级景区网络关注度趋于集中,但变化幅度较小;2016~2019年K 值逐渐减小并呈现趋近于17.96的态势,这说明全国对陕甘宁5A 级景区网络关注度趋于分散,并且呈现出越来越稳定的态势,景区网络关注度在31个省份的分布结构不断优化。
表3 2011~2019年陕甘宁5A级景区网络关注度地理集中指数统计表
四、结论
在年度特征上,2011~2016年陕甘宁5A级景区网络总关注度逐年递增,自2016年起波动下降;在月度特征上,夏季为陕甘宁旅游旺季,冬季为淡季;节假日景区网络关注度特征表现为假期中期为网络关注度高峰时期,此后网络关注度稳定下降。在空间特征上,陕甘宁5A级景区网络关注度总量最高的为陕甘宁本省区,其次为青、新、豫等交通便捷的省份或京、沪、粤等经济发达的省份,而我国南方及东北大部分省份关注度总量较低。从人均关注度数据来看,秦岭-淮河以北省区陕甘宁5A 级景区人均网络关注度较高,而秦岭—淮河线以南地区人均网络关注度较低。