基于新浪旅游博客的河北省A级景区网络关注度研究
2015-06-07静恩明,郭风华,李仁杰,3,张军海,3*,傅学庆,3
静 恩 明,郭 风 华,李 仁 杰,3,张 军 海,3*,傅 学 庆,3
(1.河北师范大学资源与环境科学学院,河北 石家庄 050024;2.河北省科学院地理科学研究所,河北 石家庄 050021;3.河北省环境演变与生态建设实验室,河北 石家庄 050024)
基于新浪旅游博客的河北省A级景区网络关注度研究
静 恩 明1,郭 风 华2,李 仁 杰1,3,张 军 海1,3*,傅 学 庆1,3
(1.河北师范大学资源与环境科学学院,河北 石家庄 050024;2.河北省科学院地理科学研究所,河北 石家庄 050021;3.河北省环境演变与生态建设实验室,河北 石家庄 050024)
基于新浪旅游博客平台,以河北省317家A级景区为研究对象,选取景区的网络游记数量作为网络关注度的评价指标,分别从全省总体格局、不同级别、不同地市等角度,分析河北省A级景区网络关注度空间格局特征。结果表明:河北省A级景区网络关注度具有明显的空间分异和极化特征,形成了“一条高关注度带”、“两个关注度一级中心”、“三个关注度二级中心”的空间发展格局。景区级别与景区网络关注度呈低度正相关,少部分低级别景区的关注度高于多数高级别景区。旅游资源具有相似性的区域,表现出不同的关注度特征。基于A级景区的网络关注度特征,提出河北省旅游发展对策。
A级景区;网络关注度;空间格局;发展对策;新浪旅游博客
0 引言
根据中国互联网信息中心统计数据,截止到2013年底,中国网民规模达6.18亿人,互联网普及率45.8%[1]。随着互联网的发展与普及,旅游活动与互联网的联系越来越密切,如景区管理者利用互联网进行景区的宣传与服务,游客通过互联网查询旅游信息,利用博客、微博等新媒体分享“游记”、“旅游攻略”等。互联网为旅游研究开阔了新的视角,提供了丰富的数据,许多学者开始利用互联网数据进行旅游景区关注度研究。例如,网络旅游信息搜寻行为特征分析[2,3]、虚拟旅游社区对旅游者行为的影响[4]、基于旅游网站访问者人数与景区接待人数的相关性,分析信息流对旅游流的导引作用[5,6]、基于搜索引擎平台,利用百度指数、Google趋势模型,分析旅游景区网络关注度的时空变化及前兆效应[7-11]、利用游客发布的照片分析景区的关注度特征[12]。当前旅游网络关注度研究所采用的百度指数等替代指标,能够较好地表征游客的总体关注度,但未能区分潜在旅游者和实际旅游者。实际旅游者通过互联网社交平台发布的网络游记对准确表征旅游景区的网络关注度具有重要意义,后续与实际客流的相关性比较也更有针对性。
旅游博客是一种以文字、照片、视频等方式记录游客旅游过程、表达游客思想感情的网络游记。旅游博客主要运用于旅游目的地形象感知[13]、旅游营销[14]等研究中,利用旅游博客对旅游景区关注度的研究较少。新浪旅游博客是我国著名的旅游社交平台,用户覆盖率21.7%,平均在线时长370 min,平均页面浏览数7.5。本文以新浪旅游博客为数据源,采用核密度分析和均值比率方法,分析河北省A级景区网络关注度空间格局特征,为河北省旅游资源的开发、旅游规划的制定提供理论支持。
1 研究区域与数据来源
1.1 研究区域概况
河北省地处华北,位于东经113°04′~119°53′、北纬36°01′~42°37′,东临大海、南望黄河、西靠太行、北依燕山、内环京津,下辖11个地级市。河北省是全国唯一兼有高原、山地、丘陵、平原、湖泊和海滨的省份,自然景观奇特优美。河北省历史文化悠久,拥有5座国家历史文化名城,国家重点文物保护单位168处,人文旅游资源丰富多彩。区域A级景区的数量可以反映出区域旅游资源的丰富程度及旅游资源的开发水平。河北省旅游资源丰富,拥有317家A级景区,其中,1A级景区42家、2A级景区100家、3A级景区70家、4A级景区100家、5A级景区5家。
1.2 数据来源
根据国家旅游局网(http://www.cnta.cn)、河北省旅游局网(http://www.hebeitour.gov.cn/)公布的河北省A级景区数据(截止到2012年12月),得到A级景区的数量和所在区域。根据新浪旅游博客(http://blog.sina.com.cn/lm/travel/),获取各景区的网络游记。基础地理数据来源于1∶25万河北省政区图。
通过Google Earth获取各景区的地理坐标,利用ArcGIS软件制作河北省A级景区空间分布图(图1)。基于新浪旅游博客平台,以景区的名称为关键词,检索各景区的网络游记,并利用火车采集器采集网络游记。遵循数据科学性、准确性的原则对各网络游记进行分析和整理,去除景区介绍、旅行社广告等文章,最终确定各景区的网络游记数量,总计43 010篇。
图1 河北省A级景区空间分布
Fig.1 Spatial distribution of A-grade tourist attractions
2 研究方法
景区网络游记的数量可以反映出游客对景区的关注程度。本文以景区网络游记数量作为景区网络关注度的评价指标,网络游记数量越多,关注度越高;网络游记数量越少,关注度越低。采用核密度分析方法分析河北省A级景区总体网络关注度格局;选取网络游记数量的平均值、标准差,比较不同级别景区网络关注度差异;选取网络游记数量的均值比率,比较不同地市A级景区网络关注度差异。
2.1 核密度分析法
核密度分析法是空间分析中常用的非参数分析方法,一般定义为:设X1,X2,…,Xn是从分布密度函数为f的总体中抽取的独立同分布(iid)样本,估计f在某点x处的值f(x),通常有Rosenblatt-Parzen核估计:
(1)
其中,K( )为核函数,h为带宽,d为数据的维数,(x-xi)表示估计值点到Xi处的距离。在核密度估计中,核函数决定了密度值曲面的分布状况,常用的核函数有二次核函数、正态核函数、四次多项式核函数等[15,16]。带宽h的选择对计算结果影响很大,随着h的增加,空间上点密度的变化更为光滑;随着h的减小,估计点密度突兀不平。在具体的实践中h的取值是有弹性的,需要根据不同的h进行试验,探索估计点密度曲面的光滑程度[17]。
2.2 均值比率
均值比率是反映样本与总体均值差异程度的指标,常用于区域经济差异研究中。借鉴区域旅游经济差异的研究方法[18],选取网络游记数量的均值比率,分析河北省11个地市A级景区的网络关注度差异。网络游记数量的均值比率是指各地市A级景区网络游记数量与全省A级景区网络游记数量平均值的比值,其公式为:
(2)
其中,Si为各市A级景区网络游记数量的均值比率。Si越大,网络关注度越高;Si越小,网络关注度越低;Si>1表明网络关注度高于全省平均水平;Si<1表明网络关注度低于全省平均水平。
3 河北省A级景区网络关注度空间格局分析
3.1 总体网络关注度格局
吴必虎在旅游目的地选择行为研究中总结出,中国61%的城市居民出游距离在50km范围内[19]。结合河北省A级景区空间分布特征和游客的旅游行为特征,经过反复试验发现,50km带宽能清晰反映出A级景区网络关注度中心,较好地表现出景区间网络关注度差异。因此,利用ArcGIS软件,以景区的网络游记数量为权重,选择50km带宽,对河北省A级景区网络关注度进行核密度分析,得到河北省A级景区网络关注度密度图(图2)。由图2可知,河北省A级景区网络关注度具有明显的空间分异特征。关注度最高的是秦皇岛海滨地区、承德市西南部;保定、石家庄地区形成了几处大范围的较高关注度区域;西部太行山区、冀中南地区为大面积的低关注度区域。
图2 河北省A级景区网络关注度密度
Fig.2Networkattention-degreedensityofA-gradetouristattractions
河北省A级景区网络关注度具有明显的极化特征,形成了“一条高关注度带”、“两个关注度一级中心”、“三个关注度二级中心”的发展格局(表1)。1)“一条高关注带”是指秦皇岛海滨高关注度带。秦皇岛市海滨景区独具特色,21家A级景区集中分布在海滨地区,各景区协调发展,关注度差异较小。因此,形成了一条以山海关、北戴河、南戴河、黄金海岸为核心景区的海滨高关注度带。2)“两个关注度一级中心”是承德市西南部地区、白洋淀景区。承德市是一座历史文化名城、文化底蕴深厚,景区间的组合状况好,形成了以避暑山庄、金山岭长城、雾灵山为核心景区的关注度一级中心。白洋淀是华北平原上一颗璀璨的明珠,独特的北方水乡风光和红色革命文化,吸引众多的游客,形成了关注度一级中心。3)“三个关注度二级中心”是石家庄地区、保定市区及北部山区、木兰围场。石家庄地区自然风光优美,西柏坡、赵州桥的知名度较高;保定市历史悠久,旅游资源类型齐全;木兰围场为清代皇家狩猎场,草原风光独具特色,具有较高的关注度。
表1 河北省A级景区总体网络关注度格局
Table 1 Network attention-degree spatial pattern of A-grade tourist attractions
关注度格局名称景区数量游记总数核心景区核心景区游记所占比例(%)高关注度带秦皇岛海滨高关注度带215796山海关、北戴河、南戴河、黄金海岸69.8关注度一级中心承德市西南部地区125731避暑山庄、金山岭长城、雾灵山77.9白洋淀景区12680白洋淀100关注度二级中心石家庄地区214399西柏坡、赵州桥、柏林禅寺74.2保定市区及其北部山区124789野三坡、清西陵、古莲花池70木兰围场11522木兰围场100
3.2 不同级别景区网络关注度
景区级别体现出景区旅游资源的质量和景区的综合服务水平,是影响游客选择旅游目的地的重要因素[20]。利用SPSS统计软件,对景区级别与景区网络游记数量进行相关性分析,相关系数为0.321,表明景区级别与网络关注度呈低度正相关。为进一步明确景区级别与网络关注度的相互关系,研究中计算了不同级别景区的游记数量、平均值、标准差等统计指标。平均值反映景区关注度的一般水平,标准差反映景区间关注度的差异程度。
由表2、图3可知,景区级别越高,网络关注度越高,但随着景区级别由高到低,不同级别景区关注度的整体差异明显减小。5A级景区平均游记数量为2 143篇,比4A级景区高出近11倍,关注度最高。4A级景区平均游记数量为198篇,具有较高关注度,但与3A和2A级景区的关注度差异明显缩小;4A级景区平均游记数量比3A级景区高出2倍多,比2A级景区高出3倍多。4A级以下景区的整体关注度较低,其中,3A和2A级景区的关注度水平较接近,游记总数和平均游记数量相差不大;1A级景区平均游记数量仅为31篇,关注度最低。
表2 不同级别景区网络游记数量统计分析
Table 2 The statistical analysis of network travels quantity for different grade tourist attractions
景区级别景区数量游记总数最大值最小值平均值标准差5A5107172925148921435614A10019862161431982843A7059849331851612A1005120753151901A42131712113127
图3 不同级别景区网络游记数量曲线
Fig.3 The network travels quantity curve of different grade tourist attractions
景区级别越高,景区的主导性越明显。同级别景区间的关注度差异越大,说明随着景区不断发展,景区公众认知的多源驱动逐步增强。从游记数量的标准差可知,5A级景区游记数量的标准差为561,关注度最高的避暑山庄比最低的西柏坡多1 436篇游记,关注度差异最大。4A级景区游记数量的标准差为284,比5A级景区下降50%,关注度差异明显缩小。4A级以下景区间的关注度差异继续缩小,1A级景区游记数量的标准差为27,关注度差异最小。
少部分低级别景区却在互联网空间上表现活跃,关注度高于多数高级别景区。4A级的木兰围场、金山岭长城分别拥有1 614篇、1 512篇游记,依托承德皇家文化,与避暑山庄及其周围中小景区形成明显的旅游资源集群,关注度高于5A级的西柏坡景区。3A级的古莲花池兼具南北古典园林之美,拥有933篇游记,关注度高于多数4A级景区。2A级的翡翠岛、天漠分别拥有753篇、374篇游记,依托优质的海滨、独特的沙漠风光,关注度高于多数3A级和4A级景区。
3.3 不同地市景区网络关注度
河北省各地市自然地理条件和社会经济发展水平存在一定差异,致使各地市A级景区分布不均衡。根据式(2)计算各地市A级景区网络游记数量的均值比率,发现关注度差异显著。采用自然断点法,将各地市A级景区网络关注度划分为高、较高、中、低4个等级(表3)。1)保定市景区关注度最高。保定市拥有39家A级景区,9 298篇游记,占全省总数的21.62%,网络游记数量的均值比率为2.38,远远高于全省平均水平。白洋淀、野三坡、狼牙山、古莲花池等景区对全市关注度的贡献大于多数景区的群体效应。2)具有较高关注度的是承德市、秦皇岛市、石家庄市,分别拥有7 874篇、6 939篇、6 452篇游记,网络游记数量的均值比率为2.01、1.77、1.65,高于全省平均水平。承德市皇家文化与生态草原相结合,景区间组合状况好;石家庄市为省会城市,经济发展水平较高,交通便捷;秦皇岛市是我国著名的旅游城市,旅游基础设施优越,长城文化与海洋风光相结合,对游客具有较大的吸引力。3)具有中等关注度的是唐山市和张家口市,分别拥有3 668篇、3 029篇游记,网络游记数量的均值比率为0.91、0.77,低于全省平均水平。虽然唐山市和张家口市A级景区数量较多,但景区的级别较低,景区间的组合状况较差。4)邯郸市、邢台市、衡水市、沧州市、廊坊市网络游记数量的均值比率低于0.5,关注度最低。这些地区景区分散且规模较小,景区的开发利用度较低,城市旅游发展水平较为落后。
部分旅游资源具有相似性的地区,却表现出不同的关注度特征。例如,同属于滨海旅游区,秦皇岛海滨景区关注度高于唐山海滨景区;同属于生态草原旅游区,承德草原景区关注度高于张家口草原景区;同属于太行山旅游区,保定、石家庄地区的景区关注度明显高于邢台和邯郸地区。说明各区域在旅游资源禀赋的基础上,区域经济发展水平、旅游基础设施、交通状况等外源动力作用明显。
表3 河北省各地市A级景区网络关注度
Table 3 Network attention-degree of A-grade tourist attractions for each city in Hebei
地市景区数量景区占全省比重(%)游记数量游记占全省比重(%)均值比率关注度类型保定3912.30929821.622.38高承德278.52787418.312.01较高石家庄4213.25693916.131.77较高秦皇岛3310.41645215.001.65较高唐山4413.8835688.300.91中张家口3611.3630297.040.77中邯郸247.5718374.270.47低邢台257.8912552.920.32低衡水144.4212272.850.31低沧州165.058762.040.22低廊坊175.366551.520.17低
注:全省A级景区317家,各地市游记数量的平均值为3 910。
4 基于网络关注度的河北省旅游发展对策
(1)基于网络关注度空间格局,整合相似旅游资源,实现区域旅游合作共赢。应充分利用已经形成的“一条高关注度带”、“两个关注度一级中心”、“三个关注度二级中心”的总体关注度格局,加强关注度中心和邻近景区的整合力度。例如,针对冀东海滨、张承草原、太行山区等旅游资源聚集区,进行统一规划,分层次开发。在旅游线路设计上,将相似旅游景区进行组团开发,减轻山海关、北戴河、木兰围场等成熟景区的环境承载压力,积极引导唐山海滨、张家口草原、邢台和邯郸太行山自然风景区的发展。通过跨区域旅游合作,打造魅力海滨游、草原风情游、秀美太行游等主题游览线路,形成合理竞争、合作共赢的发展格局。
(2)深入挖掘历史文化内涵,培育新的旅游中心。河北省拥有丰富的旅游资源,但许多地区的旅游资源潜力未能充分挖掘出来。例如,冀中南地区历史悠久、文化底蕴深厚,但旅游景区关注度较低。冀中南地区应深入挖掘历史、民俗文化内涵,将燕赵文化与太行山自然风光结合起来,以历史文化为内源动力,以太行山自然风光为空间载体,开发新的旅游产品,培育新的旅游中心,带动冀中南地区旅游经济发展。
(3)充分利用互联网传播平台,提高旅游景区的知名度。博客、空间、微博等互联网新媒体为旅游景区品牌塑造和形象传播提供了新的平台。各景区应根据自身旅游资源的特点、发展阶段特征,采取不同的网络营销策略。5A和4A级景区已经具有较高的关注度,应充分利用互联网,提升景区整体文化内涵的认知,促进景区可持续发展;4A级以下景区整体关注度水平较低,应采用多元信息传播模式,着力培养特色旅游增长点,快速塑造景区品牌,提高景区的知名度。
5 结论与讨论
基于新浪旅游博客平台,采用核密度分析和均值比率方法,对河北省A级景区网络关注度空间格局进行初步分析,得出以下结论:1)河北省A级景区网络关注度具有明显的空间分异和极化特征,形成了“一条高关注度带”、“两个关注度一级中心”、“三个关注度二级中心”的空间发展格局。2)景区级别越高网络关注度越高,随着景区级别由高到低,景区间的关注度差异明显减小,少部分低级别景区的关注度高于多数高级别景区。3)旅游资源具有相似性的区域,表现出不同的关注度特征,说明各区域在旅游资源禀赋的基础上,外源动力作用明显。
网络游记能够较好地表征游客对旅游景区的关注程度,并进一步揭示旅游景区的发展状态和景区间的联系等。与传统的问卷调查方式相比,网络游记能够真实记录游客的旅游认知,并具有数据持续、动态积累特点,网络游记不能代替问卷调查的设计优势,二者可以相互补充、互为验证,提高旅游地理研究的精确性和全面性。本文仅以新浪旅游博客为数据源,后续可以引入多个互联网社区,并引入时间维度,开展多源数据支持下的关注度演化特征分析,也可以扩展到更多区域,进行区域的时空对比分析。
[1] 第33次《中国互联网络发展状况统计报告》[R].北京:国家互联网信息中心,2014.
[2] JORDAN E J.Online Travel Information Search Behaviors:An Information Foraging Perspective[D].Clemson:The Graduate School of Clemson University,2008.
[3] PAN B.Semantics of online tourism and travel information search on the Internet:A preliminary study[J].Information and Communication Technologies in Tourism,2002,3:320-328.
[4] ARSAL I.Influence of an online travel community on travel decisions[J].Information and Communication Technologies in Tourism,2008,3:82-93.
[5] 路紫,赵亚红,吴士峰.旅游网站访问者行为的时空分布及导引分析[J].地理学报,2007,62(6):622-632.
[6] 路紫,李娜,ZUI Z.澳大利亚旅游网站信息流对旅游人流的导引:过程、强度和机理问题[J].人文地理,2007,17(5):88-93.
[7] 李山,邱荣旭,陈玲.基于百度指数的旅游景区络空间关注度:时空分布及其前兆效应[J].地理与地理信息科学,2008,24(6):102-107.
[8] 龙茂兴,孙根年,马丽君,等.区域旅游网络关注度与客流量时空动态比较分析——以四川省为例[J].地域研究与开发,2011,30(3):82-87.
[9] 王章郡,方忠权,杜坤,等.中国自驾车旅游网络空间关注度的时空演变——基于Google搜索解析的分析[J].地域研究与开发,2011,30(5):113-117.
[10] 林志慧,马耀峰,刘宪锋,等.旅游景区网络关注度时空分布特征分析[J].资源科学,2012,34(12):2428-2434.
[11] 龙茂兴,孙根年,龙珍付.遵义红色旅游网络关注度的客流响应研究[J].地理与地理信息科学,2013,29(5):98-101.
[12] 王守成,郭风华,傅学庆,等.基于自发地理信息的旅游地景观关注度研究——以九寨沟为例[J].旅游学刊,2014,29(2):84-92.
[13] 冯捷蕴.北京旅游目的地形象的感知——中西方旅游者博客的多维话语分析[J].旅游学刊,2011,26(9):19-28.
[14] 张卫卫,王晓云.基于弱连带优势的旅游博客营销初探[J].旅游学刊,2008,23(6):10-21.
[15] SILVERMAN B W.Density Estimation for Statistics and Data Analysis[M].New York:Chapman and Hall,1986.
[16] 王远飞,何洪林.空间数据分析方法[M].北京:科学出版社,2007.66-71.
[17] 刘悦,胡伟平,王红亮,等.基于核密度估计的广佛都市区路网演变分析[J].地理科学,2011,31(1):81-86.
[18] 万绪才,王廷厚,傅朝霞,等.中国城市入境旅游发展差异及其影响因素——以重点旅游城市为例[J].地理研究,2013,32(2):337-346.
[19] 吴必虎,唐俊雅,黄安民,等.中国城市居民旅游目的地选择行为研究[J].地理学报,1997,52(2):97-103.
[20] 黄谦.旅游者目的地选择的影响因素分析[D].成都:西南交通大学,2007.
Analysis of Scenic Network Attention-Degree of A-Grade Tourist Attractions in Hebei Province:Base on Sina Travel Blogs
JING En-ming1,GUO Feng-hua2,LI Ren-jie1,3,ZHANG Jun-hai1,3,FU Xue-qing1,3
(1.CollegeofResourcesandEnvironmentScience,HebeiNormalUniversity,Shijiazhuang050024; 2.InstituteofGeographicalSciences,HebeiAcademyofSciences,Shijiazhuang050021; 3.HebeiKeyLaboratoryofEnvironmentalChangeandEcologicalConstruction,Shijiazhuang050024,China)
Base on Sina Travel Blogs,this paper takes 317 A-grade tourist attractions in Hebei Province as research objects,and selects network travels′ quantity as evaluation index of network attention-degree.The network attention-degree spatial pattern of A-grade tourist attractions was analyzed from the angles of overall pattern,different levels and different cities.The results show that:the network attention-degree of A-grade tourist attraction shows significant spatial differentiation and polarization characteristics.Forming "one high attention belt","two first class central" and "three second class central".The scenic grade shows a low positive correlation with the network attention-degree.Minority low grade scenic attention-degree is higher than majority high grade scenic.Tourism resources have similar regions,show different characteristics of attention-degree.Based on the characteristics of A-grade tourist attractions in Hebei,the development countermeasure is proposed.
A-grade tourist attractions;network attention-degree;spatial pattern;development countermeasure;Sina Travel Blogs
2014-08-25;
2014-11-29
国家自然科学基金项目(41101105 、41171105、41471127);河北省软科学研究计划项目(13406002D);河北省高校重点学科建设项目;河北省杰出青年科学基金培育项目(D2015205208)
静恩明(1989-),男,硕士研究生,主要从事旅游信息挖掘研究。*通讯作者E-mail:zhangresc@163.com
10.3969/j.issn.1672-0504.2015.03.023
F590
A
1672-0504(2015)03-0118-05