基于团体旅游轨迹数据的旅游公路识别方法研究
2021-07-22彭立勇
彭立勇
(湖南省交通运输厅规划与项目办公室, 湖南 长沙 410015)
0 引言
随着大众消费时代到来以及旅游行业快速发展,公路交通对全域旅游的支撑引领作用日益凸显。2017年,国家交通运输部等六部委联合印发《关于促进交通运输与旅游融合发展的若干意见》(交规划发〔2017〕24号),明确提出加快构建便捷高效的“快进慢游”的旅游交通网络,打造精品旅游公路产品,促进交通与旅游融合发展。其中,“快进”交通网络主要实现游客远距离快速进出目的地,提高目的地的交通通达性与便捷性。“慢游”交通网络,则集交通通达、游憩、体验、运动、健身、文化、教育等复合功能于一体,主要依托连接旅游资源点的普通国省道及农村公路等构建。从现状公路网中准确评估与识别具有一定旅游交通量或周边旅游资源丰富、旅游价值较高的公路,是明确旅游公路建设需求的重要依据。
田雨佳[1]在已有干线路网的基础上,通过旅游资源评价确定网络节点并划分旅游公路的功能层次,采用混合遗传算法优化得到旅游公路网布局方案;符蕾[2]参考现有公路景观评价等级划分方法,建立旅游公路景观综合评分模型;田蓓[3]对西北五省区域旅游流与交通网络的综合发展水平和耦合协同发展程度进行时序分析;戢晓峰等[4]对云南省旅游景区的可进入性进行了定量研究,并对公路、铁路和航空3种交通方式的网络空间布局进行分析;王兆峰等[5]在分析旅游合作效率指标的基础上,构建交通网络结构下湘西地区区域旅游合作效率评价模型并进行实证分析。总体来看,目前国内对旅游公路识别的研究偏少,且较少考虑旅游者实际出行需求,或是研究计算方法复杂,难以实际应用。
因此,本文基于“两客一危”中的旅游大巴GPS定位轨迹数据进行核密度分析,筛选景区周边适宜范围内轨迹核密度数值,进行两步法聚类,分析道路旅游功能强弱和分布特征,最后选取部分路段对比其聚类结果和实际情况,进行结果验证。
1 旅游公路的功能定位
团体旅游一般指由旅行社负责组团、制定出行计划、安排所有旅游事项,其中出行较近的旅程多采用乘坐旅游大巴的交通方式。旅游大巴按车型来区分,一般是18、25、37、45、53座,相对也能反映一个旅行团的出行人数。一个旅行团人数通常在10人以上,因此旅游大巴车的一次出行能够代表多人的旅游出行需求,对其轨迹数据的统计分析在旅游公路识别中具有重要意义。
2011年4月,交通运输部、公安部、国家安监总局、工业和信息化部联合下发《关于加强道路运输车辆动态监管工作的通知》,要求所有旅游包车、三类以上班线客车和运输危险化学品、烟花爆竹、民用爆炸物品的道路专用车辆(简称“两客一危”车辆)安装使用卫星定位装置。因此,“两客一危”数据具有良好的可靠性、实用性,并且覆盖范围广泛。基于“两客一危”车辆轨迹数据,可以从中提取旅游包车相关信息,分析团体旅游出行情况及空间特征,从而实现对旅游公路的识别。
2 分析方法
2.1 核密度分析法
核密度分析法 KDE(Kernel Density Estimation)在统计学中是一种常用的基于有限样本来估计其概率密度函数的方法。在应用于地理信息系统时,其假定地理事件可以发生在空间上的任何位置,且不同的位置上事件发生的概率不同,由此计算点或线事件的空间分布模式,从而体现分析目标在空间上的集聚情况。
按照概率理论,定义核密度函数:设X1,X2,…,Xn是服从分布密度函数为总体中抽取的独立同分布(idd)样本,估计f在某点x处的值f(x),通常采用Rosenblatt-Parzen核估计方法。
(1)
式中:k0是核函数;h大于0,即带宽;n为点事件总数;(x-Xi)表示某点x到任意一个点事件Xi的距离。
2.2 两步法聚类
两步聚类法(TwoStep Cluster Algorithm)是在SPSS Modeler中使用的一种聚类算法,是BIRCH层次聚类算法的改进版本。其特点包括: ① 用于聚类的变量可以是连续变量,也可以是离散变量,适用性强;② 相比其他聚类算法,两步聚类法占用内存资源小,对大数据处理快;③ 利用统计量作为距离指标进行聚类,根据一定的统计标准自动确定最佳的类别数,结果更有保障。
两步聚类算法主要分为两个步骤: ① 通过构造聚类特征(CF)树将大量零散的数据样本浓缩成可管理数量的子簇,此时的预聚类数量要远远小于原始数据数量;② 从CF树叶节点的子簇开始利用凝聚法(agglomerative hierarchical clustering method)逐个合并子簇,直到期望的簇数量。
两步聚类法使用赤池信息量准则(AIC,Akaike information criterion)和贝叶斯信息准则(BIC, Bayesian information criterion)两项指标,在每一个步骤中计算判定AIC或者BIC的大小和类别之间最短距离的变化情况,快速处理大数据集并自动决定最佳分类数。
3 案例分析
3.1 旅游资源总体情况
以湖南省为案例进行分析。湖南省是旅游大省,拥有享誉中外的张家界、崀山等世界自然遗产,韶山、花明楼、岳麓山等10处国家5A级旅游区。其主要旅游资源如表1所示,各类旅游资源共计629个。考虑到不同类型景区出现重复、部分未评级景区准确位置难以确定等原因,将482个A级景区作为主要分析对象,其空间分布如图1所示。
表1 湖南省主要旅游资源序号景区类型数量/个1A级景区4822国家级红色旅游经典景区303国省级特色小镇284省级文旅小镇205全国乡村旅游重点村346国家级历史文化名镇、名村35合计 629
图1 湖南省A级景区空间分布图
3.2 团体旅游轨迹核密度分析
3.2.1原始数据筛选
旅游大巴GPS定位基础数据为湖南省“两客”行驶轨迹数据,由轨迹点(经纬度)构成,数据日期范围为2019年10月。研究数据均经过脱敏处理,不涉及个人隐私。从中提取车辆类型为“旅游客车”的数据,以此为研究样本进行下一步处理。
3.2.2原始数据清洗
在样本数据中,仍然存在关键字段缺失以及坐标点位异常(不落在研究范围内)的情况,该类数据会对计算与分析工作造成较大影响,因此需要对数据进行清洗,排除噪点数据。
3.2.3停驻点识别
客车出行轨迹点数据中,存在部分点位在一定时间阈值范围内空间移动较小的情况,将此类数据识别为停驻点。通过对停驻点识别,可去除轨迹点数据中冗余数据,降低分析算法复杂度。
3.2.4轨迹数据连接及清洗
轨迹数据是具有位置、时间信息的采样序列,轨迹点蕴含了对象的时空动态性,因此可以按照采集时间和车牌信息将轨迹点连接成线。由于连续性的运动轨迹被离散化表示,同时受到采样精度、位置的不确定与数据预处理的影响,部分轨迹线大幅度偏移实际道路,因此需要基于现有高速公路、普通国省道等基础数据,对轨迹线数据再次进行清洗。再次清洗完成后的团体旅游轨迹空间分布如图2所示。
图2 团体旅游轨迹分布图
3.2.5轨迹核密度分析
以清洗后的轨迹数据为基础,输入车型、轨迹线进行核密度分析,得到分析结果如图3。可以看出,由于旅游团队出行主要串接热门景点与地区,所以在旅游资源相对薄弱的地区未能体现较强的集聚效应,而是主要集中于湖南省旅游资源相对丰富的长沙-张家界-湘西州、长沙-韶山以及衡山景区等。
图3 团体旅游车流核密度分析结果图
3.3 核密度结果聚类分析
3.3.1旅游资源聚类指标确定
参照国家旅游资源评价标准,从资源特征价值和市场影响力进行考虑,确定重要程度高、旅客吸引力大的旅游资源评价指标作为聚类变量。考虑到指标量化问题,本文仅针对A级景区进行分析,以景区等级、年总接待人数、日最大接待人数为旅游资源吸引力的评价指标,作为聚类变量的组成部分(见表2)。
3.3.2旅游资源覆盖范围设定
旅游公路和旅游资源密不可分,只有路域内拥有自然、文化、历史、游憩或视觉价值且价值达标旅游资源的公路,才能认定为旅游公路。因此,首先需对道路进行筛选,整理保留离旅游资源较近的道路。根据对比多次实验结果,本文选取旅游资源周边15 km半径内的道路作为旅游公路识别对象。
利用ArcGIS软件裁剪湖南省A级景区周边15 km半径内的团体旅游轨迹核密度计算结果,得到数据如图4所示。统计覆盖范围内的核密度值,作为聚类变量之一。
表2 旅游资源吸引力影响因子和评价指标评价项目评价因子评价指标资源要素价值观赏游憩使用价值;历史文化科学艺术价值;珍惜奇特程度;规模与丰度;完整性景区等级市场影响力知名度;美誉度;市场辐射力;主题强化度年总接待量;日最大接待量
图4 团体旅游轨迹核密度旅游资源15 km覆盖范围筛选结果
3.3.3两步聚类法结果分析
以景区等级为分类变量,以轨迹核密度值、景区年总接待量、日最大接待量为连续变量,进行两步聚类。模型经多次迭代后成功收敛,最终得到3个组团。聚类后轮廓系数(Silhouette Coefficient)为0.7,接近1,说明样本聚类合理。
聚类结果如图5~7所示,对聚类结果进行特征分析。
图5 聚类结果及各组团大小
3.3.3.1 类聚类结果
图6 聚类轮廓系数
图7 聚类结果
1类聚类结果的轨迹核密度值高,多服务于5A级景区,年总接待游客量大,日最大接待量大。说明该类别轨迹所在路段距高等级景区较近,旅游资源吸引力大,道路旅游功能强。定义该类道路为一级旅游公路,参考《旅游公路技术指标》,建议该类道路采用一级公路,增设或完善旅游服务等有关设施,打造与景区资源主题相契合的高质量旅游公路。
3.3.3.2 类聚类结果
2类聚类结果的轨迹核密度值较低,多服务于3A级景区,年总接待游客量较少,日最大接待量低。说明该类别轨迹所在路段主要服务于较低等级景区,旅游资源吸引力小,景区最大接待能力小,道路旅游功能弱。定义该类道路为三级旅游公路,建议采用三级公路,以连接各旅游景区作为主要功能。
3.3.3.3 3类聚类结果
3类聚类结果的轨迹核密度值较高,多服务于4A级景区,年总接待游客量较多,日最大接待量较大。说明该类别轨迹所在路段距较高等级的景区较近,旅游资源吸引力较大,道路旅游功能较强。定义该类道路为二级旅游公路,建议该类道路采用一、二级公路,提高道路质量和景观,提升景区吸引力。
3.4 结果验证
1) 选取普通国道G107衡山大道交叉口至八里坪段作分析:按照聚类结果,该路段被聚类为第1类,即一级旅游公路。从道路现状来看,该路段位置如图8所示,是连接至5A级景区南岳衡山旅游区的重要通道,现状为二级公路,团体旅游轨迹核密度均值为86.78,其连接的南岳衡山旅游区年总接待量约550万人次,日最大接待游客量约12万人次,旅游交通吸引量大。对比结果表明该段道路的聚类结果与实际情况基本一致,聚类结果合理。
图8 路段聚类结果验证
2) 选取普通国道G240在陈赓故居周边的路段分析:按照聚类结果,该路段被聚类为第2类,即三级旅游公路。道路现状为二级公路,团体旅游轨迹核密度均值为26.57,其连接的陈赓故居为3A级景区,年总接待量约30万人次,日最大接待游客量约500人次,旅游交通吸引量较小。对比结果表明该段道路的聚类结果与实际情况基本一致,聚类结果合理。
4 结论
从规模庞大的公路网中识别出旅游公路网,对推动全域旅游公路网建设具有重要意义。本文创新性地从团体旅游视角出发,基于“两客一危”团体旅游轨迹数据,采用核密度分析方法并筛选旅游资源周边计算结果,综合资源特征价值和市场影响力因素进行聚类,最后以湖南省为对象进行案例分析。由于团体旅游出行对当前热门景点和设施相对完善的景点存在明显偏向性,因此本研究的分析结果偏重于高品质旅游资源周边道路,对正在开发和潜力较大的景点重视不够。但总的来说,本文研究方法具有较强的可操作性和适用性,聚类结果基本符合实际情况,可以为旅游公路网的识别和特征分析提供参考与路径。