基于GPS时空行为数据的三种游客停留点提取方法比较研究
2019-08-22董伟张斌王光奎
董伟 张斌 王光奎
基于时间地理学,利用GPS轨迹数据,研究微观(公园、景区)尺度公众游憩行为是当前环境设计、城市规划、旅游管理等多学科交叉关注的热点课题。本文以127条秦岭浅山区游客GPS轨迹为数据基础,比较了单点提取法、网格聚类法、速度-距离法三种停留点提取方式的操作流程和结果。研究表明三类方法各有优劣,单点提取法过程相对简单,信息留存度高,适合微型场地(中小型城市公园)的停留点研究;网格提取法,操作比较复杂,信息概括程度较高,效果直观,适合场地较大的场地景区(景区、大型城市公园);速度-距离法信息具有连续性,更适于线性场地空间。本研究为微观尺度的游客停留点提取提供了技术方法和实践经验。
一、背景与问题
随着中国经济的腾飞,国内城市化发展方式已逐渐由面积快速增加的量变阶段逐步过渡到了质量提升的阶段。对人居环境品质要求的提高已成为共识,规划设计已到走到了城市精细化、智慧化的新阶段。如何使城市环境规划更符合公众的行为特征,更好满足公众需求,是人居环境相关学科当前面临的重要课题。
时间地理学为刻画公众空间行为特征这一课题提供了概念框架。时间地理学由瑞典地理学家哈格斯特朗及其团队隆德学派于20世纪60年代创立并发展而来。(柴彦威,1998)时间地理学认为人的活动和行为受到自身因素和各种外界客观条件约束和限制,是可认知和测量的;通过确定各种限制因素,可确定人类潜在的行为活动范围。(柴彦威等,2018)空间行为研究的基础是行为数据,在20世纪90年代之前的数据获取方法有基于调查问卷的空间日志法、跟踪法、心智地图法等方法。基于时间地理学的微观尺度的空间游憩行为相关研究方兴未艾,是环境设计、城市规划、旅游管理等多学科交叉关注的热点课题。本文针对这一课题,以城市市郊浅山区为研究区域,以游客游憩行为链条中的停留点判别方法为研究对象,进行了初步探索。
二、核心概念解析
空间行为研究中对游客停留点的研究是重要内容。广义的游客停留点是指游客停留时长到达一定阈值的区域或位置点。该概念比较宽泛,在不同时空尺度下有相对不同的解释。例如,在时间粒度为一周,游览区域为数个城市的尺度研究中,停留点在时间尺度上主要是指超过6小时停留的住宿点,在空间尺度上是某个城市。而在一天之中某微观景区内的时空粒度下,时间阈值为数十分钟,空间占地范围为数百平米的休息区、就餐区、小型主题游览区都被认为是停留点。本研究中的停留点特指微观(公园、景区)尺度下从GPS信息中的提取停留点,是将GPS信息中信息点中的时间数据按一定时空分析粒度累加起来,超过预定时空阈值即认定为停留点。
三、实验场地与数据收集
本文研究场地定于秦岭浅山区的西安市郊段子午峪及以子午峪峪口为上山或下山通道的,游客一天左右可抵达的周边山峪。该区域位于西安市长安区南部,因域内有著名的子午道(汉代、唐代从京城通往蜀地的交通要道)而知名。该地属于关中平原与秦岭山脉之间的交接区域,交通便利,从西安市中心钟楼区域到子午峪约33公里,驾车仅需一个半小时左右,是名副其实的西安市郊浅山区区域。
本文资料以网络公开的游客的行为轨迹为数据基础。数据采集以子午峪口为上山地点或下山地点的轨迹,时间跨度为2012-2019年,共收集143條,经过对轨迹的清洗,删除重复、信号丢失过多,位置错误的轨迹,最终保留124条轨迹。轨迹中,最短时间53分钟,最长时间25小时,最长距离60.3公里,最短距离2.2公里,轨迹点总计222 765个。
四、三种方法的操作过程
对比实验以ESRI Arcgis地理信息系统为操作平台,采集的轨迹数据文件类型为GPX格式,该格式是一种轻量的GPS交换数据格式,目前主流的GPS设备均能输出这一格式。论文中的三种停留点提取方法有一些通用的基础步骤。首先,将所有通过筛选的轨迹数据通过数据转换功能导入Arcgis桌面版,导入后获取的是一组点要素数据,在组中每一个点要素均带有多个属性,属性信息一般包括轨迹ID、坐标点经度、坐标点纬度、日期-时间数据。由于原始的轨迹数据的坐标通常是WGS1984大地坐标,因此导入成功后,首先要对轨迹进行投影处理,将大地坐标转换为UTM墨卡托投影,在投映时需格外注意投影条带号的选择问题,以防投影错误。另外,Arcgis平台中的地图数据底图采用的是经过投影处理的研究区域的卫星遥感影像。
(一)网格提取法
网格提取法是地理学、景观生态学等常用的定量分析场地数据的统计方法,它的实质是降低场地分辨率(粒度),减少信息冗余,帮助分析者快速掌握适宜尺度的场地信息方法。它针对所需的场地某种属性和实际需要,选择合适的分析粒度,进而将场地利用欧式几何手段,按照分析粒度要求,均匀地将场地分成数量若干的格网,并进一步统计每一个格网内的属性值,最终呈现较低分辨率的场地信息格。时空行为学下的游客停留点的提取方法与地理学网格提取法从逻辑上看并无区别,只不过将某种地理属性置换为了时间属性。
利用网格提取法提取游客停留点的具体操作方法如下。首先,应用追踪统计工具获取每一条轨迹中每一个单要素点的累积停留时间,其次,将微观景区以垂直视角格网形式进行分割,要说明的是,网格间距的选取即空间分析粒度,要基于设计需求具体情况具体讨论。再次,通过要素空间链接的方式,聚合所有轨迹点上累积的时间数据,并以此字段为属性值将要素转换为栅格。最后,通过重分类工具,将超出预设时间阈值的栅格要素值设置为1,其他栅格赋值为0。通过对停留次数进行叠加,再次设置需要的阈值,获取格网式样停留点。
(二)单点直接提取法
直接提取法是针对GPS轨迹点数据的特点而采取的方法。方法的实质是审视所有GPS点数据中的时间信息,将数据中所有大于预定阈值时间的GPS点要素全部提取出来,并以点密度分析等工具进行信息概括化显示。
利用直接提取法提取游客停留点的具体操作方法如下。第一步与网格提取法一致,应用追踪统计工具获取每一条轨迹中每一个单要素点的累积停留时间。第二步,将所有的轨迹进行要素合并。第三步,以预先设定的时间阈值为标尺,应用属性表的提取工具将超过阈值的轨迹点提取出来。至第三步一万平米以下的微型场地,已可清晰的表述。如果场地过大,信息点过于杂乱,可应用第四步,即选择合适的搜索半径和形态,进行所有提取轨迹点的点密度分析,得到概化后的类似于网格提取法的栅格停留点数据。
(三)速度-距离法
利用GPS速度-距离信息判定停留点,当轨迹点在空间上呈现团状结构,或线性结构较,并停留较长时间,此时GPS信息点中的速度将较低,利用这一特點提取所有速度低于预定阈值的连续的轨迹点,也可将这些连续的轨迹点转为线性要素或利用工具转化为栅格,进行概括化处理。
利用速度-距离法提取游客停留点的具体操作方法如下。第一步,利用追踪统计工具,审视所有轨迹点的速度信息,以预定的速度信息为阈值,提取所有低于阈值的轨迹点。第二步,观察所有提取出的点数据,连续性超过预定设置,或时间高于阈值的连续点判定为停留区域,或休憩型游览区域,将这些连续点转化为栅格要素,并进行重分类。第三步,进行与上文网格提取法中的叠加操作,将停留超过一定人次的要素再次提取出来。
综上,从步骤上可以看出,三种提取方法中网络提取法步骤最为复杂,既考虑了单人停留的时间和停留范围(网格大小),又进行了多人次的叠加判断,涉及了要素与栅格转换和栅格叠加操作。速度-距离法步骤比网络提取法简单,省去了分隔场地,链接要素这一操作。单点提取法过程最简单,合并所有轨迹点数据,直接以时间为标尺提取轨迹点,不需要提前确定划定空间网格,也不需要网格提取法、速度距离法中的基于停留概率的二次叠加判断。
五、提取结果与讨论
本课题为了对比方便,网格法以25×25米为基本粒度,以180秒为停留判定阈值,获取停留网格。以样本数量的20%以上人停留判定为停留点,结果见图1。单点提取法以180秒为阈值,进行提取后又进行了点密度分析,结果见图2。速度-距离法结果与网格法类似,仅在栅格排布上有所不同,故未附图。
图1 网格提取法提取结果
图2 单点提取法提取结果
结合步骤和结果可以看出,当有明确的时间空间分析粒度需求时,格网法准确,并且效果直观。劣势在于步骤较为复杂,且无论多小的空间分析粒度,空间格网都可能将停留场地一分为二,损失停留信息。单点直接提取法,当空间较小且有明确的时间阈值设定时,精度较高信息无损耗且步骤简单。劣势在于未经过二次判断,精确度一般,当场地尺度较大时,如图2,效果不直观,需要结合点密度分析降低分辨率。速度-距离法介于上述两者之间,更适用于线性场地空间。
综上所述,本文为微观尺度的游客停留点提取提供了简要的技术方法和一定实践经验。本文的缺点是以仅以微观尺度的区域下的浅山区类型场地作为实验对象,且受制于数据采集成本,得到的样本数据较为有限。未来应以不同尺度不同场地进行试验,总结出较为普世的指标和方法选择标准。
(作者单位:西安工业大学)