一种基于车辆轨迹数据的城市建成区边界识别方法
2019-02-15,
,
(太原理工大学,山西 太原 030024)
分析城市建成区的变化特征和分布范围,可以预测、控制城市发展速度及扩张规模,快速准确获取城市建成区的边界范围是评估城市土地利用效率、城市人口密度、城市单位面积产值和城市生态文明建设的重要基础。目前,已有较多学者对城市建成区边界的获取方法进行了研究,已有研究主要集中于遥感手段的提取方法,多利用遥感影像的纹理特征[1-3],并结合数学形态学方法、监督分类和聚类分析等[4-5]方法提取建成区的边界范围。如文献[5]基于多核学习理论提出了多场积分、多假设投票的新监督分类方法,用于从ZY-3和GF-1卫星影像中提取城市建成区,其方法有一定的创新性。文献[6]利用遥感影像中建成区边缘的视差特征,对图中的高值像素进行空间聚类,提取了较为准确的建成区。也有较多学者研究基于SAR影像获取建成区边界范围,如文献[7]基于RADARSAT-1高分辨率SAR影像,利用图像的纹理、各向异性等特征建立数学模型,进行建成区范围探测,准确度高达81.3%。文献[8]根据PolSAR数据中建成区散射机理不同于无目标散射机理,研究建成区的提取,也得到了其预期的结果。此外,使用夜间灯光遥感数据也是十分有效的研究手段,文献[9—10]利用Landsat TM/ETM+影像、DMSP/OLS夜间灯光数据,以单一或组合使用的方式提取建成区边界,并将提取结果与Google Earth城市建成区比对进行验证分析,也能得到较为准确的结果。尽管传统遥感手段用于城市建成区已有大量宝贵的研究成果,但现阶段遥感影像数据仍存在着较多的问题:高分影像获取成本高,数据源更新周期长,现势性不强;由于遥感影像同物异谱、同谱异物现象的存在,给影像识别造成较大困扰;传统经验边界阈值方法直接造成建成区提取范围不准确。针对此问题,文献[10—11]对于边界阈值的确定方法都有一定的研究,以减小经验阈值法固有缺陷造成的误差,但是建成区边界阈值难以确定的问题仍普遍存在,仍需更加准确合理的解决方法。因此,探索更为合理、高效的建成区边界获取方法还有待研究。
众多学者对于新的提取方法仍进行着不懈的探索,文献[12—13]通过POI数据的密度分布判定城市建成区边界的技术,方法新颖且分析结果客观准确,但由于很多规模较小的城市POI数据尚不完善,电子地图中POI数据更新滞后,因此基于POI数据的城市建成区边界方法有待进一步研究。从《城市规划基本术语标准》中可以看出,人口集聚的居民点是城市的主要特征,由此可见城市的发展和扩张与人的行为活动密切相关,从一定程度上,人的集聚模式能够体现城市建成区扩张的模式。然而由于人口统计周期长,且城市获取人口流动性大,致使区域人口密度统计数据的时效性差,因此区域人口密度指标难以反映城市建成区的分布状态[14]。出租车轨迹数据与城市人口活动规律密切相关[15],出租车轨迹点的密度与城市人口聚居区(如大型商场、学校、居民区等)呈正相关,且轨迹点符合在城市中心区域分布十分密集、远离城市中心密度逐渐减小的特点。此外,轨迹点数据具有定位精度高、准实时更新、采集方便等优势,因此利用城市出租车轨迹点数据进行城市建成区边界提取具有一定的现实意义。本文基于出租车GPS轨迹点数据,对不同分辨率格网下轨迹点数据的点模式进行研究,并在整个研究区域内利用Densi-Graph方法[12]计算建成区范围界定的最佳阈值,以期获取最佳边界范围。
1 基于规则格网的城市建成区边界提取
网格分析方法是地学领域最为经典、使用最为广泛的方法之一,具有操作简单、计算效率高的特点,主要用于模拟大范围区域地表形态特征,以及分析大区域植被覆盖、降水、区域地质灾害等的研究。
1.1 多分辨率下轨迹点分布模式研究
基于多分辨率格网对比分析,能够较为直观地观察轨迹点分布模式在不同格网分辨率下的变化规律,研究过程包括多源数据的配准、轨迹点量化和密度格网插值生成密度值等值线。为了详细准确地分析在整个研究区域尺度下轨迹点的分布模式,依据研究区域的边界范围,生成分辨率约为50、100、300、500 m的矩形规则格网,将规则格网与轨迹点数据进行叠置分析,统计落入各基础单元的轨迹点数即为该格网单元的密度值d,至此完成轨迹点要素的量化,即将轨迹点要素的离散分布特征量化为数字特征,并映射至带有密度属性的二维网格空间。由于此时带有密度值属性的二维网格空间中,密度值变化不够平滑呈现跳跃性,故利用Krigin插值方法将整个带有密度值属性的网格表层进行插值分析,生成连续变化的覆盖整个研究区域的密度表面[16]。最后,基于此连续变化的密度表面生成密度值等值线。
1.2 利用Densi-Graph方法识别城市建成区边界
等值线的空间分布特征表现为:接近城市中心区域等值线十分密集,等值线间距小;远离城市中心,等值线间距逐渐扩大,在靠近城市边缘地区,等值线变得较为稀疏,等值线间距较大。Densi-Graph方法正是基于密度值等值线这一空间分布特征,分析核密度值d与相应闭合曲线围成面积Sd的理论半径Sd^(1/2)的变化情况,以期计算出密度值等值线由密至疏的临界值,用于判断城市建成区的边界。该方法包括两个步骤:刻画密度值d与面积Sd的关系、临界值的判定。
(1) 首先以密度值d与理论半径增量ΔSd^(1/2)分别为坐标横纵轴绘制散点图,然后对该散点图进行函数拟合,生成一条光滑曲线。
(2) 为了更加准确地分析d-ΔSd^(1/2)拟合曲线的变化速率,对拟合函数求导分析。由于从整个城市尺度看来,随着密度值d的减小,逐渐远离城市中心区域,相应闭合曲线的理论半径值不断增大,因此基于波动曲线的增长速率,在城市建成区的边界处应存在着某一具有全局意义的临界值点r,当时,曲线显著增长且波动趋势明显不可逆,则此时的密度值d可视为城市建成区边界的临界值,本文中边界提取的直观方法模型如图1所示。
2 试验与分析
2.1 数据来源
本文试验数据来源于网络T-Drive taxi trajectory数据集,此数据集为北京市2008年2—8月10 357辆出租车轨迹点数据,共1500万条记录,文献[17—18]均曾引用此出租车轨迹数据进行科学研究。本文筛选出部分轨迹数据共82 159条,轨迹数据样式见表1。
出租车ID获取时刻经度/(°)纬度/(°)12008-02-02 15:36116.5117239.92123392008-02-04 14:49116.3673739.910275002008-20-08 17:30116.2691839.8790326062008-02-08 17:35116.3553639.65597
2.2 多分辨率格网下的密度等值线计算及规律分析
依照图1的方法模型,分别计算500、300、100、50 m格网分辨率下的密度等值线。根据密度等值线结果可以看出在整个研究区域内,密度等值线符合城市中心区域等值线密集、接近城市边缘等值线稀疏的分布规律,且随着格网分辨率的逐渐增大,密度等值线逐渐呈现出沿道路分布的规律,符合轨迹点的分布特征,以格网分辨率100 m为例,结果如图2所示。
2.3 d-ΔSd^(1/2)曲线拟合分析及临界密度值的界定
在50~500 m格网分辨率下,以密度值d与理论半径增量 ΔSd^(1/2)分别为坐标横纵轴绘制变化曲线,并对该散点图进行函数拟合。研究结果表明,500、300 m格网分辨率下对d-ΔSd^(1/2)散点图采用五次多项式拟合精度较高,拟合方程相关系数R2分别为0.995 97、0.999 73;100、50 m格网分辨率下对d-ΔSd^(1/2)散点图采用四参数方程拟合精度较高,拟合方程相关系数R2分别为0.973 14、0.900 84。通过观察不同格网分辨率下的拟合曲线,均满足理论半径值ΔSd^(1/2)随密度值d的减小不断增大的规律,且在全局范围内存在某一临界值r,当曲线增长速率大于r时,曲线呈现不可逆转的增长趋势,且当格网分辨率逐步增大时,拟合曲线的突变特征更为显著。
对以上试验生成的4条d-ΔSd^(1/2)曲线去量纲化处理,并进一步将拟合函数求导,由于文献[12]中通过对全国地级以上城市建成区边界进行分析,确定Densi-Graph曲线的增长率容许值为5%,故本文参考此容许值进行临界密度值计算,结果如图3所示。
2.4 结果精度分析
图3中试验结果表明,格网分辨率为100和50 m时,拟合的四参数方程较为接近,曲线均呈现较为显著的突变特征,临界密度值稳定于0.8附近,在此分辨率下提取的建成区边界范围更为准确。由于随格网分辨率的增大,数据量显著增大,导致运算时间成倍增加,计算效率低,因此综合考虑计算结果的准确度和计算效率,选定格网分辨率100 m较为合适。在格网分辨率为100 m时,基于上述方法进行建成区边界提取结果如图4所示。据图5中2008年北京市城镇和建设用地分布图,可见本文方法提取的建成区范围符合城镇和建设用地分布特征,且本文中提取的北京市2008年建成区总面积约为1 077.33 km2,中国城市统计年鉴中公布的北京市2008年建成区总面积为1 310.94 km2,故本文方法提取结果准确率为82.18%,提取结果较为可靠,能够为快速高效获取城市建成区边界范围提供参考。
3 结 语
本文基于出租车轨迹数据,利用城市中轨迹数据的分布特征与人的活动规律相符,且存在强相关性的特点,结合多分辨率下格网分析方法和Densi-Graph方法,探究了不同于传统城市建成区边界提取的新方法。与传统基于遥感影像提取方法相比,本文基于出租车轨迹数据的建成区边界研究是对传统提取方法的一种补充,且结果准确可靠。由于城市出租车轨迹数据精确度高、获取方式简单、实时动态采集,故能够动态提取城市建成区边界范围,可以对城市空间分析及决策管理提供帮助,具有实用价值。但本文仅从轨迹数据的位置特征进行了研究分析,此外出租车轨迹数据还具有时序特征、载客状态特征等,因此后续可以进一步将轨迹数据多特征融合分析或将轨迹数据与城市POI数据等融合分析,以时空大数据的思维模式用于城市建成区分析研究。