基于智慧城市多源时空数据脉动规律认知的城市病研究
2017-10-16李高盛尤承增
彭 玲,吴 同,3,李高盛,2,李 祥,2,胡 媛,2,尤承增,2
(1.中国科学院 遥感与数字地球研究所,北京 100094; 2.中国科学院大学,北京 100049 3.西安科技大学,陕西 西安 710600)
0 引 言
目前,随着城市人口、工业、交通运输业不断扩张,由于城市的环境、资源和基础设施难以适应城市的快速发展,使得交通拥堵、环境破坏、热岛效应、大气污染等一系列城市问题日渐显著。在此形势下,准确把握城市发展规律,推动城市健康发展,成为智慧城市发展的必然趋势。
由于遥感、物联网、无人机等技术的快速发展,获取得到的诸如遥感影像数据、传感器数据、视频监控数据等的城市数据种类愈加繁多,这些数据具有大数据量、多空间尺度、多时间尺度、多用户对象和多专题类型的特点,因此统称为时空大数据[1-4]。数据科学家和城市管理者通过对这些多源时空大数据进行分析挖掘,探究潜藏在数据背后的脉动规律并将其应用于智慧城市的建设。如在智慧交通中,通过对行车轨迹进行数据挖掘,从而确定最佳的行车路径;在智慧环保中,利用深度学习算法进行城乡垃圾堆的自动提取,实现垃圾堆的智能识别和管理等。在智慧城市中,采用数据分析手段,挖掘多源时空数据的隐藏价值,分析城市脉动发展规律,对于精细化城市管理,现代“城市病”问题的研究以及人民生活品质的改善均起着不可替代的作用。
本文针对城市交通拥堵、垃圾堆放、热岛效应等城市病,依托智慧城市公共信息平台所收集的多源时空数据,采用深度学习、关联规则挖掘等机器学习算法进行信息提取和时空数据分析,认知城市病发展过程中各项指标的脉动规律,从而对现代“城市病”问题的解决提出合理建议。
1 城市病研究方法与进展
1.1 城市病研究进展
在城市化发展进程中,如果人口集中的规模超过了工业化和社会经济发展的水平,就可能产生诸如交通拥堵、生态破坏、垃圾堆放等一系列的城市问题,而“城市病”是城市的正常功能受到影响的一种形象化描述[2-5]。周加来[6]从城市发展的不同阶段,对城市病的起因进行了系统的阐述。倪鹏飞[7]在对我国城市发展历程进行总结的基础上,将我国城市病的表现特征归纳为环境污染、交通拥堵、住房紧张、健康危害、城市灾害及安全弱化等。梁丽[8]从人口、城市体制等几个方面对城市病形成的原因进行了分析,同时提出了利用大数据进行城市病治理的对策建议。本文就环境破坏、交通拥堵以及社会频发事件方面的城市病进行研究。
在环境领域,城乡生活垃圾堆是目前最难得到处理、最具综合性且最贴近生活的环境问题[9],随着中国社会经济的不断发展,我国生活垃圾的数量呈现出明显的增长趋势,我国城市每年垃圾的产生量以8%~10%的速度增长,2010年我国生活垃圾产生量为3.52亿吨,居世界首位[10]。目前,城乡生活垃圾的露天堆放、无人管理不仅造成了严重的大气、水体和土壤污染,同时也对居民的身体健康产生了负面影响。
除生活垃圾堆问题外,城市热岛效应也已逐渐成为影响城市人居环境和居民生活健康的一个重要因素。城市热岛效应是指城市化发展过程中,由于城区下垫面性质的改变、温室气体以及人工废热的排放等因素所引起的城市地表和大气温度明显高于城市周边郊区的一种现象[11]。城市热岛的形成与发展与其所处的地理位置和几何形状有着密切的关系[12]。Oke[13]将城市中心区的温度最高值与郊区温度的差值定义为“热岛强度”,热岛强度与城市的发达程度密切相关,如北京、上海、广州等几个城市的热岛强度十分明显,城市热岛问题严重。严重的城市热岛效应不仅形成了严重的大气污染,也严重影响了人们的生活质量和制约着城市的发展进程。
在交通领域,随着我国城镇化进程的不断加快,城市的交通问题也愈演愈烈,主要表现为交通拥堵及由此带来的污染、安全等一系列的问题。近年来,我国私家车数量的日益增加使得城市交通拥堵问题日益严重[14],其中北京、上海等特大城市尤为严重,其他大城市和一些中小城市也陆续出现交通拥堵问题。交通拥堵直接影响着居民的工作、生活效率,同时抑制着人们的日常活动,使得城市活力大打折扣,居民的生活质量也随之下降。
除了环境破坏、热岛效应和交通拥堵外,城市的不断发展,人口的过度集中,也使得城市中道路破损、道路积水、路面塌陷等社会事件频繁发生,大量的城市基础设施、公共服务设施和社会公共事务等需要进行维护和管理,给城市管理部门的管理工作增加了难度。
因此,城市病的长期存在及恶化,已经严重困扰了城市发展。本文在诸多学者研究基础上,运用遥感手段和各类传感器所获取的城市数据,结合当前主流深度学习算法和机器学习分析模型,对城市病进行多角度剖析,针对城市交通拥堵、城市垃圾堆放、城市热岛效应和城市监管案件等典型城市病进行分析,取得阶段性成果。
1.2 多源时空数据是城市病研究基石
随着遥感技术、无人机、物联网以及互联网+等技术的发展,多源时空数据的种类越来越多,主要包括遥感影像和无人机影像数据、各类传感器数据、视频监控数据和微博签到数据等。在城市智慧化、信息化建设和发展的浪潮下,由物联网、社交网络及城市基础设施等产生的数据量已经由GB(Gigabyte)、TB(Terabyte)级快速增长为PB(Petabyte)和EB(Exabyte)级。
在解决现代各个领域的城市病的研究中,多源时空数据是各项工作的基石。如利用高分辨率遥感影像数据对城乡生活垃圾堆进行提取,从而统计分析其分布情况;利用遥感影像中的热红外波段数据进行温度反演可以分析城市热岛效应的时空特征;利用无人机遥感数据进行城市的车辆提取判断道路的拥堵情况,同时利用视频监控数据等时间序列的数据获取车辆运动状态;利用传感器手段、社交网络的众源数据获取城市的社会事件类型及具体的空间坐标,以便进行城市基础设施、社会公共事务的维护和管理。
综上,多源时空大数据反映了城市的健康状态,同时也是城市病研究的基础,利用多源时空数据进行脉动分析,对城市病的溯源和解决具有重要意义。
1.3 脉动分析是城市病研究基本手段
城市脉动分析是对城市各项指标特征变化规律的探索。它充分利用了数据挖掘技术从大量、有噪声、模糊的数据中提取隐含在其中的、有价值的信息和知识。在城市病分析中,为了挖掘多源时空数据的隐藏价值,对城市脉动规律进行分析,常常需要综合应用遥感信息提取、机器学习、空间分析等方法,并根据特定需求综合选择和使用相应数据挖掘理论、方法和工具,提高智能化程度[3-4]。
遥感信息提取技术是以遥感图像为研究对象,在计算机系统支持下,综合运用遥感图像处理、GIS分析、人工智能等技术对地学专题信息进行智能化提取。由于不同波段、不同地物具有不同的波谱特征,通过对某种地物在各波段进行波谱曲线的分析,并将其特点进行增强处理,从而在遥感影像上识别并提取同类目标物[15]。如利用遥感信息提取技术可以快速、高效地对城乡垃圾堆进行判别,从而为垃圾堆放这一城市病的研究提供数据支撑。
空间分析技术是对目标的位置和属性数据进行分析的一系列技术[16]。利用空间分析技术可以对城市频发事件、交通拥堵和热岛效应等城市病问题进行研究。通过对城市频发事件进行空间分析,可以发现不同地区的主要社会事件,从而因地制宜地进行监管;在交通拥堵方面,可以通过对不同地区车流量情况的分析,从而评价不同地区的繁华程度,为交通规划、车辆管理提供指导;另外,通过遥感影像进行温度反演,能够分析城市热岛的空间变化规律,获取城市热岛的区域特征,从而进一步分析不同地区热岛效应的产生原因并对其发展趋势进行预测,最终为生态环境的保护、城市发展规划提供指导。
机器学习主要是利用计算机理解并模拟人类的学习过程,针对不完全的信息进行自动规划并用以获取新的知识和技能,重新组织已有的知识结构使之不断改善自身的性能。深度学习作为机器学习的一个分支,已广泛地应用于图像分类、自然语言的处理和人工智能等各个领域,并在目标检测中也取得了前所未有的成果[17]。利用机器学习可以对车辆轨迹和不同地区的车流量情况等进行分析,从而应用于交通拥堵的研究之中。
本文从交通拥堵、城乡垃圾堆、热岛效应和城市频发社会事件4个方面的城市病出发,利用数据挖掘方法、空间分析、深度学习算法等手段,基于多源时空数据开展典型的城市脉动分析,从而对城市病的研究提供途径。
2 城市病脉动分析案例
针对城市病中交通拥堵、环境破坏以及社会频发事件等问题,利用我们在智慧城市建设中形成的空间信息公共平台所汇聚的遥感影像、无人机数据和各类传感器数据等多源时空数据对城市交通拥堵、城市垃圾堆放、城市热岛效应和城市监管案件开展了脉动应用分析。
2.1 城市交通拥堵分析
城市交通脉动分析包括城市车辆空间位置提取、城市公交车客流量状况分析等方面。其中,随着交通拥堵现象的愈发严重,对车辆空间位置的提取是交通管理和规划的关键环节。传统的车辆空间位置的提取都是基于地面的监测设备,如雷达系统和视频监控[18-19]。然而这些设备的覆盖面有限,难以有效监测整个道路网络的交通情况。由于遥感技术能够进行大范围、长时间地动态监测,近年来利用遥感影像数据进行车辆空间位置的提取已然成为一个新兴的研究方向。许多学者利用高空间分辨率遥感影像(如IKONOS, QuickBird,WorldView)来进行车辆检测[20-23]。还有一些学者在车辆空间位置提取基础上进行了进一步研究,他们利用QuickBird卫星全色和多光谱传感器拍摄时间的微小间隔来估计运动车辆车速[24]。
在城市车辆空间位置提取中,本文使用caffe框架实现Faster R-CNN模型,实验数据为空间分辨率为0.13m的Google Earth影像中采集200张包含车辆大小为500×500像素的影像,其中的车辆样本多达2 000个。选择其中的100张图片作为训练集,50张图片作为验证集,另外50张图片作为测试集。原始样本数据如图1所示。测试集上的检测效果图如图2所示。
图1 城市车辆原始样本数据Fig.1 Original sample data of urban vehicles
图2 测试集检测效果图Fig.2 Test results in test-set
在获取了车辆分布的基础上,本文分析了不同日期的某道路车流量的异常比,计算方式如公式(1),该特征反映了路网交通流的紊乱程度,通常拥堵情况将会导致该值居高不下或者极速攀升。
式中,Nanomaly为当前时段异常状况的车辆数,Ntotal为当前被估计的所有交通流状况总数。日常情况下,城市交通路网异常状况比例会维持在一个相对稳定的较小值,当区域内出现恶性突发事件(如车祸)时,路网交通流就会相对“紊乱”,异常状况比例迅速攀升,如图3所示,11月4日,交通拥堵导致路网受到较强烈的影响。
图3 各时段交通流异常比情况Fig.3 Traきc flow abnormal ratio in time interval
通过对车辆提取和交通拥堵的监测,了解城市各道路的交通流量状况,并及时向有关部门反映和建议,有利于改善交通管理控制和路网的规划,缓解交通拥堵现象。
2.2 城市垃圾堆放分析
城乡垃圾堆的长期随意堆放,给城乡环境的改善和全面有效治理带来很大的困难。目前,遥感技术应用于垃圾处理方面的研究有了一定的进展,但仍有大量关键性问题需要解决。WaiYeungYan等[25]基于Landsat影像检测固体废弃物的表面温度,发现垃圾堆的地表温度比周围植被温度高了4°到10°,为垃圾监测提供了更多信息。Enrico Giuseppe Cadau等[26]用高分辨率遥感光学影像对垃圾堆进行二维监测,用合成孔径雷达(SAR)影像对垃圾堆进行三维检测,并通过反演温度,提出了一个垃圾堆监测指数DDI(Dump Detection Index)。秦海春等[27]采用高分二号影像数据,以决策树分类为研究方法,建立了垃圾堆解译标志,得出了在影像上垃圾堆颜色往往呈高亮白色、纹理结构明显、表面凹凸不平等结论。现有的研究并没有充分利用机器学习和人工智能等自学习技术手段来减少人机交互。因此,本文利用遥感影像结合全自动的目标检测技术智能化地提取露天垃圾堆从而为环境卫生部门的管理提供帮助。
本文主要采用深度学习算法中的Faster R-CNN模型进行城乡垃圾堆的提取,并对其分布特征进行空间分析。实验中采用空间分辨率为0.13m的Google Earth影像,并裁剪200个500×500像素的包含城市垃圾堆的影像为样本数据集。其中,选择60张图片作为训练集,60张图片作为验证集,另外80张图片作为测试集。原始样本数据如图4所示。
图4 城乡垃圾堆原始样本数据Fig.4 Original sample data of urban and rural garbage heap
在Faster R-CNN模型中,不同的参数设置意味着系统整体性能的差异[28],通过交叉验证将模型的参数进行如下设置:初始学习率设置为0.001,梯度更新权重为0.9,权重衰减项为0.001 2。首先采用均值为0,方差为0.01的高斯分布初始化模型的所有新层;然后使用ImageNet完成分类任务的预训练,并使用预训练好的模型初始化RPN网络和Fast R-CNN检测网络;最后将样本影像中的垃圾堆一一框选用于模型的训练。
在进行caffe环境搭建的基础上,利用Faster R-CNN进行模型的训练,并选取某城市的遥感影像进行垃圾固废的检测,检测效果如图5所示。
图5 在测试影像中对垃圾堆位置的判别Fig.5 Identification the location of the garbage in the test image
由图6可以看出,该城市中垃圾堆集中分布在南部的城乡结合地段。因此,通过对遥感影像中垃圾堆的提取及其空间位置分析,可以有效地圈定垃圾堆的分布地段,从而辅助环卫部门进行针对性的治理,改善城市市容环境。
图6 垃圾堆监测结果的空间密度分析Fig.6 Spatial density analysis of garbage monitoring results
2.3 城市热岛效应分析
近年来,我国学者对城市热岛效应做了许多研究,任霞等人[29]在进行温度反演的基础上,对比分析了归一化植被指数、归一化建筑指数和归一化水汽指数3种主要的地表特征参数在表达热岛效应方面的有效性。江樟焰等人[30]利用TM影像根据辐射传输方程进行北京地区地表温度的反演,从而对热岛现象与土地覆盖类型和植被指数的关系进行了研究。
本文在以往定性研究城市热岛的基础上引入了定量分析手段,并结合剖面线分析方法,对天津生态城城市热岛效应的时空分布特征进行剖析。依据单窗算法所反演的温度数据,对生态城2013~2015年的热岛效应进行分析,包括热岛效应的年度变化、区域特征等。
从图7中可以看出,2013年到2015年间生态城的次高温、高温、特高温三区之和从42.3%增加到44.5%,可见近三年城市热岛效应呈逐年增强的态势,说明随着生态城的发展,居民活动日益增强。但是,生态城的特高温区比例,从2013年的18.4%降低为2015年的0.1%,说明随生态城的生态建设成果已经初见成效。
图7 2013-2015年生态城热岛效应各温区比重图Fig.7 The proportion of the temperature zone of Eco-city in 2013-2015
2.4 城市监管案件脉动分析
随着城市的不断扩张,人口过度聚集和交通拥挤等因素加剧了城市中车辆违章停放、露天垃圾或道路不洁等社会事件频繁发生,城市管理部门每天都要对城市中的各类基础设施、公共服务设施等市政内容进行维护和管理。在管理过程中积累了大量的历史数据,通过对这些数据的脉动分析并将城市的运行现状进行可视化展示,可以及时发现城市运行过程中存在的问题和监管盲区。同时,揭示了城市基础设施和服务运行的历史规律,从而对城市的规划和管理起到有效的辅助指导作用。以中新天津生态城为例,对城市监管案件的字符云可视化展现如图8所示。
图8 生态城监管案件字符云Fig.8 Eco-city supervision case character cloud
生态城监管案件字符云图展示了生态城历史案件的内容分布情况,其案件信息来源于生态城城市事件管理中的案件记录,依据每个案件的类型和内容进行凝练,按照关键词出现频率以及案件等级的高低进行排序,将频发程度通过字符的大小进行可视化表现。由此突出重点案件和高频案件,对城市运行的监管方向提供建议。
3 结束语
本文利用在物联网、遥感、无人机等技术蓬勃发展下所获得的多源时空数据,基于数据挖掘和深度学习等技术手段,对交通拥堵、城乡垃圾堆、城市热岛和社会事件四方面的城市病问题进行探索性的分析研究,并科学地解释了城市脉动结果的变化规律,为有关部门解决现代城市病提供了技术支撑。
同时,目前所进行的利用多源时空数据对城市脉动规律的分析探索仍属冰山一角,仍有许多要完善和改进的地方。现有城市脉动分析模式距离多源时空数据真正融合还有一段距离;因此在后续研究中,需要进一步实现天空地一体多源时空数据融合,更好地挖掘城市各类数据之间关联性以辅助城市病深入研究。此外,需要进一步提高城市脉动分析准确性和高效性,进一步优化脉动分析模型。在数据可视化方面,需要进一步增加面向用户的更为人性化的可视化展示方式。