地表温度与城市空间分布结构的关系及其预测模型
2020-11-20包瑞清
包瑞清
1 背景与目的
气候变暖和快速城市化增加了城市的热应力,从而降低了人体舒适感受,甚至危及健康,引起城市人口发病率和死亡率升高;同时增加了建筑夏季空调制冷能耗,加剧了能源短缺矛盾[1]。就城市的热环境问题而言,其观测评价方法主要涉及实地观测法,如校园景观对局地热环境影响研究[2],基于移动测量的城市空间形态对夏季午后城市热环境影响研究[3]等;模拟评价方法则主要使用ENVI-met等提供的计算模型进行模拟,如湿热地区景观要素配置对园林热环境的影响研究[4],岭南名园余荫山房庭院空间的热环境模拟分析[5]等;遥感观测法则主要利用Landsat系列遥感影像反演地表温度,分析地表温度与土地覆盖之间的关系,如基于RS和GIS的郑州市植被覆盖度与地表温度演化研究[6],以保定市中心城区为例的城市绿地对热岛效应缓解作用研究[7],以及以广东南海为例的城市开敞空间热环境调控规划方法研究[8]等。
实测法可以更为精准地追踪研究场所的热环境气候数据,描述局地微气候质量,定性进行热环境分析,或者用于验证其他评价方法的结果;模拟评价方法可以对中、小尺度的城市微气候环境进行模拟,分析城市小尺度范围内的表面、空气和植被之间的相互作用;遥感观测法根据遥感影像高空分辨率的不同,可以实现任意尺度的热环境分析,但因为是二维影像,通常以反演的地表温度作为热环境评价的指示因子,并结合地表覆盖物(城市土地利用)之间的分布关系,以及绿地的降温效应等内容。
为了能够分析城市尺度的热环境与城市空间分布的关系及结构,选择遥感影像反演地表温度,以地表温度作为城市热环境的指示因子,提出基于地表温度差值数量变化界定全区植被降温效应的空间分布,基于卷积温度梯度变化界定冷区和热区等方法量化具体的空间分布结构。并基于机器学习回归算法建立用于绿地规划评估的地表温度预测模型,从规划可落实的方面探索实现的可行性。
2 数据和方法
2.1 研究区域和数据来源
西安是中国西部地区重要的中心城市,属于暖温带半湿润大陆性季风气候,四季分明,气候温和,雨量适中。春季温暖、干燥、多风,夏季炎热多雨,秋季凉爽,冬季寒冷、多雾、少雨雪。分析植被和建设用地空间分布与地表温度的关系,选取2018年8月10日和2019年1月17日的Landsat OLI 8数据,用于反演地表温度及提取植被和建设用地区域。数据来源于美国地质勘探局(United States Geological Survey,USGS),关键数据信息如下。
2019年1月17日数据:
LANDSAT_PRODUCT_ID=“LC08_L1TP_127036_20190117_20190131_0 1_T1”,DATE_ACQUIRED=2019-01-17,SCENE_CENTER_TIME=“03:19:39.7352850Z”。
2018年8月10日数据:
LANDSAT_PRODUCT_ID=“LC08_L1TP_127036_20180810_20180815_01_T1”,DATE_ACQUIRED=2018-08-10,SCENE_CENTER_TIME=“03:19:13.1549220Z”。
2.2 研究方法
2.2.1 基于地表温度差值数量变化界定全区植被降温效应的空间分布
找到植被和建设用地空间分布与地表温度的关系,量化绿地降温效应的空间范围,步骤如下:反演冬季和夏季典型的地表温度—计算地表温度差值—分析温度差值直方图数值拟合曲线的特征,找到分布拐点—根据拐点数值分类温度差值,提取地表温度的空间分布结构—通过剖面温度进一步观察绿地夏季降温和冬季保温的作用及空间变化关系。
其中,地表温度反演的计算方法采取胡德勇等提出的单窗算法,结合Landsat OLI 8热红外数据反演[9]获取。直方图数值拟合曲线采用python库seaborn提供的distplot方法进行计算。地表温度会因为地物的不同而变化,通过不同季节地表温度差值计算强化了植被、建设用地空间分布与地表温度之间的联系。植被夏季降温、冬季保温,温度差值较小;而建设用地夏季高温、冬季低温,温度差值较大;植被与建设用地的过渡区域则表现为从一类地物过渡到另一类地物的温度变化,从这个温度变化可以推测出绿地降温效应的区域。
图1 2018年8月10日地表温度
图2 2019年1月17日地表温度
2.2.2 基于卷积温度梯度变化界定冷区和热区的空间分布结构
此次实验中所定义的冷区和热区是由温度变化为0作为边界来界定的。具体的含义代表每一栅格单元(此次实验的遥感影像精度为30m)与其周边栅格单元的温度差异,当变化大于0时,该栅格单元相较周边具有较高的温度,具有热源的效应,通常为建设用地;在风景园林规划分析绿地的降温效应时,通常是指冷源,即温度变化值小于0,计算栅格温度较周边栅格温度低。以栅格温度变化来区分冷、热区域,较之与温度均值的比较更具有说服力,明确了温度变化的特征,强调了温度水平向的动态变化。
为了提取冷区和热区,需要分析每一栅格温度与周边临近栅格温度的变化关系,因此使用卷积的方法,设置卷积核为:[[1/8,1/8,1/8],[1/8,-1,1/8],[1/8,1/8,1/8]],即计算栅格温度与周边栅格温度均值的差值,作为栅格间温度变化比较的参照。卷积使用python库SciPy提供的convolve2d方法。为了进一步分析冷区的空间分布结构,提取冷区用以标识出独立的冷区范围,调整这些独立冷区的绿地结构,有助于改善城市微气候的舒适度。
2.2.3 基于机器学习回归算法建立用于绿地规划评估的地表温度预测模型
地表温度所反映的城市空间分布结构,有助于在城市微更新的过程中对城市开放空间的热环境进行调控。但是,若以地表温度作为热环境的指示指标来评估规划内容的合理性,则需要能够根据规划中绿地的分布来预测地表温度的分布,从而更加直接地反馈规划布局,并给出调整的方向。
此次实验采用机器学习开源库scikit-learn的Extra trees(极其随机森林)、k-NN(k-近邻算法)、Linear regression(线性回归)和Ridge(岭回归)算法建立预测模型。以地表温度为目标变量,以植被、建设用地和水体作为解释变量。切割2018年8月10日的地表温度数据,获取每一样本范围为3 000m×3 000m的324个样本为目标变量,并将其划分为训练数据集和测试数据集,划分比例为0.85。对于标识用地类型的解释变量,使用归一化植被指数(Normalized Difference Vegetation Index,NDVI)。人工辨别可以划分植被、建设用地和水体的阈值为[0.17,0.48],即小于0.17的为建设用地,位于0.17~0.48之间的为植被,大于0.48的为水体。解译阈值由人工辨别调试确定,不同的影像阈值范围会有所不同。
对于模型的评估,采用准确率(PRE)和召回率(REC)的组合F1分数:
F1=2(PRE×REC)/(PRE+REC)
具体调用机器学习开源库scikit-learn的f1_score方法直接计算。在初步预测评估中,将预测结果按照均值划分为2个区域,再调用f1_score方法进行评价,分析其与真实值之间的差距。最大值为1,最小值为0,值越趋近于1,精确度越高。
图3 地表温度差值
图4 温度差值直方图、拟合曲线和拐点
图5 A区:城市绿地(汉长安城未央宫遗址)
3 结果
3.1 基于地表温度差值数量变化界定全区植被降温效应的空间分布
反演2018年8月10日和2019年1月17日地表温度(图1、2),8月10日的地表温度变化范围为17.78~37.89℃,1月17日为-8.93~14.44℃。计算二者的地表温度差值(图3),变化范围为11.60~37.89℃,因为地物不同,植被和建设用地的分布影响了温度变化的幅度。为了分析地表温度变化与植被和建设用地空间分布的关系,尤其是植被的降温效应,使用直方图观察温度差值的数据分布,拟合曲线并寻找曲线变化的关键区域(图4)。根据曲线变化特征,获取主要拐点,依次为16.2、18.9、19.8、20.5、21.8和25.0℃6个关键点。根据关键点划分温度变化的区间(图4),分析空间分布关系。10.0~16.2℃的温度差值数量开始上升,主要为平原林地;16.2~18.9℃数量爬升相对较快,此区间分布为大量农田;18.9~19.8℃数量有所下降,并于19.8~20.5℃区间基本保持水平,并再次于20.5~21.8℃开始爬升。这3组区间的温度变化反映了植被与建设用地之间的温度变化情况,即18.9~21.8℃反映了植被的降温效应空间分布结构;21.8~25℃区域温度差值数量开始迅速下降,主要为建成区;25℃之后的区域为一些较为特殊的建筑,对地表温度的影响最为突出。同时可以观察到南部山区温度差值相对较高,高程变化对地表温度的影响较高。
进一步分析植被的降温效应,提取图3中标识的A区(城市绿地:汉长安城未央宫遗址)和B区(城市边缘)。从A区中可以观察到城市绿地对城市降温效应(18.9~21.8℃变化区间)的空间分布情况(图5),为研究城市发展、绿地建设,尤其是开放空间提供了可以量化的绿地降温效应空间范围。剖面的温度变化可以进一步说明绿地的降温效应,在夏季降温,以及在冬季保温的作用(图6~8)。
B区城市边缘的农田、林地与城市建成区之间的温度变化情况,与A区城市绿地的降温效应相同。
3.2 基于卷积温度梯度变化界定冷区和热区的空间分布结构
图9-1为2018年8月10日部分区域地表温度;图9-2为卷积后结果,即每一栅格单元(30m×30m)与邻近周边栅格单元的温度差值;图9-3为以单元间温度变化为0为界,提取冷区和热区。栅格单元温度高于周边栅格,值为正,为热区;相反,为冷区。根据计算后结果,冷区的分布主要适应植被的分布情况(图10)。其中白色区域为热区,带有颜色的区域为冷区,表明了冷热区的空间分布相互交替,并且互相穿插连通,形成众多多变的局地小气候环境。进一步,通过对冷区赋予不同的颜色,可以清晰地观察到相对独立的冷区区域。根据绿地集聚效应增强局地降温效果,指出了可以进一步通过绿地的调整来连接这些独立冷区,为城市微更新、改善城市热环境提供量化的参照。
3.3 基于机器学习回归算法建立用于绿地规划评估的地表温度预测模型
在建立预测模型时,数据方面需要准备用作解释变量的土地覆盖类型数据(本次实验为绿地、水体和建设用地),并通过计算解译的准确率来判断解译精度是否满足数据需求,以及用作目标变量的地表温度。
在解译遥感影像获取地表覆盖类型数据后,分析解译精度。根据n=pqz2/d2,p和q分别为解译判读正确和错误的百分比,z对应于置信水平,d为误差允许范围。假定解译精度为90%,则p=0.9,q=0.1,取置信水平为95%时,z2=3.84,如果误差允许范围q=±5%,则n=(3.84×0.9×0.1)/(0.05×0.05)≈138。因此,样本量应不小于138[10]。设计2018年8月10日Landsat-8 NDVI计算实验样本数为150(图11)。计算NDVI,通过人工判读确定3个分类的阈值区域分别为:NDVI建成区<0.3、0.3≤NDVI绿地<2.5、NDVI水体≥2.5(图12)。对计算结果给予精度评价,计算混淆矩阵结果为:[[70,7,0],[7,64,0],[2,0,0]],其中真实建设用地为70,误判为绿地的为7,误判为水体的为2;真实绿地为64,误判为建设用地的为7;水体误判为建设用地的为2。准确率为89.3%,因此该数据可以用作解释变量的输入数据。
计算地表温度结果如图1、2所示。以建设用地、绿地和水体分类的用地类型为回归模型的解释变量,以LST计算结果为目标变量,使用回归模型Extra trees、k-NN、Linear regression和Ridge分别训练模型。图13为在测试数据集中,根据已知用地分类预测LST的部分结果。
在结果的评价上,以LST均值将预测结果划分为2类:小于均值区域和大于均值区域。图14中以色彩折线标识两区。计算F1分数,4类模型预测结果箱形图。其中,Linear regression和Ridge表现较好,中位数分别为0.723、0.727,均值分别为0.723、0.726。由F1分数折线图(测试样本集数量为57)可以看到,测试样本20的F1分数Linear regression和Ridge约为0.4,分数较低(图15)。对比样本20的NDVI分类真实值,其所涵盖的分类类型单一,基本为建设用地。因此,以该种类型为解释变量预测LST的分布预测值的精度较低。如果所包含的类别丰富,则预测值的精度较高,在一定程度上可用于规划空间结构热环境的评估参照。
4 结论与讨论
4.1 量化地表温度所反映的城市空间分布结构
Dipanjan Majumdar 等通过局部空间自相关指标(Local Indicators of Spatial Autocorrelation,LISA),使用开源GeoDa计算比较不同空间权重下地表温度的空间同质性,并以温度和植被指数特征空间(The Temperature and Vegetation Index Feature Space)验证具有显著的土地利用变化[11]。Guo Guanhua等则将面向对象的图像分割与局部空间自相关指标相结合,从地表温度中提取城市热岛簇,分析地表温度与归一化植被指数、归一化建筑指数和归一化差异裸露指数的相关性,探索了在精细空间尺度下地表温度随城市土地利用变化的关系[12]。Lin Wenqi等通过分析绿地8个方向上的截面温度,测量降温效应的有效范围[13]。部分研究者以60m步长,绿地周边设置10个缓冲带,计算缓冲带温度均值的差来分析绿地对热岛效应降温范围的影响等[7]。
上述依据地表温度研究城市土地利用变化及绿地降温效应的方法,均以不同的途径试图找到地表温度变化与城市空间分布结构之间的关系,但是没有涉及提取城市尺度下植被与建设用地过渡区域地表温度变化的具体范围,即绿地降温效应的作用区域。对降温效应具体区域的确定,在将地表温度作为城市热环境评价指示因子的同时,有助于城市绿地规划的落实。
图6 2018年8月10日的P1剖面地表温度
图7 2019年1月17日的P1剖面地表温度
图8 P1剖面的温度差值
图9 部分区域地表温度、卷积温度梯度和冷、热区
同时,根据上述相关研究者提及的局部空间自相关指标,使用GeoDa计算2018年8月10日地表温度的局部空间自相关指标(图16)。P值为0.01的为7 101个单元,P值为0.001的为3 232 899个单元,均小于0.05,置信度大于95%,说明分析的结果是可行的。但是通过局部空间自相关指标只能提取H-H(热点:目标栅格及其周边栅格的温度高于平均水平)、L-L(冷点:目标栅格及其周边栅格的温度低于平均水平)、H-L(岛屿:目标栅格温度明显高于周边栅格温度)和L-H(环礁:目标栅格温度明显低于周边栅格温度)。因此,本次实验基于地表温度差值数量变化,拟合数值直方图曲线,根据曲线拐点分析地表温度的城市空间分布,进一步推进了绿地降温效用空间区域的量化。同时,与局部空间自相关指标获取的冷、热区不同,采取卷积温度梯度变化界定冷区和热区的空间分布结构,细化了冷、热区的范围,为城市微气候的研究提供了一种界定分析界限的思路。
图10 独立的冷区区域
图11 随机采样
图12 土地覆盖
图13 预测结果
图14 F1分数分布
图15 测试数据集F1分数
图16 局部空间自相关指标
4.2 将地表温度作为城市热环境评价的指示因子建立预测模型
目前对于地表温度的研究通常处于对城市土地利用的关系分析、绿地调控、热环境评估等阶段,但是不容易将其落实到规划空间,即操作性相对较弱,Zhang Yujia等以美国亚利桑那州凤凰城作为研究区域,利用地表温度和土地覆盖数据对绿地的直接和间接降温效益进行量化和预测,通过生态景观指数将降温效应与绿地位置联系起来,确定最佳绿地布局的方法[14],在一定程度上推进了规划落实的可行性。
图17 基于多模型人脸补全(引自机器学习开源库scikit-learn官网)
根据既往研究[6,7,11-12],地表温度与NDVI、NDBI等反映城市土地利用关系的相关指数存在相关性,可以建立回归模型,通过反映土地利用的相关指数来预测地表温度,进而指导规划。因此,在此次实验中,试图通过提取规划阶段的绿地、建设用地和水体的空间分布来直接预测地表温度的变化。其中的核心技术是机器模型的建立,迁移机器学习开源库提供的人脸补全案例(图17为案例的实验结果),初步依据绿地、建设用地和水体的城市空间分布数据建立地表温度的预测模型。
预测精度受到几个因素的影响。1)遥感影像的精度。此次实验高空分辨率为30m,适合于分析城市级尺度,如果希望空间精细化,则需提升影像的分辨率。2)土地覆盖物的分类。虽然绿地、建设用地和水体是影响地表温度的主要因素,但是进一步细分覆盖类型可能会提升预测精度,在之后的实验中可以分析之间的相关程度,增加分类类别。3)同一覆盖物的分布差异。如林地存在稀疏之分,建筑密度也会不同,因此可以尝试结合Guo Guanhua提出的面向对象的图像分割方法,细分同一覆盖类型。4)模型的选择。此次实验Linear regression和Ridge表现较好。因为预测模型不能精准预测具体的温度,但是对于温度变化的分布预测较好,因此在精度评价时,采取以均值分为2类的方式做F1分数评估。随着对实验精度主要影响因素的改进,可以尝试将预测温度划分多个等级,做精度评价。如果精度评价的分数合理,对规划的指导意义将会得到进一步提升。
探索地表温度与城市空间分布结构的关系,主要目的是量化地表温度在空间上的分布范围及结构形式。空间上的分布范围通过分析地表温度差值数量变化拟合的曲线拐点来确定,而结构形式则通过卷积温度梯度变化界定冷区和热区得以观察。在将地表温度作为城市热环境评估的指示因子时,则试图建立机器学习回归模型,通过对地表温度有主要影响的绿地、建设用地和水体来预测地表温度,从而在热环境评价方面为规划提供参照。同时,需要强调的是,受所获取数据的限制,本次实验为某一时刻所拍摄的遥感影像数据(Landsat8重访周期为16d),反演的地表温度为静态温度。因此,根据规划目的的需要,调整计算的地表温度在空间上的分布结构或推测影响的阈值区间是进一步深入研究的重点。
注:文中图片除注明外,均由作者绘制。