北京市空气质量时空特征分析
2016-12-15池天河李浩川徐逸之
李 祥,彭 玲,池天河,李浩川,徐逸之
(1. 中国科学院遥感与数字地球研究所,北京 100094; 2. 中国科学院大学, 北京100049; 3. 国家信息中心,北京 100045)
北京市空气质量时空特征分析
李 祥1,2,彭 玲1,池天河1,李浩川3,徐逸之1,2
(1. 中国科学院遥感与数字地球研究所,北京 100094; 2. 中国科学院大学, 北京100049; 3. 国家信息中心,北京 100045)
近年来,随着我国经济持续迅速发展,环境问题日益突出,空气污染日益严重,灰霾现象频发。研究空气质量演变的时空特征,揭示空气污染的成因具有十分重要的意义。本文基于自然正交函数(EOF)分析了北京市空气质量变化的时空特征,借助地理加权回归(GWR)揭示了其驱动力。研究结果表明:①北京市PM2.5 AQI年均空间分布由南到北有减小趋势;②北京市PM2.5 AQI异常呈现西北、东南反向分布;③POI特征对PM2.5 AQI的影响具有显著的南北差异,且在中心城区的影响作用比郊区大;④土地利用特征对PM2.5 AQI影响具有显著的南北差异;⑤路网特征对PM2.5 AQI具有正向作用,在中心城区的影响比郊区大。
EOF;GWR;空气质量;时空特征
空间异质性是事物在空间的一种常态,反映了地理现象局部的特殊性。空气质量由于受气象条件、土地利用、地表植被、人类活动等多方面因素的影响,具有典型的空间异质性。研究空气质量时空演变特征,探索其驱动力的空间异质性,对于控制空气污染、改善城市空气质量具有重要意义。
自然正交函数(EDF)是长时间序列的空间演化分析的有效工具[1-4]。地理加权回归(GWR)基于传统回归分析理论,充分考虑了空间数据的空间自相关性和空间异质性,可用于空间变量间的定量关系描述,揭示某种空间分布的内在成因。通过分析北京市空气质量时空演变特征及驱动力,可为治理空气污染、合理制定城市规划提供指导性意见。
一、研究方法
1. 自然正交函数(EOF)
20世纪50年代,EOF被引入气象学研究,并在地学与相关学科得到了广泛应用。在地学分析中,特征向量对应空间样本,称为空间模态;主成分对应时间变化,称为时间系数。因此,EOF分析在地学中被称为时空分解[4-6]。
将气象场的观测数据以矩阵形式给出,即
式中,m为空间点个数(观测站点或网格点);n为时间序列长度(观测次数)。气象场的自然正交展开,是将X分解为时间函数Z和空间函数V两部分,即
X=VZ
上式说明,第i个格点上的第t次观测值,可以看作是p个空间函数vik和时间函数zki的线性组合。
上述分解要求满足两个正交条件
2. 地理加权回归模型(GWR)
GWR是一种改进的空间线性回归模型,它在建模过程中通过引入空间权重矩阵,充分考虑了空间自相关和空间异质性,能够很好地描述响应变量与预测变量之间的定量关系随空间位置的变化,是最有发展潜力的空间统计模型之一[7]。公式如下
式中,(ui,vi)代表第i个地点的地理坐标;εi为i处的随机误差。y与xj间的关系随地理位置而变化。空间核函数和核带宽是GWR模型拟合中最重要的参数。GWR模型中一般使用高斯函数或截尾函数作为空间核函数。常用的空间带宽优化方法有交叉验证法、Akaike信息准则法及贝叶斯信息准则等[8-11]。综合考虑各种方法的性能,本文选择高斯函数作为空间核函数,采用交叉验证CV(Cross-validation)的方法来确定最优宽带,计算公式为
二、数据准备
以北京市的36个气象站点为分析单元,以空气污染物PM2.5的浓度为研究对象,获取每个气象站周围5 km范围内的路网特征、POI特征、土地利用特征,作为GWR分析的数据源。如图1—图2所示。
图1 北京市气象站分布
图2 北京市土地利用
1. 路网特征数据
交通污染源是重要的大气污染源之一。路网密集地区车辆较多,因而会产生较多的空气污染物。因此,路网结构是影响空气质量的重要因素。本文从百度地图获取了北京市道路网数据,并选择路网总长度、节点数量等参数来表征路网特征。
2. POI数据
POI类别和密度能够反映区域功能结构和交通模式,可作为空间插值的辅助特征。本文选择各类别POI数量来表征POI特征。去掉行政地标等不表征地块特征的POI后,剩余的POI类型包括:房地产、公司企业、购物、交通设施、教育培训、金融、酒店、丽人、旅游景点、美食、汽车服务、生活服务、文化传媒、休闲娱乐、医疗、运动健身、政府机构。
3. 土地利用数据
土地利用类型能够在一定程度上反映空气污染源排放量和污染物扩散模式,也是影响空气质量的重要因素之一。由于土地利用数据难以获取,本文以地表覆盖产品代替。本文地表覆盖数据来源于中国科学院计算机网络信息中心全球变化参量数据库GlobCover产品(global land cover characterization,GLCC)。GlobCover为全球陆地覆盖数据,分辨率为300 m,拍摄时间为2009年。GlobCover全球陆地覆盖数据的原始数据来自Envisat卫星,由MERIS(medium resolution imaging spectrometer)传感器拍摄完成。计算每个分析单元内各种土地类型所占的比例作为特征参量输入。
三、空气质量时空演变特征
图3为北京市2014年PM2.5 AQI月际变化规律。从图中可知,北京市空气质量夏季最优,春秋次之,冬季最差。这主要是由于冬季气温低,热气流微弱,对流不强,空气污染物在空气中停置时间较长,降雨也少得多,空气湿度低,灰尘更容易漂浮于空中。
图3 北京市2014年PM2.5 AQI月变化
通过EOF分析,发现前两个特征累计方差贡献率分别为78%、90%,因此可以用它们说明PM2.5 AQI变化的时空结构。由于特征向量相互正交,因此,第一模态的特征向量反映空气质量距平的平均状态,其余的反映空气质量距平的变化状态,其时间系数作为特征向量的权重,反映了不同月份对这种空间分布贡献的大小。
EOF第一模态的方差贡献为78%。EOF第一模态反映了北京市空气质量的总体空间分布特征,如图4(a)所示。其特征值全为正,说明这些站点空气质量变化具有同步性。特征值南高北低,说明北京市PM2.5 AQI总体空间分布从南到北有减小趋势,即空气质量有变好的趋势。造成这一现象的主要原因是冬季北京南部地区燃煤产生的污染物从南向北扩散,导致北京空气质量从南到北有递减的趋势。第一模态时间系数如图5(a)所示。1月、2月、3月、10月、11月的时间系数为正,说明PM2.5 AQI在增大,其中2月时间系数绝对值最大,说明2月AQI增大趋势最明显。4—9月、12月的时间系数为负,说明PM2.5 AQI在减小,其中6月时间系数绝对值最大,说明6月AQI减小趋势最明显。
图4
第二模态的方差贡献为11%。EOF第二模态反映北京市空气质量差异空间分布特征,如图4(b)所示。特征值西北方向为负,东南方向为正,说明这两块地区空气质量异常呈反相位。也即西北方向PM2.5 AQI异常大时,东南方向PM2.5 AQI异常小;西北方向PM2.5 AQI异常小时,东南方向PM2.5 AQI异常大。结合其时间系数(如图5(b)所示)可以看出,12月、1月、2月时间系数为正(即西北PM2.5 AQI异常小,东南异常大),其他月份时间系数为正(即西北PM2.5 AQI异常大,东南异常小)。
图5
四、基于GWR的驱动力分析
1. 模型构建
城市空气质量在空间分布特征主要受位置相关特征参量的影响,在研究区内,气象特征较为一致,因此不作为GWR分析的自变量。运用主成分分析法计算相关系数矩阵及累积贡献率(85%以上),确定了RD_LEN、POI_PC1、POI_PC2、GLCC_PC1、GLCC_PC2等5个指标作为自变量,分别表示路网长度,POI数据经PCA降维之后的第一、第二主分量,GLCC数据经PCA降维之后的第一、第二主分量。
在GWR模型构建之前,采用Moran’s I指数进行了空间自相关分析。结果表明,北京市PM2.5浓度在空间上呈积聚状态,但仍然表现出一定差异性,这为模型的构建奠定了基础。设北京市某气象站PM2.5浓度为yi,第i点的坐标为(ui,vi),GWR模型为
yi=β0(ui,vi)+β1(ui,vi)(t1i)+β2(ui,vi)(t2i)+
β3(ui,vi)(t3i)+β4(ui,vi)(t4i)+β5(ui,vi)(t5i)+εi
(3)
式中,β1(ui,vi)为POI_PC1回归系数;β2(ui,vi)为POI_PC2回归系数;β3(ui,vi)为GLCC_PC1回归系数;β4(ui,vi)为GLCC_PC2回归系数;β5(ui,vi)为RD_LEN回归系数。它是地理位置的函数。
2. 模型检验
通过模拟计算得到GWR模型参数,见表1。从表中可知,GWR模型能够解释人均GDP变异的87%,AIC为278.38,核带宽为0.44,回归方程通过P=0.001的显著性检验。
表1 GWR模型结果
3. 结果与分析
(1) POI特征对空气质量的影响
POI第一主分量回归系数呈现明显的北高南低的趋势,北边为正值,南边为负值。而POI第二主分量回归系数呈现明显的北低南高的趋势,均为负值。从绝对值上来看,中心城区回归系数高于郊区。整体来看,POI特征对PM2.5 AQI影响具有显著的南北差异,且在中心城区的影响作用比郊区大。如图6所示。
图6
(2) 土地利用对空气质量的影响
GLCC第一主分量回归系数呈现明显的北高南低的趋势,北边为正值,南边为负值。而GLCC第二主分量回归系数呈现明显的北低南高的趋势,均为正值。整体来看,GLCC特征对PM2.5 AQI影响具有显著的南北差异。如图7所示。
图7
(3) 路网特征对空气质量的影响
路网总长度回归系数绝大部分是正值,对PM2.5 AQI具有正向作用。从空间分布来看,回归系数在中心较大而四周较小,说明路网总长度在中心城区对空气质量的影响比郊区大。如图8所示。
图8 RD_LEN回归系数空间分布
五、结论与讨论
本文通过EOF分析和GWR空间统计分析方法,对北京市空气质量影响因素进行了时空演变分析,得到如下结论:①EOF分析的第一模态反映出北京市PM2.5 AQI年均总体空间分布从南到北有减小趋势,即空气质量有变好的趋势;②EOF分析的第二模态反映出北京市PM2.5 AQI月际异常特征,其呈现西北、东南方向分布;③GWR分析可知,POI特征对PM2.5 AQI影响具有显著的南北差异,且在中心城区的影响作用比郊区大;④土地利用特征对PM2.5 AQI影响具有显著的南北差异;⑤路网总长度对PM2.5 AQI具有正向作用,在中心城区的影响比郊区大。
通过本文分析可以看出,EOF分析可以很好地把时间序列和空间变化相结合,揭示区域空气质量演变的时空规律,GWR分析能很好地解释区域空气质量演变的空间异质性的形成机制。
同时,本文在数据源选择方面具有一定的局限性。首先是POI数据是对城市特征点的有偏采样;
其次,使用地表覆盖数据替代土地利用数据,虽然两者具有一定的相似性,但也给后续分析带来了不确定性。
[1] 蒋国富, 刘嘉俊. 自然正交函数在区域经济时空演变中的实证分析——以河南省县域经济为例[J]. 经济地理, 2009, 29(7):1-2.
[2] MARTINEZ Y, YU W, LIN H. A New Statistical-dynamical Downscaling Procedure Based on EOF Analysis for Regional Time Series Generation[J]. Journal of Applied Meteorology and Climatology, 2013, 52(4):935-952.
[3] YANG M, CHO H, KANG W, et al. EOF: Efficient Built-in Redundancy Analysis Methodology with Optimal Repair Rate[J]. IEEE Transactions on Computer-aided Design of Integrated Circuits and Systems, 2010, 29(7):1130-1135.
[4] MONAHAN A H, FYFE J C, AMBAUM M H, et al. Empirical Orthogonal Functions: The Medium Is the Message[J]. Journal of Climate, 2009, 22(24):6501-6514.
[5] 龚斌, 甘小莉, 刘伟玲, 等. 基于EOF分析的三江源区植被覆盖变化时空分布特征[J]. 地学前缘, 2013, 20(3):234-239.
[6] 雷杨娜, 龚道溢, 张自银, 等. 中国夏季高温日数时空变化及其环流背景[J]. 地理研究, 2009, 28(3):653-662.
[7] 王磊. 基于引致需求模型的城市间住宅用地价格水平差异研究[D]. 杭州:浙江大学, 2006.
[8] BROWN S, VERSACE V L, LAURENSON L, et al. Assessment of Spatiotemporal Varying Relationships between Rainfall, Land Cover and Surface Water Area Using Geographically Weighted Regression[J]. Environmental Modeling & Assessment, 2012, 17(3):241-254.
[9] 苑韶峰, 杨丽霞, 杨桂山, 等. 耕地非农化的社会经济驱动因素异质性研究——基于STIRPAT和GWR模型的实证分析[J]. 经济地理, 2013, 33(5):137-143.
[10] 王景雷, 康绍忠, 孙景生, 等. 基于PCA和GWR的作物需水量空间分布估算[J]. 科学通报, 2013, 58(12):1131-1139.
[11] 吴玉鸣, 李建霞. 省域经济增长与电力消费的局域空间计量经济分析[J]. 地理科学, 2009, 29(1):30-35.
Spatial-temporalFeaturesofAirQualityinBeijingCity
LI Xiang,PENG Ling,CHI Tianhe,LI Haochuan,XU Yizhi
李祥,彭玲,池天河,等.北京市空气质量时空特征分析[J].测绘通报,2016(9):47-51.
10.13474/j.cnki.11-2246.2016.0290.
P207
B
0494-0911(2016)09-0047-05
2015-11-16;
2016-01-07
国家科技支撑计划(2015BAJ02B00);国家高技术研究发展计划(2012AA12A408)
李 祥 (1992—),男,博士生,研究方向为地理信息系统研究与应用、数据挖掘。E-mail:lixiang01@radi.ac.cn
彭 玲。E-mail:pengling@radi.ac.cn