基于MODIS数据与多机器学习法的日PM2.5模拟研究
2022-06-29徐发昭褚馨德满元伟
徐发昭,李 净,褚馨德,满元伟
基于MODIS数据与多机器学习法的日PM2.5模拟研究
徐发昭,李 净*,褚馨德,满元伟
(西北师范大学地理与环境科学学院,甘肃 兰州 730070)
为了深入了解地面PM2.5的空间分布,以山东省为研究区,利用2019年的PM2.5站点实测数据,结合中分辨率成像光谱仪(MODIS)的L3级别的MCD19A2气溶胶光学厚度产品,充分考虑人口、地形、气象等因素,使用RF、SVR、BPNN、DNN等4种机器学习算法对山东省2019年逐日PM2.5进行了模拟.结果表明:随机森林模型(RF)的RMSE和MAE的值分别为12.67和6.62,优于BPNN、SVR和DNN模型.随机森林模型(RF)最适合山东省的日PM2.5模拟.
遥感;PM2.5;AOD;机器学习
PM2.5作为大气污染的主要来源,与人类健康关系密切[1-2].由于空气质量监测站点分布的极不均匀,大多数地方站点稀少,因此,对PM2.5实测站点较少的区域进行PM2.5的估算是一项非常有意义的研究工作.随着遥感技术的飞速发展,影像的空间分辨率不断更新提高,借助卫星遥感数据解决这一问题成为现在主要的手段[3-5].
目前,PM2.5的空间分布模拟包括基于站点实测数据和基于卫星遥感数据这两种主要的方法.早期工作主要是基于站点数据的PM2.5空间模拟,其利用地理学第一定律在空间上进行插值,主要包括克里金插值、反距离插值与样条函数插值等[6-7],基于站点数据的插值只适用于站点稠密的城市区域,而且极容易引入误差,普适性差.基于卫星遥感数据的PM2.5估算模拟主要有单变量回归模型、化学传输模型、基于经验的物理方法模型、统计模型与机器学习模型.Wang等[8]首先提出了PM2.5站点数据与气溶胶光学厚度(AOD)具有一定的相关性,并利用AOD与PM2.5的简单线性关系计算PM2.5的分布,虽然计算效率较高,简单易用,但会产生误差,导致预测精度较差.化学传输模型[9-10]模拟PM2.5需要具有较强的理化基础,且模型的精度高度依赖于排放清单,计算成本高,不具有普适性.基于经验的物理方法模型[11-12]PM2.5模拟需要准确的气溶胶特征参数,特征参数的求解需要经验统计关系来进行拟合,该模型的精度高度依赖于输入参数,极易导致误差传播.目前,使用较多的是统计模型与机器学习模型.景悦等[13]利用AOD数据构建的混合效应模型对基于时间与空间的PM2.5进行了模拟,表明该模型对PM2.5的模拟具有较好的效果.由于考虑到PM2.5受到多种因素的影响,仅仅利用AOD数据无法很好地模拟出PM2.5的空间分布特征.孙成等[14]构建的混合效应模型中加入温度、相对湿度、风速等气象要素,这些要素加入明显提高了PM2.5的模拟精度.这表明气象条件在PM2.5模拟中起着非常重要的作用.冷湘梓等[15]对比分析了非线性模型与多元线性回归模型在PM2.5中重金属的模拟,结果表明非线性模型在PM2.5中重金属模拟的效果好于多元线性回归模型.由于考虑到PM2.5在时间与空间上的异质性,越来越多的学者开始研究时间和空间对空气质量的影响,许多学者把地理加权回归模型(GWR)与时间地理加权回归模型(GTWR)引入到PM2.5模拟研究中[16-18].Guo等[19]利用时空地理加权回归模型、陈辉等[20]利用地理加权回归模型对PM2.5进行了模拟,得到比传统统计模型更好的结果.因它不能客观地反映PM2.5和其他变量之间的非线性关系,所以不具有通用性.
现阶段,越来越多的学者使用机器学习算法来刻画这种非线性关系,并取得了较好的效果.夏晓圣等[21]利用随机森林模型对影响PM2.5的因素进行了分析,发现AOD对PM2.5反演的贡献率最大,达37.96%.刘林钰等[22]则利用深度神经网络模型对PM2.5进行了反演研究,得到的结果比线性模型与非线性模型都要好.耿冰等[23]则提出了一种端到端的深度学习模型对PM2.5进行了模拟,相比于混合效应模型等传统统计模型的模拟效果,该模型的模拟精度有很大的提升.不同于数学统计模型,机器学习以数据为驱动,并把非线性关系进行了充分的刻画,因此,机器学习模型被广泛用于PM2.5的模拟研究[24-27].
在PM2.5模拟研究中,除了气溶胶光学厚度这一主要的影响因素,陈优良等[28]以长江三角洲为研究区,利用GIS空间分析、数理统计等方法,对PM2.5与气象要素的关系进行了研究,结果显示出PM2.5与气象因素中的风速、气压相关性明显.孙成、Beans、潘晨等[14,29-30]的研究同样表明气象因素在PM2.5的模拟中起着非常关键的作用.臧振峰等[31]采用克里格插值与统计学方法,对我国粮产区河南省的PM2.5和PM10的影响因素进行研究,发现年降水量、NDVI和人口密度对PM2.5与PM10的影响最大.因此,本文除了选择气溶胶光学厚度这一主要变量外,不仅考虑了气温、风速、边界层高度、气压、相对湿度等气象因素,还考虑了人口密度和高程以及空间位置特征(纬度).
目前,在PM2.5的区域尺度模拟研究中,前人研究的时间尺度多为月尺度与年尺度,对于日尺度上的研究较少,且利用多机器学习法结合遥感数据估算PM2.5的研究也较少.前人在变量选取上考虑气象变量较多,本文借助MODIS遥感数据,不仅考虑了气象数据,还加入了人口、地形和空间位置等数据.本研究在前人的基础上利用多机器学习法结合遥感数据以山东省为例来模拟日PM2.5的时空变化特征,以便为山东省的大气污染治理提供一定的数据支撑.
1 研究方法与数据
1.1 研究区与数据来源
图1 研究区位置
本研究以山东省为研究区,图1.本文的数据主要包括气溶胶光学厚度(AOD)、气象、高程、人口密度与PM2.5站点实测数据.其中,AOD在PM2.5模拟中起着最为重要的作用.AOD数据来源于美国国家航空航天局(NASA)的MCD19A2数据(https: //ladsweb.modaps.eosdis.nasa.gov/).气象数据(气温(TEM,K)、风速(西风()和南风(),m/s)边界层高度(BLH,m)、气压(SP,hPa)、湿度(RH,%))来自欧洲中期天气预报中心的ERA5陆地小时数据的合成(https://cds.climate.copernicus.eu/#!/home).人口密度(MPD)数据来自WorldPop(https://www.worldpop. org/).高程(DEM,m)数据来自资源环境科学与数据中心(https://www.resdc.cn/).PM2.5站点实测数据来自中国环境监测中心(http://www.cnemc.cn/).
由于原始栅格数据的时间分辨率和空间分辨率不统一,本文对原始栅格数据进行了重采样、投影转换、数据提取和整合,得到统一空间分辨率为1km的数据集,并对空缺值与异常值进行剔除.气溶胶光学厚度数据受云的影响较为严重,云层会导致波段信号无效,因此导致部分区域的气溶胶光学厚度为空值.目前还没有一项很好的技术可以把云对气溶胶光学厚度的影响计算清楚,因此遇到有云的天气时,直接把受到各种云层影响的区域清除掉.
1.2 研究方法
1.2.1 随机森林(RF) 随机森林(Random Forest)[32]的实现借助编程工具python 3.7,将影响PM2.5的因变量逐一输入到模型中,拟合得到最优的PM2.5模拟模型.在模型模拟时,随机选取所有累计数据的80%作为训练数据,剩余的20%作为测试数据,一遍遍地训练1000次,选取皮尔逊相关系数最大的一次研究模型作为PM2.5的模拟模型.本模型所设置的参数如下:叶子的数量为100,叶子节点的最小样本数为2,最大深度为10,bootstrap为True.
1.2.2 BP神经网络(BPNN) BP神经网络(Back Propagation Neural Network)[33]是一种广泛用于地理学中分类与回归的多层前馈神经网路.BP神经网络的编程工具、数据选取与最佳模型选择和随机森林模型的相同,参数设置为:激活函数选择ReLU,传递函数设置为purelin,隐藏层设为8.
1.2.3 支持向量回归(SVR) 支持向量回归模型(Support Vector Regression)[34]在回归问题中广泛使用.支持向量回归的编程工具、数据选取与最佳模型选择和随机森林模型的相同.支持向量回归模型的参数:核函数kernel为RBF,惩罚系数为35,误差阈值gamma为0.2.
1.2.4 深度神经网络(DNN) 2006年Hinton等[35]研究机器学习算法时提出了一个新的研究领域“深度学习”,基础为深度神经网络(DNN),其对地理学的分类与回归问题起到了重要的推动作用.深度神经网络的编程工具、数据选取与最佳模型选择和随机森林模型的相同.深度神经网络的参数设置:数学模型设置为Adagrad,激活函数设置为ELU,传递函数设置为Lambda,隐藏层为32.
1.3 模型评估方法
本文使用3个指标(相关系数2、均方根误差RMSE、平均绝对误差MAE)评估4种机器学习模型的性能,各指标计算公式如下:
2 结果与讨论
2.1 变量相关性分析
本文将影响PM2.5浓度的11个变量与站点实测PM2.5进行相关性分析,结果如表1所示.PM2.5与TEM、、BLH、DEM、、SP呈现明显的负相关;PM2.5与RH、AOD、MPD呈明显的正相关.PM2.5与植被类型(NDVI)、土地利用类型(LUCC)的相关性相对较弱.因土地利用类型和植被类型与PM2.5的相关性较弱,本研究选择除了LUCC和NDVI的其他9个变量,并加入纬度(POINT_Y)共10个变量(由于经度产生分块效果,故不作为变量进行输入)对山东省日PM2.5进行了模拟.由于AOD受到多种因素的影响,导致缺失数据较多.本文一共获得2019年的309天数据,获取的时间有效率为84.65%,AOD有效率为55.98%.
表1 PM2.5与其影响因素的相关性
2.2 机器学习算法的比较
4种机器学习法计算结果如表2所示,2介于0.36到0.76之间,RMSE介于12到33 μg/m3之间,MAE位于6.6到15μg/m3之间.通过比较这4种机器学习模型,发现RF与DNN的相关系数均大于0.67,均方根误差小于15μg/m3,相对绝对误差均小于7μg/m3;SVR和BPNN的相关系数在0.4左右,均方根误差大于24μg/m3,相对绝对误差大于10μg/m3.支持向量回归模型与BP神经网络模型的效果较为接近,2较低,误差较大.深度神经网络模型的相关性较高,平均绝对误差也相对较低,但相较于随机森林模型,其效果略显不足.所以,在这4种模型中,随机森林的表现效果最好,深度神经网络效果次之,支持向量回归和BP神经网络的效果较差.故选择随机森林模型对山东省每日PM2.5进行模拟研究.且本研究利用随机森林模型反演PM2.5的效果好于陈辉、Guo等[17,20]利用多元线性回归模型(2=0.56,RMSE= 37.03μg/m3)、地理加权回归模型(2=0.7,RMSE= 26.2μg/m3)和时空地理加权回归模型(2=0.58, RMSE=30.51μg/m3)得到的效果.相较于线性回归模型、多元线性回归模型、地理加权回归模型的模拟,使用机器学习算法结合遥感数据进行PM2.5模拟的效果更好,误差更低.这在一定程度上也表明,利用遥感数据结合机器学习法进行PM2.5的模拟具有一定的可行性.
表2 机器学习算法对比
2.3 PM2.5时空分布与讨论
利用随机森林模型模拟得到山东省2019年每日的PM2.5,在每个季节随机选择2d,结果如图2所示.春季PM2.5浓度处在较高的水平,由于风力较大,导致空气中粉尘数量较多;夏季PM2.5的浓度下降到一年中较低的水平;秋季PM2.5的浓度开始有明显的增高,其中浓度最高的地方大部分分布在山东的东南部、西南部、西北部,其中菏泽和聊城境内污染最为严重.气温下降、密集的人类活动以及化石燃料的燃烧是导致PM2.5升高的主要原因.在山东的东部和胶州湾附近,由于靠近海洋,风速较大,风速有利于PM2.5的扩散,导致PM2.5的浓度处于较低的水平.但是由于受到海洋性气溶胶的影响,估算的PM2.5的值比较大.在冬季,PM2.5的浓度达到一年中的最高.在每日的PM2.5的反演中,大部分呈现西南高、东北低的趋势.在某些地方,由于没有气溶胶光学厚度数据,所以在图中显示为空白.
山东省2019年季节PM2.5浓度时空分布如图3所示,季节的PM2.5浓度为每日模拟的平均值,其中空白处为AOD数据缺失区域.夏季平均浓度最低为28.605μg/m3,夏季雨水比较充沛,降水过程可以清洗掉空气中的杂质,起到净化空气的作用;温度较高也有利于PM2.5的扩散.春季和秋季平均浓度较为相近分别为44.974μg/m3、45.75μg/m3,春季风速较大,易发生扬尘的情况,导致PM2.5的浓度处于较高的水平.秋季天气逐渐变冷,温度下降不利于PM2.5的扩散,在山东西南部、东南部、西北部,开始燃烧植被作物进行取暖,导致空气中的PM2.5浓度上升.冬季平均浓度最高为79.909μg/m3,由于大量化石燃料燃烧、气温较低等原因,使得山东省的PM2.5浓度处于一年中最高的水平,尤其在枣庄市、菏泽市、聊城市、德州市PM2.5浓度升高尤为明显,整体处于85μg/m3以上,这已经到达了轻度污染的水平,对身体健康已经产生影响,因此对冬季的治理仍要继续.
2019年全年的PM2.5结果如图4所示,PM2.5平均浓度为50.295μg/m3,比国家颁布的GB 3095—2012二级标准的PM2.5浓度35μg/m3高43.7%.其中空白处为AOD数据缺失区域.将本文PM2.5的模拟结果与加拿大达尔豪斯大学大气成分分析小组[36](Atmospheric Composition Analysis Group)模拟的2013年(71.117μg/m3)、2015年(66.714μg/m3)、2017年(51.82μg/m3)的PM2.5结果进行对比,可以看出山东省的整体PM2.5浓度较前几年显著下降,但还没达到国家颁布的二级标准,还需要进一步采取措施进行治理.就2019年来说,污染严重的区域集中在山东的西南部、南部与西北部,包括枣庄、菏泽、聊城和德州等地区,总体呈现西南高、东北低的趋势.
图2 日PM2.5浓度空间分布
a、b位于春季,c、d位于夏季,d、e位于秋季,f、g位于冬季
图3 各季节PM2.5平均浓度空间分布
图4 2019年PM2.5平均浓度空间分布
本文利用多机器学习法结合遥感数据来估算山东省PM2.5的浓度,该方法对其他区域的相关研究具有一定的参考价值.本文对于PM2.5的来源、轨迹以及形成过程涉及较少,接下来可在PM2.5的形成过程和传播路径进行研究.
3 结论
3.1 在四种机器学习方法中,随机森林模型(RF)模拟效果表现最好,其次是深度神经网络模型(DNN),支持向量回归模型(SVR)和BP神经网络模型(BPNN)模拟的表现效果较差.
3.2 2019年山东省的PM2.5空间分布基本呈现西南高、东北低的格局,时间分布为冬季>秋季>春季>夏季,全省污染最为严重的是冬季,尤其在1月和12月.
3.3 将影响PM2.5浓度的变量与PM2.5的实测数据进行相关分析,结果发现,PM2.5与温度、风速、边界层高度、气压和高程呈显著负相关,与湿度、人口密度和气溶胶光学厚度呈显著正相关,气溶胶光学厚度、风速和边界层高度在PM2.5模拟中起着最重要的作用.
[1] Zhao C, Wang Y, Su Z, et al. Respiratory exposure to PM2.5soluble extractdisrupts mucosal barrier function and promotes the development of experimental asthma [J]. Science of The Total Environment, 2020,730:139145.
[2] 曾贤刚,阮芳芳.中国PM2.5污染健康效应的国民经济影响分析 [J]. 中国环境科学, 2020,40(7):3228-3238.
Zeng X G, Ruan F F. Analysis on the national economic impact of PM2.5induced health effects in China [J]. China Environmental Science, 2020,40(7):3228-3238.
[3] Man Y, Huang Y, Shen H, et al. Effects of urban form on haze pollution in China: Spatial regression analysis based on PM2.5remote sensing data [J]. Applied Geography, 2018,98:215-223.
[4] Guan Y, Xiao Y, Wang Y, et al. Assessing the health impacts attributable to PM2.5and ozone pollution in 338 Chinese cities from 2015 to 2020 [J]. Environmental Pollution, 2021,287(9):117623.
[5] Zhang Y, Li Z. Remote sensing of atmospheric fine particulate matter (PM2.5) mass concentration near the ground from satellite observation [J]. Remote Sensing of Environment, 2015,160:252-262.
[6] 梅 杨,党丽娜,杨 勇,等.基于时空克里格的PM2.5时空预测及分析 [J]. 环境科学与技术, 2016,39(7):157-163.
Mei Y, Dang L N, Yang Y, et al. Spatiotemporal prediction and analysis of PM2.5based on spatiotemporal kriging [J]. Environmental Science and Technology, 2016,39(7):157-163.
[7] 李 杰,翟 亮,桑会勇,等.PM2.5浓度插值中不同空间插值方法对比 [J]. 测绘科学, 2016,41(4):50-54+101.
Li J, Zhai L, Sang H Y, et al. Comparison of different spatial interpolation methods for PM2.5[J]. Science of Surveying and Mapping, 2016,41(4): 50-54+101.
[8] Wang J, Christopher S A. Intercomparison between satellite-derived aerosol optical thickness and PM2.5mass: Implications for air quality studies [J]. Geophysical Research Letters, 2003,30(21):2095.
[9] Geng G, Zhang Q, Martin R V, et al. Estimating long-term PM2.5concentrations in China using satellite-based aerosol optical depth and a chemical transport model [J]. Remote Sensing of Environment, 2015,166:262-270.
[10] Liu Y, Rokjin, et al. Mapping annual mean ground-level PM2.5concentrations using multiangle imaging spectroradiometer aerosol optical thickness over the contiguous United States [J]. Journal of Geophysical Research: Atmospheres, 2004,109(D22).
[11] Li Z Q, et al. Remote sensing of atmospheric particulate mass of dry PM2.5near the ground: Method validation using ground-based measurements [J]. Remote Sensing of Environment, 2016,173:59-68.
[12] Lin C, Li Y, Yuan Z, et al. Using satellite remote sensing data to estimate the high-resolution distribution of ground-level PM2.5[J]. Remote Sensing of Environment, 2015,156:117-128.
[13] 景 悦,孙艳玲,徐 昊,等.基于混合效应模型的京津冀地区PM2.5日浓度估算 [J]. 中国环境科学, 2018,38(8):2890-2897.
Jing Y, Sun Y L, Xu H, et al. Daily estimation of PM2.5concentrations based on mixed effects model in Beijing-Tianjin-Hebei region [J]. China Environmental Science, 2018,38(8):2890-2897.
[14] 孙 成,王 卫,刘方田,等.基于线性混合效应模型的河北省PM2.5浓度时空变化模型研究[J]. 环境科学研究, 2019,32(9):1500-1509.
Sun C, Wang W, Liu F T, et al. Spatial-Temporal Simulation of PM2.5Concentration in Hebei Province based on Linear Mixed Effects Model [J]. Research of Environmental Sciences, 2019,32(9):1500- 1509.
[15] 冷湘梓,王勤耕,钱 新,等.基于非线性数学方法的PM2.5中重金属浓度模拟[J]. 中国环境科学, 2017,37(3):821-828.
Leng X Z, Wang Q G, Qian X, et al. Simulation of heavy metal concentrations in PM2.5based on nonlinear mathematics methods [J]. China Environmental Science, 2017,37(3):821-828.
[16] He Q, Huang B. Satellite-based high-resolution PM2.5estimation over the Beijing-Tianjin-Hebei region of China using an improved geographically and temporally weighted regression model [J]. Environmental Pollution, 2018,236(MAY):1027-1037.
[17] Guo Y X, Tang Q H, Gong D Y, et al. Estimating ground-level PM2.5concentrations in Beijing using a satellite-based geographically and temporally weighted regression model [J]. Remote Sensing of Environment, 2017,198:140-149.
[18] Liu N, Zou B, Li S, et al. Prediction of PM2.5concentrations at unsampled points using multiscale geographically and temporally weighted regression [J]. Environmental Pollution, 2021,284:117116.
[19] Guo B, Wang X, Pei L, et al. Identifying the spatiotemporal dynamic of PM2.5concentrations at multiple scales using geographically and temporally weighted regression model across China during 2015~2018 [J]. Science of The Total Environment, 2020,751:141765.
[20] 陈 辉,厉 青,张玉环,等.基于地理加权模型的我国冬季PM2.5遥感估算方法研究[J]. 环境科学学报, 2016,36(6):2142-2151.
Chen H, Li Q, Zhang Y H, et al. Estimations of PM2.5concentrations based on the method of geographically weighted regression [J]. Acta Scientiae Circumstantiate, 2016,36(6):2142-2151.
[21] 夏晓圣,陈菁菁,王佳佳,等.基于随机森林模型的中国PM2.5浓度影响因素分析[J]. 环境科学, 2020,41(5):2057-2065.
Xia X S, Chen J J, Wang J J, et al. PM2.5Concentration influencing factors in China based on the random forest model [J]. Environmental Science, 2020,41(5):2057-2065.
[22] 刘林钰,张永军,李彦胜,等.基于深度学习的华东地区PM2.5浓度遥感反演[J]. 环境科学, 2020,41(4):1513-1519.
Liu L Y, Zhang Y J, Li Y S, et al. PM2.5inversion using remote sensing data in Eastern China based on deep learning [J]. Environmental Science, 2020,41(4):1513-1519.
[23] 耿 冰,孙义博,曾巧林,等.基于深度学习方法的PM2.5精细化时空估算模型 [J]. 中国环境科学, 2021,41(8):3502-3510.
Geng B, Sun Y B, Zeng Q L, et al. Refined spatiotemporal estimation model of PM2.5based on deep learning method [J]. China Environmental Science, 2021,41(8):3502-3510.
[24] 康俊锋,黄烈星,张春艳,等.多机器学习模型下逐小时PM2.5预测及对比分析 [J]. 中国环境科学, 2020,40(5):1895-1905.
Kang J F, Huang L X, Zhang C Y, et al. Hourly PM2.5prediction and its comparative analysis under multi-machine learning model [J]. China Environmental Science, 2020,40(5):1895-1905.
[25] Li J, Garshick E, Hart J E, et al. Estimation of ambient PM2.5in Iraq and Kuwait from 2001 to 2018 using machine learning and remote sensing [J]. Environment International, 2021,151(151):106445.
[26] Mg A, Yc A, As A, et al. Estimating daily high-resolution PM2.5concentrations over Texas: Machine learning approach [J]. Atmospheric Environment, 2021,247:118209.
[27] Chen W, Ran H, Cao X, et al. Estimating PM2.5with high-resolution 1-km AOD data and an improved machine learning model over Shenzhen, China [J]. Science of the Total Environment, 2020,746: 141093.
[28] 陈优良,李亚倩.长三角PM2.5和O3变化特征及与气象要素的关系[J]. 长江流域资源与环境, 2021,30(2):382-396.
Chen Y L, Li Y Q. Characteristics of O3and PM2.5and its relationship with meteorological factors in Yangtze River Delta [J]. Resourcesand Environmentin the Yangtze Basin, 2021,30(2):382-396.
[29] 史旭荣,逯世泽,易爱华,等.全国2018~2019年秋冬季气象条件变化对PM2.5影响研究 [J]. 中国环境科学, 2020,40(7):2785-2793.
Shi X R, Lu S Z, Yi A H, et al. Impact of meteorological conditions on PM2.5in autumn and winter of 2018~2019 in key areas [J]. China Environmental Science, 2020,40(7):2785-2793.
[30] 潘 晨,康志明.2001~2019年气象条件对江苏省PM2.5分布的影响[J]. 环境科学, 2022,43(2):649-662.
Pan C, Kang Z M. Impact of meteorological conditions on PM2.5in Jiangsu Province from 2001 to 2019 [J]. Environmental Science, 2022,43(2):649-662.
[31] 臧振峰,张凤英,李永华,等.我国主要粮产区PM2.5、PM10时空分布特征及影响因素——以河南省为例[J]. 自然资源学报, 2021,36(5): 1163-1175.
Zang Z F, Zhang F Y, Li Y H, et al. Spatiotemporal distribution and affecting factors of PM2.5and PM10in major grain producing areas in China: A case study of Henan province [J]. Journal of Natural Resources, 2021,36(5):1163-1175.
[32] Breiman. Random forests [J]. Mach Learn, 2001,2001,45(1)(-):5-32.
[33] DE Rumelhart, Hinton G E, Williams R J. Learning representations by backpropagating errors [J]. Nature, 1986,323(6088):533-536.
[34] Cortes C. Support-vector networks [J]. Machine Learning, 1995,20 (3):273-297.
[35] Hinton G E, Osindero S, Teh Y W. A fast learning algorithm for deep belief nets [J]. Neural Computation, 2014,18(7):1527-1554.
[36] Donkelaar A V, Martin R V, Li C, et al. Regional estimates of chemical composition of fine particulate matter using a combined geoscience-statistical method with information from satellites, models, and monitors [J]. Environmental Science and Technology, 2019,53(5): 2595-2611.
Simulation of daily PM2.5based on MODIS data and multi-machine learning method.
XU Fa-zhao, LI Jing*, CHU Xin-de, MAN Yuan-wei
(College of Geography and Environmental Science, Northwest Normal University, Lanzhou 730070, China)., 2022,42(6):2523~2529
In order to further understand the spatial distribution of PM2.5on the ground,based on the PM2.5measured data in 2019, MCD19A2 aerosol optical depth product of the Moderate Resolution Imaging Spectroradiometer (MODIS) at the L3 level, taking Shandong Province as the study area, and fully considering the factors including population, terrain, and weather. The daily PM2.5in 2019 was simulated by using the four machine learning algorithms of Random Forest (RF), Support Vector Regression (SVR), Back Propagation Neural Network (BPNN), and Deep Neural Networks (DNN). The result shows the RMSE and MAE values of the RF are 12.67 and 6.62, respectively, which are better than BPNN, SVR and DNN models. RF is most suitable for the daily PM2.5simulation in Shandong Province.
remote sensing;PM2.5;AOD;machine learning
X513
A
1000-6923(2022)06-2523-07
徐发昭(1998-),山东德州人,西北师范大学硕士研究生,主要从事生态环境与GIS应用的研究.
2021-11-24
国家自然科学基金资助项目(41861013,42071089,41801052)
* 责任作者, 副教授, li_jinger@163.com