APP下载

福州市城区PM10浓度空间插值方法对比研究

2021-03-09周淑玲

海峡科学 2021年1期
关键词:实测值克里插值

周淑玲

(福建省福州环境监测中心站,福建 福州 350011)

空间插值技术始于20世纪50年代,是根据已有的空间数据预估未知空间数据的方法,对于获取已知采样点周边空白区域环境属性有重要意义。随着空间插值技术的发展,不断衍生出各种插值方法,而不同方法间的对比研究也越来越受到重视。张海平等对不同空间插值方法进行了实验对比,并提出了各方法的适用性建议[1]。李金洁等对西南地区月降雨量的多种插值方法对比结果显示,整体上克里金插值效果明显优于反距离加权法[2]。近年来,随着大气环境质量受到越来越多关注,更多学者开始研究利用空间插值方法估计大气污染物浓度的空间分布特点。Wu等对美国南加州森林大火前后PM10浓度变化进行了研究,结果表明,反距离权重插值法预测结果比克里金更好[3]。丁卉等基于珠三角地区大气环境自动监测站的主要污染物数据,对三种空间插值方法进行比较分析,其研究结果显示克里金法插值效果最佳[4]。

本文基于福州市城区空气自动监测站数据,对PM10浓度监测数据进行数据探索性分析,并采用反距离权重法、径向基函数法和普通克里金插值法对福州市城区PM10浓度进行插值,最后运用交叉验证对插值后PM10浓度实测值与预测值进行误差计算,对比分析了各种空间插值方法的效果,为福州市PM10浓度的空间插值提供决策依据。

1 数据来源

本研究使用的PM10质量浓度数据取自2019年1月1日至12月31日福州22个空气自动监测点,包含5个国控监测点、7个市控监测点、10个区控监测点(详见图1)。选取1月、4月、7月、10月分别代表一年四季,对PM10的浓度进行空间插值分析,分别计算4个代表月份的PM10质量浓度均值及均方差(表1)。结果显示,福州市夏季PM10浓度均值及均方差分别为35.35μg/m3、11.85μg/m3,都明显低于其他季节,呈现明显的季节性特征。

表1 福州市城区PM10浓度数据统计结果 单位:μg/m3

图1 福州市城区PM10自动监测站点空间分布

2 插值方法

2.1 数据分析

为了更好地认识研究对象,并在插值过程中做出更好的决策,从而提高空间插值准确率,在空间插值前需对已有样点数据进行分析,主要是对数据的分布特征进行探究。常用的有直方图分布、正态QQ分布图、趋势分析等数据分析方法,其中直方图是显示数据概率分布特征的统计指标,正态QQ分布图用于检查数据的正态分布情况,而趋势面分析则能够发现数据是否在某个方向上有分布趋势。本文应用这三种常用方法分别对四个季度的样点数据进行分析,PM10样点直方图结果显示,PM10浓度日均值为67.455μg/m3,中位数值为67.5μg/m3,二者较为接近,偏度为0.03,接近于0,接近正态分布。正态QQ分布图(图2)中样点分布基本接近45°参考线,数据整体分布倾向于标准正态分布,故后续进行克里金插值时无需进行数据变换。趋势面分析图(图3)显示,PM10在南-北方向和西-东方向均呈现平缓、再逐渐降低的趋势。

图2 PM10样点正态QQ分布图

2.2 空间插值方法

空间插值是根据已有空间数据预估未知空间数据的方法,根据其数学本质不同,可分为确定性空间插值和地统计空间插值。本文选取了应用较为广泛的反距离权重插值法、径向基函数法这两种确定性插值方法,以及普通克里金插值的地统计插值方法。利用地理信息的ArcGIS软件实现空间插值。

(X轴为东方,Y轴为北方,Z轴为数据值,垂直的黑线高度表示数据的大小)

2.2.1 反距离权重法(Inverse Distance Weighting,IDW)

反距离权重法是空间插值方法中最简单,也是应用较多的一种。它假定空间中任意点均有其影响力,并且距离越近,影响力越大,即基于距离较近的事物要比距离较远的事物更相似的假设。相对于距离预测位置较远的实测值,距离预测位置较近的实测值对预估值的影响更大。因此,通过给已知点赋权重值来预测未知点,权重值随着距离增大而减小,所以称之为反距离权重法。

2.2.2 径向基函数法(Radial Basis Function,RBF)

径向基函数法指某种沿径向对称的标量函数,由于距离是径向同性的,因此通常定义为样本到数据中心之间欧氏距离的单调函数。

函数的形式为:

(1)

其中,Xi是函数的中心,φ以输入空间的点X与Xi中心的距离为自变量,因此称为径向基函数。

2.2.3 普通克里金插值(Ordinary Kriging,OK)

普通克里金插值的应用范围极为广泛,其基本原理是基于数据满足正态分布的假设,首先计算样本的变异函数,在此基础上,选择对应的理论模型进行模拟,最后应用模拟的变异函数对未知点进行预测[5]。

2.3 插值结果验证

由于反距离权重插值法和径向基函数法的实测值与预测值无任何误差,因此,为了定量分析3种插值方法的精确性,采用交叉验证对插值结果进行分析,首先逐一剔除某一站点数据,然后利用其他站点数据来模拟生成该站点的预测值,最后通过对比预测值与实测值,从而了解空间插值的误差情况。采用平均误差(ME)、均方根误差(RMS)、平均相对误差(MRE)三个评价指标对空间插值结果进行评价。通过计算实测值与预测值间的相关系数(R)来评估空间插值结果的可靠性。

平均误差(ME)是实测值与预测值之间差值的平均值,反映预测误差的整体分布情况,计算公式如下:

(2)

均方根误差(RMS)指模型预测结果与实测值的偏离程度,值越小,说明预测结果越接近实测值,计算公式如下:

(3)

平均相对误差(MRE)是指预测值与实测值的绝对偏差相对实测值的百分率,反映了预测值相对实测值的准确度,计算公式如下:

(4)

相关系数用于评价两个连续变量的相关程度:

(5)

3 结果与讨论

3.1 插值结果的显著性检验

利用福州市城区22个大气环境自动监测站的PM10浓度监测数据,基于反距离权重插值法、径向基函数法、普通克里金法对福州市城区PM10浓度进行空间插值。分别计算三种插值方法PM10实测值与预测值的相关系数(表2),从表2可以看出,三种方法预测值与实测值的相关系数都很高,其中普通克里金法最高,达0.933,而反距离权重法最低,为0.917。且三种插值方法反映显著性水平的P值均小于0.01,说明三种方法的预测值与实测值具有显著相关性,结果可靠。

表2 空间插值预测值与实测值的相关系数

3.2 空间插值交叉验证结果

对空间插值结果进行交叉验证,得到不同空间插值方法的整体结果(表3)。从表3可以看出,三种空间插值方法中,径向基函数法和普通克里金插值的平均误差(ME)为正,而反距离权重插值法的平均误差(ME)为负,说明径向基函数法和普通克里金法的插值结果整体上是略高于实测值,反距离权重插值法则是低于实测值,且普通克里金法的平均误差最小,仅为0.06μg/m3。从均方根误差(RMS)结果看,普通克里金法的RMS为6.97μg/m3,是三种方法中最小的,说明其插值结果最接近于实测值,插值精度最高,而反距离权重法的插值结果偏离实测值最多。从平均相对误差(MRE)看,普通克里金为0.126,仍是三种方法中最小的,可见相对于测量值来说,简单克里金法的插值结果也是最为准确的。

表3 三种空间插值方法的交叉验证结果

综上可见,整体上,普通克里金法的空间插值效果最理想,其次是径向基函数法,而反距离权重法则最差。普通克里金法在插值过程中既考虑了未知点与已知站点位置的相关性,同时还考虑了变量之间的空间相关性[6],并且引入变异函数,使得整体插值效果最优、插值误差最小。

简单克里金法虽然是三种方法中插值精度最高的,但是其RMS值也达到6.97,说明方法的精度还不是非常理想,这主要是因为PM10的分布不是简单的空间分布,还受温度、湿度、气压等大气因素的影响[7],由于本文主要是比较几种插值方法,所以并未将这些因素考虑进来。

3.3 季节对插值结果的影响

对三种插值方法,按月份统计插值结果(表4,图4),从图4可以看出,三种插值方法在任一月份的均方根误差都是普通克里金法最低,径向基函数法次之,而反距离权重法最高。可见,三种插值方法的优劣排名并未受季节的影响。

反距离权重法 径向基函数法 普通克里金法

表4 三种空间插值方法的月插值结果

图4 三种空间插值方法的均方根误差图

研究发现,夏季的插值结果是四季中最好的,其均方根误差明显小于其他季节,特别是普通克里金法的MRE仅为4.23μg/m3,而冬、春季的插值结果偏离实测值较多,插值结果较差。可见PM10的季节性分布特征对空间插值结果有显著影响。夏季是福州市一年中气温最高并且湿度较大的时期,气温越高、湿度越大,有利于气体扩散[8],PM10浓度就低,同时空气扩散快,各监测站点间浓度差异小,均方根误差也低,空间数据分布较为均匀,因此空间插值效果也最好。

从误差分布图(图5)可以看出,7月插值结果的误差分布较其他月份明显更集中,且是紧密分布在0点两侧,而1月误差分布则明显偏离在0点的右侧,预测值整体高于实测值,10月则偏离在0点的左侧,预测值整体低于实测值。因此,在进行插值时可考虑对结果进行整体的偏移,以降低插值误差。

此外,从表4中可以看出,夏季径向基函数法与普通克里金法的插值结果MRE分别为4.24μg/m3、4.23μg/m3,二者较为接近,说明PM10浓度低且分布较为均匀时,径向基函数法只是略逊于普通克里金法,但是考虑到普通克里金插值对数据要求高,且算法更为复杂,此时可选择径向基函数法。

3.4 PM10浓度插值空间分布图

从PM10浓度插值空间分布图(图6)可以看出,三种插值方法的PM10浓度分布趋势是一致的,4月26日PM10浓度分布图(图6a)以三坊七巷为中心,往外浓度不段上升,其次是在东南面也有一个PM10浓度低值片区;4月27日(图6b)PM10浓度形成西北-东南条带浓度低,而东北、西南片区浓度高的趋势。此外,从图中可见,普通克里金插值的PM10浓度空间分布图局部存在块状想象,平滑性最差,可观性低,这是克里金插值过程中充分考虑了数据点之间的空间相关性导致的,而反距离法的插值图数据不合理现象最为明显,即出现多个孤立点数据异于周围数据(图中圆圈处),不符合空气质量的分布规律,这是因为IDW插值过程中只考虑了距离这个因素,使得插值结果易受数据集群影响[5]。因此在插值结果相近的情况下,考虑插值结果的可观性,可优先选择径向基函数法进行插值。

(a)反距离权重法

4 结论

①三种插值方法的计算结果表明,福州市城区PM10浓度空间插值预测值与实测值相关系数都很高,特别是普通克里金法最高,达到0.933。且三种插值方法反映显著性水平的P值均小于0.01,说明三种方法的预测值与实测值具有显著相关性,结果可靠。

②通过交叉验证,从统计插值结果的平均误差(ME)、均方根误差(RMS)、平均相对误差(MRE)看,普通克里金法的空间插值效果最理想,其次是径向基函数法,而反距离权重插值法则最差。

③PM10的季节性分布特征对空间插值结果有显著影响。三种插值方法中,夏季插值结果均明显优于其他季节,这是因为PM10浓度低,均方根误差也低时,空间数据分布较为均匀,因此空间插值效果也最佳。而夏季径向基函数法插值结果只略逊于普通克里金法,此时可选择径向基函数法。

④三种插值方法的PM10浓度空间分布趋势较为一致,但是普通克里金插值的PM10浓度空间分布图局部存在块状现象,可观性低,而反距离法的插值图数据不合理现象最为明显,因此在插值结果相近的情况下,考虑插值结果的可观性,可选择径向基函数法进行插值。

猜你喜欢

实测值克里插值
滑动式Lagrange与Chebyshev插值方法对BDS精密星历内插及其精度分析
大银幕上的克里弗
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
常用高温轴承钢的高温硬度实测值与计算值的对比分析
市售纯牛奶和巴氏杀菌乳营养成分分析
你今天真好看
一种基于实测值理论计算的导航台电磁干扰分析方法
你今天真好看
基于pade逼近的重心有理混合插值新方法
混合重叠网格插值方法的改进及应用