APP下载

基于小波分析的太原市空气质量变化特征及预测

2019-02-16姚清晨张红

关键词:子集太原市回归方程

姚清晨,张红

(1.太原市环境监测中心站,山西 太原 030002;2.山西大学 环境与资源学院,山西 太原 030006)

0 引言

随着城市人口的不断增加,经济和科技的高速发展,排放到空气中的污染物愈加复杂,因此,深入了解一个地区空气污染的变化特征并做出准确的预报也愈发重要。已有研究表明,空气污染物时空变化与气象条件之间有着密切的关系。许多学者从空气污染的特征、空气污染与气象因子的关系等方面对不同城市的空气污染展开探讨。Dunea[1]采用小波和神经网络方法,对罗马尼亚城市空气污染物浓度进行了预测;王式功[2]等研究兰州城区冬半年冷锋活动及其对空气污染的影响,并建立了兰州冬半年污染浓度与气象要素的回归方程;Morabito[3]等采用小波分解和神经网络结合的方法进行了空气污染物的预测研究;林祥明[4]等探讨了污染物浓度与气象因子分布规律,建立气象预报指标及统计预报方程;高歌[5]对我国1961~2005年霾的气候特征研究中发现,霾日变化趋势与日照时数变化趋势相反;张浩等[6]采用广义隐马尔可夫模型对北京市PM2.5浓度进行了预测,结果表明广义隐马尔可夫对重污染天气的预测准确率较高。胡清华等[7]利用大数据的分析机理与空气质量模型,建立了福州市城市空气质量实时精细化模拟与预报系统。

关于太原市大气环境质量的研究同样已陆续有报道,张桂香[8]等研究了太原市PM2.5的碳组分的特征和季节变化;刘珊[9]等研究了太原市PM2.5中有机碳和元素碳的污染特征;王璐[10]等对大气颗粒物中水溶性无机离子质量浓度及粒径分布进行了测定;张红[11]等建立了基于ANN和吸入因子模型,对PM10浓度进行了预测和健康评估。但以上有关太原市空气污染的研究大多是从污染物的化学成分、污染特征、健康风险等方面进行研究,而针对太原市空气污染物的时间序列变化特征以及污染物与气象因子之间相关性分析并建立预报模型的研究尚不多见。

根据太原市环境监测中心站2013年1月~2016年12 月的空气质量指数AQI以及PM2.5、NO2、SO2等污染物监测浓度为研究对象,结合太原市地面气象数据,采用相关分析、小波分析等方法对太原市空气质量AQI(air quality index)变化特征进行了研究,同时采用小波去噪和最优子集回归方法分别建立AQI的春、夏、秋、冬季预报方程。本文研究目的:1)探明近3 a太原市空气质量和主要空气污染物的变化规律;2)分析太原市空气污染与地面气象要素之间的关系;3)基于小波分析研究AQI、PM10和SO2浓度的时间序列周期,发现潜在的变化规律;4)采用小波去噪和最优子集回归方法建立AQI指数的预报方程,为太原市政府针对不同季节和气象条件下制定空气污染防御措施,做好不利气象条件来临前的准备和部署提供依据。

1 数据与分析

1.1 数据来源

采用的空气污染物数据来自太原市环境监测中心站,时段为2013年1月1日至2016年12月31日,测定指标包括可吸入颗粒物(PM10)、可入肺颗粒物(PM2.5)、 二氧化硫(SO2)、二氧化氮(NO2)、一氧化碳(CO)、臭氧(O3)浓度的日平均值数据,监测采样仪器主要在包括太原市城区尖草坪、涧河、金胜、晋源、南寨、上兰、桃园、小店和坞城9个环境监测站点。空气污染物浓度使用自动化监测系统,全年365 d连续运行,每天不少于18 h,监测采样及分析方法见表1。气象数据来源于国家气象科学数据共享服务平台中国气象数据网(http:∥data.cma.cn/site/index.html),下载日期为2017年3月,测定指标包括日平均能见度、大气压、室外温度、室外湿度、风速等5个气象要素。

1.2 数据处理与分析

1.2.1 AQI计算与统计分析

根据太原市逐日污染物浓度及污染物浓度限值计算空气质量指数AQI。AQI数值越大,说明空气污染状况越严重,对人体的健康危害也就越大[12]。采用描述性统计计算太原市AQI及污染物浓度的均值、标准差、最大值、最小值等统计指标;采用Spearman相关系数分析AQI与污染物浓度及气象因素之间的相关性。统计分析在R软件中实现。

表1 太原市环境空气监测采样及分析方法

1.2.2 小波分析与小波去噪

小波分析即通过增加或减小伸缩尺度来得到信号的低频和高频信息,然后分析信号的概貌或细节,实现对信号不同时间尺度和空间局部特征的分析[13]。小波基函数的选取在很大程度上影响小波分析的准确性,同一信号或时间序列,若选择不同的小波基函数,所得的结果往往会有所差异。本文采用db3(Daubechies)小波基函数对AQI和相关气象因子进行小波分析,研究污染物浓度时序数据中隐藏的周期规律。在此基础上,将污染物浓度时间序列进行小波去噪,将原时间序列通过小波算法变换后,选取一个合适的阀值,大于阀值的小波系数被认为是有信号产生的,予以保留;小于阀值的则认为是噪声产生的,置为零从而达到去噪目的。通过对原始AQI和相关气象因子数据进行小波分解,低频部分的小波分解系数(LL)作为有用信号被保留下来,噪声部分包含垂直方向上的小波分解系数(HL)、水平方向上的小波分解系数(LH)和对角线方向上的小波分解系数(HH)中,对HL、LH、HH作相应的小波系数处理,然后对信号进行重构,得到小波去噪后的时间序列。小波分析和小波去噪在MATLAB软件中实现。

1.2.3 最优子集回归

采用最优子集方法对太原市空气质量AQI指数进行预测。最优子集回归是从对因变量有影响的自变量集合中,依据特定准则选择出最有效的自变量子集构成回归方程[14],回归方程的复相关系数达最大时相应的模型即为最优子集回归模型[15]。根据输入指标的不同分为以下四种模型:OSRm(仅气象因子)、OSRm+h(气象因子+前一天AQI指数)、DN-OSRm(去噪后气象因子)、DN-OSRm+h(去噪后气象因子+去噪后前一天AQI指数)。采用平均绝对误差(MAE)与均方根误差(RMSE)对构建的四种模型进行拟合优度判定,MAE与RMSE越小,模型拟合度越好。最优子集回归R软件中实现。

2 结果分析

2.1 太原市AQI及主要污染物浓度变化特征分析

依据空气质量指数计算方法可得到太原市AQI指数,然后对AQI指数及主要污染物PM10、PM2.5、SO2和NO2浓度数据绘制逐日的时间序列并分析,结果见表2。

根据“环境空气质量指数(AQI)技术规定(试行)(HJ633—2012)”规定,AQI指数0~50为一级优,51~100为二级良,101~150为三级轻度污染,151~200为四级中度污染,201~300为五级重度污染,>300为六级严重污染。太原市日AQI指数多分布在100~200标准线之间(图1a),表明2013~2015年太原市日空气质量多为良或轻度污染。冬半年(11~4月)出现中度污染甚至重度污染的概率较大,冬半年污染程度明显严重于夏半年。从3 a中出现严重污染的天数来看,主要集中在2013年春天和2014年冬天,有文献表明[16],2013年春天重污染天气的发生与不利气象条件有关。

从AQI年均值及最值统计结果来看(表2、图1a),2013年~2015年,太原市AQI指数均值呈现逐年降低趋势。污染最严重时期出现在2013年,重污染天数共计38 d,其中AQI最大值达到了462,到2015年,重污染天数共计32 d,其中AQI最大值为301,说明无论是污染天数还是污染程度都有了减轻。从AQI优良天数及比例来看,AQI年优良天数在稳步增加,从2013年的162 d,到2014年的197 d,到2015年的230 d,

说明相关的治理和防治措施产生了明显效果。

从PM10和PM2.5的时间序列分析可知(图1b、1c),PM10、PM2.5浓度超过国家《环境空气质量标准》二级日均值标准的天数较多,全年均有分布,表明太原市颗粒物的污染较为严重,PM10、PM2.5时间序列与AQI时间序列的变化趋势基本一致,反映出PMl0和PM2.5是太原市主要的污染物。由PM10和PM2.5统计结果来看(表2),两种污染物浓度均值及最大值均逐年减小,说明太原市PM10、PM2.5浓度在逐年降低,PM10、PM2.5优良天数及比例3 a内明显提高,环境治理取得显著效果。

从SO2年均值及最值统计结果来看(表2),3 a间SO2浓度均值及优良天数及比例变化不明显,且2015年SO2浓度最大值明显提高。结合时间序列分析(图1d),SO2的时间序列变化趋势与AQI的趋势并不完全一致,3 a内SO2浓度降低不明显。从NO2年均值及最值统计结果来看(表2),3 a间NO2浓度均不超标,表明NO2不是太原市主要空气污染物。

表2 太原市环境空气质量指数AQI及主要污染物浓度的统计特征值

2013~2015年,太原市PM10、PM2.5浓度和AQI指数逐年下降,但SO2浓度变化幅度不大。这主要与污染物来源不同有关,太原市PM10、PM2.5的污染源主要包括扬尘、燃煤尘、机动车尾气尘、硫酸盐、土壤风沙尘、建筑水泥尘等,SO2的主要污染源是含硫燃料(如煤)的燃烧。2013~2015年,太原市政府对城中村锅炉燃煤进行清洁燃料的置换,用焦炭置换原煤,因此城中村冬季取暖造成的颗粒物排放量明显下降,同时太原市政府扩大柴油车禁止驶入区域、实施必要时的机动车限行措施、重污染企业错峰生产、限产、停产等一系列措施,因此太原市AQI指数和PM10、PM2.5浓度呈下降趋势;对于SO2而言,由于城市建筑面积不断扩大,集中供暖面积也在扩大,用于冬季取暖的用煤量并没有明显下降,因此SO2浓度降低不明显。虽然近年来太原市空气质量有了明显改善,但与国外及国内其他城市相比[17-19],太原市各项环境指数和污染指标仍处于较高水平,形势不容乐观。

Fig.1 Daily time series of AQI and main pollutants from 2013/1/1 to 2015/12/31图1 2013年1月—2015年12月太原市空气污染的逐日变化(虚线分别代表《环境空气质量标准》(GB 3095—2012)各污染物的二级日均值标准)

2.2 太原市AQI、空气污染物和气象因子的相关分析

太原市2013年1月~2015年12月AQI、空气污染物及气象因子间的Spearman相关分析结果见图2。

从AQI与空气污染物的相关性来看,影响太原市AQI的污染因子依次为:PM2.5、PM10、SO2、CO、NO2、O3,AQI与PM2.5和PM10的相关系数最高,达到了0.94和0.93,其次是SO2、CO和NO2,AQI和各污染物的相关性均达极显著(P<0.001)。从AQI与气象因子的相关分析可以看出,与AQI相关性由强到弱的气象因子依次为:能见度、室外温度、风速、臭氧、大气压强、室外湿度,其中AQI与能见度、室外温度和风速的相关性达到极显著水平(P<0.001),AQI和室外湿度不具有显著性相关关系。

从空气污染物与气象因子的相关性来看,污染物浓度与气象因子具有相对较强的相关性。除O3以外的5种污染物与风速、能见度、室外温度之间的相关系数呈负数,说明风速、温度越大,污染物浓度越低,能见度越高。大气压强与除O3外的其他污染物浓度呈正相关关系,表明大气压越高,污染物浓度也越高,较低的大气压不利于污染物的扩散。O3浓度与气象因子的相关性比较特殊,随风速和温度的增大而增大,这是由于大气中垂直向的湍流作用以及风速大小对臭氧“飘移”所造成的现象[20]。

Fig.2 Correlations between AQI,pollutants and meteorological factors图2 AQI、各种污染物及气象因子之间的相关关系(*P<0.05,**P<0.01,***P<0.001)

2.3 基于小波分析的太原市AQI指数的周期变化特征

为进一步研究太原市污染状况的周期变化特征,利用db3(Daubechies)小波对AQI和相关气象因子进行小波分析。图3给出了AQI、大气压、风速、能见度、室外湿度、室外温度等相关气象因子的5层db3小波分解滤波图。

Fig.3 Wavelet decomposition of AQI and meteorological factors图3 AQI及相关气象因子的小波分解图

小波滤波图比原时间序列图更加平滑,更直观地反映了各污染物浓度随时间的变化。AQI及相关气象因子均具有较明显的年际周期振荡、30~60 d的季节周期振荡、10~20 d的双周振荡及5~7 d的单周振荡。由图3a可知,每年10~11月份,太原市污染程度开始加剧,3~4月逐渐回落,期间为北方的供暖期,大量燃煤产生了的悬浮颗粒物、SO2浓度增加,影响空气质量随之降低;结合气象因子小波图可知(图3b~图3f),近年来太原市冬季风速较低,燃煤产生的污染物无法快速扩散,长期滞留城区,能见度降低,污染物浓度上升加快。此外,AQI变化具有较强的节日性,每年国庆期间污染开始加剧,春节期间达到最大值,主要原因为节日期间市区车流量增加,尾气排放加剧,空气中颗粒物大量增加,直接影响空气质量。总的来看,太原市AQI具有明显的周期性特征,这种周期震荡主要受人类活动影响,但气象因素对空气质量也有较强影响。

2.4 太原市空气污染物的最优子集预测

2.4.1 基于原始时间序列数据的AQI预测

采用日平均能见度、气压、室外温度、室外湿度、风速5个气象因子为自变量,建立AQI指数的最优子集回归模型(OSRm)。同时,由于空气污染物具有累积效应、持续性特征,因此历史状况与预测目标关系密切,在上述模型中加入前一时刻历史AQI数据作为模型输入变量,建立基于气象因子和历史数据的预测模型(OSRm+h)。两种模型的拟合结果见表3。

由表3列化OSRm所建的最优子集回归方程可知,春、夏、秋、冬所建回归方程的复相关系数分别约为0.519 4、0.607 9、0.577 7、0.450 5,分别经F检验,回归效果均显著(P<0.05),冬季所建方程的拟合效果相对较差。这可能由于冬季是太原市供暖旺季,且煤炭为主要热源,导致空气污染物浓度受人为供暖影响较大,而受气象条件影响较小。引入前一时刻历史AQI数据,分别建立春、夏、秋、冬的OSRm+h回归方程,经F检验,回归效果均显著(P<0.05)四个季节OSRm+h方程的复相关系数为0.588 6、0.636 0、0.659 0、0.474 6,拟合度均明显提高,说明历史数据的引入在一定程度上提高了模型精度,有助于提升模型泛化能力。

表3 基于原始时间序列数据的AQI最优子集回归方程

2.4.2 基于小波去噪时间序列的AQI预测

将日平均能见度、气压、室外温度、室外湿度、风速5个气象因子和AQI指数进行小波去噪(DN),去除数据中的突变值,减少噪声,重建最优子集回归方程。方程分为:仅考虑去噪后气象数据进行AQI指数建模(DN-OSRm)、去噪后气象数据加前一天去噪后AQI值进行AQI指数建模(DN-OSRm+h),结果见表4。

表4 基于小波去噪时间序列的AQI最优子集回归方程

由表4中DN-OSRm所建的最优子集回归方程可知,春、夏、秋、冬所建回归方程的复相关系数分别约为0.582 9、0.623 4、0.605 0、0.474 5,经F检验,回归效果均显著(P<0.05)。其中春、夏、秋三季的拟合效果较好,冬季拟合效果较差。DN-OSRm+h所建的回归方程的复相关系数分别约为0.652 5、0.687 5、0.699 7、0.531 5,经F检验,回归效果均显著(P<0.05),表明历史数据引入到小波去噪后的时间序列中,提高了模型的预测精度。

2.4.3 四种模型对比分析

分别采用四种模型:OSRm(仅气象数据)、OSRm+h(气象数据+历史AQI数据)、DN-OSRm(去噪后气象数据)、DN-OSRm+h(去噪气象数据+去噪历史AQI数据)对2016年AQI值进行拟合,得到AQI指数的最优子集回归方程拟合曲线(图4)。由图4可见,所建的最优子集回归模型对AQI的升降趋势、峰值、谷值均具有较好的预测。四种回归模型的预测误差分析见表5。

从是否增加历史AQI数据来看,增加前一天的AQI数据后,回归方程的拟合值与真实值之间的MAE与RMSE均有降低。因此增加前一天AQI数据所建的最优子集回归方程比单选用气象因子更优。

从是否对数据进行小波去噪处理来看,对数据进行小波去噪后,回归方程的拟合值与真实值之间的MAE与RMSE均有降低。因此对数据进行小波去噪后所建的最优子集回归方程比使用原始数据更优。

Fig.4 Fitting curves with the 4 models and original curves of 2016,Taiyuan图4 2016年太原市AQI原始时间序列与模型拟合时间序列

模型MAERMSE OSRm27.189 0840.106 56 OSRm+h25.916 4238.688 14 DN-OSRm26.781 7739.138 24 DN-OSRm+h25.524 2137.368 67

综合而言,对原始数据进行小波去噪并且引入历史数据后,所建立的“去噪气象数据+去噪历史AQI数据”模型可以较好地实现对太原市AQI指数的短期预测。

3 结论与讨论

利用2013年1月~2015年12月太原市PM2.5、NO2、SO2等污染物数据资料,采用相关分析、小波分析、功率谱分析等方法对太原市空气污染的变化特征与地面气象各要素的关系进行研究,同时对太原市空气质量指数建立了最优子集回归模型并得出以下结论:

(1)从2013年~2015年的监测和统计分析来看,太原市的环境空气质量有所好转且逐年进步,2013~2015年期间,太原市空气质量多数情况下为良或轻度污染。PM10、PM2.5为太原市主要的污染物,其次为SO2,PMl0、PM2.5及SO2的变化基本一致,异常峰值出现在冬季,具有冬强夏弱的特点,这与北方冬季燃煤供暖密不可分。

(2)AQI指数与PMl0、PM2.5之间的相关系数均较高,均在0.9以上。AQI指数与各气象因子呈负相关,其中能见度、温度、风速的负相关性较强;O3浓度与室外温度的相关性较强,这与太阳光中长短波辐射对O3的产生与分解有关。

(3)AQI指数与相关气象因子均具有较明显的年际周期性振荡、30~60 d的季节性周期振荡、10~20 d的双周性振荡及5~7 d的准双周振荡。从每年的10~11月份开始,污染程度逐渐加剧,3~4月开始回落,期间为北方的供暖期,过度燃煤产生了过量的颗粒物、SO2等,直接影响空气质量。并且污染物浓度变化具有较强的节日性,每年国庆期间污染开始加剧,并在11月稍有回落,且在春节期间达到最大值。

(4)增加前一天的历史AQI数据集所建的最优子集回归方程比单选用气象因子更优,对数据进行小波去噪后所建的最优子集回归方程比使用原始数据更优,综合而言,对原始数据进行小波去噪并且引入历史数据后,所建立的“去噪气象数据+去噪历史AQI数据”模型可以较好地实现对太原市AQI指数的短期预测。

对太原市空气污染的变化特征进行了分析,并探讨了影响AQI的气象要素,但是由于空气质量变化的原因不仅与污染源排放大小有关,来自固定和流动污染源的污染物排放量是影响空气质量的最主要因素之一,而且,城市的发展密度、地形地貌和气象因素等也是影响空气质量的重要因素。其中,污染物排放数据是影响空气质量模型模拟的最重要因素,但是由于我国污染源排放数据一直未公开,本文未能收集到太原市污染源的排放数据,因此仅探讨了在气象数据和历史监测数据相对容易获得的情况下,构建短期空气质量预测模型的可行性和模型的预测精度。未来将采用更为先进的空气质量预测模型,纳入地形高程、土地利用、气象观测资料、空气质量监测数据及污染源排放数据等大量环境基础信息数据,对模型中的关键性参数进行本地化和有效率定,这也是空气质量预测模型发展的主流方向。

猜你喜欢

子集太原市回归方程
太原市为农村寄递物流补“短板”
拓扑空间中紧致子集的性质研究
太原市61个村要建污水处理设施严禁直排入河
太原市园林绿化植物选择及分析
采用直线回归方程预测桑瘿蚊防治适期
线性回归方程的求解与应用
线性回归方程要点导学
太原市六家药茶企业获省级授权
Carmichael猜想的一个标注
关于奇数阶二元子集的分离序列