基于逐步回归法的天津市大气PM10浓度预报模型及其应用
2018-01-28孟丽丽王怡
孟丽丽 王怡
摘要:分析了天津市大气污染物的时空特征,利用数据资料重点研究了风速、相对温度、相对湿度,以及降水等对空气污染的影響,在此基础上利用逐步回归统计方法建立了不同季节的PM10的浓度预报模型,并对这3种预报模型进行了比较,结果表明:夏季的独立样本的检验结果明显优于冬季,和天津当地的气候比较融洽。同时,该模型的建立大大缩减了日常监测的工作量和运算过程,提高了效率,为政府采取普遍有效的污染防治措施提供了依据。
关键词:空气质量;PM10;预报模型;逐步回归
中图分类号:X511
文献标识码:A
文章编号:1674-9944(2018)6-0069-04
1引言
天津是北方重要的港口城市,处于环渤海地区和东北亚的核心区域。但是随着现代化的发展,天津的白然环境却在日益恶化。尤其近几十年来,汽车数量成倍增长,汽车尾气加重了空气污染。大气中的主要污染物是大气气溶胶、二氧化硫、二氧化氮、一氧化碳、氯气和光化学烟雾。空气污染问题日益严峻,人们开始对空气质量进行预报,以便采取有效的污染防治措施。所以研究分析空气污染状况,建立空气污染预报方案是当前研究的重要课题。本文的研究内容包括:天津市污染气象条件分析,研究了风速、温度、相对湿度、降水与空气的关系及对空气污染的影响。通过上述分析,选出与PM10 浓度相关性较强的因子作为统计预报方法的输入因子,利用逐步回归法精选出预报模型的输入因子,通过分季节建立PM10浓度的线性回归模型,该模型通过了检验,在此基础上利用该模型进行预报。
2天津市大气质量影响因素分析
2.1天津市地理位置气候概况
天津市地处华北平原东北部,环渤海湾的中心.东临渤海,北依燕山,位于北纬38°34'~40°15',东经116°43'-118°04'之间,处于国际东八时区。天津市土地面积为11919170hm2,南北长189km,东西宽117km。天津地质结构多样,大部分被新陈代谢沉积物覆盖,地势以平原和洼地为主,海拔由南到北降低,北部最高有低山丘陵,海拔1052m,东南部最低,海拔为3.5m。
天津位于中纬度欧亚大陆东侧,主要受季风环流影响.是东亚季风盛行的地区,属于大陆性气候。四季分明,春季多风.干旱少雨;夏季炎热,降雨集中;秋季冷暖适中;冬季寒冷干燥,降雪量少。天津的年平均气温在11.4~12.9℃,市区平均气温最高值是12.9℃.1月份最冷,平均气温在-5-- -3℃之间;7月份最热,平均气温在26 --27℃。夏季季风盛行,冬季春季风速最大;夏季秋季风速最小。年平均风速在2~4m/s,大部分为西南风。天津年平均无霜期为196--246d,最长无霜期为267d,最短无霜期为171d。四季中,冬季最长,有156--167d,夏天有87--103d;春季56~61d,秋季最短,仅有50~56d。天津年平均降水量为520~660mm,降水日数在63--70d之间。在地区分布上山地多于平原,沿海多于内陆。在季节分布上,6、7、8月份的降水量占全年的75%。天津的日照时间比较长,年日照时长在2500--2900h。
2.2天津市空气中污染物主要来源
天津市空中的污染物主要为可吸入颗粒物二氧化硫,其次是二氧化氮和一氧化碳等。目前天津市常规进项的空气检测检测的污染物包括:二氧化硫、二氧化氮、臭氧、一氧化碳、PM10、PM2.5等。
2.3天津市气象条件对空气污染的影响
2.3.1风速与空气污染
风对于空气中的污染物有传递和运输的作用,风速在一定程度上影响着空气中污染物的浓度。天津处于东亚季风盛行的地区,受到季风环流支配,全年各季主导风向都受到了季风的很大影响。天津夏季多南风、偏南风、东南风,受东南偏南风的主导,平均风速在1.7m/s,10%的大风风速可达到3m/s;过渡季多北风、偏北风、南风和偏南风,受西南风的主导,平均风速在2.2m/s,10%的大风风速可达到5m/s;冬季多北风、东风、南风、西南风、受东风主导,平均风速在2.9m/s,10%的大风风速可达到5m/s。
2.3.2相对温度与空气污染
近地表层的空气温度对空气污染物有显著影响,空气中的污染物与近地表层的空气成呈负相关关系。空气温度越高相对的大气对流活动越强,空气层的结构也就越不稳定,这就有利于空气中的污染物传播、扩散,空气中的污染物浓度得到稀释,空气质量就会变好。反之,空气温度越低,空气中的污染物不能被稀释,污染物在空中沉积,就容易造成空气污染物。夏季的太阳辐射强,相应的近地层空气温度高,大气对流活动强,空气质量较好。冬季太阳辐射弱,近地层空气温度低,大气对流活动弱,空气中的污染物得不到稀释,空气质量差。
2.3.3相对湿度与空气污染
空气湿度也会影响空气质量的好坏,天津市随着城市的快速发展,城区面积扩大,水域面积相对减少,导致气温上升,同时地面的公共设施,城市马路,人行道,建筑,多为不透水层,并具有良好的排水设施.降雨后雨水迅速流失,地面干燥;天津市内地表植被覆盖少,自然蒸发量和蒸腾量少,是天津天气比较干燥。天津的湿度类型属于干燥型,年平均相对湿度在59%左右,冬季和春季多风,降水量少往往是天津最干燥的季节,春季的相对湿度在44%-53%,冬季的相对湿度在55%-69%;夏季季是天津雨水比较集中的季节,空气中的湿度比较大,所以夏季的相对湿度在67%-74%,秋季的相对湿度在62%-68%。
2.3.4降水与空气污染
降水能够有效地清除、冲刷空气中的各种污染物,降低空气中各种污染物的浓度,使空气中的污染物得到自然净化,对减少污染物和抑制扬尘有很好的作用,按季节来看,夏季更能体现降水对空气质量的影响,夏季降水可使空气中的可吸入颗粒物明显降低,使空气质量好转;可是冬季这种影响却很少体现。主要是因为降水在夏季较集中且量多,冬季降水次数少而且量少。
3天津市大气PM10预报模型及其应用
3.1数据来源
本文选用的主要资料包括环境监测资料和气象资料。环境监测资料:2013年12月~2014年11月天津市监测站的主要空气污染PM10、SO2、NO2的每日浓度资料,每日AQI指数;月度平均资料。2012年12月~2014年12月,201 5年4月,2015年8月天津市每日PM10浓度。
气象资料:主要是2012.12~2015.11天津基准站地面气象逐日观测数据(数据由web站点“Reliable Prognosis”提供)。
3.2逐步回归法
在多元回归方程中,选取合适的变量是十分重要的。逐步回归法是一种选择最优变量子集的方法,可以从提供的可供挑选的变量中,根据一定的显著性检验,每一步只选人一个变量进入方程。
逐步回归法是一种考虑全部解释变量对被解释变量作用大小,显著程度大小,然后从大到小的引入回归方程,对被解释变量作用小的变量可能被排除在回归方程外。对已经被引入回归方程的解释变量在引入新的解释变量后也有可能失去原来的重要性而被从回归方程中提出。引入一个变量和从方程中提出一个变量都是逐步回归的一步.每进行一步都要进行显著性检验,以确保回归方程中只含有对被解释变量显著影响的解释变量。
3.3预报因子的选取
使用逐步回归法对冬季预报因子进行精选,得到6个预报因子,对春季预报因子精选得到4个预报因子,对夏秋预报因子精选得到8个预报因子。
3.4 PM10统计预报模型的建立
3.4.1多元线性回归方程建立
利用所选取的预报因子,将天津市的PM10日均浓度作为预报对象建立回归分析的资料长度分别是:春季5个月139d,夏秋季17个月518d,冬季9个月329d,使用SPSS统计软件分别建立冬季,春季,夏秋季的PM10浓度的线性模型。其模型如下:
冬季:
y=415.215-4.667X1-4.089X2-45.556X3-23.838X4+0.216X5-l.239X6
春季:
y=5491.69-3.124X1-6.899X2+5.83X3-2.708X4
夏秋:
y=1679.62+0.559X1-1.737X2-l.079X3-1.307X4-2.063X5-4.667X6+0.802X7+3.105X8
利用回归方程的显著性检验的方法对上述方程进行显著性检验,由F检验临界值表可以查出,F(0.01)(8120) =2.16,F(0.01)(4120)-3.47,冬季、春季、夏秋季的F检验值分别是F(冬)=2.907、F(春)=3.48、F(夏秋)=2.52。冬季和夏秋季F检验值均大于F(0.01)( 8120)=2.16,春季的F检验值大于F(0.01)(4120)-3.47。所以分季建立的PM10預报方程是显著的。方程式可行的。
3.4.2模型对独立样本检验
利用该预报模型,对于没有参与模型建立的2014年12月,2015年4月,8月的这3个月作为独立样本做逐日预报。从表2中可以看出2014年12月31d的相对误差平均值72.20μg/m?,相对误差在61.95%,对PM10 的浓度有一定的预报能力。
表3通过对2015年4月30d的数据进行预测,得到结果其相对误差在,绝对误差控制在56.95%。对PM10浓度处于144~188之间的天数,有较好的预报效果,对PM10浓度较小时反应不灵敏,一定范围内可以有较好的预报PM10浓度。
表4对2015年8月31 d进行预测,得到结果其相对误差在,绝对误差是18.09%。在8月3日出现一次较大误差,其相对误差为83.21%。其他天数误差均小于50%,维持在很低的误差水平上,说明此模型可以很好的预测夏秋PM10浓度。
通过对3个独立月份的预测,得到的结果。分季节建立的PM10浓度预报模型,模型表现出季节的差异,从预测效果上来看:夏秋季最好、春季次之、冬季最次。其原因是冬季一方面由于大风天气带来的扬尘,另一方面冬季气温偏低不利于污染物扩散。夏季影响污染物浓度的因素变化活跃,各种因素的影响是回归模型包含的因子丰富,更易得到准确的预测。在实际的防治中应该在冬季加以重视,保障人体健康安全不受到威胁.