基于PLS1的哈尔滨市PM2.5与空气污染物相关性分析
2014-02-25郑煜邓兰
郑煜,邓兰
基于PLS1的哈尔滨市PM2.5与空气污染物相关性分析
郑煜,邓兰
东北林业大学,黑龙江 哈尔滨 150040
以往对PM2.5的研究多集中在气象因子或单一空气污染物对PM2.5质量浓度变化的影响,未考虑多种空气污染物对PM2.5质量浓度的协同作用。通过哈尔滨市环保局发布的2014年1月份(共31 d)市区内主要空气污染物SO2、NO2、PM10、CO、O3、PM2.5的质量浓度数据,运用相关性分析、PLS1和通径分析方法,研究哈尔滨市区内主要空气污染物对PM2.5质量浓度变化的直接影响、通过其他空气污染物的间接影响及污染物之间的协同作用。结果表明,SO2、NO2、PM10、CO与PM2.5质量浓度显著性相关,O3与PM2.5质量浓度相关性不显著,SO2、NO2、PM10、CO之间存在严重的复相关性。依据相关性分析结果,建立了SO2、NO2、PM10、CO对PM2.5质量浓度的PSL1模型,模型的拟合优度r2为0.852,模型拟合良好。对所建立的模型进行通径分析,结果显示,SO2、NO2、PM10、CO对PM2.5质量浓度变化的直接作用分别为0.005、-0.142、-0.140、1.191,CO对PM2.5质量浓度变化的直接影响作用最大。SO2、NO2、PM10通过CO对PM2.5质量浓度变化的间接作用分别为0.706、1.011、1.118均大于它们对PM2.5质量浓度变化的直接作用。SO2、NO2、PM10、CO对PM2.5质量浓度变化的总决定系数为85.9%。CO是主要空气污染物中影响PM2.5质量浓度变化的主要因素,降低冬季煤炭供暖期CO的排放量,有利于提高空气环境质量,降低对人体的健康危害。
PM2.5;CO;PLS1;通径分析;空气污染物
近年来,空气质量问题越来越受到人们的关注,尤其是对空气能见度和人类健康造成严重影响的灰霾现象(魏香玉等,2009;王晨波等,2013;宋宇等,2003)。2012年2月29日,环境保护部公布了新修订的《环境空气质量标准》,在新标准中首次将对危害人类健康的细颗粒物PM2.5确立为产生灰霾的主要因素(王玮等,2000)。PM2.5是指存在于大气中,空气动力学直径小于或等于2.5 μm的可入肺颗粒,主要是由空气中的气态污染物与直接排放到空气中的一次微粒经过一系列化学或光化学反应而生成的二次微粒,属于二次反应生成的复合型污染物(钱婧等,2013;廖乾邑等,2013)。虽然PM2.5在大气成分中所占的比例很小,但由于其的粒径小,能够在大气中停留较长时间,输送距离较远,并富含有大量的有毒有害物质,极易富集于肺部,对大气环境和人体健康均存在着极大的威胁(陈武等,2012;郭涛等,2012;杨维等,2013)。因此,研究哈尔滨市冬季空气中PM2.5及空气污染物之间的关系,有利于找到影响冬季灰霾天气增多的原因。
现今对PM2.5与空气污染物或气象因子相关关系的分析,一般采用的是相关性分析、主成分分析、因子分析等多元统计分析的方法(史宇等,2013;黄虹等,2009;潘传信等,2013;孟晓艳等,2013)。由于这些研究方法只对PM2.5与空气污染物间的相关性进行了分析,忽略了污染物自身间的多重复相关性,导致在建立PM2.5与空气污染物间的线性回归模型时,破坏了参数估计,扩大了模型误差,使模型丧失了稳定性,致使所建立的模型失效。若对这样的数据强行建立模型,自变量的系数往往也很难解释。而偏最小二乘回归方法(PLS)能够在自变量存在严重多重复相关性及样本点个数少于变量个数的条件下进行回归建模,模型中将包含所有的原有自变量,并且每个自变量的回归系数将更容易被解释。同时利用通径分析方法把因变量与自变量之间的相关关系划分为直接作用及通过其他变量的间接作用,能够更好的分析各变量之间的相互作用关系。
本文利用哈尔滨市环保局发布的2014年1月份(共31 d)市区内主要空气污染物SO2、NO2、
PM10、CO、O3、PM2.5的质量浓度数据为研究对象,通过相关性分析,运用PLS1方法建立了主要空气污染物对PM2.5质量浓度的PSL1模型。对所建立的PLS1模型运用通径分析方法,更进一步的得出各主要空气污染物对PM2.5质量浓度的直接影响作用及通过其他污染物对PM2.5质量浓度的间接影响作用的大小,有利于找到影响PM2.5质量浓度变化的内在因素,为如何选择降低PM2.5的质量浓度的方法提供理论支持。
1 材料与方法
1.1研究区概况
哈尔滨市位于东经125°42′~130°10′,北纬44°04′~46°40′之间,是东北地区北部的政治、经济、文化和交通中心,是中国省辖市中陆地管辖面积最大、管辖人口居第二位的特大城市。气候属于中温带大陆季风气候,冬长夏短,冬季寒冷漫长,冬季1月平均气温约零下19 ℃。哈尔滨市2013年空气质量超标天数为171 d,其中冬季超标天数为87 d,首要污染物均为PM2.5。2014年1月份及2月份空气质量超标天数为47 d,首要污染物为PM2.5,均超年二级标准2倍以上。哈尔滨市冬季面临着严重的空气环境污染问题。
1.2数据来源
本文所用数据为:2014年1月1日至1月31日(共31 d)哈尔滨市环保局发布的哈尔滨市南岗学府路监测点位监测的空气环境质量日报数据,数据共7项,包括SO2、NO2、PM10、CO、PM2.5平均质量浓度及臭氧一小时平均质量浓度(O3(1h))、臭氧八小时平均质量浓度(O3(8h))。哈尔滨市南岗学府路属于哈尔滨市商业及人居密集区,位于哈尔滨市中心,能够代表哈尔滨市区内空气环境质量。
1.3研究方法
1.3.1 相关性分析
在实际生产生活和科研的过程中,经常会遇到多个因素同时对一个事物或现象产生影响的情况,由于多变量间一般都存在一定的相关性,或强或弱,使得信息在一定程度上产生重叠,阻碍对事物或现象的深入分析。相关性分析是对两种或两种以上的事物或现象是否具有相关性及其相关性的强弱进行分析的一种统计方法。
1.3.2 单因变量偏最小二乘回归(PLS1)原理及方法
(1)t1和u1应尽可能多地携带它们各自数据表中的变异信息;
(2)t1和u1的相关程度能够达到最大。
在第一个成分t1和u1被提取后,偏最小二乘回归分别实施X对t1的回归以及Y对t1的回归,如果回归方程已经达到满意的精度,则算法终止;否则,将利用X被t1解释后的残余信息以及Y被t1解释后的残余信息进行第二轮的成分提取。如此往复,直到能达到一个较满意的精度为止。若最终对X共提取了m个成分t1,t2,…,tm,偏最小二乘回归将通过实施Y对t1,t2,…,tm的回归,然后再表达成Y关于原变量x1,x2,…,xp的回归方程,至此偏最小二乘回归建模完成。
根据上述原理,偏最小二乘回归的算法可归纳为如下步骤:
(1)将X与Y进行标准化处理,得到标准化后的自变量矩阵E0和因变量矩阵F0。
(2)从E0中抽取一个成分,t1=E0W1,其中:
实施E0在t1上的回归:E0=t1P1ʼ+E1,即:E1=E0-t1P1,其中:
检查收敛性,若Y对tj的回归方程已达到满意的精度,则进行下一步;否则,令:E1=E0,回到第(2)步,对残余矩阵进行回归分析。
(3)在第h步(h=2,…,m),方程满足精度要求,这时得到用个成分t1,t2,…,tm,实施F0在t1,t2,…,tm上的回归,得:
由于t1,t2,…,tm均是E0的线性组合,因此可写成E0的线性组合形式,即:,其中:
(4)按照标准化的逆过程,将的回归方程还原为Y对X的回归方程。
1.3.3 通径分析
通径分析是1921年由数量遗传学家Sewall Wright提出的,并经遗传育种学者不断改进和完善而形成的一种标准化的多元线性回归分析方法。它不是一般的标准化多元线性回归分析,不是用来预测和控制的,也不是相关分析,而是把自变量与因变量之间的相关关系划分成直接作用和通过其他变量的间接作用的一种统计分析方法。通过对所建立模型的通径分析,能够告诉我们在没有其他变量掺杂进去的情况下,xi对y的本质作用的大小,得到某个自变量决定y的最佳路径,具有决策的意义。通径分析是由标准化线性回归的正则方程来表达的:
其中xxr为pxxx,,,21…的相关阵,,xyr为x对y的相关阵,即。对于p=4,有
上式第一个方程表明,x1对y的直接影响, x1通过x2对y的间接影响为r12,x1通过x3对y的间接影响为r13,x1通过x4对y的间接影响为,四者之和为x对y的总影响力r,即r由1y1yx1的直接影响和三个间接影响组成。
在通径分析中,各条路径也有其相应的决定系数,它由如下分解得出:
2 结果与分析
2.1相关性分析
以PM2.5(y)、SO2(x1)、NO2(x2)、PM10(x3)、CO(x4)、O3(1h)(x5)、O3(8h)(x6)为解释变量,运用SPSS软件对哈尔滨市2014年1月1日至1月31日AQI日报数据进行相关性分析及多重共线性分析,结果见表1和表2。
表1 相关性分析结果Table 1 The results of correlation analysis
表2 多重共线性分析结果Table 2 The results of multi-colinearity
由表1可知,PM2.5与SO2、NO2、PM10、CO具有强相关性,PM2.5与O3(1h)、O3(8h)相关性不显著。由表2可知,CO膨胀因子VIF超过10,且SO2、NO2、PM10、CO的容差均接近于0,说明SO2、NO2、PM10、CO之间存在严重的多重复相关性。
2.2PM2.5的PLS1回归模型的建立
结合相关性分析结果,利用哈尔滨市2014年1月16日至1月31日哈尔滨市AQI日报数据,以PM2.5(y)为因变量,SO2(x1)、NO2(x2)、PM10(x3)、CO(x4)为自变量,运用DPS软件建立SO2、NO2、PM10、CO对PM2.5的PSL1回归模型,模型公式如下:
经检验,模型的拟合优度r-2为0.852,模型拟合良好。
2.3PM2.5的PLS1回归模型的通径分析
根据相关性分析结果,由通径分析方法得到回
归模型(1)的正则方程为:
运用Excel软件对回归模型(1)中因变量y与自变量xi(i=1,2,3,4)进行通径分析,结果见表3。
表3 通径分析结果Table 3 The results of path analysis
由表3可以得出:
xi对y的直接决定系数:
xi的各相关路径y的间接决定系数:
xi对y的总决定系数:
剩余因素ε对y的直接影响作用:
剩余因素ε的决定系数:
PM2.5的PSL1回归模型的通径分析表明:
(1)对PM2.5的直接作用中,SO2对PM2.5的直接作用最小为0.005,CO对PM2.5的直接作用最大为1.191,NO2、PM10对PM2.5的直接作用分别为-0.412、-0.14。
(2)对PM2.5的间接作用中,SO2、NO2、PM10通过CO对PM2.5的间接作用分别为0.706、1.011、1.118,均大于它们对PM2.5的直接作用值。
(3)对PM2.5的总作用中,CO对PM2.5的总作用最大,为0.924;PM10对PM2.5的总作用其次,为0.867;对PM2.5的总作用最小的是SO2,为0.738;NO2对PM2.5的总作用为0.761。
(4)对影响PM2.5质量浓度的主要污染物中,SO2、NO2、PM10、CO对PM2.5的决策系数分别为0.5%、-23.6%、-26.2%、82.6%。
(5)剩余因素ε对PM2.5浓度影响的决策系数为10.5%,对PM2.5的直接作用为0.324。
由以上分析可知,SO2、NO2、PM10、CO对PM2.5浓度影响的总决定系数达到89.5%,其中CO对PM2.5的直接作用最大,SO2、NO2、PM10对PM2.5的直接作用均小于它们通过CO对PM2.5的间接作用。因此,CO对哈尔滨市PM2.5浓度的变化起到了重要的影响。
3 结论
PM2.5、SO2、NO2、PM10、CO之间具有显著性相关关系,CO与PM2.5质量浓度之间相关性最强。在数据量少及SO2、NO2、PM10、CO之间具有多重复共线性的前提下,建立了PM2.5与SO2、NO2、PM10、CO的PLS1模型,通过对PLS1模型的通径分析得出影响PM2.5质量浓度变化的主要空气污染物是CO。CO对PM2.5质量浓度的直接作用及SO2、NO2、PM10质量浓度通过CO对PM2.5质量浓度的间接作用均最大,因而逐步提高供暖过程中煤炭的充分燃烧率,减少CO的排放量,有利于降低冬季PM2.5质量浓度,提高空气环境质量。
PLS1方法解决了目前PM2.5相关数据量较少,且影响PM2.5质量浓度变化的各自变量之间严重的复相关性问题,更好的解释了回归模型中各变量的系数。通径分析方法进一步的分析了回归模型中SO2、NO2、PM10、CO对PM2.5质量浓度变化的直接作用及通过其他自变量的间接作用,更细致的分析了影响PM2.5质量浓度变化的因素,也为其他地区制定有效的降低PM2.5质量浓度的方法提供了理论依据和技术支持。
陈武, 董发勤, 邓跃全, 等. 2012. 银川市城郊 PM2.5质量浓度日变化规律与组成特性分析[J]. 矿物学报, 增刊: 131-132.
郭涛, 马永亮, 贺克斌. 2009. 区域大气环境中PM2.5/PM10空间分布研究[J]. 环境工程学报, 3(1): 147-150.
廖乾邑, 张巍, 陈建文, 等. 2013. 环境空气背景值中PM2.5和PM10的相关性分析[J]. 四川环境, (2): 16-19.
钱婧, 韩婧, 阮幸. 2014. 西安市冬季重污染天PM2.5高分辨率及其中碳
气溶胶污染特征分析[J]. 生态环境学报, 23(3): 464-471.
史宇, 张建辉, 罗海江, 等. 2013. 北京市2012-2013年秋冬季大气颗粒物污染特征分析[J]. 生态环境学报, 22(9): 1571-1577.
宋宇, 唐孝炎, 方晨, 等. 2003. 北京市能见度下降与颗粒物污染的关系[J]. 环境科学学报, 23(4): 468-471.
王晨波. 2013. PM2.5浓度对能见度影响分析[J]. 科技信息, (15): 439-440.
王玮, 汤大钢, 刘红杰. 2000. 中国PM2.5污染状况和污染特征的研究[J].环境科学研究, 13(1): 1-5.
魏玉香, 银燕, 杨卫芬, 等. 2009. 南京地区PM2.5污染特征及其影响因素分析[J]. 环境科学与管理, 34(9): 29-34.
杨维, 赵文吉, 宫兆宁, 等. 2013. 北京城区可吸入颗粒物分布特性与呼吸系统疾病关分析[J]. 环境科学, 34(1): 237-243.
Correlation Analysis Based on PSL1 between PM2.5 and Air Pollutants in Harbin City
ZHENG Yu, DENG Lan
Northeast Forestry University, Haerbin 150040, China
In recent years, the environmental quality of air get the more attention of people, especially for visibility and great harm to human health of the fine particulate matter PM2.5. On the past studies the meteorological factors of PM2.5or single air pollutants of PM2.5mass concentration of change were focused on the influence of a variety of air pollutants on PM2.5mass concentration of synergy was not considered. Through the Harbin city environmental protection bureau released in January 2014, (a total of 31 days) within the city the main air pollutants SO2, NO2, PM10, CO, O3, the mass concentration of PM2.5data, using correlation analysis, PLS1 and size analysis method, study the main air pollutants in Harbin concentration changes directly affect the quality of PM2.5, indirect effects through other air pollutants and synergy between pollutants. The results show that, SO2, NO2, PM10, CO and PM2.5mass concentration significantly related to O3and no significant correlation between PM2.5mass concentrations, SO2, NO2, PM10, CO of mass concentration of PM2.5PSL1 model, model of goodness of-fit-R2is 0.852, the model fitting is good. Size analysis of the established model, the results showed that SO2, NO2, PM10, CO a direct affect on quality of PM2.5concentration change were 0.005, -0.142, -0.140, 1.191 respectively, CO concentration changes directly affect the quality of PM2.5. SO2, NO2and PM10through CO have indirect effects on PM2.5concentration change were 0.706, 1.011, 1.118 respectively were greater than a direct effect on quality of PM2.5concentrations change them. SO2, NO2, PM10, CO of PM2.5mass concentration changes of total decision coefficient was 85.9%. CO was a major air pollutant in the main factors influencing the quality of PM2.5concentration change, reduce CO emissions from coal in winter heating period, to improve the air environmental quality, reduce the harm to the health of human body.
PM2.5; carbon monoxide; PLS1; path analysis; air pollutants
X16
A
1674-5906(2014)12-1953-05
黑龙江省自然科学基金项目(G201117)
郑煜(1962年生),女,教授,研究方向为概率论与数理统计。E-mail:zhengyu62@126.com
2014-09-24
郑煜,邓兰. 基于PLS1的哈尔滨市PM2.5与空气污染物相关性分析[J]. 生态环境学报, 2014, 23(12): 1953-1957.
ZHENG Yu, DENG Lan. Correlation Analysis Based on PSL1 between PM2.5 and Air Pollutants in Harbin City [J]. Ecology and Environmental Sciences, 2014, 23(12): 1953-1957.