基于支持向量机和树叶磁学的大气颗粒物浓度模拟
2019-06-20刘雪梅周梦帆李慧明
许 悦,刘雪梅,周梦帆,李慧明,钱 新
(南京大学环境学院,污染控制与资源化研究国家重点实验室,南京 210023)
1 前 言
近年我国城市化和工业化进程的加快,大量污染物排放到大气中,大气污染问题日益显著,对人类健康产生了潜在威胁[1]。城市化导致机动车辆的剧增和频繁活动,工业化导致大量工业废气和工业尘埃的排放,产生多种大气污染物,包括大气重金属以及磁性颗粒物[2]。尽管磁性微粒本身不会对人体健康构成直接威胁,但由于它们与有害污染物密切相关,有潜力用作评估大气污染的指标[3]。
环境磁学的原理是通过测量环境介质中物质的磁学特征,从中提取环境信息[4]。城市植物叶片比表面积大、生长周期长,可通过叶表内外面的蜡质层吸附或通过气孔直接吸收大气颗粒物,尤其是粒径小于10μm的细颗粒物[5-6],而植物本身通过根从土壤中吸收的部分相对于其通过叶片蜡质层吸收的大气沉降物质,其背景场微乎其微,可忽略不计[7]。此外,植物叶片采集方便且磁学参数测试经济可行,因此,可通过分析自然生长的树叶磁学信息来评估大气污染状况[8],这对我国城市大气颗粒物监测具有重要现实意义。
2 材料与方法
2.1 样品采集与处理
树叶及大气颗粒物采样点位于南京大学仙林校区内(见右上图),在校园环境空气质量自动监测站点1km范围之内选择树龄、高度相似且生长状况良好的桂花、雪松及女贞各5棵,于2015年12月4日~2016年11月30日采集树叶样品。每隔4天采集树叶样品一次,雨雪或台风等极端天气下暂停采样。采样时佩戴一次性塑料手套,用陶瓷剪刀于1.5~2m高的范围内选择成熟、健康无病害、无虫斑、新生树枝上最成熟的叶片进行采集,桂花和女贞于每棵树的不同方向采集4~8片树叶,雪松每棵树采集12簇松针,树叶采集后置于塑料自封袋中,带回实验室放入冰箱冷藏保存,以备处理。每类树共采集到84组树叶样品,测试磁学特征后用于大气颗粒物模型的构建。
图 采样点位置Fig. Sampling site
2.2 磁性参数测试
将采集到的树叶样品放入烘箱,50~60℃烘干,再用陶瓷剪刀剪碎,称取约2g样品用保鲜膜包裹置于用于磁学参数测试的10mL圆柱状聚乙烯样品盒中,压实待测。利用KY-3S卡帕桥磁化率仪测量样品的体积磁化率(κ),经密度对κ进行校正从而得到树叶样品的质量磁化率(χ)。使用Molspin交变退磁仪进行退磁后,利用JR-6A旋转磁力仪测量树叶样品的非磁滞剩磁(ARM)。使用ASC Scientific Model IM-10-30对树叶样品加1 000mT的磁场进行脉冲磁化后,利用JR-6A旋转磁力仪测量树叶样品的等温剩磁(IRM1T),作为树叶样品的饱和等温剩磁(SIRM)。树叶样品的磁学参数测试均在南京大学地球科学与海洋学院的古地磁实验室完成。
2.3 大气颗粒物浓度和气象数据的获取
气象数据(风速、温度、湿度和气压)的小时值从仙林监测站获取,PM2.5和PM10浓度小时数据从南京市十个主要国控点空气质量实时发布系统(http://222.190.111.117:8023/)中获取,均取采样日期对应的四天平均值作为模型的气象因子输入参数。
2.4 支持向量机模型构建
以PM2.5和PM10浓度作为输出层,分别以“气象因子+树叶磁学参数”以及“树叶磁学参数”作为输入参数,随机选取80%作为训练数据,剩下20%作为验证数据,在MATLAB 环境下使用Libsvm作为建模工具,选取支持向量机中常用的径向核函数(RBF核函数)epsilon-SVR模型,通过交叉试验的方法选取预测模型的最佳核函数 g 值及惩罚因子 c 值,建立大气颗粒物浓度模拟模型。
2.5 统计方法
运用SPSS 23.0软件将PM2.5和PM10同步监测的4天移动平均浓度值与树叶磁学参数、气象数据进行皮尔逊相关性分析。使用相关性系数(Correlation coefficient,R)、平均绝对误差(Mean absolute error,MAE)和均方根误差(Root mean squared error,RMSE)评价模型模拟精度,计算公式如下:
(1)
(2)
(3)
3 结果与讨论
3.1 树叶磁学特征
χ大小主要取决于样品亚铁磁性矿物的含量[16];SIRM与矿物磁性和铁磁性物质含量有关,也可指示磁畴特征[17],同时也易受反亚铁磁性矿物干扰,不受顺磁性矿物影响[18];ARM反映了铁磁晶粒的磁畴信息,与单畴晶粒的含量呈正相关[19]。如表1所示,总体上,雪松树叶的χ、SIRM和ARM值最高。3种树叶的χ值季节分布均为:冬季>春季>秋季>夏季。桂花和雪松树叶的 SIRM值季节分布为:冬季>春季>秋季>夏季,而女贞树叶的SIRM值季节分布为:冬季>秋季>春季>夏季。桂花和女贞树叶的ARM值季节分布为:冬季>秋季>夏季>春季,而雪松树叶的分布为:冬季>春季>秋季>夏季。除桂花和女贞树叶的ARM值季节分布外,三种树叶的χ、SIRM和ARM值统一呈现出冬高夏低的季节分布特征,这也与PM2.5和PM10浓度季节分布情况一致(PM2.5浓度季节分布为春季63.34±16.142μg/m3,夏季43.124±10.649μg/m3,秋季52.088±10.571μg/m3,冬季77.402±19.524μg/m3;PM10浓度季节分布为春季96.86±29.433μg/m3,夏季63.586±14.787μg/m3,秋季74.928±24.016μg/m3,冬季105.161±27.165μg/m3),即冬季大气颗粒物污染更加严重。
ARM/χ和ARM/SIRM值主要反映与磁畴状态相关的铁磁性矿物颗粒的大小,数值低代表样品以粗粒的假单畴(PSD,0.50~15.00μm)或多畴(MD,15.00~17.00μm以上)颗粒为主;数值高代表样品以细粒稳定的畴颗粒(SSD,0.03~0.50μm)为主[20]。由表1可知,3种树叶夏季和秋季ARM/χ和ARM/SIRM值较高,而在春季和冬季较低,表明3种树叶在夏季和秋季富集了相对较多的细磁畴磁性颗粒物,而在春季和冬季富集了相对较多的粗磁畴磁性颗粒物。
表1 桂花、雪松和女贞树叶的磁学参数 Tab.1 Magnetic parameters of leaves of Osmanthus fragrans Lour,Ceder deodara G.Don and Ligustrum lucidum Ait
表2为不同城市不同树种的磁学参数χ和SIRM之间的对比。总体上,南京市桂花和女贞树叶的χ和SIRM值相对表中其他城市偏低,而雪松的χ值大于安徽凤阳县城的杨树和平顶山的紫叶李,小于其他城市的树种。上海广玉兰的χ和SIRM值最高,临沂桧柏、白皮松(2012.4)的χ值仅次于上海广玉兰,北京常青圆柏、白皮松、日本扁柏的SIRM值仅次于上海广玉兰。不同城市树叶磁学参数的差异与树叶的附尘能力、各地大气污染状况和磁性颗粒物的来源有关[15]。
表2 南京树叶磁学参数与中国其他城市对比 Tab.2 Comparison of leaf magnetic parameters between Nanjing and other cities in China
3.2 大气颗粒物浓度与树叶磁学参数、气象数据的相关性分析
经验证,大气颗粒物浓度与树叶磁学参数、气象数据符合正态分布,因此采用皮尔逊相关系数分析大气颗粒物浓度与树叶磁学参数、气象数据的相关性,结果如表3所示,PM10和PM2.5与风速、温度和湿度之间显著负相关,与大气压显著正相关。可能原因是风速对大气污染物有一定的稀释作用,风速越高,越易降低大气颗粒物浓度;一般来说,温度越高,大气压越低,空气对流运动越明显,大气颗粒物扩散速率越快,其浓度也同时有所下降;空气湿度对大气颗粒物最显著的影响是降水对其的冲刷作用。
PM10和PM2.5浓度与3种树叶的磁学参数χ、ARM和SIRM的相关系数范围为:桂花树叶0.182~0.641,雪松松针0.088~0.543,女贞树叶0.051~0.596;PM10和PM2.5浓度与3种树叶的磁学参数χ、SIRM显著正相关(p<0.05),其中与桂花树叶χ、SIRM的相关系数r均高于0.560;颗粒物浓度与χ和SIRM的相关性高于ARM值。结果表明,周围环境中大气颗粒物浓度可能是影响树叶磁学参数的因素之一。本文只建立颗粒物浓度与树叶磁学参数的关系,不同来源大气颗粒物及颗粒物化学成分与树叶磁学的响应关系还需进一步研究。
其他城市的研究结果也显示,树叶磁学参数可用于指示大气颗粒物浓度。如李勇(2016)[26]对安徽省凤阳县的研究表明,杨树、银杏树和梧桐树树叶的磁学参数能反映局部大气环境污染和变化;张春霞等(2006)[28]对北京首都机场高速公路旁松树松针的磁学研究表明,χ、SIRM能间接反映颗粒物的含量及粒度等特征,是经济实用的监测城市大气污染的手段。HANESCH(2003)[2]等人的研究显示,钢铁厂土壤和枫树叶的磁化率可用于反映大气状况。
3.3 大气颗粒物磁学模型构建与评估
将PM2.5和PM10浓度作为输出因子,“四类气象数据(风速、温度、湿度和大气压)+三类树叶磁学参数(χ、ARM和SIRM)”作为输入因子;另外,为提高模型的可应用性,考虑到采样点不能获取气象数据的情况,直接将“树叶磁学参数”作为输入因子构建模型,共构建了12个支持向量机模型,模型特征如表4所示。
表3 PM2.5和PM10平均浓度值与树叶磁学参数、气象数据的皮尔逊相关系数(n=84)Tab.3 Pearson’s coefficient(r)between concentrations of PM10 and PM2.5 and leaf magnetic parameters,meteorological factors(n=84)
注:* *表明在0.01水平(双侧)上显著相关。
表4 12个支持向量机模型特征Tab.4 Features of twelve SVM models
12个支持向量机模型模拟结果的相关性系数(R)、平均绝对误差(MAE)和均方根误差(RMSE)如表5所示,模型对PM2.5和PM10浓度模拟值与监测值的比较如图2所示。结果显示,12个模型训练组和验证组的R值均>0.7,误差也在可接受范围内,说明利用树叶磁学参数模拟大气颗粒物浓度获得了较为理想的效果。对于同一种颗粒物和同一类输入因子,3种树叶对颗粒物的模拟效果没有明显差异。在验证阶段,只将“树叶磁学参数”作为输入因子的模型对PM10浓度的模拟R>0.8,说明这些模型(模型8、10、12)对PM10具有较好的模拟效果。而将“树叶磁学参数+气象数据”作为输入因子的模型,对PM2.5浓度模拟的R值均>0.8,说明这些模型(模型1、3、5)对PM2.5具有较好的模拟效果,这可能与PM2.5浓度受气象条件的影响相对较大有关。因此,在模拟不同粒径颗粒物浓度时,可考虑采用不同的输入因子模型,以便获得更好的模拟效果。
运用支持向量机和树叶磁学能够快速预测大气颗粒物浓度,为重污染天气的预防和控制策略制定提供数据支撑,还为空气质量监测站还较为稀疏的城郊地区及还未普及的偏远地区空气质量监控提供技术支撑。
表5 12个模型相关性系数(R)、平均绝对误差(MAE)和均方根误差(RMSE)Tab.5 Correlation coefficients(R),average absolute error(MAE)and root mean square error(RMSE)of the twelve models
续表5
Model训练组验证组RMAERMSERMAERMSE40.71110.913.50.72610.0514.050.74910.312.90.8598.489.9860.71011.914.70.7297.9410.270.74616.020.20.74014.616.580.77115.819.10.82016.219.690.72315.219.10.71521.927.6100.79615.618.10.89017.119.1110.76415.418.40.73916.621.3120.77815.318.80.86717.119.6
图2 树叶磁学模型对PM2.5和PM10浓度的模拟结果Fig.2 Simulation results of PM2.5 and PM10 concentrations by leaf magnetic models
4 结 论
4.1 对于研究区域中3种树叶的磁学参数,雪松的χ、SIRM和ARM值最高。χ值季节分布均为:冬季>春季>秋季>夏季。3种树叶在夏季和秋季富集了相对较多的细磁畴磁性颗粒物,而在春季和冬季富集了相对较多的粗磁畴磁性颗粒物。
4.2 PM10和PM2.5浓度与风速、温度和湿度之间显著负相关,与大气压显著正相关;颗粒物浓度与χ和SIRM的相关性高于ARM;与3种树叶的磁学参数χ、SIRM显著正相关(p<0.05),其中颗粒物浓度与桂花树叶磁学参数的相关系数r均高于0.560。
4.3 支持向量机模型对PM10和PM2.5浓度模拟的误差均在可接受范围内,对于同一种颗粒物和同一类输入因子,三种树叶对颗粒物的模拟效果没有明显差异。在模型验证阶段,将“树叶磁学参数+气象数据”作为输入因子的模型,对PM2.5浓度模拟的R值均>0.8,模拟效果较好;将“树叶磁学参数”作为输入因子的模型,对PM10浓度模拟的R值均>0.8,模拟效果较好。