基于气象因素的PM2.5质量浓度预测模型探讨

2019-04-22盛凯张平华

科技视界 2019年5期

盛凯　张平华

【摘要】要想确保预测模型有良好的拟合效果，必须要构建多元回归模型以及机器学习预测模型，以此预测PM2.5质量浓度。本文在介绍改善输入因子的基础上，分别介绍了多元线性回归预测模型和机器学习算法预测模型，希望可以为有需要的人提供参考意见。

【关键词】气象因素;PM2.5;质量浓度预测模型

中图分类号： X513 文献标识码： A 文章编号： 2095-2457（2019）05-0146-002

通常，影响环境空气质量的重要大气污染物是大气细颗粒物PM2.5，正确预测其质量浓度具有重要的意义。采用气象参数以及其他因素输入预测PM2.5质量浓度时，最主要的方法有两种，分别是多元回归预测模型和机器学习预测模型，这两种模型都可以科学合理的预测PM2.5质量浓度，所以普遍应用于各个城市的环境保护监测中心，对我们了解空气质量做出很大的贡献。

1 改善输入因子

为了确保预测结果是准确，应当在输入气象因素的基础上讲不同类型的变量融入进去，而这些变量主要包括周期因素和污染物质量浓度基础值。周期因素，就是考虑人为因素和自然因素考虑污染物的周期变动影响，融入日变量、月变量以及季节变量。污染物质量浓度基础值，也就是前一天6个污染物的质量浓度日均值。[1]这种因素考虑到各种气象条件下，前一天气态污染物和颗粒物的转化情况，很有可能影响PM2.5质量浓度，其最终取值是此监测点位置的质量浓度24小时日均值。其中，就季节变量来讲，各个季节污染物是不同的，所以其变化规律也是不同。结合某市2018年实际的气候特点可以将季节变量划分成春夏秋冬四个阶段内。结合某市环境保护监测中心发布的12个区域监测点1个小时平均PM2.5质量浓度，经过换算后得出季節平均值，并且将其归一化。这里的假定该取值也可以在将来几年来使用，也就是说加入将来几年来季节变化对污染物变化造成的影响趋势是不发生改变的。在季节变量的前提下月变量考到各个月份的气候特点很有可能或多或少的影响人为污染源，所以可以将每年的3月到8月划分成冷暖季。

2 构建基于气象因素的 PM2.5质量浓度预测模型

2.1 多元线性回归预测模型

多元线性回归模型侧重于研究单一的因变量和多自变量之间的线性关系。本次研究采用SPSS Statistics 20 逐步回归的方式，建成多元线性回归模型：Y=bo+∑biXi+ε，常数项是bo，回归系数是bi，回归误差是ε。运用最小二乘法求出回归系数与常数项。逐步回归法利用对偏有关系数最大的变量作为回归系数明显性检验，由此鉴定其是否都已经进入回归方程。首先的选择对预测值做出最大贡献且与判定条件相符合的变量剔除。根据这个过程重复，一直到没有任何的变量被引入。该处必须要构建基于两种类型输入因子的MLR预测模型。第一，以气象因素为基础的MLR传统预测模型;第二，以污染物质量浓度基础值、周期因素已经气象因素为基础的MLR综合预测模型。

相对于传统的仅仅考虑气象因素的预测模型而言，经过逐步回归总共有气象因素10个，输入MLR综合预测模型，同时也会改变输入模型的气象因素，之所以存在该情况关键在于但两个或者两个的预测输入变量之间发生线性有关关系，这样就会导致使用最小二乘法预测的模型参数稳定性较差，为了确保自变量具有一定的独立性。[2]但提高模型变量时，需要通过多重共线性将具备相关关系的自变量剔除，所以造成该模型中的系数或者变量出现重大的改变。而最大风速依旧是影响PM2.5质量浓度的关键因素，次要因素是日最高气温、平均相对湿度等等。

加强PM2.5效应的影响因素主要有降雨量、SO2基础值以及CO基础值等等，而去除PM2.5效应的影响因素主要有平均水汽压、日最低气压、日照时间、最大风速以及小型蒸发量等等。在模型中平均风速与降雨量都没有充分体现在PM2.5在传统意义上所提到的去除效应，其与使用两者的日均值当做预测输入有密切关系。[4]大量的研究结果表明，尽管降雨过程可以显著的去除PM2.5，但是由于降雨前后空气相对湿度较高，很有可能导致扩散条件恶劣，造成PM2.5质量浓度在短时间内骤然增加，所以短时间的降雨往往不会使PM2.5质量浓度值下降，反而会增加。风速去除PM2.5效应具体表现在最大风速，也就是每天去除PM2.5效应的主要风速因素是最大风速。就影响较为严重的几个因素来讲，都包括平均相对湿度以及最大风速，表示这两个气象因素都可以将PM2.5效应去除。本次研究所引用的输入因子进到MLR综合预测模型后，其污染物质量浓度基础值分别是SO2、CO等等，周期因素分别有月变量以及日变量，表示其也直接影响PM2.5质量浓度。

2.2 机器学习算法预测模型

采用机器学习算法，可以对输入变量进行自动分析，而且得出规律，再按照规律预测输出。为了对各种算法的预测效果进行比较，可以通过支持向量机和BP神经系统进行预测，这两种都是机器学习算法。首先，支持向量机的网络结构在形式方面类似于神经网络，但是区别在于其是基于优化技术和数学方式，这种方式的主要理论是统计学理论，以找到最小的结构风险来加强学习防滑能力，从而实现最小化的经验风险。其次，BP神经网络，这是一种反向传播算法，主要是由输出层、输入层以及隐含层三部分组成，这种方式通常缺乏科学的理论引导，其预测结果主要依靠使用人员的方法所获得，所以经常存在泛化能力不高以及过拟合等情况。根据各种算法的基本原理，其预测输入选择污染物浓度基础值等其他数据，建模时使用MATLAB R2011b。

3 结语

总而言之，本次研究通过构建不同的预测模型，比较和预测PM2.5质量浓度，得出以下这些结论：第一，预测模型影响PM2.5质量浓度预测结果，基础是18个气象因素，而且引进污染物质质量浓度基础值6个、周期因素3个当做输入因子来预测，这样能够将PM2.5质量浓度日变化反映出来;第二，与多元回归建模预测相比之下，机器学习算法建模的预测结果更加准确，其可以迅速地找到每个输入因子和PM2.5质量浓度之间的非线性影响规模。

【参考文献】

[1]王珍珍，孙丽，李志文，马泽源.2016年南昌市PM_（10）和PM_（2.5）质量浓度变化研究[J].内蒙古师范大学学报（自然科学汉文版），2019，48（01）：34-39.

[2]卢文，王红磊，朱彬，施双双，康晖.南京江北2014～2016年PM2.5质量浓度分布特征及气象和传输影响因素分析[J/OL].环境科学学报：1-10[2019-03-07].https：//doi.org/10.13671/j.hjkxxb.2018.0439.

[3]张亮林，潘竟虎，赖建波，魏石梅，王云，张大弘.基于GWR降尺度的京津冀地区PM2.5质量浓度空间分布估算[J/OL].环境科学学报：1-10[2019-03-07].https：//doi.org/10.13671/j.hjkxxb.2018.0428.

[4]熊兴隆，崔雅峰，马愈昭.基于消光系数的机场PM_（2.5）质量浓度神经网络预测模型[J].科学技术与工程，2017，17（32）：274-279.

[5]杨云，付彦丽.基于T-S模型模糊神经网络的PM2.5质量浓度预测[J].陕西科技大学学报（自然科学版），2015，33（06）：162-166.