APP下载

基于MATLAB 和SPSS 的空气质量数据建模及分析校准

2021-05-06张世龙

南通职业大学学报 2021年1期
关键词:负相关风速湿度

张世龙

(川北幼儿师范高等专科学校 初等教育系, 四川 广元 628017)

空气污染对人类健康、工农业生产及全球环境等都会造成很大的危害, 实时掌控空气质量非常重要。虽然大气污染种类繁多,性质复杂,但是若能对“两尘四气”(PM2.5、PM10、CO、NO2、SO2、O3)进行实时监测及预报,就能对污染源采取措施,大大改善空气质量[1]。

国家对“两尘四气”有较为准确的监测数据,但因布控点少,数据发布滞后且花费较大,空气质量监测和预报的实时性有待提高[2]。鉴于此,拟在国控点附近建立自控监测点,对地区空气质量进行实时网格化监控。由于各种因素的影响,自控点所测数据与国控点数据有一定误差,需通过建立数学模型对自测点数据进行校准。

1 国控点与自建点“两尘四气”数据透视分析

利用Excel 对2019 年全国大学生数学建模竞赛D 题给出的国控点与自建点“两尘四气”浓度进行数据透视分析。初步分析发现,数据透视表中两组数据存在不完全对应现象。如:国控点数据里有2019 年1 月14 日数据,而未发现相应日期自建点数据;在自建点数据里有2019 年1 月12 日与2019 年4 月10 日数据,而在国控点数据中无此日期的相应数据。因此,删去这三组数据以便对应分析。计算数据表中自建点的一个小时时间段各污染物浓度的算术平均值,对应于国控点的整点时刻污染物浓度,得到国控点与自建点“两尘四气”的部分数据走势,如图1—图5(篇幅所限,不能给出全部数据走势图)。

根据数据透视图1 可知,自建点PM2.5 浓度大多高于国控点,二者整体波动较大。在2018 年11 月30 日国控点 P M2.5 浓度达到最高,接近180 μg/m3。在 2 018 年 1 1 月 2 6 日自建点 P M2.5浓度达到最高,接近160 μg/m3。自建点PM10 浓度大多高于国控点,但在5~6 月国控点PM10 浓度基本都高于自建点,二者整体波动较大。在2018 年11 月30 日国控点与自建点PM10 浓度均达最高,国控点浓度超过230 μg/m3,自建点浓度接近 3 30 μg/m3。

图2 显示,国控点CO 浓度基本都高于自建点,尤其在 2 019 年 2 月 1 日~5 月 1 8 日这段时间内国控点CO 浓度远高于自建点,且国控点CO浓度波动起伏大,相较国控点而言自建点CO 浓度波动较小。在2019 年2 月24 日国控点CO 浓度达到最高,接近 2 .5 mg/m3。在 2 019 年 5 月 2 3 日自建点 C O 浓度达到最高,超过 1 .1 mg/m3。

由图3 可见,自建点NO2浓度大多高于国控点,在2019 年1 月上旬自建点NO2浓度远高于国控点,且二者波动起伏不大。在2019 年1 月23日国控点浓度NO2达到最高,超过83 μg/m3。在2019 年3 月27 日自建点NO2浓度达最高,超过114 μg/m3。

图1 国控点与自建点“两尘”的部分数据

图2 国控点与自建点CO 的部分数据

图4 表明,在2018 年11 月 1 4 日—12 月31日国控点SO2浓度均高于自建点,之后二者SO2浓度几乎接近,但在1 月23 日自建点SO2浓度急剧增至118 μg/m3,后又急剧下降。

图3 国控点与自建点NO2 的部分数据

图4 国控点与自建点SO2 的部分数据

由图5 可见,自建点O3浓度均高于国控点,1月25 日后二者浓度变化趋势相同,波动较大。在2019 年6 月 11 日国控点 O3浓度达到最高,为176 μg/m3。在 2019 年 6 月 5 日自建点O3浓度达到最高,为 132 μg/m3。

图5 国控点与自建点O3 的部分数据

综上所述,国控点与自建点数据间均存在较大差异。

2 “两尘四气”与各指标的相关性分析

利用SPSS 分析“两尘四气”与风速、压强、降水量、温度、湿度等指标的相关性。首先,对所得国控点与自建点每小时的平均值数据透视表进行数据筛选,删除了62 个国控点数据、759 个自建点数据(如:国控点1 月14 日测得的13 个小时数据在自建点数据里均没有,同样在自建点2019 年1 月1 日0 时与11~16 时的数据在国控点数据中也没有,等等,予以删除。)。再利用SPSS[3]对筛选后的数据表分析“两尘四气”数据与风速、压强、降水量、温度、湿度的相关性,结果如表1。

由表 1 可见,PM2.5 与湿度的皮尔逊相关性系数r=0.6,呈中度相关,大于其与压强的相关性(r=0.35)。PM2.5 与降水量的相关系数 r=0.190,说明相关程度弱,基本不相关。PM2.5 与风速、温度都呈负相关。

PM10 与湿度的相关系数r=0.61,呈中度相关,与压强的 r 为 0.39,表明 PM10 与湿度相关性大于而其与压强的相关性。PM10 与降水量相关程度弱,基本不相关,与风速、温度都呈负相关。

CO 与风速、压强、温度的 r 值都小于 0.3,说明与其相关程度弱,基本不相关。CO 与降水量、温度的r 值均为负数,说明呈负相关性。

NO2与降水量、湿度的r 值分别为0.441、0.364,均为低度相关关系。NO2与压强、风速、温度基本不相关。

SO2与风速、湿度基本不相关,与其他均为负相关。

O3与压强、降水量、湿度的 r 都大于 0.3 且小于0.5,都呈低度相关,其他与之均为负相关。

综上表明,自建点数据与国控点数据之间的差异与风速、压强、降水量、温度和湿度有关。PM2.5 和PM10 的差异主要跟自建点和国控点的湿度成正相关,跟风速和温度都呈负相关。PM10的差异主要跟自建点和国控点的湿度成正相关,跟风速和温度都成负相关。CO 的差异主要跟自建点和国控点的降水量和温度成负相关。NO2的差异跟自建点和国控点的降水量和湿度成低度正相关。SO2的差异主要跟自建点和国控点的压强、降水量和温度成负相关。O3的差异主要跟自建点和国控点的压强和降水量成低度正相关,跟风速、湿度和温度都成负相关。实际上,除上述原因外,造成这两者间的差异还有很多其他因素,如所使用的电化学气体传感器在长时间使用后会产生一定的零点漂移和量程漂移,非常规气态污染物(气)浓度变化对传感器存在交叉干扰,以及天气因素对传感器的影响,自建点的地理环境因素,等等,由于篇幅所限对这些因素不加讨论。

表1 “两尘四气”数据与风速、压强、降水量、温度、湿度的相关性结果

3 建立自建点数据矫正模型

根据表1 中自建点数据-国控点数据得出“两尘四气”的差值(Yi,i=1,2,3,4,5,6),利用[4]MATLAB 多元线性回归函数求出差值与风速(X1)、压强(X2)、降水量(X3)、温度(X4)、湿度(X5)的函数关系式。PM2.5、PM10、CO、NO2、SO2和 O3的差值函数式分别如下:

利用此模型,根据 Y校准值=Y自建点-Yi分别对自建点 PM2.5、PM10、CO、NO2、SO2和 O3的数据进行校准,计算模型的相对误差,并做出误差分析,最后检验模型的准确性和可行性。

随机选取给出的部分数据,代入上述差值函数式,计算自建点数据矫正结果如表2 所示。

表2 自建点“两尘四气”的数据矫正结果

由表2 可知,“两尘四气”的数据矫正相对误差平均值在 8.27 %~20.27 %范围内,说明多元线性回归模型能起到预期校准作用,但仍有不小的误差。造成误差的主要原因有:一方面对国控点数据和自建点数据(取算术平均值)作平滑处理存在一定的数据偏差;另一方面,多元线性回归是对两个或两个以上的自变量作回归分析,而一种现象常常与多个因素相关,由多个自变量的最优组合共同预测或估计因变量,比用单个自变量进行预测或估计更有效,也更符合实际,但可能忽略了交互效应和非线性的因果关系。

4 结束语

空气污染对生态环境和人类健康危害巨大,通过对“两尘四气”(PM2.5、PM10、CO、NO2、SO2、O3)浓度的实时监测可以及时掌握空气质量情况,对污染源采取相应措施。本文对自建点数据与国控点数据进行探索性数据分析, 并对数据造成差异的因素进行了分析,在此基础上利用国控点数据构建了自建点数据校准的数学模型,模型检验表明效果达到预期。

猜你喜欢

负相关风速湿度
湿度变送器测量结果不确定度评定
N-末端脑钠肽前体与糖尿病及糖尿病相关并发症呈负相关
高速铁路风速监测异常数据判识方法研究
加湿器用不对 警惕肺炎缠身
幼儿教师职业倦怠及主观幸福感状况研究
2006—2016年平凉市风速变化特征分析
翻译心理与文本质量的相关性探析
带有双检测结构的电缆接头保护装置
技术应用型本科院校非英语专业本科生英语学习焦虑的调查与研究
快速评估风电场50年一遇最大风速的算法