空气质量检测仪的浓度预测及校准
2019-07-12
亳州学院 安徽 亳州 236800
一、问题重述
1.1 问题的背景 空气问题是我们人类关乎生存的重大问题,人类没有了空气就如同鱼儿离开了水就不能存活。习大大在2018年全国生态环境保护大会上为了解决生态环境问题而提出的新观点:“坚决打好污染防治攻坚战,推动生态文明建设迈上新台阶。”大气污染是全人类的公敌,它不仅对人体健康存在严重的危害,同时也严重的影响着自然生态环境。所以对空气质量的建立相应的数学模型,不仅对我们的生活有所裨益,而且对各地政府机构研究制定大气污染防治政策具有实际的指导意义。习大大曾经说过:“绿水青山就是金山银山。”因此空气质量十分重要。
空气污染对生态环境和人类健康危害巨大,通过对“两尘四气”(PM2.5、PM10、CO、NO2、SO2、O3)浓度的实时监测可以及时掌握空气质量,再通过准确的建立数学模型来对于对污染源采取相应措施。虽然国家监测控制站点(国控点)对“两尘四气”有监测数据,且较为准确,但因为国控点的布控较少,数据发布时间滞后较长且花费较大,无法给出实时空气质量的监测和预报。某公司自主研发的微型空气质量检测仪花费小,可对某一地区空气质量进行实时网格化监控,并同时监测温度、湿度、风速、气压、降水等气象参数。空气污染对生态环境和人类健康危害巨大。国家有国控点,地方有自建点,但国控点与自建点都有优劣之处。国控点仪器精准,但国控点的基站数目较少且影响因素多。
二、问题分析
对自建点数据与国控点数据进行探索性数据分析。通过对自建点数据与国控点数据进行使用借助MATLAB数学软件及C语言程序导入并且对相应的数据求均值,导出分析自建点数据与国控点数据,分析自建点与国控点。再通过运用Python软件得出自建点与国控点的未来预测数据。
对导致自建点数据与国控点数据造成差异的因素进行分析。由于所使用的电化学气体传感器在长时间使用后会产生一定的零点漂移和量程漂移,非常规气态污染物(气)浓度变化对传感器存在交叉干扰,以及天气因素对传感器的影响,对自建点与国控点的数据图通过借助MATLAB数学软件及C语言程序拟合分析制并制作出拟合数据库,通过拟合数据库分析其因素。根据国控点的数据与自建点的数据进行比较。国控点的数据以小时为单位,自建点的数据以每五分钟为单位。对自建点数据与国控点数据进行探索性数据分析。根据国控点的数据与自建点的数据运用MATLAB数学软件及C语言程序与Python软件对导致自建点数据与国控点数据造成差异的因素进行分析。
三、问题假设
(1)假设自建点数据与国控点数据都是准确无误的数据均为可供分析的可靠数据,不存在错误数据
(2)假设自建点数据与国控点数据相同的外部环境,在对自建点数据与国控点数据测量过程中不考虑随机因素
(3)假设题中的6个条件指标的影响程度是不相互影响的
(4)假设各个机器都能正常检测“两尘四气”
(5)假设自建点数据与国控点数据是相互独立,不互相影响的
(6)假设自建点数据与国控点数据不存在零点漂移和量程漂移
(7)假设自建点数据与国控点数据不存在非常规气态污染物(气)浓度变化对传感器存在交叉干扰
(8)假设自建点数据与国控点数据不存在天气因素对传感器的影响
四、模型的建立与问题解答
空气污染对生态环境和人类健康危害巨大,通过对“两尘四气”(PM2.5、PM10、CO、NO2、SO2、O3)浓度的实时监测可以及时掌握空气质量,对污染源采取相应措施。虽然国家监测控制站点(国控点)对“两尘四气”有监测数据,且较为准确,但因为国控点的布控较少,数据发布时间滞后较长且花费较大,无法给出实时空气质量的监测和预报。某公司自主研发的微型空气质量检测仪花费小,可对某一地区空气质量进行实时网格化监控,并同时监测温度、湿度、风速、气压、降水等气象参数。这是对“两尘四器”(PM2.5、PM10、CO、NO2、SO2、O3)的大致的数据处理,其误差偏大,但有一定的科学依据反应出国控点与自建点有误差,可以大致看出两尘四气体的基本状况。
我们拟通过数学MATLAB软件与Pytho软件来预测空气污染物浓度模型。由于本文所构建的是非机理模型,当前时刻空气污染物浓度会受过去一个时间段内空气污染物浓度的影响,所以有本底污染物浓度的初始值存在,又因为影响空气质量的PM2.5、PM10、CO、NO2、SO2、O3等6种污染物之间彼此会存在一定程度的转换关系,换言之,当前时刻的6种常见污染物指标的浓度势必会影响到后一时刻的其他污染物浓度。通过建立污染物单因子循环神经网络的预测模型,经过多次试验,决定以过去2小时内因子的小时浓度均值和当前时刻六种污染因子的每小时浓度平均值共计8项作为输入层。并将因子的下一小时的浓度平均值用作输出层。以预测PM2.5一小时浓度均值为例,如下表所示,当我们模型要预测PM2.5一小时浓度均值模型时,只需要知道当前PM2.5、PM10、CO、NO2、SO2、O3一小时浓度均值以及过去2个小时的PM2.5小时浓度均值,我们就能预测出下一个小时PM2.5的浓度均值。
通过用MATLAB对数据进行分析得到数据国控点与自建点的主要污染指标分析
PM2.5:国控点PM2.5浓度的变化,在3916小时左右显示最低,在1306小时的时候浓度变化最大。从开始一直到2466小时左右国控点下PM2.5浓度的变化比较大显的非常陡峭。在2466小时以后则显得非常平缓,基本上都在0到200ug/m3内变化,可以看出时间越长,PM2.5变化会越小。自建点PM2.5浓度变化图中,在40471h到48565h之间PM2.5浓度达到最高为540ug/h,在1h到72847h之间PM2.5主要集中于280ug/h3.后期变化较为稳定。
PM10:国空点下PM10的浓度变化。仅在2076小时左右和3191左右的变化比较高。随着时间的增加,国控点下PM10的浓度变化将会越来越平缓。基本上在0到300ug/m3之间变化。国控点下PM10的浓度变化随时间变化并不是很大。整体上看起来是特别平缓,所以看出PM10影响比较小。自建点排名PM10浓度变化中,在40471h和48565h之间最高可达到920ug/h3.在1h和72847h在50ug/h3聚集。在72847h之后少数可达到400ug/h3,主要集中于150ug/h3到300ug/h3之间。
CO:国控点下CO浓度变化随时间的变化。1530小时左右看,可以看出国空间下CO浓度变化最低。前642小时之前,国控点下CO浓度的变化随时间的变化比较陡峭。此之后,国控点下CO浓度的变化逐渐变得平缓。总体上看国控点下CO浓度随时间变化比较明显。特别是在时间前期变化的非常明显。整体上都在0到3mg/m3之间变化。自建点下CO浓度变化整体来看CO浓度落差不大,但在40471h到56659h之间最大落差可达到3mg/h3.在1h到202351h之间主要集中于1mg/h3和1.5mg/h3,较少的位于0.5mg/h3.其他的主要集中于2mg/h3。
N02:国控点NO2的浓度随时间的变化。从总体上看。随着时间的增加,国控点NO2的浓度的变化比较明显。0到1016年段内,国控点NO2的浓度的变化比较低且比较平缓。在1161分钟后,国控点NO2的浓度变化比较大。在1016分钟后,国控点NO2的浓度的变化呈现波形震荡。从整体上看,在3626分钟时国控点NO2的浓度取得最大值。在581分钟左右国控点NO:的浓度取得最小值。整体上看,随时间的增加,国控点NO2的受到的影响比较大。自建点NO2的浓度随时间的变化。在前期自建点NO2的浓度变化比较平稳。56659分钟时,自建点NO2的浓度变化比较陡峭,且为整个图表的最高值,在这个时间后自建点NO2的浓度迅速下降,且变化平稳。在97129分钟后,自建点NO2的浓度的变化。有陡然上升,后来又变得比较的平稳。从整体上看自自建点NO2的浓度随时间的变化,还是比较平稳的。
S02:国控点下SO2浓度变化随时间的变化。在时间的后期,随时间的变化,国控点下二氧浓度的变化比较平缓。在时间的前期国控点SO2浓度变化比较陡峭。特别是在1073小时之前。国控点下SO2浓度随时间在0到120ug/m3内变化。在时间的后期3619小时左右浓度变化会陡然上升。从整体上可以看出控点SO2浓度随时间变化还是比较明显的。自建点下so2浓度变化当时间56659分钟时浓度变化达到最大值,约1100ug/分钟,在56659分钟之后无明显变化,基本浓度为零。但是在56659之前浓度有细微的变化。总体而言浓度还是趋近于零,除了56659分钟时达到最大值。
03:国控点下O3浓度的变化随时间变化,在291小时代时候O3浓度变化的比较明显,随着时间的增加O3浓度变化比较平缓,直到2756小时的时候,随着时间的增加,国空点下O3的浓度开始陡然上升。在1161小时代时候国控点下的O3浓度最低。在2841小时的时候国控点下的O3浓度最高,在时间变化的过程中,开始的阶段,国控点的O3浓度变化平缓,时间越长,则变化的比较陡。可以看出时间越长国控点下的O3浓度将会越大。自建点下O3浓度变化随时间的变化。在150895分钟左右的时间段取得取得最大值。58682时间段里取的最小值,从总体上看。自建点下O3浓度随时间的变化非常陡峭,比较明显在。在58682到100597的时间段自建点下O3浓度随时间变化比较小,影响比较小。时间越长,自建点下O3浓度的变化范围越广。
自建点下的其他数据运用MATLAB软件对数据进行分析得到以下:
以下自建点的风速、压强、降水量、温度、湿度的数据分析
风速:自建点风速变化中在72847h到80941h之间浓度每小时变化最快,可达到9h每秒。在129505到186163之间较为突出,主要集中于7h每秒。前期时间段比较平稳,整体变化较为平和。
压强:自建点压强变化中其平均压强在1000pa以上,最高压强可达1040pa,整体趋势呈下降趋势。
降水量:自建点下降水量变化可分为两个部分,在1h到48565h之间降水量呈上升趋势,达到最高点310mm/h2.分布的降水量较为集中,呈现出矩形形状。第二部分,在48565h到161881h之间,48565h与64753h之间降水量接近0mm/h2,此后降水量在逐步上升。在161881h到169975h之间出现降水量直线回落,直到226633h时逐步平稳至250mm/h2.
温度:自建点温度变化下,整体趋势呈现上升。在97127h到105210h之间出现了巨大转折,后期趋势一路上涨达到40摄氏度。但是在16187h到48559h之间出现零下摄氏度。
湿度;自建点下湿度随时间的变化,随着时间的增加,自建点下湿度变化还是比较平缓的整体上成一个波动不大的波浪线,整体自建点下湿度的变化20rh到100rh没变化,自建点下湿度129505分钟左右取得最小值。湿度的最大值为100rh。时间后期基本上保持在80rh到100rh之间变化,自建点下湿度波动不是很大影响比较小。
通过MATLAB软件对自建点与国控点进行预测得到通过使用Python对自建点的风速、压强、降水量、温度、湿度的数据处理与预测得到数据分析:
通过预测数据可以看出“两尘四气”(PM2.5、PM10、CO、NO2、SO2、O3),这些数据对未来的监测有一定参考价值。通过预测值、国控点、自建点三方面数据可以对未来的数据的精准的有大大提升。
空气中的所有的气体污染物达到一定浓度时,将影响人体健康,降低能见度,甚至改变区域的气候。目前中国的所有的气体污染物污染已经受到政府相关部门、科学界与普通民众的广泛关注已成为影响人民生活的重要因子之一。所有的气体污染物是区域性大气复合污染的重要产物,其既有一次来源,也有经其它气态或半挥发性物种二次转化生成,来源复杂。准确掌握大气所有的气体污染物浓度对于掌握区域大气复合污染特性,以及制定科学的污染控制措施有重要的作用。国控点与自建点两家每天每小时都在发布所有的气体污染物浓度数据,由于浓度数据不完全一样,有时甚至存在较大差异,导致不少民众会对真实的所有的气体污染物浓度产生疑惑。我们主要对国控点与自建点数据对比分析两个机构公布的所有的气体污染物浓度,以增公众和强学界对所有的气体污染物浓度的理解。首先假定大气环境中污染物信息熵的时间序列作为我们研究的参考序列灰色关联分析法源于灰色系统理论。它是通过描述序列曲线的几何形状,根据其相似程度来判断系统因素之间的联系是否紧密,从而找出复杂系统中的主次因素。将数据带入公式得出结论在该理论中,关联度数值越大,表示该因素在大气污染物指标系统中对参考序列(特定污染指标,如PM2.5、PM10、CO、NO2、SO2、O3污染浓度指标)的影响就越大,反之,关联度数值越小,表示该因素在系统中对参考序列影响就越小。
我们对国控点与自建点,分析了2018年11月4日到2019年6月11日各污染物的浓度均值,污染物采用24h平均值作为日均值;而月(年)均值为各月(年)所有有效天的日均值的平均值。通过对比不同月份两个机构监测的浓度分析国控点与自建点大气细颗粒物污染监测的差异,通过MATLAB软件对国控点与自建点的数据进行拟合,建立国控点与自建点的数据拟合数据,通过图片分析“两尘四气”(PM2.5、PM10、CO、NO2、SO2、O3)。
(一)拟合数据分析。国控点与自建点空气污染物浓度对比,国控点与自建点空气污染物浓度均值表现出一致的日变化规律与相似的浓度水平。总体而言,自建点(2018与2019年均值分别为55与50)略高于国控点的均值。(2018与2019年均值分别为53与49)从空气污染物月均值的差值来看,自建点在2018年5-6月的浓度显著较低(图3),5月和6月比国控点的数据分别低了约10和30μg/m3,在2018年年初与8-9月也偏低约5~10μg/m3,但自建点的平均浓度在2018年12月,2019年1月和7一10月要比自建点高出约5~10μg/m3,其余月份自建点的浓度与国控点平均浓度水平接近。从两年的数据来看,自建点与国控点的空气污染物浓度差异并未呈现出季节性规律。若剔除2019年6月这一极端月份,则自建点与国控点均值接近。这说明国控点空气污染物年均浓度高于自建点均值主要由于某个极端月份造成,大部分时段两者都比较接近。
(1)国控点与自建点PM2.5拟合数据:在0到1000小时左右的时间内。国控点与之间点的差别比较大呈现出一年中的极端月份。如果剔除这个极端月份的话,国控点与自建点的均值接近。在这个极端月份国控点与自建点呈现你高我低的趋势。国控点的空气污染浓度差异。并没有呈现季节性规律。从图的整体上看,国控点与自建点PM2.5随着时间的变化逐渐的降低,且逐渐变得平缓。
(2)国控点与自建点PM10拟合数据:国控点与自建点PM10随着时间的变化非常的平缓。国控点与自建点PM10空气污染物浓度均值表现为一致的变化,浓度均在0到180ug/m3之间变化。国控点与自建点PM10浓度污染并没有呈现季节性变化,也也无极端月份。国控点与自建点对空气的污染度基本上一致,两者比较接近,几乎是相等的。
(3)国控点与自建点CO拟合数据:在0到4000小时之内,国控点与自建点CO浓度的变化曲线是比较平稳的。在4000小时之后,有的陡然上升的趋势。在2000小时到2500小时左右的时间锻炼也有着明显上升的趋势,在这个时间段内,存在极端月份,剔除这一极端月份,则国控点与自建点CO浓度在这上半年均值相等,随着时间的变化,在下半年国控点与自建点CO浓度有着陡然上升的趋势,且国控点与自建点CO浓度的差异比较明显。
(4)国控点与自建点NO2拟合数据:从国控点与自建点NO2的浓度上来看,NO2的浓度变化存在的极端月份。在0到1500小时之内,国控点与自建点NO2拟合图存在着很大的变化,特别是在500到1000小时之内。有着极端月份的变化,随着时间变化,国控点与自建点NO2浓度变化比较大,国控点与自建点NO2浓度之间点的差异较大,均值不同。整个变化范围在0到50ug/m3之间变化,如果这个剔除这个极端月份,整体上来看,国控点与自建点NO2的浓度还是比较平缓的。
(5)国控点与自建点SO2拟合数据:在0到1000小时的时间内变化的波动还是比较大的。国控点与自建点SO2浓度差异比较大,均值不同。在1500小时之后再变得比较平缓,这里存在着极端月份,并没有存在的季节变季节性变化。如果剔除极端月份的话,国控点与自建点SO2浓度在0到30ug/m3之间变化。从500小时到1500小时的时间段内,国控点与自建点SO2浓度随时间下降的速度最快。总体上来看下半年国控点与自建点SO2浓度的变化还是比较平缓的。
(6)国控点与自建点O3拟合数据:从开始的阶段两者的差异非常大,从250ug/m3下降的速度非常的快,再到500小时之后,变得的较为平缓,在1500小时之后,国控点与自建点O3的浓度变化逐渐的增加,两者出现较大的差异。国控点与自建点有着同步增加的趋势,随着时间的推移,1500到4000小时这个这个时间段内。国控点与自建点O3的浓度不断的增加,这里存在着季节性差异,从土地整体上来看,国控点与自建点O3浓度随时间的差异还是比较大的。
(二)原因分析。国控点位于城市市的中心城区,附近路网密布,交通繁忙,受交通源的影响较大;自建点分布于不同行政区的不同功能区,其中包括学校、公园或居民区。位置的差异是造成两者浓度差异的主要原因。由于广自建点分布较广,其均值更能代表城市平均污染水平;而国控点使用站点有限,其不足以代表城市的平均情况,只能说明其所在区域的情况。另外,监测设备测量方法的差异也是原因之一。由于所使用的仪器不同外界因素导致的误差存在,由于电化学气体传感器在长时间使用后会产生一定的零点漂移和量程漂移,非常规气态污染物(气)浓度变化对传感器存在交叉干扰,以及天气因素对传感器的影响,在国控点近邻所布控的自建点上,同一时间微型空气质量检测仪所采集的数据与该国控点的数据值存在一定的差异,因此,需要利用国控点每小时的数据对国控点近邻的自建点数据进行校准。
因此,自建点的数据与国控点均值不具有直接的可比性,但由于自建点与国控点都在城市市中心城区,所以在谈及城市大气污染时,两者都有一定的参考价值。
五、模型的改进
5.1 模型的改进 回归模型预测技术中采用最小二乘法计算回归模型参数理论上存在一定的缺陷,是模型在进行中长期时产生较大误差。通过对最小二乘法进行改进,在一定程度上弥补这种缺陷,提高了回归模型的适用性和稳健型。在传统回归模型的参数估计方法中,最小二乘法利用刻画真实值与模型值之间偏差,主要考虑到计算简便,参数估计易于用公式求解,但当原始数据存在奇异点时,平方会放大奇异点对可信度的影响,导致回归模型的预测效果不好,即最小二乘法的稳健性不好。在中长期负荷预测中,经常会出现异常点。采用传统的最小二乘法进行负荷预测时通常首先剔除这些偏差较大的奇异点,再进行下一-步的分析和预测。然而这些异常点恰好在某些方面反映了一些特殊的信息,不可以随意剔除。