基于Tableau的合肥市空气质量可视化分析
2019-09-10蒋健舒畅
蒋健 舒畅
摘 要:以“天气后报网”为数据源,通过现实情况验证数据准确性,利用Python爬虫技术,选用2014—2018年合肥市空气质量数据,基于Tableau软件对收集的空气质量数据进行了可视化分析。分别从空气质量指数、质量等级、空气质量预测三个方面对合肥市空气质量进行可视化分析和总结,揭示合肥市空气质量特征和未来空气质量发展趋势。
关键词:Tableau;空气质量;可视化
中图分类号:X831 文献标识码:A 文章编号:1003-5168(2019)07-0153-03
Absrtact: Taking "weather report network" as the data source, verifying the accuracy of the data through the actual situation, using Python crawler technology, choosing the air quality data of Hefei City from 2014 to 2018, the collected air quality data were visualized and analyzed based on tableau software. The visual analysis and summary of air quality in Hefei were carried out from three aspects: air quality index, quality grade and air quality prediction. The characteristics of air quality and the future development trend of air quality in Hefei were revealed.
Keywords: Tableau;air quality;visualization
隨着我国经济的快速发展,空气质量区域性特性日渐明显。合肥市作为安徽省省会,经济迅速发展的同时,环境污染问题也日渐突出。合肥市主要环境影响因素指标有SO2、NO2、PM2.5、PM10、O3等。国内外学者对空气质量评价建立了许多模型和评价方法。例如,贺爱香[1]等对合肥市空气质量进行评价时,使用了灰色聚类法,同时通过模糊综合评价对空气质量进行评价。赵明艳[2]通过卷积神经网络模型和多元线性回归对空气质量进行短期预测。李慧杰[3]等通过空间插值和灰色关联度分析探究京津冀地区空气质量影响因素。通过建立模型的方法固然能在一定程度上发现空气质量的影响因素,并预测空气质量,但基于现实数据的可视化能更加形象地呈现出合肥市空气质量的变化趋势,从而使相关工作人员制订出相应的解决方案。因而,基于可视化研究的空气质量分析具有重要的现实意义。
1 数据来源与可视化方法
分析报告以“天气后报网”为数据源,使用Python爬虫技术爬取了从2014年1月1日至2018年12月31日的空气质量数据,共获得1 814个字段。每个字段的信息包括:AQI指数、AQI排名、质量等级、当天AQI排名、PM2.5、PM10、NO2、SO2、CO和O3等信息。最后,利用Tableau等软件对相关数据进行可视化处理。
2 合肥市空气质量总体概况
2.1 总体情况
从2014年到2018年的5年内,平均空气质量优良天数比例为69.86%。其中,2014年平均空气质量优良天数比例为54.25%;2015年至2017年优良天数比例为70%~75%;2018年的优良天数比例为79.18%。从2016年平均年各项空气指标数据变化来看,2016年是合肥市空气质量变化的一个转折点。2016年以前,空气质量指数AQI、PM2.5和PM10均呈现快速下降趋势,自2016年以来,虽然仍然呈现下降趋势,但下降趋势明显变缓。从NO2和SO2的变化也可以明显看出2016年作为转折点这一特性,2016年以前,NO2呈现出上升趋势,SO2呈现缓慢下降趋势;而在2016年以后,NO2含量急速下降,SO2含量急速上升。
2.2 AQI指数
2018年平均AQI指数为77.36,较2017年下降了9.22%。近5年来,合肥市空气质量明显好转。使用Tableau做出2014年到2018年每一天AQI的空气质量等级(由于篇幅有限,仅展示2016年图)。经过统计分析可以看出,2014年合肥市全年空气质量处于中度污染和轻度污染,空气质量较差;到2018年,合肥市全年没有一天出现严重污染等级。其中2014年有11天处于严重污染状态,2015年有7天,2016年有2天,2017年3天,2018年全年没有出现严重污染的天气状况。
从可视化结果可以看出,1月、2月、12月是空气质量最差的3个月。7月、8月和9月是全年空气质量最好的3个月。
2.3 主要污染物状况
5年来,合肥市的主要大气污染物有CO、SO2、NO2、O3、PM2.5和PM10。从2014年到2018年,首要污染物逐渐从PM10向O3转变,污染物的总量有所下降。
在合肥市,2014年至2018年,PM10和PM2.5浓度同比有所下降,环比有所上升;NO2和CO浓度同比整体有所下降,环比有所下降;SO2同比上升,环比上升;O3浓度同比有所上升,环比有所下降。5年来,PM2.5的平均浓度为46.9~79.6μg/m3,每年的平均浓度为60.4μg/m3,5年来呈现下降趋势;5年来,PM10平均浓度为68.8~110.6μg/m3,每年的平均浓度为86.3μg/m3,5年来呈现下降趋势;5年来,NO2在平均浓度为6.1~42.7μg/m3,每年的平均浓度为27.74μg/m3,5年来呈现先上升后下降的趋势;5年来,SO2的平均浓度为13.8~39.2μg/m3,每年的平均浓度为23.28μg/m3,5年来呈现先下降后上升趋势;5年来,CO的平均浓度为13.8~39.2mg/m3,每年的平均浓度为23.28mg/m3,5年来呈现下降趋势。5年来,O3的平均浓度为33.5~66.4μg/m3,每年的平均浓度为53.56μg/m3,5年来呈现上升趋势。
3 质量等级分析
3.1 不同质量等级污染物分布
在空气质量等级为优良的天气,O3是首要污染物,而在轻度污染以上的天气,PM2.5和PM10则逐渐成为主要污染物。可见,空气污染的主要原因还是PM2.5与PM10等细颗粒物浓度提高。
由图2可以看出,PM2.5和PM10在严重污染天气中占比较大,其他污染物相对较少。可见,PM2.5和PM10是造成空气质量变差的主要因素。
3.2 严重污染天气分布
2014年至2018年,一共出现了23次严重污染的天气。其中,2014年1月出现了7次,2月、6月、10月和11月各出现1次;2015年1月出现了2次,12月出现了5次;2016年1月和2月各出现1次;2017年1月出现1次,12月出现2次;2018年没有出现过严重污染的天气。综上所述,严重污染天气主要出现在1月和12月。
4 2019年空气质量指数及主要污染物预测
4.1 预测结果
通过Tableau的预测功能,可以预测出2019年每个月的PM10、PM2.5和AQI指数值。其中,AQI和PM10指数的误差范围不超过30μg/m3,PM2.5浓度的误差范围不超过20μg/m3。预测结果表明,2019年8月的空气质量最好,空气质量指数为67.64;1月的空气质量最差,空气质量指数为118.76。
从预测结果可以看出,空气质量指数整体呈现下降趋势,随季节性变化特征表现明显,夏秋空气质量较好,春冬空气质量差。呈现这种变化的主要原因在于PM2.5和PM10等细颗粒物,尤其在1月和12月份,细颗粒物浓度达到顶峰。
4.2 结果分析
2019年1月份的平均AQI指数实际值为118.5μg/m3,2月份平均AQI实际值为87μg/m3,与估计的118.76μg/m3和84.5μg/m3相差极小;PM10的1月份实际平均浓度为70.94μg/m3,2月份实际平均浓度为50.89μg/m3,其估计值分别为62.1μg/m3和63.7μg/m3;PM2.5的1月和2月的实际平均浓度分别是85.65μg/m3和63.67μg/m3,估计值分别是82.58μg/m3和52.90μg/m3。各估计值均在误差范围内,存在合理性。
5 结论
通过分析可视化结果得到如下结论。
①5年来,合肥市空气质量有了明显改善。空气质量指数逐年递减,优良天数比例逐年增加,特别是2018年,没有出现过空气质量等级为严重污染的天气。
②分析AQI指数得出,合肥市2014年至2018年PM10和PM2.5等细颗粒物对空气质量影响最大,SO2、NO2、CO等气态污染物相较于细颗粒物对空气质量的影響较低。随着O3浓度的不断增加,PM10和PM2.5等细颗粒物的不断减少,主要污染物逐渐从细颗粒物转为O3。
③细颗粒污染物减少,气体污染物增多,不同污染物变化趋势不同。PM10和PM2.5等细颗粒物呈现明显下降趋势。SO2浓度在2014年到2016年间略微减少,2016年后增多,上升趋势明显。NO2浓度在2014年到2016年间增多,2016年后减少,整体变化不大。CO浓度整体变化不大。而O3的浓度增大。整体来看,固定污染物明显减少,气体污染物有增有减。
④季节性变化明显:从整体空气质量等级分布来看,近5年空气质量呈现春冬差,夏秋好的季节性变换,呈现这种变化的根本原因在于细颗粒物的季节周期性变化,秋天是全年空气质量最好的季节。
参考文献:
[1]贺爱香,魏巧玲,范奎奎,等.基于灰色聚类法的合肥市空气质量综合评价研究[J].安庆师范大学学报(自然科学版),2019(1):99-103,112.
[2]赵明艳.基于卷积神经网络的空气质量预测[J].科学技术创新,2019(9):10-12.
[3]李慧杰,王秀兰,王计平,等.2013—2017年间京津冀地区空气质量及影响因素分析[J].环境监测管理与技术,2019(2):21-25.