基于Tableau的苏州市空气质量可视化分析
2022-07-08于晓晶左煜杰郭玉斌
于晓晶 左煜杰 郭玉斌
(苏州市职业大学计算机工程学院 江苏苏州 215104)
引言
随着国民经济、科学技术迅猛发展,数据信息呈现了爆炸式的增长。互联网、电子商务网站、社交网络、移动设备、传感器每时每刻都在生成各种各样的数据。数据无处不在,政府机构职能部门运行、企业竞争发展、科学技术创新、衣食住行等各方面都面临着挑战,随着大数据时代的到来,各行各业都十分关注对繁杂无序数据的分析处理及友好展示[1]。因此,未来任何领域的普通个人均存在着大数据分析的需求。“人人都懂大数据、人人都能可视化”将是大数据领域的发展目标之一[2]。如何快速简洁地分析处理数据、清晰直观地展示数据,并准确获取有用信息,洞悉其中特征、趋势、规律,并最终正确解读现实、预测未来,实现基于数据的科学决策和行动,是目前亟待解决的课题。
近些年来随着改革开放的深化,工业化和城镇化进程加快,机动车保有量以及能源消耗逐年的增加,大气环境污染源逐年逐渐增多。苏州市的经济建设取得令人瞩目的成就,经济迅速发展的同时,环境污染问题也更加突出,区域性特性日渐明显。空气质量是关乎民生的大问题。苏州政府部门为落实建设“强富美高”的总目标,一直贯彻新发展理念,努力把这一蓝图变成美好现实,空气质量有明显改善。本文基于tableau 技术,依据苏州市2014 年到2020 年的空气质量数据,对苏州市的空气环境质量状况及变化趋势,进行定量与定性相结合的研究分析,为改善苏州市环境质量提供参考。
1 数据、工具准备
1.1 数据采集
分析所用数据均来源于天气后报网(http://www.tianqihoubao.com),用Octopus8.3.0 软件从天气后报网上获取苏州历史空气质量数据,以天为单位记录数据,包括日期空气质量等级、AQI 指数、当日AQI 排名及PM2.5、PM10、SO2、NO2、CO、O3六项污染物的浓度,共计2557 条数据。
1.2 数据处理
对采集到的数据进行初步处理,首先是对所有数据规范化格式,统一设置数据类型、字段命名,添加了“频次”字段,处理异常值。视具体情况分析,对于缺失数据处理主要采用如下方法:(1)采用前后两日的算数平均值;(2)用邻近城市(无锡)同日数据代替;(3)分析往年同期数据及前后几日数据,适当选取。
1.3 空气质量等级与AQI(Air Quality Index)
《环境空气质量标准》(GB3095-2012)[3]是2016 年1 月1 日在全国实施,把6 项污染物实测浓度值按规定方法与标准相应限值进行比较,得出各项污染物空气质量分指数(Individual Air Quality Ind ex,简称IAQI),在6 项污染物中IAQI 数值最大的即为AQI。
1.4 可视化工具Tableau
可视化作为一种可以放大人类感知的数据、信息、知识的表示方法,日益受到重视并得到越来越广泛的应用,大数据可视化常用的工具主要有Tableau、Datawatc 及大数据魔镜等。处理步骤为:数据采集,处理,计算、挖掘,可视化呈现。
Tableau public 是Tableau 公司开发的一款,用于实现交互的、可视化分析的免费数据分析工具,可建立交互式、可视化图表,用来实现交互的、可视化的分析和仪表盘分析,方便快速完成数据的整合、筛选。广泛用于商务服务、能源、电信、金融服务、医疗保健、制造业、媒体娱乐、教育等领域。仅需简单的拖放操作即可实现数据突出显示,改变数据分析内容与数据呈现方式,具有较强的交互性,并能依照一定思维方式及需求将多个工作表进行组合、布局,用于呈现出数据间的复杂关系与逻辑内涵。
2 苏州市空气质量分析
近些年来,苏州市一直大力推进挥发性有机化合物(volatile organic compounds,VOCs)及重点行业污染治理,重点实施精细化扬尘管控,取得了一定的成效。苏州市区环境空气质量总体趋于良好,大气空气质量优良的天数逐年上升,蓝天白云不再是难得一见。下面从空气质量指数、6 种主要污染物入手,具体分析苏州市空气质量特征。
2.1 苏州市空气质量指数AQI分析
导入相关数据表,数据是核心,是撬动数据价值的杠杆[4]。Tableau public 支持Excel、Access 和多种文本文件,对单个数据文件行数限制为10 万行,对数据的存储空间限定在50MB 以内[7],可以处理空气质量数据。打开工作表,将维度、度量中的数据拖放放行、列。“年度”拖放放行、列区域,“优良”“良”拖放放行区域,并设置度量为“求和”,在标记中设置图的类型为条形统计图。由图1 工作表中,可以直观看出苏州市天气整体趋于好转,空气质量“优”(AQI 指数小于50)的天数逐年上升,从2018 年开始都是高于7 年的算数平均值线;图2 的工作表展示了2014 年到2020 年的空气质量信息,优良(AQI 指数小于100,即符合中国的环境空气质量标准)出现的天数及其占全年的百分比逐年上升,从2015 年开始苏州市已经达到国家卫生城市标准。
图1 年度AQI<50天数
图2 年度达标天数及占全年百分比
根据需求设置约束条件实现动态过滤,Tableau public 工作表中建立交互式的可视化图表,对数据可视分析过程中各种任务建模,通过可视化界面中的图形元素进行交互式分析,方便快速完成数据的整合、筛选。图3 仪表板功能整合了7 张工作表,展示了2014年到2020 年的空气质量信息,即不同等级出现的天数统计图及其占全年百分比,通过“质量等级”“日期”筛选可以查看、对比每一月空气质量情况或者某一等级分布情况。可直观看到苏州市天气整体趋于好转,“重度污染”“严重污染”的天数急剧下降;当日AQI 排名逐年上升。
图3 空气质量等级可视图
2.2 城市空气质量影响因素——6种污染物分析
经济快速发展和城市化进程中大量能源的消耗排放了大量对人体有害的物质,对大气环境造成了一定程度的污染。随着生态文明建设理念的普及,人们对环境空气质量的意识在提高,要求也逐渐提升。中国的环境空气质量标准2012 年进行了第三次修订,调整了环境空气功能区分类,居住区、商业交通居民混合区、文化区、工业区和农村地区执行二类标准,调整了部分污染物的浓度限值,增设了PM2.5 浓度限值和臭氧8 小时平均浓度限值。PM2.5 的标准,是由美国在1997 年提出的,目前为止包括美国、欧盟、日本等一些发达国家已将其纳入国标并强制性限制[5]。2012 年我国新修订发布的 《环境空气质量标准》 首次增加了PM2.5 监测指标。
2.2.1 PM2.5、PM10、NO2可视化分析
运用tableau 的分析功能突出显示年度平均线,设置6 种污染物的二级标准浓度限为常量参考线,分析2014 年到2020 年的6 种污染物变化趋势。图4 是PM2.5 的可视分析图,其中可以清晰直观得到不同年份、不同月份的PM2.5 的浓度信息。通过交互筛选按器,对比查看不同月份的PM 2.5 浓度值,点击“真”可以得到超过标准值的日期及其数值。在时间分布上,PM2.5、PM10、NO2的大气污染物质量浓度日变化具有明显的季节性特征,秋冬季偏高、夏春季偏低,平均值逐年下降、达标天数逐年增加。
图4 PM2.5 趋势分析图
图5 综合分析,PM2.5、PM10、NO2三种污染物浓度都呈现下降趋势:PM 2.5 从2014 年~2020 年超过二级标准线的天数分别为105、79、53、43、37、32、16 天,明显下降;但是年平均值直到2020 才低于二级标准年均75ug/m3;PM10 从2014 年~2020 年超过二级标准线的天数分别为34、21、14、8、16、9、1,18 年稍有起伏,总体是下降,年平均值在2017 年低于二级标准年均70ug/m3;NO2从2014 年~2020 年超过二级标准线的天数分别为25、28、25、19、21、9、4,下降非常缓慢,年平均值也是直到2020 才低于二级标准年均40ug/m3。
图5 PM2.5、PM10、NO2可视化分析[6]
2.2.2 SO2、CO、O3可视化分析
图6 中展示了其近几年的三种污染物的变化趋势线。数据显示SO2日均值、年均值都没有超过二级标准值150ug/m3、60ug/m3,年均值逐年下降,比2014 年下降了76.3%,下降速度到2020 年稍有放缓;CO 的日均值、年均值都没有超过标准值4 mg/m3;O3在2020 年有一天超过8 小时均值160 ug/m3,年均值都没有超过标准线,但是曲线有上升趋势,要引起重视。
图6 SO2、CO、O3可视化分析
结语
综上所述,苏州市区环境空气质量总体持续改善、稳中向好,空气质量达标天数稳中上升,空气污染程度明显下降。但是以可吸入颗粒物PM10、细颗粒物PM2.5、二次污染物臭氧(O3)等为特征的污染依然存在。“可吸入颗粒物”PM10 和PM2.5 作为环境空气中的首要污染物直接威胁着人类身体健康,超标的臭氧则是个无形杀手:强烈刺激呼吸道,对人体皮肤中的维生素A 起到破坏作用。
所以要加快污染防控步伐,严格管理工程车、控制机动车保有量、提倡使用清洁能源、增加绿化面积,以减少扬尘、烟尘和机动车尾气尘是城市空气主要污染源。持续实施大气污染防治工程,防微杜渐,才能保持现有环境质量状况,继而继续改善空气质量。进一步深入推进污染源治理,实施大气综合治理,实现生态环境“高颜值”。