APP下载

基于大数据可视化技术的水资源审计方法研究

2021-05-28上海对外经贸大学

现代经济信息 2021年12期
关键词:可视化水资源水质

汪 倩 上海对外经贸大学

资源环境审计的历史在我国较短。由于我国地理范围广阔,地形分布复杂多样,更是加大了资源环境审计的难度。2019年,南京市审计局在南京市水资源保护政策落实情况专项审计调查项目中,面对审计对象多、审计事项复杂、数据和审计资金量大的特点,积极采取“双主审、双方案、双报告”的组织模式,深度融合大数据审计手段,取得了一定实效。2020年,江苏省扬州市审计工作就将水资源审计作为资源环境审计的重中之重。扬州市审计局发布了多个加强资源审计的方案,并要求以“五个强审”行动计划为引领,深入推进水环境审计高质量发展。

水资源审计是水资源保护与治理中重要的一环。水源质量的高低不仅会直接影响到居民的身体健康,也会对经济社会的健康可持续发展产生重大影响,由此可见,水资源保护与治理对整个社会的发展的重要性。水资源审计单位可以作为社会独立机构,审计相关环保部门的资源保护的效果以及污水治理资金是否得到恰当有效的利用,其具有一定的监督评价力度。由于,我国水资源审计发展历史较短,还存在一定的局限性。例如,审计人员的教育背景倾向财会方向,对环境资源相关的知识不了解。大数据可视化技术可以快速处理环境质量检测,污水排量与超标因子等统计数据,形成易于理解的图形,便于审计人员从探求数据背后的规律和潜在问题。笔者结合大数据环境下基于数据可视化技术的电子数据审计方法(陈伟,2017),我国水资源审计的现状与未来探讨(耿建新,2018),研究基于数据可视化技术的水资源审计方法。

一、大数据可视化技术方法分析

(一)大数据可视化技术的定义

近几年,大数据在我国计算机学科方面引起国民的高度关注,掀起了一股“人人都在学Python”的热潮。其中,大数据可视化技术是指利用工具对数据进行处理分析,用直观的图表向读者展示最关键核心的信息,同时也便于读者发现隐藏在大量数据中的异常数据。在互联网时代,我们每天可以及时有效的接受到各种各样的信息数据,那么如何在海量的信息中,最便捷直观的向读者输出关键信息,成了一大难题。而大数据可视化技术正好满足这个要求。例如,在新冠疫情蔓延全国各地时,我们手机每日按各地区分类上报的新冠疫情感染人数的图表,就是大数据可视化技术的结果,它可以直观清晰的让我们获取相关的信息,以及近段时间数据的变化趋势,也能为预测未来近期的趋势提供相关有效数据。其次,在市场调研工作中,经常需要使用到大数据可视化技术,其可以有效的将市场产品相关的数据进行处理,用多样且具有艺术形态的图表来体现核心思想,这使得向客户的市场汇报具有一定的趣味性,同时又简洁明了,便于工作中思想的有效交流传达。

(二)大数据可视化技术的工具

在获取可视化图表之前,我们首要工作就是进行数据挖掘。行业报告和政府数据通常是需要自己在网上爬取相关数据。专业人士会选择Python,但是市场也存在零代码数据挖掘工具,例如造数。国内爬虫软件如Gooseeker,八爪鱼等。数据处理好后,我们就可以进入可视化图表制作了,其工具有BDP,Python等。由于Python相对与R语言要简单,且是开源软件,本文根据水资源审计需要,以Python为例,分析折线图,词云图等可视化技术。

二、水资源审计方法原理分析——基于大数据可视化技术

(一)水资源审计所需的数据

1.被审计单位的内部数据

其主要包括两类,一是体现被审计单位自身经营状况的文书报告,如水利工程建设,省市重点排污企业名单,各地区用水量以及饮用水质量检测标准等,便于审计人员开展相关审计工作。二是水资源存量与质量相关的具体数据,如饮用水安全与污水基础设施,污水排放标准。针对水资源审计工作的内容,重点关注饮用水安全情况与污水排放治理工作等。

2.被审计单位的外部数据

审计人员所需的外部数据具体包括水质自动监测系统数据,地区企业用水数据。全国部分地区设置的水质自动监测系统,及时有效的为水资源审计提供大量的较准确的数据,节约了大量的审计采集数据的时间,形成较完整的数据采集,分析,预测和决策系统。审计人员基于各地区有关部门制定的污染排放标准、企业用水数据和相关环境政策法规,结合相关污水基础设施资金的运用情况,环保资金是否得到恰当的使用。另外,审计人员可以使用爬虫工具在环保部门网站上抓取需要的水资源质量检测数据,如《xx省水资源公报》《xx省水利发展统计公报》《xx发展年鉴》以及巡测资料和水文站实时监测成果。

(二)基于大数据可视化技术的水资源审计方法原理

审计人员结合大数据可视化技术进行审计时,首先要确认进行可视化分析的目标。通俗的话,一个具体的审计对象或审计目的的提出,其实就可以对应一个数据可视化的主体。确定数据围绕的审计目的后,就可以获取相关数据,选择合适的工具将数据进行整理清洗,用合适的图表将数据展示出来,最后将可视化的结果作为企业决策的依据。通常来说,我们可以把这个过程概括为三个阶段,即采集、分析、应用。

在第一阶段,审计工作人员是到审计现场获取进行可视化分析时用到的有效数据。数据来源可以是业务检测系统,例如水源质量监测数据。传统方式上获取的数据来源于财务室相关的财务会计信息和管理部门发布的相关水污染防治工作情况的报告等。

当我们收集到数据后,需要对数据进行预处理,将没有意义的数据和错误的数据剔除。数据分析阶段是根据我们的审计具体目标,选择合适的图表,进行统计分析,数据透视,地理分析等多种操作。

通过分析后会得到我们的数据可视化结果,通过对呈现的可视化图标进行观察,发现差异,获取审计线索。进一步对异常数据进行延伸审计,最终获取审计证据,以期发现水资源管理中存在的问题并提出优化建议,从而促进水资源健康,可持续发展。

三、基于大数据可视化技术的水资源审计方法应用案例

(一)案例背景

本文以建设饮用水安全工程,加强水污染防治工作为背景,从水资源数量和质量上总体把握,以地下水源丰富,河湖众多,水系复杂的xx省水资源审计为例,结合环保政策法规,考察xx省2017—2019年期间水质变化与水质污染源数据情况,探究大数据可视化技术在水资源审计中的具体应用。现已获取xx省2017—2019年水质均值检测数据,2019年国控重点排污单位自动监控超标数据等。目前,大数据分工具主要包括商业化软件工具和开源的、可编程的工具。本文使用在国民圈大热的大数据可视化分析软件python,进行可视化分析。

(二)水资源审计中大数据可视化技术的应用

1.文本与文档可视化分析

文字是传递信息最常用的载体。在浮躁的当代社会,人们少有耐心读面前大段文字,经常是扫几眼文章中的配图。这体现了人们对图片的接受程度要比枯燥的文字要高很多,此时就出现了另一种更高效的方式,即文本可视化。文本可视化处理的对象是文字,借助数据可视化的逻辑框架,通常运用编程软件,将复杂大量的枯燥文本内容,用有趣的图表形式,将文本中的抽象的难以发现的现象规律展示出来,给人们一定的视觉冲击感。

词云是文本可视化分析技术的典型的结果形式,最先由美国一名副教授提出,是最新的,网络流行的传播方式。在新浪微博上,我们可以经常看到大小不一样,频率不一样的文字的图片,却其中一段文字在大量文字中异常显眼突出,让我们过目不忘,这就是词云的效果。为了在大量文本信息中突出关键文本信息,给予视觉上的冲击,让读者一眼就能抓住文本的核心内容。其广泛应用于报纸,杂志等传媒和互联网行业。

2.全省水质月报数据变化分析

图1 2017—2019年水质自动检测数据达标率变化情况

为了从整体上把握被审计地区水资源质量情况,审计人员首先应该采集相关水质检测数据和收集相关的文件公告。此时,面对环保部门官网的实时更新的质检数据,可以借助前文提到的爬虫软件。在此基础上,借助Python工具,采用折线图分析,从而有效清晰地分析水质变化情况。例如,2017—2019年水质月报数据变化分析情况,分析结果如图1所示。其中,三条颜色不同的折线分别为集中式饮用水水源地,太湖流域重点断面,南水北调控制断面水质的月达标率。

由图1可以容易发现太湖流域重点断面水质达标率在近三年较平稳上升。2016年太湖流域遭受特大洪水灾难,这对太湖流域断面水质有直接影响。据被审计单位相关重点水利工程建设进展文本信息,可知于2017年、2018年,政府分别对太湖治理工程新沟河先后完成投资39 359万元和9 400万元,2019年完成太湖治理工程投资194 694万元。图线直观的上升趋势在一定程度上肯定了被审计单位关于加强太湖流域水资源保护和水污染防治,保障防汛等工作进展的情况。其中,集中式饮用水水源地水质,检测的达标率控制在90%与100%之间,可以体现出饮用水安全管理工作进行的较好。另外,图示很明显的异常点是2019年8月,南水北调控制断面的水质达标率低到了40%,水质情况属于比较恶劣,需要引起审计人员的注意,应当及时进行调查,从而发现原因是由于自然灾害,相关工程项目没有实施到位,或者是自动检测设备传输的数据异常问题,从而发现影响问题的线索。

3.全省国控重点污染源数据分析

为了解XX省2019年的国控重点污染源自动检测数据超标情况,审计人员可以借助编程工具进行建模,计算该期间排放超标的企业名单频次情况;在此基础上,按年度对所有排放超标企业名单生成词云图进行分析。词云不仅可以用于展示标签,还可以展示更为复杂的文本信息,目的是给予使用者直观的视觉感受,便于使用者抓取文本中的关键信息。词云中字体的大小表示企业在2019年度重点排污单位自动监控数据超标公示表中出现的次数情况。图2的分析结果表明:xx省2019年重点排污超标单位有实联化工有限公司、宿迁市群英纺织印染科技有限公司、连云港晨兴环保产业有限公司、盱眙北控水务发展有限公司等。这些单位在2019年12次重点排污单位自动检测数据超标公示表中出现了至少六次以上。这些企业是污水排放的重大风险点,也是今后政府审计需要督促内部审计进行经常评价并报送的重点企业。政府审计可针对这些企业建立名单,并要求内部审计定期报送具体评价结果,从而给出可能的处罚措施;另一方面,也可以发现行业中污水治理比较好的企业,以便将其治理方案在行业中传播,达到降低整个行业污水排放的目的。

图2 重点排污单位内容分析

审计人员可以将这几个公司纳入重点审计对象,对排污数据超标因子进行进一步的延伸取证。抽离出重点排污单位,对其进入深入分析。审计人员可以发现:盱眙北控水务发展有限公司的超标因子为COD。COD出水浓度指标可以用来衡量污水对周围环境的污染情况,COD出水浓度排放标准为50mg/L(国家标准),在2019年后半年,该公司显然远超出平均超出排放标准。在10月份,COD出水浓度更是排放标准的10倍,是六月份超标浓度的近3倍。此时,审计人员可以对污水治理资金以及相应排污处罚措施进一步分析,从而也可以为审查相关监督机构的环境保护项目的绩效审计获取证据。

四、结语

基于数据可视化技术的水资源审计过程中,结合地域特点,以水资源生态环境为审计重点,在时间紧,任务重的情况下,坚持严谨尽职的审计工作态度,严格执行现场管理办法,及时通报审计进度和发现的问题,加强对审计获取的证据进行分析,提高大数据环境下水资源数据的使用效果。我国水资源分布地理范围广阔,因此审计的覆盖范围广。同时审计需要的时间长,取证难度大,以及数据繁杂等特征都促使审计方法创新。与此同时,利用大数据可视化技术开展水资源审计可能是一种可行性研究方法。本文基于现实的需要,利用python探索了如何在水资源审计中应用大数据可视化技术,并通过案例具体分析。■

猜你喜欢

可视化水资源水质
水质抽检岂容造假
基于CiteSpace的足三里穴研究可视化分析
《水资源开发与管理》征订启事
基于Power BI的油田注水运行动态分析与可视化展示
珍惜水资源 保护水环境
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
一月冬棚养虾常见水质浑浊,要如何解决?这9大原因及处理方法你要知晓
加强水文水资源勘测合理开发利用水资源
浅议我国水资源的刑事立法保护