空间统计分析集成技术及其在区域环境中的应用
2010-03-20马民涛张雁雁王江萍
马民涛,孙 磊,韩 松,张雁雁,王江萍,张 菁
(北京工业大学环境与能源工程学院,北京 100124)
空间统计分析集成技术及其在区域环境中的应用
马民涛,孙 磊,韩 松,张雁雁,王江萍,张 菁
(北京工业大学环境与能源工程学院,北京 100124)
在分析了我国目前区域环境中若干问题、解决问题的相应技术手段及其缺陷、国内现有环境数据资源利用不足等前提下,简介将GIS与多元统计分析技术集成成果——“区域环境管理数字化集成技术”的组成、结构、功能及特点,以北京市(1∶50000)数字化地图为工作底图,选取具代表性区域为研究靶区,以《全国环境统计信息系统》中的海量环境数据为依据,分别调用主成份分析、聚类分析、回归分析、趋势面分析等与 GIS集成技术的方法,对相应区域中的相关区域环境问题进行了针对性地提取、分类、归纳和分析;为更有效利用全国现有环境数据资源,解决城市及其区域性的若干环境问题提供了高效数字化集成工具和示范性工作途径.
区域环境;地理信息系统;统计分析;污染源;环境管理
我国环境保护虽已取得积极进展,但环境形势依然十分严峻[1].发达国家上百年工业化过程中分阶段出现的环境问题[2]在我国近 20多年来集中爆发[3].特别是近年来,我国环境污染负荷呈不断加重趋势.区域环境与社会、经济始终密切相关,社会、经济、环境间的协同、稳定、可持续水平决定着一个国家或地区的致命结构关系.目前,对区域环境问题的认识和相关研究还很有限.近年来,我国环境科技发展已有长足进展,但环境污染防治技术和环境管理能力与经济发展形势相比仍无法满足解决日益复杂化环境问题的需要.
1 区域环境问题的解决需要数字化集成技术的支持
区域环境是社会与经济发展的基石,解决区域环境问题(污染特征、环境污染发生与发展规律、环境主要问题及其成因、环境污染主要控制因素、环境污染可能产生的区域环境效应和区域环境质量发展趋势等)是一项系统工程;这不仅涉及到广域地理空间中众多基础环境背景和污染排放数据,还涉及相关学科的理论内涵和技术.解决基础区域环境问题,一是要对众多区域性地理实体实施空间分析,二是要对各类环境中的多变量、多样本海量数据实施分析与处理.地理信息系统(Geography Information System,GIS)技术与多元统计分析技术是解决上述 2方面问题的有效工具.目前 GIS技术应用领域已相当普遍且其技术本身仍在迅速提高,但基于 GIS在有效管理城市区域空间海量污染源分析并对城市区域环境质量改善对策方面的研究及应用还很少见[4].另外,虽已有很多研究者曾采用多元统计分析中的相应方法(方差分析、相关分析、回归分析、聚类分析、因子分析等)来解决有关环境科学与工程中的部分问题,但对上述方面的研究及应用还尚未见到.
从技术集成创新方面看,在结构、功能与效率方面利用 GIS强大的空间管理功能与多元统计分析方法处理多变量、多样本海量数据的强大潜能来解决区域环境相关问题是更为快速、有效的途径;这种集成技术方法对区域环境问题具极好的应用前景[5];目前虽有少数学者在一定范围内有过初步试探性的应用[6-7],但从现有技术集成水平看,国内外现有 GIS技术与多元统计分析技术的集成“程度”还处于一种“脱节”状态;此外,目前我国现有各级环境数据利用率极低,极大地浪费了现有环境数据资源.本文工作正是针对上述需要而展开的.
2 区域环境管理集成技术信息系统
在北京超图地理信息技术有限公司研制的全中文桌面式地理信息系统 SuperMap GIS 5.0平台上,采用 SQL Server 2000为数据库,Visual Basic 6.0编程工具,通过二次开发创建了区域环境管理集成技术信息系统.本系统以北京市(1∶50000)数字化底图为基础,将 GIS平台与统计分析方法进行了有效地集成,以 GIS空间数据库和专业方法模型库为系统设计和开发的重点.
该系统污染源数据管理与统计分析模块是区别于其他空间信息系统的重要标志[8].污染源信息管理模块主要解决了与《全国环境统计报表》等数据库的联接,也可按多种格式输入、检索、编辑、修改相关空间数据库中各类属性信息.数据分析模块包括主成份分析、聚类分析、回归分析、趋势面分析等统计分析方法.该系统最大特点是使对空间管理功能强大的 GIS技术与对多变量、多样本数据处理功能强大的多元统计分析方法得以高效的技术集成,为实施区域污染源 “时、空”快速分析、数字挖掘及区域环境管理打造了高效工具.系统主界面与数据分析模块如图 1所示.
图1 系统主界面Fig.1 The Systemic Main
3 区域环境管理数字化集成技术的应用实例
以北京市(1∶50 000)数字化地图为工作底图,选取有代表意义的典型区域为研究靶区,以《全国环境统计信息系统》中每年上报的海量环境数据为依据,进行了如下几种集成技术方法的应用与探索.
3.1 主成份分析集成技术在区域污染主控因素提取中的应用
从全国环境统计信息系统中北京市某区域内登记注册所有企事业单位的环境污染(废水、废气、废渣)数据中,选取分析区域中 104个重点工业企业作为样本;由 81个各类环境污染参量(变量)构成该区域内污染物排放表,建立该区域的污染排放信息数据库.选取该研究区域沿岸工业带作为分析区域,选定对生产生活、经济、区域环境具重要影响的 SO2、COD、石油类、工业废气、烟尘排放、工业固体 6个污染因子为分析变量.调用主成份分析模块实施分析,首先选取区域污染源和变量确定所需污染源数据,进一步通过数据进行标准化,然后选取计算变量相关系数矩阵、特征值和特征向量,最后再按大小顺序排列特征值;本文根据累计方差贡献率≥0.85的原则,选取特征向量以及对应的贡献率;最后求得初始因子载荷矩阵.参见表 1.
表 1 初始因子载荷矩阵表Table 1 The initialization factor m atrix Table
根据原始数据信息基本无损(累计方差贡献率≥0.85)原则,提取 2个相互独立主因子(F1、F2).F1可解译为大气污染控制因子;F2可解译为废水污染控制因子.由此可知,该研究区域的环境污染主要集中于废气污染、水污染两大方面.结合区域内企业地理分布、环境质量状况、污染源属性,经综合分析可知,大部分企业在 F1上权重比较大,少部分企业在F2上权重较大;说明该区域有相对严重的大气(及部分固体污染物)污染,而废水污染因素居于第二位.据该区域中 2个污染主控因子及相应企业的区域位置分布情况,还可进一步分析区域污染的平面分布、发展趋势及应采取的污染控制措施.
3.2 聚类分析集成技术在区域污染源分类与分析中的应用
据研究目标、现有资料、数据资源,选取研究区内 18个重点工业企业为样本;选取大气污染宏观控制指标中工业废气排放量、SO2排放量、烟尘排放量,水污染控制指标中工业废水排放量、COD排放量,工业固体废弃物宏观控制指标中工业固体废物产生量等 6个指标为评价因子;调用聚类分析模块,采用标准差标准化为预处理方法,以相关系数为分类统计量,实施聚类过程.聚类结果以谱系图形式输出,参见图 2.
图2 区域污染源聚类分析结果谱系图Fig.2 The pedigree diagram of regional contaminated sources clustering analysis resu lt
由图 2可知,在 Q型聚类分析相似性系数为 0.15附近,18个样本可分为 5类.按统计指标反映的特征,可分为数量指标(由总量指标组成)和质量指标(由平均指标和相对指标组成);本文采用平均指标经对 5类企业各项评价指标的统计描述、比较与分析后得知:在分析样本中污染物排放量居中低水平的企业大于 50%,在第Ⅱ类、第Ⅲ类、第Ⅴ类中,均出现特征明显的污染物排放因子;可见该区域污染物排放量集中于少数重点企业,它们对区域污染物排放量整体水平影响较大,应予以特别关注.利用 GIS的空间显示功能可将研究区域内已注册的企业很方便地显示在 GIS平台的地图上;还可根据上述聚类结果分析企业在地图上分布情况,结合污染源性质、数量、区域环境目标等,进一步对区域环境污染状况及环境质量改善对策进行深入分析.
3.3 回归分析集成技术在区域污染规律归纳及预测中的应用
利用回归分析集成技术可对区域污染现象的规律进行总结并运用规律对环境质量等相关方面进行预测.在某研究区域大气污染影响因子确定后,要解决的就是掌握有关大气污染因子之间的依存关系及依存程度.本文选取与大气环境污染相关的主要影响因素,如 SO2、NOx、工业燃料燃烧、烟尘排放等变量,共13项;调用回归分析模块,在 GIS呈现的地图空间内选取相关研究区域,添加污染源图层.企业样本分布如图 3所示.
图3 企业样本分布图Fig.3 The enterp rise swatch distributingmap
在图层中选取待分析的企业,经选择变量和样本后,即可进行相关系数输出、回归分析、回归预测等.根据回归分析中变量间相关系数分析可知:SO2、烟尘、NOx是影响该研究区域大气环境质量的主要因子,工业煤炭消费量和燃料燃烧中废气排放量与 SO2、烟尘、NOx因子的相关程度均较高,而与其他影响因子相关程度相对较低.因此,分别以烟尘排放量、SO2排放量、NOx排放量为因变量,工业煤炭消费量和燃料燃烧中的废气排放量为自变量,进一步对这些因子进行回归分析以探索大气污染规律.经回归计算、对因变量影响不明显自变量的剔除、计算回归系数并进行显著性检验等过程,确定该研究区域中主要大气污染因子回归分析方程(模型)如下:
从回归模型分析可知:该区域烟尘排放量主要来自工业煤炭消费量;SO2、NOx排放量则主要受工业煤炭消费量和燃料燃烧过程中废气排放量的影响显著.其中,工业煤炭消费量与 NOx的回归系数最大(4.396),与烟尘排放次之(1.127),而与 SO2的回归系数较小(0.564);由此可知,该区域工业煤炭的脱硫效果较好,但含氮量较高,NOx排放量主要取决于工业煤炭消费量.此外,含硫、含氮化合物随燃烧废气一起排放到空气中,废气排放量与 SO2、NOx排放量的回归系数相差不大,分别为 0.80和 0.846.
对于上述某种大气污染回归方程的进一步应用还表现在以下 2个方面:其一是根据现有污染主要控制因素的计划用量来预测今后某一时空内大气环境质量水平;其二是可进一步根据该研究区域的大气环境总量控制目标,通过预测和调整主体燃料及其用量,为确保区域环境质量达标提供计划方面的科学依据.
3.4 趋势面分析集成技术在区域污染面型分析中的应用
基于 GIS集成的趋势面分析方法,主要是用来揭示研究区域内污染源时空分布规律与变化趋势;这可为城市具体区域的环境质量改善提供科学依据,给出不同区域、不同环境污染类型及不同区域环境问题的合理环境管理对策和实用可行的治理技术建议.
在选定研究区域内,将数据库中污染源数据添加到污染源图层后,调用趋势面分析模块,选择分析变量后实施行趋势面计算.通常可从计算 1次趋势面开始,直到 F检验为显著或特别显著,得到的趋势面方程才能应用.理论上趋势面拟合度越高越好,但实践表明,变化较为缓和的资料配合较低次数的趋势面可以较好地反映区域背景;而变化复杂、起伏较多的资料,配合的多项式阶次可以适当高一些.本文工作在该选定区域内共选取 66个工业企业为分析样本,以该区域大气首要污染物烟尘排放量作为分析变量,分别求得 1~8阶趋势函数;经分析认为,5阶趋势函数拟合最好,其拟合度可达到 0.72.为此,选择 5次趋势面作进一步分析.将上述趋势面分析计算结果保存到污染源图层属性数据表中,根据趋势面计算结果绘制趋势图(可直观反映所选变量在空间上总体变化趋势)和剩余图(反映局部变化).
根据所拟合的函数,以工作区域为背景,取边界点到边界 500m的矩形区域进行插值计算.本文选用距离反比权值插值(Inverse Distance Weight,IDW),在得出栅格图基础上提取趋势等值线,即绘制最优趋势函数的等值线图,参见图 4.
图4 研究区域内烟尘排放量趋势分布图Fig.4 The trend surface analysismap of sootemission quantity in the researching region
从图 4分析可知,该区域烟尘排放量由西向东及由北向南逐渐降低,以西北部某河沿岸地带最为严重,从而形象地表示出该区域烟尘排放量的整体趋势.结合该区域具体工业企业分布、企业状况、燃料状况、环境质量等情况的分析可知:该研究区域东部为经济中心区,工业企业相对较少,粉尘排放量少,因而烟尘污染较轻.对该区域大气环境质量的改善,主要应加强对区域西部沿河地带工业区的烟尘治理力度、严格控制工业企业排放量、改善区域能源结构等措施.
4 区域环境管理数字化集成技术系统应用中应注意的问题
区域环境问题与社会、经济共同构建了一个复杂的巨系统.解决区域环境问题是一项系统工程.利用本文所提倡的数字化集成技术在解决具体区域环境问题时应注意如下问题:首先,注意对引用数据中“特殊点”的分析,必要时可剔除或单独处理,以免影响全局分析.其次,在利用具体方法时应根据其相关数学原理,注意具体应用条件,例如 1)主成份分析中对因子轴的合理专业解译,2)聚类分析中分类统计量的选择,3)回归统计时、空域的有效性问题,4)趋势面分析中“边界效应”对分析区域的影响等.只有充分注意上述有关问题,才能更好应用本文提倡的集成分析技术,快速有效地提取区域环境的主控因素、对环境问题及内容合理分类、总结有关规律、给出环境发展趋势.
5 结束语
本文构建的技术集成系统仍在开发与完善之中.区域环境与社会、经济密不可分.每种方法在解决区域环境问题时,只有与区域中社会、经济资料密切结合综合分析,才能有效发挥其应有作用.本文实例方法及所构建的集成技术工具及其工作思路对更有效地利用全国现有环境数据资源和相应区域性中若干问题的解决提供了可借见的模式和工作途径.
[1]周生贤.我国环境形势严峻必须严格执行“环评”[J].科学决策,2006,8:5-6.ZHOU Sheng-xian.The environmental position is austere and must stern ly to carry out the environmental impact estimate system in China[J].Science Decision-making,2006,8:5-6.(in Chinese)
[2]曲格平.工业污染的控制——国际上面临的重大环境问题之六[J].环境保护,1981(6):2-5.QU Ge-ping.Industry pollution controlling—world face to the fateful environmental problem(6)[J].Environmental Protection,1981(6):2-5.(in Chinese)
[3]靳君.辽宁能源水资源与环境问题探讨[J].气象与环境学报,2006,22(5):50-52.JIN Jun.Energy resources,water resources and environmental problems in Liaoning[J].Journal of Meteorology and Environment,2006,22(5):50-52.(in Chinese)
[4]马民涛,韩松,张雁雁.改善区域环境质量急需基础性研究与创新[J].云南农业大学学报:自然科学版,2007,22(6A):130-132.MA Min-tao,HAN Song,ZHANG Yan-yan.To improve district environmental quality needing the basal researching and innovation[J].Journal of Yunnan Agricultural University,2007,22(6A):130-132.(in Chinese)
[5]马民涛,王江萍,张菁,等.区域环境质量与环境管理集成技术现状分析[J].环境与可持续发展,2009,34(2):36-37.MA Min-tao,WANG Jiang-ping,ZHANG Jing,et al.The actuality analysis on the district environmental quality and environmental management integrative technology[J].Environmen and Sustainable Development,2009,34(2):36-37.(in Chinese)
[6]BUROUGH P A.GIS and geostatistics:essential partners for spatial analysis[J].Environmental and Ecological Statistics,2001,8:362-377.
[7]GRUBER U,BARTELT P.Snow avalanche hazard modeling of large areas using shallow water numerical methods and GIS[J].Environmental Modelling&Software,2007,22:1472-1481.
[8]刘伯红.组件式 GIS应用研究[J].计算机与数字工程,2006,34(11):12-15.LIU Bo-hong.Research and practice of ComGIS[J].Computer&Digital Engineering,2006,34(11):12-15.(in Chinese)
(责任编辑 张 蕾)
The Integrated Technology of Spatial Statistical Analysis and Its Application in the Regional Environment
MAMin-tao,SUN Lei,HAN Song,ZHANG Yan-yan,WANG Jiang-ping,ZHANG Jing
(College of Environmental and Energy Sources Engineering,Beijing University of Technology,Beijing 100124,China)
This paper analyzed the regional environmental problems and its present solutions,technology and limitation in china.And it presented a brief introduction to the composition,structure,function and special features of the regional environ mental management digital integrated technology.With the Beijing city digital map(1∶50 000)as the basic working map,typical regions were chosen as the researching regions,by using the jillion data in the country environmental statistical data system.This paper selectd,classified,concluded and analyzed the correlative regional environmental problems in the chosen researching regions by the integrated technology of GIS and the principal component analysis,partitioning analysis,regression analysis and trend surface analysis.This paper designed a digital management tool and suggested a solution to the regional environmental problems.
regional environment;geographical information system;statistical analysis;contaminated sources;environmental management
X 821
A
0254-0037(2010)04-0511-06
2008-11-28.
国家自然科学基金面上资助项目(70673003).
马民涛(1955—),男,吉林省吉林市人,教授.