淮河流域水利普查数据成果提取的方法研究
2012-09-10倪大银李凤生赖晓珍
倪大银 李凤生 赖晓珍
淮河流域水利普查数据成果提取的方法研究
倪大银1李凤生2赖晓珍3
一、前言
流域机构是水利普查的重要工作层面,在水利普查工作中承担着大量工作,责任重大。形成流域水利普查数据成果是流域机构的主要工作之一,也是开展流域数据审核汇总工作的基础。作为流域水行政主管部门,获取和掌握这些极具价值的基础水信息,将能够更好地提升流域日常管理能力和水平。
全国水利普查实施方案的设计上有流域汇总这个阶段,但未考虑流域成果汇总的方法,清查对象和部分普查对象缺少流域标记信息,给流域成果提取工作带来困难。本文对流域水利普查数据的提取方法进行了探讨和分析,并基于流域行政区划成果,实现了流域水利普查成果数据的提取。该方法具有一定的通用性,可应用于其他流域级水利普查数据成果的提取。
二、提取方法分析
流域各省上报国家和流域的数据成果分为两类:一是普查业务数据,包括清查数据和普查数据,专用软件的文件格式;二是空间数据成果,专用软件加密后的电子地图图层集。
空间数据提取方法相对简单,将解密后的空间数据图层集,与流域基础图层,如水资源分区底图,通过GIS(地理信息系统)软件进行空间叠加运算分析,即可提取出流域的空间数据成果。
通常情况下,空间数据与水利普查数据一一对应,可将空间数据流域提取成果映射到普查表的数据提取。但由于存在标绘错误、流域边界误差、图表数据不一致等问题,空间数据与表格成果不能很好对应,无法直接应用于水利普查数据成果的提取。
清查表和普查表都包含不同级别的行政区划信息,普查对象所在行政区划按不同专业分类,精确程度有所不同,分别精确到县、乡镇和行政村级别。因此根据流域行政区划成果,通过行政区划代码来建立流域范围和清查、普查对象的关联关系,是水利普查数据提取的有效技术路线之一。
对于部分有“所在水资源三级区”和“所在河流”等指标的对象,则可以精确进行流域识别和提取,保证了流域成果的准确性。
通过清查、普查对象的分析,结合数据字典内容,设定了水利普查数据的提取规则,尽可能利用对象的流域标识信息,提高数据提取的准确性;对于缺少流域标识的对象,则完全依赖行政区划进行提取。普查对象的提取过滤条件及精确性分析见表1。
三、相关技术准备
1.流域行政区划成果编制
流域行政区划成果是流域水利普查数据提取的基础。为能及时编制完成流域行政区划成果,早在2011年7月,淮委普查办组织有关单位利用国普办下发的行政区划列表与淮委已有的1∶5万地形图(2006年成果)进行对照,提取流域行政区划范围的初步成果,形成了流域行政区划范围初稿并发送五省予以复核;根据各省反馈意见,进行了相应调整,形成了流域行政区划范围技术成果(修订稿);经专家审查,进一步复核和完善后,2011年11月形成了《第一次全国水利普查淮河流域行政区划范围技术成果报告》。
2012年,在各省提交水利普查成果数据后,根据P701灌区面积表和P801规模以上机电井普查表,再次补充和完善了淮河流域行政区划成果,进一步提高了成果的精确性。
2.省级普查成果导入
数据提取依赖于水利普查成果基础数据库。将各省提交的数据成果,通过水利普查数据管理专用软件导入到数据库中,实现数据的还原。基于普查成果基础数据库,使用水利普查专用软件和数据库自身管理软件可实现业务数据的提取。
3.普查空间数据解密
普查空间数据因其特殊性,各省提交的数据是经专业软件加密后的成果,需要进行相应的解密后方能使用。
四、技术实现
1.清查成果提取
水利普查清查成果缺少流域性标识,实现难度相对较大,而且缺少相应专用软件的支持。考虑到简单便捷性,清查成果提取仅在数据库层面,通过SQL(数据库结构化查询语言)创建查询视图来实现。
提取过滤条件参照表1的提取条件,大部分对象依赖于流域行政区划进行流域识别,少数对象可通过所在河流湖泊编码进行精确提取。对于“所在河流(湖泊)编码”有漏填的清查对象,为提高精度,结合行政区划进一步筛选。
表1 淮河流域水利普查数据提取过滤条件表
视图字段与数据管理系统中清查数据导出内容相一致,以便于各专业人员进行数据比对和审核。数据导出可借助第三方软件工具,如PL/SQLDeveloper或ToadforOracle等软件,一般导为EXCEL格式。实际使用中,后者功能更强大,可实现大数据量的EXCEL文件格式导出。
2.普查成果提取
水利普查数据指标信息丰富,大部分对象都含有“所在水资源三级区名称及编码”字段。调用水利普查数据管理系统专用软件的普查查询功能,在水资源三级区名称及编码中输入“E”,即实现了流域的数据提取。通过软件的数据导出功能,输出成EXCEL文件格式。同时,查找出水资源三级区编码为空值的对象,结合行政区划进一步判别。这种提取方式,能够遍历所有记录,保证流域对象提取的完整性。
对于无法通过“水资源三级区编码”的提取对象,通过关联行政区划编码进行识别,技术实现方法与清查成果提取相似。
3.空间数据提取
经解密后的空间数据为shapefile文件格式,通过ArcMap中ArcToolbox的空间分析工具,将各省空间成果数据与流域边界数据进行相交叠加分析,即可实现各省空间数据流域提取。提取工作可以单独对某个图层进行操作,也可对多个图层进行批量处理。各省提取的成果经协调合并后,形成流域空间数据成果。
五、结语
对水利普查成果数据进行分析,提出切实可行的数据提取方法并加以实现。经初步比对分析,提取的流域成果与历史资料基本一致。
部分对象只能根据行政区划代码进行判别,行政区划的精度和准确性直接影响数据提取的准确性。现有流域基础行政区划精细到乡镇级,与流域自然区划范围存在细微差异,也就决定了这些对象只能提取近似精确的成果;少数普查对象如灌区,只能划归到县,与实际情况有差别,后期还可结合空间数据作进一步识别。
以上流域清查、普查和空间数据成果可用来互相校验,并已应用于水利普查数据汇总审核工作中。通过提取形成的流域水利普查成果,可进一步与常规统计资料对比,开展相关的数据分析。获取的基础信息和对比分析情况,将为流域日常业务和管理提供很好的数据支撑,进一步提升流域管理和服务能力
1.淮委水利普查领导小组办公室 233001 2.淮委水文局(信息中心) 233001 3.淮河流域水资源保护局 233001)