APP下载

基于规则驱动的地理国情数据质量检查方法*

2016-10-27王剑辉伍素贞

地矿测绘 2016年3期
关键词:质量检查国情普查

王剑辉,符 彦,伍素贞

(广东省地质测绘院,广东 广州 510800)



基于规则驱动的地理国情数据质量检查方法*

王剑辉,符彦,伍素贞

(广东省地质测绘院,广东 广州510800)

文章从地理国情普查空间数据质量检查出发,分析了常规质检方法的局限性,提出一种基于ArcGIS Data Reviewer构建质检规则对空间数据质量控制与检查的方法。通过研究基于Data Reviewer构建检查规则进行自动化、批量化的数据检查,并与交互式、可视化的数据检查相结合,实现地理国情普查数据的检查、修改、审核,这种数据检查方法和质量控制机制大大提高了质检的灵活性和效率,保证了数据成果的质量。

空间数据质量;Data Reviewer;地理国情;检查规则

0 引言

地理国情普查是一项重大的国情国力调查,是全面获取地理国情信息的重要手段,国家制定了地表覆盖、国情要素、元数据、解译样本、数据库和统计分析等一系列规范,省、市和县可根据地方需求扩展地理省情、市情及县情等,对地理国情普查的采集内容进行扩充,对采集指标进行细化。因此,质量检查也需有相应的自定义规则去适应地方需求。

地理国情普查时间紧、任务重,以顺德区为例,高清影像的采用、指标的细化以及城市地区的划定等都造成地表覆盖图斑、国情专题要素等数量剧增,质量因素增多,因素之间互相影响,增加了生产和质检难度,靠人工检查耗时耗力,且很多问题较难通过人工检查解决,虽然国普办提供了检查软件,但此软件是针对国家数据标准编写的,检查方案不可更改,不能完全满足顺德区质检要求,数据的规范性、完整性、正确性[1]完全依靠生产人员和质检人员检查,提高效率势在必行。因此,在对地理国情普查空间数据成果进行质量检查时,检查程序自动化只是基本要求,建立一个以国家和地方的技术规则为依据,全面规范化、无需编程且可重复利用的质量检查方法显得极其重要。为此,本文利用Data Reviewer构建检查规则,进行自动化、批量化的数据检查,并通过交互式、可视化的方式,将两者相结合进行成果质量控制,提高了质检的灵活性和高效性。

1 常规质检方法及其局限性

目前通常采用购买的QC-Spatial、Geoway地理国情普查质检软件自动检查、人工检查和人机交互检查相结合的方法进行检查,该方法存在以下几个问题:

1)这些商业软件的检查内容都是根据国家数据库标准编写的,不能完全满足地方要求。

2)其检查方案往往难以更改,软件错误或者增加功能都需要通过邮件、QQ群、电话等渠道多次沟通后进行补充开发、下发补丁,更改不及时,周期过长。

3)由于商业软件购买成本高,服务完地理国情项目后往往不能继续在其它项目中发挥质检作用,软件生命周期短,导致作业单位较少购置,生产时需要轮换借用。

4)数据的规范性、完整性、正确性主要依靠生产人员和质检人员的经验,通过加班或基于ArcEngine二次开发质检软件进行解决,劳动强度大,效率不高。

2 基于Data Reviewer的规则驱动质量检查方法

2.1Data Reviewer介绍

ArcGIS Data Reviewer是ArcGIS平台的一个扩展模块,在ESRI原有PLTS解决方案的基础上发展而来,Data Reviewer是进行数据质量控制很好的工具,在国外有不少成功案例,但是在国内却鲜有人知,它能够自动化和简化数据质量控制的过程。Data Reviewer能够帮助用户集中管理质量控制流程(查找、修改、验证错误),从而减少与传统的质量控制流程相关的文件记录。Data Reviewer提供了丰富的自动化检查项目,能够较快提高数据的一致性,比如空间信息、属性信息、拓扑、连续性、数据库验证、Z值[2]。不同行业的用户都可以轻松地配置Data Reviewer检查规则,无需编程开发即可重复用于行业数据的检查。

2.2基于Data Reviewer的地理国情数据质量检查

根据规范与设计要求,确定要素之间可能存在的规则,技术负责与检查员共同设计检查规则库,在实际应用中不断添加和完善。在Data Reviewer中可实现数据的自动化、可视化、批量化的检查,生成错误记录、标识和质量分析报告,作业人员根据错误记录利用ArcGIS编辑工具进行修改,检查人员根据检查和修改记录进行核查,核查之后满足规则要求的数据才可入库,确保地理国情普查数据的质量。基于Data Reviewer的地理国情数据检查技术路线,如图1所示。

图1 基于Data Reviewer的地理国情数据检查技术路线Fig.1 Technical route of geographical conditions data based on Data Reviewer

2.2.1自动化、批量化的数据检查

2.2.1.1配置检查器会话

Data Reviewer提供了检查器会话管理器,它是一种较好的组织和管理数据质量检查表的方法,每一个检查器会话可以由不同的人检查、校正、验证数据,并且每一次数据都会被记录在数据质量检查器表中。通过检查器会话管理器创建检查器工作空间,它在地理数据库中创建检查器方案,其中包括检查器表和检查器要素数据集,如图2所示。

图2 检查器表和检查器要素数据集Fig.2 Table and feature datasets of checker

2.2.1.2检查规则设计

利用Data Reviewer提供的11组42种校验规则(见图3),对整个要素类或数据库、当前范围内的要素或仅所选要素集执行几何和属性验证,确保数据完整性、正确性[3]。

图3 Data Reviewer数据校验规则Fig.3 Data validation rules of Data Reviewer

地理国情普查数据是空间数据,其检查主要包括地表覆盖和国情要素检查、地理国情元数据检查、遥感解译样本检查等[4]。其中,检查内容主要包括:空间参考、采集与分类精度、库体结构、拓扑关系、属性值、空间关系、一致性[5]。本文利用Data Reviewer数据校验规则设计了地表覆盖和国情要素检查的规则(见图4),并将这些检查规则以检查器批处理作业文件(*.rbj)的形式保存。

图4 地表覆盖和国情要素检查规则Fig.4 Checking rules of surface cover and national conditions elements

2.2.1.3 数据检查

Data Reviewer提供了针对数据集、数据库进行的批处理作业,它是一种封装和分布质量控制的方法。质检人员将设计好的rbj检查规则文件导入到批处理作业中。在检查同一区域不同作业区的数据时,可通过批处理作业在不同位置使用相同的质检规则,确保数据质量检查的标准统一,如图5所示。

图5 导入规则执行批量检查Fig.5 Importing rules to perform batch check

2.2.2交互式的数据检查

2.2.2.1创建检查网格

Data Reviewer提供了多种方式创建网格(见图6),它用于将指定范围分解为单元格,以便系统地检查一个大型数据集[6]。在面格网中,各格网单元都是可以属性化和选择的面要素。这些格网可以在检查器会话期间使用,以便管理可视化和自动质量控制。使用检查器,可以将面格网与检查器表相关联并将格网信息与各个记录相关联。如果单元格中所包含的要素已记录为检查器表中的记录,那么单元格中的 QC_GRID 字段将填入面网格信息。

图6 创建网格Fig.6 Creaing a grid

2.2.2.2人工辅助标记缺失要素

将数据与影像或其他数据源进行比较时,发现地图中缺失要素,可以通过 Data Reviewer直接在地图中数字化缺失的要素,也可以根据其所属的要素类和子类型查找缺失要素的位置。在地图中数字化要素会创建一个图形,该图形代表缺失的要素,并保存在检查器数据集中的点、线、面图层中。

使用检查器表记事本窗口中的工具可根据需要绘制缺失的点、线或区域要素,然后自动将其提交至检查器表(见图7)。

使用“标记缺失要素”工具查找到缺失要素的位置之后,可以通过单击“检查器表”窗口上的“显示记录位图”按钮查看缺失要素所属位置的快照。

图7 捕获缺失要素Fig.7 Flaging a missing feature

2.2.3数据修正与审核

在质检人员通过自动化、批量化和可视化的数据检查之后,提交质检库给作业人员,作业人员根据检查器表(见图8)对检查项逐一进行修改,并记录修改状态(见图9)。

图8 检查器表和数据浏览Fig.8 Checking table and browsing data

图9 数据修改Fig.9 Data modify

在作业人员对数据进行修改后,将数据库提交给质检人员,质检人员进行审核确认(见图10)。

3 结束语

基于规则驱动的地理国情普查数据质量检

图10 数据审核Fig.10 Data verify

查方法优于普通的数据质量检查方法及ArcGIS软件常规拓扑检查方法,该方法采用搭建式开发实现了业务与代码相分离,解决系统重用困难的同时全面完成了数据质量规范性检查,整个规则设计与搭建过程极其简便,无须编程,检查人员和作业人员都可以进行日常维护,极大地提升了检查效率,满足检查规则变

动频繁的要求,更适用于未来规模化、海量化数据工程的质量控制。

[1]李诺夫.GIS数据质量控制方法探讨[J].测绘通报,2011(8):66-68.

[2]王宝山,张力仁,张俊.浅谈地理国情普查项目成果的质量控制关键点[J].测绘与空间地理信息,2013,36(9):224-226.

[3]杨海关,丘云峰,杨忠祥,李俊娟.地理国情普查中的拓扑规则[J].地理空间信息,2016,14(1):44-45.

[4]罗鹏.地理国情普查成果质量控制及检查方法探讨[J].测绘与空间地理信息,2014,37(6):192-194.

[5]高天虹,张金刚,刘敏.地理国情普查成果内业的质量控制[J].测绘与空间地理信息,2014,37(6):210-212.

[6]穆志杰,卢志华,郭新玲.运用统计方法对地理国情普查质量控制技术的分析[J].测绘技术装备,2014,16(2):9-13.

Quality Check Method of Geographical Conditions Data Based on Rule Driven

WANG Jian-hui,FU Yan,WU Su-zhen

(Guangdong Institute of Surveying and Mapping of Geology,Guangzhou Guangdong 510800,China)

Considering the spatial data quality control of Geographical Conditions Census,this study analyses the disadvantages of regular quality control methods.The purpose is to propose a quality control method for spatial data using checking rules of ArcGIS Data Reviewer.Based on the checking rules,this study has established an automatic,batching data processing,in combination with the interactive,and visual data checking,which carry out the inspection,modification and verification of Geographical Conditions Census data.This data checking methods and mechanism of quality control greatly improve the flexibility and efficiency of quality checking,and ensure the quality of the results.

quality of spatial data;Data Reviewer;geographical conditions;check rule

2016-05-24

P 208

B

1007-9394(2016)03-0026-03

王剑辉(1984~),男,广东梅州人,学士,工程师,现主要从事不动产测绘、工程测量、地理信息系统、摄影测量等方面的应用研究工作。

猜你喜欢

质量检查国情普查
立即全面普查 警惕二代粘虫发生
胡春华强调:确保脱贫攻坚普查取得圆满成功
悠悠游子心 深深家国情——一个普通海外留学生的成长
审计署赴江西省审计厅质量检查座谈会
家国情 诗词魂
推广生物乙醇汽油:迫切且合乎国情
中注协举办2016年证券资格会计师事务所执业质量检查人员培训班
加强会计信息质量检查促进会计基础工作规范
关于农业文化遗产普查与保护的思考
地理国情监测知识支持库初步设计