APP下载

地理国情普查矢量数据成果接边检查算法研究

2018-03-27张富玲高利鹏吕志勇

地理空间信息 2018年3期
关键词:边线国情普查

张富玲,高利鹏,吕志勇

(1.青海省第二测绘院,青海 西宁 810001;2.武汉大学 遥感信息工程学院,湖北 武汉 430079;3.西安理工大学 计算机与科技学院,陕西 西安 710048)

为适应经济社会发展、国防建设和科学管理需要,更好地反映我国各类地理环境要素的分布与关系,2012 年10月地理国情监测项目得到国家正式立项。由于地理国情监测需要本底数据, 国发 6[2013]9 号《国务院关于开展第一次全国地理国情普查的通知》于2013年2月28日正式印发。地理国情普查数据的质量控制是地理国情普查中的一个重要研究问题[1-2]。地理国情普查数据分为10个一级类,59个二级类,141个三级类。数据包括地表覆盖分类数据和地理国情要素数据两类,其中地表覆盖分类数据存储在LCA层中,地理国情要素数据根据其要素类型存储在其他36层中,数据集共37 层。地理国情普查数据包含的地物类型、数据图层较多,在作业生产过程中作业单元的划分多以县域为单位,后期县域间和省域间的数据接边是不规则区域的接边,工作量巨大。接边工作通常需人工逐要素、逐层去完成,导致质检时难以确定地理国情普查数据与结果的质量,严重影响了地理国情普查数据的应用质量[3-4]。

DLG数据接边在数据入库和更新中有非常重要的作用[5-6]。传统地理信息数据中需要接边的数据包括两 种情况:多幅标准图幅数据入库后,需在图幅边框处接边;更新数据库中某个范围内的数据,需在更新范围线处接边[7]。接边图形包括线和面两种,对于点图形不存在接边。霍春玲[8]等运用AutoCAD的二次开发技术,针对DLG数据,编程实现了自动接边检查,提高了接边检查的效率。针对海量数据的存储和组织需分幅裁切的特点,鲍立尚[9]提出了一种基于索引图的DLG批量接边检查算法。该算法首先利用标准图幅号计算图幅角点坐标;再利用角点坐标生成索引图,索引图记录了各图幅直接的邻接关系以及邻接图幅之间的接边线;最后分别对相邻图幅中的线状和面状要素进行批量接边检查,提高了数据入库检查的效率。蒋勇[10]等提出了一 种基于ArcGIS Engine的IPointCollection接边检查算法,进一步提高了检查结果的定位准确性。

综上所述,传统接边检查算法多适用于标准分幅数据,以行政区等不规则边界区域为单位的数据接边仍存在诸多问题。本文面向地理国情普查等不规则区域矢量接边的应用需求,设计了基于点搜索的矢量接边算法,能更好地服务于地理国情普查数据接边检查工作。

1 不规则区域矢量接边检查算法

1.1 接边条件和限差

图形接边与数据编辑方式、分幅等因素有关,接边的两个图形在实际地理环境中属于同一图形,因此两个图形可以正确接边,通常需同时满足几何条件和属性条件[11]。几何条件是指接边的两个图形空间位置是邻接关系,且在一个微小距离范围内,理论上接边的两个图形的拓扑关系包括部分重合、有公共边和分离等。属性条件是指接边的两个图形的属性信息完全一致。

图形接边检查的一般步骤为:①搜索得到接边参考线(图幅边框或更新范围线)两侧有邻接关系的所有图形对象;②按照几何条件和属性条件对图形对象进行配对;③检查配对后的图形对象是否接边。

在进行要素接边检查时需考虑图形到边限差和图形接边限差。图形到边限差是根据图廓边线生成接边缓冲区的阈值,是判断图内要素是否位于接边缓冲区内、是否需要进行接边检查判断的重要参数。图形接边限差是指位于接边缓冲区内的相邻图幅,同层、同类要素之间是否满足接边要求的阈值。属性接边则是在图形能够满足接边条件的基础上进行属性比较。

1.2 接边检查算法

本文提出的接边检查算法流程如图1所示,具体步骤为:

1)检查参数设置,主要设置接边限差、接边要素到接边线的距离t以及矢量数据成果的存储路径等。其中,r为国情普查项目技术规定给出的生产单元(包括图幅)间的接边限差;t主要是为了确保接边线附近一定范围内的要素必须成为接边要素。要素距离接边线的最近距离若大于t,则认为该要素不是接边要素,不纳入接边检查的对象范围。

2)判断待接边生产单元的空间参考是否一致。若空间参考不一致则无法进行接边检查,此时需先将两 个数据库的空间参考设置为一致。在这一检查中,程序算法对空间参考系的各参数进行逐个对比,避免了命名不一致但属于同一参考系而被报错的情况。

3)自动获取接边线。算法默认将两个生产单元最大行政区边界的公共边线作为接边线(若为标准图幅数据,则根据图幅号计算图幅角点坐标构造接边线),同时也支持对用户自定义的接边线进行检查。

4)以获取的接边线为中心线,以t为缓冲区半径创建缓冲区,选择与该缓冲区相交的所有线要素和面要素,并进一步提取这些要素落入缓冲区中的节点和端点,存储到以相应生产单元名命名的临时Shapefile文件中。

临时文件的字段设计包括:①继承原要素字段,根据数据字典中记录的所有图层的字段信息,在临时Shapefile文件中创建所有线图层和面图层包含的所有字段,并规定默认值;②所属图层名字段,该字段用以标识每个点属于哪个图层,因为只有图层名相同的点才能进行接边检查;③所属生产单元名字段,该字段用以标识每个点属于哪个生产单元,因为只有生产单元名字不同的点才能进行接边检查;④要素ID字段,该字段用以记录每个点属于哪个要素,便于记录要素的错误信息和定位错误要素的位置;⑤点类型字段,该字段用以记录每个点属于线要素的起始点还是终止点,对具有方向性的线要素(如河流流线)是否接边进行检查。

5)依次取出临时文件中的点作为检查点,以接边限差为缓冲区半径创建缓冲区,并从另一个临时文件中找到落入该缓冲区的点作为待匹配点。

若找到的匹配点个数大于0,则依次遍历所有匹配点,并对比匹配点与检查点所有字段是否一致,寻找属性匹配点时可采取先从是否同一图层,再字段匹配的方式,节省时间。若存在属性不一致的情况,则记录不一致的属性字段名称,并存储错误信息为属性不接边。

若找到的匹配点个数等于0,则说明该检查点在接边限差之内没有找到接边点,再搜索距该检查点最近的点,若找到最近点,则记录这两个点的位置,并存储错误信息为几何不接边;若找不到最近点,则记录该检查点的位置,并存储错误信息为找不到接边要素。

对于具有方向的线状要素,需判断接边处两侧要素的行进方向是否一致,不一致要报错;对于面状要素,需判断两个面是否是对角面,判断对角面属性不一致的误报问题。

6)记录错误信息到数据库。汇总所有接边检查结果,并对结果进行归并和整理,将标记为位置不接边和属性不接边且要素ID相同的错误记录合并为几何和属性均不接边错误。

2 实验验证

2.1 实验数据

地表覆盖分类数据和重要地理国情要素数据必须经过接边处理。接边时应叠加正射影像,对于相邻需接边线划之间的距离小于正射影像接边限差的,可调整一边的数据直接接边;对于距离小于2倍正射影像接边限差的,两边相向平移接边;对于距离大于2倍正射影像接边限差的应检查和分析原因,由技术负责人根据实际情况做出决定,并作为重大问题进行记录。依据GDPJ 01-2013《地理国情普查内容与指标》的规定:规则扩充的新类型与其对应的上级预定义类型接边时,无需对新增类型的属性编码作归并处理;接边后应保证图形数据光滑、连续,避免出现硬折、尖角;各项属性值相等的相邻同名要素接边后应合理合并为一个实体,若受计算机软硬件系统功能和性能限制,完全合并后不便于保存和访问的,可只作部分合并,但应尽可能减少同名要素实体个数。

实验数据采用青海省同仁县和甘肃省夏河县的地理国情普查过程数据LCA、BOUA5、BOUA6、BOUL、HYDL、LRDL等14层,接边要素共计835个,接边要素类型主要是面和线,具体如表1所示。

表 1 数据分层与命名汇总

2.2 实验结果

利用本文提出的算法进行测试,青海省同仁县(编码:370523DYQ)和甘肃省夏河县(编码:370502GRO)得到的不接边错误统计结果如表2所示。

表 2 接边检查错误个数统计

在算法测试过程中,安排2组人员对实验数据进行接边,经接边算法检查后精准定位、定性接边问题,极大地提高了生产效率,使原本6人3 d完成的接边工作由2人1 d完成。最终统计结果如表3所示。

在ArcMap窗口中对得到的不接边错误的统计结果进行人工验证。835个要素中,各类接边问题共计510 个,可排查问题记录97条,接边检查算法的错误统计正确率为87%,接边检查验证结果如图2~4所示。

表 3 不同接边方法的效率对比

图2 几何不接边示意图

图3 属性不接边示意图

图4 几何和属性均不接边示意图

3 结 语

针对地理国情普查不规则区域矢量数据接边检查的需求,本文开发了基于点搜索的矢量数据接边检查算法。该算法在全国多个省市的地理国情普查数据成果质量检查中得到了应用。实验结果表明,该算法能够准确、快速、高效地完成对国情要素数据、地表覆盖数据和元数据的接边检查。与传统接边检查算法相比其具有以下优势:

1)算法设计过程中考虑了多种复杂情况,如参考系的预检查、面状要素对角接边情况、河流流向矛盾情况、相邻图形找不到接边要素的情况以及几何接边但属性不一致的情况等。

2)无需手工设置接边线,算法能自动判断接边线的位置。

3)考虑了两个限差:图内限差(接边要素到接边线的距离)和图间限差(接边限差)。

4)算法针对复合要素的情况在检查时分别对单独的部分进行接边检查,避免了由于复合要素各部分不相连而导致的误报,极大地提高了接边工作效率。

5)检查结果存入数据库中,可方便导入、导出,便于查看和修改。

在今后的研究中,将针对矢量接边检查中的误报情况进行进一步处理,降低误报数量,提高检查的效率和准确率;同时,针对当前越来越多的不同类型的地理信息数据,需提出一种更加通用的矢量接边检查算法,以适用于更广泛的数据类型。

[1] 杨靓,陈新湖,李培,等.地理国情普查一体化生产组织模式探讨[J].遥感信息,2014(4):20-25

[2] 孟德舒.地理国情普查成果的三重保障[J].测绘与空间地理信息,2014,37(6):182-183

[3] 罗鹏.地理国情普查成果质量控制及检查方法探讨[J].测绘与空间地理信息,2014,37(6):192-194

[4] 宋晓红,张立朝,禄丰年,等.地理国情普查中多源异构数据整合研究[J].测绘通报,2014(9):104-107

[5] 戴相喜,周卫,高磊.DLG数据任意范围接边算法及实现[J].测绘通报,2008(7):32-35

[6] 赵江洪.GIS中多图幅自动接边的实现方法探讨[J].测绘通报,2006(2):50-52

[7] 曹健,李国忠,徐效波,等.基于ArcGIS Engine的多幅数字地形图接边算法研究[J].测绘与空间地理信息,2010,33(2):76-78

[8] 霍春玲,刘达.AutoCAD数据接边检查自动化的实现[J].测绘工程,2006(4):74-76

[9] 鲍立尚.基于索引图的DLG批量接边检查算法设计与实现[J].矿山测量,2010(4):21-24

[10] 蒋勇,刘江,黄功文,等.基于ArcGIS Engine的IPointCollection接边检查法的研究[J].测绘与空间地理信息,2014,37(11):124-125

[11] 廖振环,左志进,魏德照.DLG数据接边检查的设计与实现[J].地理空间信息,2009,7(4):60-62

[12] 朱仕杰,南卓铜.基于ArcEngine的GIS软件框架建设[J].遥感技术与应用,2006,21(4):385-390

猜你喜欢

边线国情普查
海岸水边线提取方法在GF-2卫星影像中的适应性研究
立即全面普查 警惕二代粘虫发生
胡春华强调:确保脱贫攻坚普查取得圆满成功
家国情 诗词魂
推广生物乙醇汽油:迫切且合乎国情
认识足球(六)
突破矩形上边线买入法(1)
关于农业文化遗产普查与保护的思考
地理国情监测知识支持库初步设计
特定国情教情中的中小学校自主权