基于实景三维的地理数据质量一致性研究
2022-04-22庄诗瑶王春李敏徐燕
庄诗瑶 王春 李敏 徐燕
摘 要:在分析乡镇众源地理数据的质量特征的基础上,构建了一种基于实景三维的数据质量一致性评估框架。该框架包括具体的评估指标、评估方法以及评估流程,用Context Capture和DP-Mapper获取参考数据,并且使用ArcGIS评估数据的质量一致性程度。结果表明,高精度实景三维模型不仅能够作为数据质量一致性的参考数据,其特有的直观、准确、快捷、全面特征,还能作为新数据获取良好数据源。
关键词:地理数据;实景三维;质量一致性
中图分类号:P208 文献标志码:A 文章编号:1003-5168(2022)6-0106-05
DOI:10.19968/j.cnki.hnkj.1003-5168.2022.06.025
Research on Quality Consistency of Geographic Data Based on 3d Real Scene
ZHUANG Shiyao1,4,5 WANG Chun2 LI Min3 XU Yan3
(1.School of Geomatics, Anhui University of Science and Technology ,Huainan 232000, China; 2. School of Geographic Information and Tourism, Chuzhou University, Chuzhou 239000, China;3. Key Laboratory of Physical Geography of Anhui Province, Chuzhou 239000, China;4.Key Laboratory of Aviation-aerospace-ground Cooperative Monitoring and Early Warning of Coal Mining-Induced Disasters of Anhui Higher Education Institutes, Anhui University of Science and Technology, KLAHEI (KLAHEI18015), Huainan 232001, China;5. Coal Industry Engineering Research Center of Mining Area Environmental And Disaster Cooperative Monitoring,Anhui University of Science and Technology,Huainan 232001, China)
Abstract: Based on the analysis of the quality characteristics of township geographic data, a data quality consistency assessment framework based on 3d real scene was constructed. The framework includes specific evaluation indicators, evaluation methods, and evaluation process. Context Capture and DP-Mapper are used to obtain reference data, and ArcGIS is used to evaluate the quality consistency of data. The results show that the high-precision real-scene 3D model can not only be used as reference data of data quality consistency, but also can be used as a good data source for new data acquisition.
Keywords: geographic data; Real 3D; quality consistency
0 引言
隨着社会经济和技术的发展,我国数据类型日益丰富,数据量越来越大。各类数据资源逐步应用于政府治理、民生改善、产业发展等领域,大幅度提高了人们的生产效率与生活质量,是国民经济的重要基础,支撑了数字经济的发展。各个部门前期进行数据生产时由于“缺规划少标准”,数据作业标准和作业规范不同,尽管单个项目的数据质量验收符合国家数据质量检核标准,但不同部门之间数据的共享利用存在质量不统一的问题。这些数据资源用于数据统计和宏观展示没有问题,但是应用于实际建设(如宅基地改革、房地一体确权等)会存在质量一致性问题。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》提出:“要完善城市信息模型平台和运行管理服务平台,构建城市数据资源体系,推进城市数据大脑建设,探索建设数字孪生城市。”随着数字孪生城市的提出,在对城市数据资源统一汇聚、挖掘分析、构建数字孪生全信息实景地理环境平台的过程中,要消除多源数据质量不一的矛盾,保证数据唯一且与事实相符。
吴芳华[1]对军事测绘数字信息工程中所用的各种作业规范、标准进行了分析,提出了矢量地图数据的质量评价模型,设计并实现了原型系统MapCheck软件;彭强勇[2]研究了矢量基础地理数据质量模型,并建立了DLG质量模型的一级质量元素、二级质量元素及相应的权重系数;张璐[3]以地理国情监测矢量数据为主要研究对象,设计了一套通用性较强的数据质量检查系统,不仅可以对地理国情监测矢量数据进行质量检查,还可以通过创建不同的方案数据库来对其他的地理信息数据进行质量检查;马博超[4]以三调数据库最为基础的县级数据库为研究对象,针对性设计并开发了一套专门用于三调数据质量检查的GIS软件。随着众源数据的兴起,为了解决来自非专业用户协同编辑的众源数据质量问题,王明等人[5]提出了一种地理空间数据评价技术框架,选取数据完整性、属性信息准确性和定位精度三个方面质量要素,提出了数据质量的计算方法;李亚平等人[6]针对开放式地理空间数据,选取数学精度、数据时间精度、数据完整性与正确性、逻辑一致性、元数据质量、数据权威性、数据适用性以及数据可获取性为评价指标,建立一种开放式地理空间数据可用性评价方法;蔡莉等人[7]在分析开放街道地图(OSM)数据特征的基础上构建了一个新颖的数据质量评估框架,该框架包括具体的评估指标、评估模型和评估流程,评估指标主要包括完整性、位置精度、属性精度和拓扑一致性,并采用层次分析法确定了各个评估指标的权重。
通过以上已有的GIS空间数据质量研究,可以发现以下两个问题。①仅对数据本身进行质量分析,不考虑数据是否与现实相符。现有的数据质量研究都是在国家的数据质量标准上进行数据的数据内容完整性、空间拓扑一致性、属性逻辑一致性等检查,主要研究内容放在自动化程度、使用方法的方便性、检查结果的输出与修改和系统通用性等方面,对专业地理数据的检核评价系统已经非常全面,而对专业地理数据一致性的研究比较欠缺。②目前对数据质量一致性的研究中,研究数据主要以开源数据或网络数据为评估数据,开源数据包括OpenStreetMap、社交网站数据或爬取的POI,而以政府部门生产和使用的专业地理数据为真实参考数据。这类基于开源数据的评估指标、评估模型和评估流程可以借鉴,但是不太适用于专业地理数据的一致性分析。因此,为了实现各部门数据共同利用、评估数据在实际建设中的可行性,本研究以专业测量地理数据为评估数据,以高精度三维模型的精准三维测图数据为参考数据,提出并总结专业地理数据一致性分析方法,并详细阐述了对应的评估指标和评估流程。
1 数据质量一致性分析方法
1.1 数据质量一致性评估框架
数据质量一致性是指数据与实体接近一致的程度。本研究提出一个针对专业地理数据的数据质量一致性评估方法,选用的一致性评价指标为位置一致性、属性一致性、图斑一致性和统计数据对比。数据质量一致性的评估框架见图1。
位置一致性是用来评估要素位置与现实实体相吻合程度;属性一致性是指地理数据所代表的属性信息与其所代表的真实实体一致性程度;图斑一致性是指评估数据区域内图斑与现实实地的一一对应吻合程度;统计数据对比是指评估数据的最终统计值与参考数据的统计值的差异和接近程度。
1.2 数据质量一致性评估指标
1.2.1 位置一致性。从测量的角度看,同一区域不同作业的两个数据不存在完全吻合的情况,所以位置的一致性是指在可允许的误差范围内,两个数据叠加吻合则代表数据位置一致。针对点、线和面数据都代表一个实体的情况,对数据做缓冲区叠加分析可以有效评估数据的位置一致性程度。评估数据叠加精准三维测图数据建立的内外缓冲区,超出缓冲区则位置不一致,落在缓冲区内则判定为位置一致,如图2所示。另一种情况是点和线数据代表的是一个实体的范围,直接在三维模型中测出实体的范围用来评估数据的位置一致性程度,评估数据叠加精准三维测图数据,超出实体所代表范围的数据判定为位置不一致,落在实体所代表范围的则判定为位置一致,如图3所示。
1.2.2 属性一致性。属性一致性分为属性错误和属性缺失。属性错误是指评估数据所代表的属性信息与实地所表达的属性信息不一。例如,实地是坑塘,评估数据中显示为农用地(见图4)。属性缺失是指评估数据的属性表中部分属性描述缺失。
1.2.3 图斑一致性。图斑一致性分为两种。①部分相同属性的邻近图斑被划分成多个图斑,但是从实地要素表达的属性来看,相同属性的多个图斑可以被划为一个图斑。例如,一个坑塘水面被拆分成三个图斑(见图5)。②评估数据跟实地对比有部分图斑缺少。例如,实地要素为坑塘,但评估数据中没有这个图斑(见图6)。
1.2.4 统计数据对比。一般对于国土调查来说,因为影像分辨率和人为因素等,绘制的图斑个数存在一定的差异,但是最终统计数据的正确性至关重要。对比评估数据和参考数据的面积和周长可以作为数据质量一致性的一个评价指标。点数据不存在面积和周长,所以不予考虑;线数据考虑统计周长值;面数据考虑统计面积值。采用绝对周长、相对周长、绝对面积和相对面积四个指标。指标越接近于0代表统计数据一致性越高。四个指标的计算公式为式(1)至式(4)。
[绝对周长=评估数据周长−参考数据周长]
(1)
[绝对面积=评估数据面积−参考数据面积]
(2)
[相对周长=评估数据周长−参考数据周长参考数据周长]
(3)
[相对面积=评估数据面积−参考数据面积参考数据面积] (4)
1.3 数据质量一致性评估流程
数据质量一致性评估首先要确定数据质量一致性的评估指标,根据各评估指标和数据类型总结数据质量一致性的评估方法,建立数据一致性的评估模型,根据评估数据选择并应用数据质量一致性评估方法,对数据执行评估,最后得出数据质量一致性的结果。数据质量一致性的评估流程见图7。
2 试验与分析
2.1 数据选取及试验结果
本研究的评估数据为××村的农用地、坑塘水面、宗地等矢量数据,总图斑数为770个。参考数据为实地航飞的无人机影像构建的高精度三维模型,在晴朗天气下,采用大疆M300型号无人机,搭载赛尔102S五镜头,设置平均航高为200 m,飞行速度为15 m/s,影像的航向重叠度为80%,旁向重叠度70%,地面分辨率为3.5 cm;测图软件为DP-Mapper;评估软件为ArcGIS。
根据模型的精度和人为误差将缓冲区的参数设置成5 cm。通过试验得出以下结论。
①農用地。农用地数据包括旱地、水田和水浇地,总共456个图斑,三维模型中解译出的农用地一共有447个图斑。以三维模型数据为参考真实值,位置一致的图斑有342个,位置错误的图斑有114个;属性错误图斑有5个,无属性缺失情况;缺少5个图斑;有12个图斑可以合并为4个图斑,1个图斑可以拆分为3个图斑;评估数据面积为6 862 837.720 m2,三维解译数据面积为6 858 302.919 m2,绝对面积为4 534.8,相对面积为0.001。
②坑塘水面。评估数据中坑塘水面总共95个图斑,三维模型中解译出的坑塘水面一共有86个图斑。以三维模型数据为参考真实值,位置一致性的图斑有36个,位置不一致的图斑有59个;属性错误图斑有12个,无属性缺失数据;缺少5个图斑;有三个图斑可以合并为一个图斑。评估数据面积为823 343.302 m2,三维解译数据面积为733 094.628 m2,绝对面积为90 248.67,相对面积为0.123。
③生态红线。生态红线数据总共1个图斑,以三维模型参考数据为真实值,有57 566.38 m2的农用地、1 985.93 m2的坑塘水面、109.63 m2的农村宅基地和215.41 m农村道路被划入生态红线范围。
2.2 试验结果分析
根据上述试验得出的结果,总体来说数据质量不一致是自然变化和人为因素导致的,主要原因有以下三个。
①数据具有时效性,国土调查前后间隔两年多,测量数据时间前后不一致,自然原因或工程建设使当前现状发生了改变。
②不同数据的作业单位不同,作业要求不同,本体数据获取方式也不同,国土调查过程中,调查底图采用优于1 m分辨率高分卫星影像生成的DOM为本底数据,但是本研究的三维实景数据地面分辨率为3.5 cm,用高分辨率去检查低分辨率成果会产生数据质量不一致现象。在内业勾绘中,二维正射影像受周边地物以及阴影带来的影响,部分地类具体色彩以及纹理十分相似,导致预判发生失误。
③国土调查的过程中,调查技术规程的不断修订、不断变化,对一些细节描述不精准,作业人员语义理解不到位,致使不同单位采集的数据存在不同程度的不一致现象。
3 结语
实景三维模型能够最大程度还原出真实场景的细节,模型的分辨率越高,纹理越清晰。国土数据应用于实际建设中,对数据精度要求比较高,传统的数据质量检核无法满足要求。本研究提出基于实景三维的数据质量一致性分析方法,探究数据与实地接近的接近程度,提出一个新颖的数据质量一致性评估框架,并以××村三调数据为例,评估其数据质量一致性。试验结果表明,该技术对核定各类各级数据的一致性、准确性,具有直观、高效、精准优势,具有很好的应用推广价值。
参考文献:
[1] 吴芳华.矢量地图数据质量控制的理论与实践[D].郑州:中国人民解放军信息工程大学,2002.
[2] 彭强勇.矢量基础地理数据质量评价研究[D].南京:南京师范大学,2007.
[3] 张璐.基于ArcEngine的地理国情监测矢量数据质量检查系统开发研究[D].西安:长安大学,2017.
[4] 马博超.基于AE的三调县级数据质检软件研发[D].西安:长安大学,2019.
[5] 王明,李清泉,胡庆武,等.面向众源开放街道地图空间数據的质量评价方法[J].武汉大学学报(信息科学版),2013,38(12):1490-1494.
[6] 李亚平,蔡忠亮,谢彩云,等.一种开放式地理空间数据可用性评价方法的研究[J].测绘地理信息,2017,42(1):83-87.
[7] 蔡莉,李永轩,王淑婷,等.基于层次分析法的众源地理数据质量评估研究[J].测绘地理信息,2021,46(3):98-102.