浅谈地籍调查、管理一体化系统的数据质量控制
2012-12-29吴自强
摘要要:本文讨论了地籍调查与管理一体化系统中,诸元素数据质量控制的分类、标准和方法。此外,还分析了数据产生差、漏、错质量问题的原因和解决方法。
关键词:数据质量控制;独立元素;相关元素;闭环检核
地籍调查中权属要素是具有法律效力的关键元素,决不允许存在正确性、合法性之外的质量问题。因此,数据生产质量的优劣,将成为地籍测绘市场买方的需求主流。因而也直接关系到数据生产者的生存和发展,成为数据生产者当前的技术创新主攻方向。
1 数据元素类型
元素是空间地物、一般物的抽象对象及其属性的统称,数据是元素的数字表达形式统称,元素和数据是同一个地物特征的二层表达方式。因此即便校对,其可靠性仍然较低。
2 数据关系类型
分为逻辑关系、几何关系、拓扑关系和统计关系。
3 数据质量控制的概念
数据质量控制的概念从发展角度可分为传统的质量管理和现代质量管理模式。
4 数据质量控制方法
数据质量控制按照设计、生产、总检三阶段来控制,概念上较清晰,实践上也方便易行。
4.1 设计阶段的质量控制
主要是通过方法、工艺流程、系统的功能等从整体上给予质量保证。包括三个方面:
(1)工艺流程设计主要原则:①作业流程内部工序之间在逻辑上连续、层次分明、结构关系紧密;②将有效的检核方法科学地设置到数据采集、数据输入、数据加工、数据传输等相应工序的关键点上;③检核功能设置要求简洁、经济效益最大化、检核系统化、检核早期化(初始化)。
(2)质量控制技术“标准化”。在采用了一系列新技术生产之际,关键是对所有影响作业质量的岗位及其人员,明确其质量标准、质量职责,以及相应的权限和相应的奖惩。通过对人这个关键因素实施有效的技术责任、质量责任控制,达到从基础上控制数据质量之目的。
(3)系统设计:
①人工系统的工艺流程设计。应在目标分析、环境分析的基础上,着重吃透工序间的紧密关系和连续性,突出一体化的整体性,并在相应的工序检核点建立模型、实现检核功能。数据分析中重点是做好“数据质量控制”的五项工作。
②信息分类编码数据结构的内涵设计。应突出其统一性、完整性和唯一性,实现对质量的有效控制。
4.2 生产阶段的质量控制方法
(1)元素检核:
①元素的检核亦分为独立元素和相关元素二类。(下面如无特指,即为独立元素检核)。独立元素主要是运用质量特性对其进行正确性检验。一般为人工检校,应注意其效率低、出错率高。如果采用计算机二次输入检核法,则形成较显著的重复劳动。在目前手段下虽然出错率可明显降低,但经济效益不可行。检核的主要内容有:正确性 、完整性 、合法性 、一致性 、可靠性 、时效。
②对独立工序间的同名原始数据,可采取单一渠道集中采集,汇编于一个综合性载体,并区分出独立元素,这样独立元素只需检核一次,在系统中在独立工序间建立相关数据库,可避免多载体、多头采集,转抄的重复操作。
如有土地登记申请书、地籍调查表、宗地图、宗地关系图等N个载体,其同名数据为M个,建立了相关数据库,则可减少数据元素操作次数为M(N-1)次,或者说可避免了M(N-1)次操作出错机会。这可以提高数据质量和工作效率。
③相关元素检核在数据关系类型中已作有关介绍,这里不再复述。
( 2)知识性、经验性检视
是通过人的智力活动来完成的。如:
①技术路线、设计思想、技术方案,闭环作业方法的执行情况审查;
②旧街坊内部,控制簿弱区域建筑物位置产生质量问题可能性的分析;
③道路、水系、管线系统及附属物表示合理性的检视;
④符号间配置合理性等;
⑸、⑤总检评审和总结经验阶段的质量控制活动
根据检验过程中发生的质量问题,用户回访中的反馈信息,开展对工艺流程的创新思想对质量控制作出深层次的创新研究。如若对元素关系有了重新认识,或开发了系统化检核新功能,其成果应用于下阶段的设计予以推广应用。
5 数据产生差、漏、错问题的原因及解决方法
本文讨论的数据质量主要对象是操作数据时所生产的错误,即数据的差、漏、错问题,而不是误差分析。数据产生差、漏、错等质量问题的原因较多,大体有仪器、设备、工具未经检校;技术问题;人的责任心、大脑疲劳和理性素质低;环境条件的制约等原因。我们从信息和数据的本质着眼,认为这些原因只是数据质量问题的表层现象,透过这些现象可以发现它们都有一个共性的本质性原因,就是“这些差、漏、错质量问题总是在人对客观实体、空间对象及其属性和数据发生操作时产生的”。在地籍调查数据产品生产过程中其操作可归纳为四类:
5.1 数据采集
具体的操作有:外业观测(记录);外业调查(记录);内业数字化等。数据采集的对象是客观的事实。一般被认为是没有错误的。采集的数据属原始数据,是整个系统各类数据的母本和基础,是检核的重点对象。
5.2 数据输入
具体的操作有:外业观测数据的记录或输入;外业调查数据的记录或录入;已知数据、数据处理后的中间成果抄录或输入,内业数字化等,所操作的对象是采集对象的数字信息或已知数据、中间成果数据。前者在数据输入的操作之前就可能存在质量问题,因此应与输入同步实施检核,这个检核有二个作用,一是对采集的数据正确性检核,二是对输入操作的数据质量进行检核。后者是数据加工的依据,可在输入操作前或输入同步实施检核。
5.3 数据加工
由分类、排序、计算、比较、选择等构成。
具体的操作有:控制网平差计算、街坊宗地面积计算、数据质量检核等。数据加工的对象一般是已在输入环节检核了的数据,也有些输入数据是未经检核的数据,因此数据加工时仍须设置检核,检核应与数据加工同步进行。
5.4 数据传输
是指将加工后的数据传递给使用者,这是指使用者用摘录的方式接收数据。具体的有:已知成果摘录、观测数据摘录、中间成果数据摘录、同名数据、勘丈边、宗地号、地类号、界标性质等向不同的载体,如宗地草图、调查表、宗地关系图上转抄等。
操作的对象较复杂,有已知成果、观测数据、中间成果、亦有最终成果、其检核方法只能是校对。因此,摘录转抄的出错率较高,效率较低。因此校对检核是质量控制的重要内容。
5.5 解决的方法
前面已做了些具体介绍,这里主要是几个环节上的方法。
⑴认识、分解所有的操作点上在必要操作点上设置相应的检核点,运用各类检核方法。
⑵建立独立工序间的关系和相关数据库以减少中间数据输入、数据传输中的人工干预。
⑶扩大开发相关数据质量控制的范围,独立元素是数据质量控制研究的主要对象,独立元素的相关规律是数据质量控制的主要研究方向。
⑷全过程构成闭环作业系统完善全过程质量控制,使整个数据采集、输入、加工、传输等操作均在受控条件下作业,这是一个根本的方法,也是我们将要不断努力的目标。</