APP下载

多源森林资源空间数据集成技术与应用研究

2021-11-22侯瑞霞张乃静肖云丹

自然保护地 2021年2期
关键词:数据格式空间信息空间数据

侯瑞霞 张乃静 肖云丹 纪 平

(1. 中国林业科学研究院资源信息研究所,北京 100091;2. 国家林业和草原科学数据中心,北京 100091;3. 国家林业和草原局林业遥感与信息技术重点实验室,北京 100091)

具有空间含义的多级森林资源数据,承载着不同空间专题信息,数据以不同空间形式存在。在信息技术和大数据技术等不断迅猛发展的时代,不同的森林作业形式、不同的经营管理模式以及不同渠道获取的森林资源数据,展现了多尺度、非结构化、多源性等特征,但是却又在不同空间尺度和时间尺度上具有密切的关联性。在森林资源数据的分析、更新和业务调查应用等工作中,业务处理工作要求获取的空间数据是连续的以及可相互查询的,但是面对表达形式多样、不同时间点(段)的森林资源空间数据,如何有效的完成多源异构的、不同空间尺度的数据集成就成为了数据共享和信息智能检索应用的一个亟待解决的问题[1−4]。

数据空间作为一个新的概念由此被提出,国内相关的研究正在信息集成和空间数据整合领域开展[4−6]。国家林业和草原科学数据中心根据信息需求的导向,集成多渠道获取的森林资源数据,本文分析了多源森林资源空间数据的特质和差异性,揭示森林中包含的各种因素之间的空间交互关系以及内在变化规律。同时,通过森林资源空间数据的关联性分析,实现了多源性森林资源空间数据的统一表达,为林业资源空间语义检索与共享服务提供空间信息支撑。

1 森林资源空间数据差异性分析

1.1 数据获取途径差异分析

森林资源是一个自身不断变化的研究对象,作为一个动态生长的群体[4],其内在生长的个体相互间存在竞争和互生的关系,因此,从中获取的空间数据的表达也存在着不确定性。

传统的林业工作野外数据采集模式,形成了大量的历史空间资源数据积累,手绘地图和地图数字化是主要的空间数据获取途径。然而,随着智慧感知技术和互联网+技术的不断发展,遥感信息技术、数字采集以及无人机拍摄识别等不同渠道的数据均成为森林资源空间数据汇集的重要组成部分。不同手段获得的数据,其存储格式和处理手段各不相同,从而形成了多种格式数据源共存的局面[4]。信息技术不断创新,在森林资源空间数据采集的过程中,不同空间区划的采集标准、采集渠道以及不同操作者等因素,导致空间数据的多源性和差异性。

1.2 关注重点差异分析

森林资源空间数据以专题调查的形式存储[7],在基础地理空间数据的基础上,进行专题信息的采集,为林业的各级应用和管理部门服务。由于各级业务职能的不同,数据的关注重点也各有不同,因此,森林资源各类空间数据所承载的关注因子也有不同的侧重点(表1)。

表1 森林资源空间数据因子关注重点Table 1 Focus on forest resource spatial data factors

1.3 数据存储、表达及形式差异分析

伴随着信息技术的不断进步,森林资源空间数据以多种形式的表达方式,充分展示了森林资源的真实状况。在不同的空间尺度下,同一个森林资源空间实体的表现形式是可以互相转化的。因此,根据不同的数据可视化需求,森林资源空间数据实现了空间与属性信息表达的关联,从数据表达形式上,可以划分为:点状数据、线状数据、面状数据等;从数据展示类别上,可以划分为:表格数据、矢量数据、栅格数据(表2)。

表2 森林资源空间数据类别与表达Table 2 Data categories and expression of forest resource space

2 森林资源空间数据集成技术

2.1 森林资源空间数据集成机制

实现多源的森林资源空间数据集成,必须具备三个必要条件:空间数据、集成软件以及集成规则[8−11]。空间数据是集成的对象;集成软件是载体,通常是指可以进行空间信息处理的通用或专题GIS软件,利用其提供的功能,能够实现数据集成的主要操作流程;集成规则,是指空间数据集成的依据,也是数据集成的标准参照(图1)。

图1 森林资源空间数据集成机制Fig. 1 Space data integration mechanism of forest resources

2.2 森林资源空间数据集成技术

空间数据集成,是指在对多源性森林资源空间数据进行类别划分的基础上,按照数据质量标准进行空间数据的质量检查,对整体采集或整理的空间数据实现统一管理,形成有效的、完整的空间数据集[12−14]。随后,利用空间坐标转换、空间模式转换以及多尺度集成手段,完成森林资源空间数据的空间定位统一表达;进而,采用多层次空间集成方法,完成空间数据的集成分析,提取空间数据的变化因子,实现多源性森林资源空间数据的信息统一表达,为林业资源空间语义检索与共享服务提供空间信息支撑。

2.2.1 森林资源空间数据集成质量控制

森林资源空间数据在形式上包括:矢量数据、属性数据和栅格数据等,进行空间数据的集成工作的第一步就是要实现各类森林资源数据在完整性、准确性等方面的数据质量控制,这样才能确保空间数据集成的统一表达。

森林资源空间数据质量控制,主要包括:基础检查和集成规则检查[12]。基础检查是保证空间数据集成可操作性的第一步,包括文件形式检查和空间基准检查等。其中,空间基准检查又包括地理坐标系统检查和投影坐标系统检查。在数据检查中,空间基准检查相当重要,可确保各种空间信息之间关系的准确表达,完成空间数据应用共享。森林资源空间数据集成的关键是梳理各要素之间的逻辑关系和拓扑关系,因此,集成规则检查是保证实现空间数据统一表达的重要手段,主要包括:属性数据检查、逻辑一致性检查以及拓扑关系合理性检查等。进行森林资源空间数据质量控制,是空间信息共享服务的前提和关键[15−17]。

2.2.2 森林资源空间数据转换

森林资源空间数据转换需要三个方面的信息:1)空间定位信息;2)空间关系;3)属性数据。森林资源空间数据具有空间定位属性,不同时间段形成的空间数据,具有对应的空间基准特征,统一的空间基准是保证空间数据集成的一致性、兼容性或可转换性的基础条件。一般来说,森林资源空间数据的空间基准信息包括两个方面:坐标系统和投影系统。坐标系的统一是数据格式转换的基础,也是数据集成的基础。地面上任意一点的位置,均可以采用不同的坐标系来表示。根据数据分析的结果,本文中所采集的森林资源空间数据涵盖了北京1954年坐标系和1980年西安坐标系,需要进行坐标系统一工作,以确保空间数据集成的准确性。

森林资源空间数据通过传统森林作业手段和不断更新的信息采集技术获取,不同的采集途径获得的空间数据表达形式多种多样,产生不同的空间数据格式[10]。空间数据格式转换是做到有效的空间数据集成的关键环节。空间数据格式转换,即通过专用的转换程序,把一种格式的空间数据转换成另一种格式的数据,也可以利用定位信息和属性信息进行不同的数据类型的转换,以实现空间数据集成的完整性。空间数据格式转换的表现形式,包括不同软件数据格式的转换、不同数据类型数据格式的转换以及不同版本的数据格式转换[17]。

本文中森林资源空间数据转换主要通过GIS软件平台实现:首先,确定数据格式转换的对象,分析标准数据格式的组织方式,确定其空间定位范围和属性信息的关联关系;其次,利用转换工具将其他数据转为标准数据格式。数据转换方法包括:数据直接读取、带入模型转换和数据表现形式转换输出等。

3 森林资源空间数据集成应用

本文的研究区域定位于广西热林中心,收集整理的森林资源空间数据主要包括该区域四个年度的森林资源二类调查数据和两个年度的森林资源系统抽样调查数据。这些空间数据的采集时间跨度近二十年,数据信息变化程度大,需要全方位空间数据集成,寻找其关联关系,为进一步开展森林资源空间数据信息共享及检索分析提供支撑。

3.1 多尺度空间数据权重集成

本文分别采集了1998年、2004年、2009年和2014年的森林资源二类调查数据,以面状信息表达资源调查小班的空间分布状态、面积、形状、位置以及实体自身属性。研究采集的森林资源系统抽样调查数据包括2011年和2013年两个年度的数据,以点状信息表达资源调查空间对象的位置、相对方向以及自身属性。

森林资源空间数据自身是一个消长变化的数据,在变化进程中,多时间点所采集的数据分别存储,时间作为数据的一个属性特征存在,形成时间尺度表达的空间数据。不同时段的数据,在集成结果数据中占有不同的比重;空间属性特征由不同时段的数据集成密度相互作用,数据集成的密度大,数据特征的权重就高,数据的可信度也就越高。叠加分析是指利用数据要素之间的相关关系,对多时间尺度数据进行处理。

3.2 森林资源数据空间信息集成标准化

空间数据的集成在相同的数据类型存储状态,以及统一的空间投影坐标系统的前提下进行,通过准确的获取空间关联信息,充分掌握森林资源的空间变化状况,为林业资源信息空间检索与数据检索提供分析数据支撑。

本文中森林资源调查数据为空间数据,森林资源系统抽样调查数据以属性表信息存在,属性表中存储空间坐标信息,其X、Y坐标的标示点与森林资源二类调查数据的小班在空间上是重叠的。根据坐标点数据,可以将森林资源系统抽样调查属性表数据转换为样地空间点状分布数据,从而实现空间数据集成的数据类型统一(图2)。

图2 空间数据不同表达方式转换Fig. 2 Conversion of spatial data in different expressions

本文中所采集的森林资源调查数据空间位置为固定信息,不同年度的数据,由于采用了不同的坐标系统和地图投影标准,在空间位置上具有偏差。在分析各年度空间投影信息的基础上,进行投影转换工作,使各年度的空间数据存储于统一的空间坐标系统中,完成空间数据的空间信息标准化。

经过对数据的空间信息提取得知,1998年与2009年的数据空间投影坐标信息相同,为Gauss_Kruger3度投影,Beijing_1954_3_Degree_GK_Zone_36坐标;2004年的森林资源调查数据为GCS_WGS_1984经纬度坐标,未加载投影信息;2014年数据为Gauss_Kruger3度投影,Xian_1980_3_Degree_GK_Zone_36坐标。以2009年森林资源调查空间数据作为空间基准,利用ArcGIS软件的投影转换和坐标转换功能,实现多年度空间数据的空间信息统一。投影转换前,图斑位置错位明显,误差高达90 m左右,经过投影转换和坐标匹配,两个年度的数据空间位置基本吻合。

3.3 多源森林资源空间数据集成及对比应用

森林资源空间数据在完成数据类型转换和空间投影配置后,将森林资源调查数据与森林资源系统抽样调查数据进行空间叠加,从而落实样地点分布与资源小班的空间关联关系。样地点分布在资源调查小班中,可以通过点与面的包含关系查询对含有样地点的小班进行提取,为资源信息分析提供空间对比数据。

分别以四个年度森林资源调查数据和2011年抽样调查数据进行叠加信息提取,实验区提供的抽样调查样地布设共238个,按照样地空间定位为基准,分别与各年度森林资源调查数据实行空间位置叠加,提取应用分布示例数据。其中,1998年数据提取235个空间分布单元数据,2004年数据提取232个空间分布单元数据,2009年共提取出233个小班空间分布数据,2014年共提取186个与小班空间位置叠合的空间分布数据。

以提取空间单元数量最多的2009年森林资源空间分布为基础,分别对1998年、2004年和2014年的空间数据进行叠加集成。经过分析可知,空间数据变化主要分为三种类型:空间信息合并、空间信息分割和空间重新划分(图3)。

图3 空间数据多源集成不同尺度数据变化类型Fig. 3 Spatial data multi-source integration of different scales of data change types

空间数据合并是指多源数据经过多次调查后,同处一个空间层次上的森林资源主要空间信息因子重合度较高,归并为一个森林资源空间区划单位。在进行空间信息查询时,空间区划单位中所包含的森林资源调查信息中的优势树种、森林类别、林种等内容,进行多源信息相似度为100%。

空间数据分割是指一个森林资源小班由于进行政策干预或森林经营措施调整,开展更新、不同阶段的规划设计等工作,森林资源属性产生较大变化,在原有小班边界的基础上,重新区划为多个小班用以表现新的资源信息。

空间重新划分是指更新度较为复杂的多个森林资源小班分布重新进行边界划分,并根据编码规则,重新进行小班编号。空间单元属性信息变化多样,在空间尺度上无法直接从上一年度的资源调查数据中进行获取。

4 结语

多源森林资源空间数据集成是在数据空间分布区域及特性的基础上,按照数据的业务空间层次进行差异性分析,利用集成机制,在空间尺度上实现不同信息渠道获取的森林资源数据的有效统一。空间数据集成是一个复杂的流程,是支持林业科学数据多层面专题信息的综合,涉及的技术层面比较广泛,诸如语义集成技术、共享集成技等。在“互联网+”已渐渐融入到林业信息化建设的过程中,利用不同的时空集成模型,进行多源森林资源数据更准确的信息回溯与一体化分析,是未来将要推进的工作和研究的方向。伴随着科学数据大批量的汇交,多业务类型、多专题的空间数据将是数据集成任务的重点,也将是林业和草原科学数据中心实现数据共享服务,开展空间数据有效集成探索的重点。

猜你喜欢

数据格式空间信息空间数据
结合多层特征及空间信息蒸馏的医学影像分割
GIS空间数据与地图制图融合技术
基于作战环的空间信息时效网关键节点分析模型
世界首个可记录物体内部结构等复杂信息的3D打印数据格式问世
元数据驱动的多中心空间数据同步方法研究
基于物联网的智能空间信息共享利益模型研究
论子函数在C语言数据格式输出中的应用
基于特征库的测井数据格式自动识别与转换方法
关于地理空间信息标准体系
基于文件系统的分布式海量空间数据高效存储与组织研究