国际河流流域空间数据知识组织体系构建研究
2018-09-06赵又霖
封 丽,赵又霖
(1.河海大学 商学院,江苏 南京 211100;2.河海大学 图书馆,江苏 南京 210098)
国际河流一般是指流经两个或两个以上国家的河流。21世纪,国际河流的争端由水资源的争夺而爆发。国际河流的水资源通过自然越境而打破流域各国领土的完整性与封闭性,国际河流的争端对于任何一个流域国都是不可避免而又复杂多样的难题,如何应对和解决该问题,既是各主权国家间博弈的过程,也是多种渠道并行不悖的合作过程。因此,对国际河流流域的水文、水质、水量、生态、工程建设、经济等生态与工程信息的监测与预警,是流域规划设计、水灾风险防范、应急预案制定的基础依据与支撑,也是外交谈判的重要基础资料。然而,如今尚未形成一套针对国际河流争端的预警体系。水电开发作为水资源利用的重要领域,其对周边国家的产业发展与生态环境的影响意义深远。以澜沧江-湄公河为例,水电开发的迅速发展,已经成为推动流域下游国家经济发展的重要产业之一。但在水电开发的过程中可能会对河流生态系统的结构和功能带来不利影响,同时对湄公河下游渔业的发展产生一定的影响。因此,要想推动河流服务功能的协调发展,需要在满足生态系统稳定的基础上进行水电开发。
跨界水资源的利益分配常常关系到国家的生存和发展。近年来,世界各地跨界水纠纷有增无减,国际河流争端成为国际社会中矛盾最多、最不稳定的领域之一[1]。由于我国的地理位置特殊,多居于国际河流的上游,对河流的利用和开发拥有天然的控制权,然而水资源的开发利用会或多或少地对下游产生影响,水资源的污染也可能被延伸到下游国家。因此,下游国家对中国开发利用水资源的一举一动都保持高度的警惕和敏感。中国在澜沧江上的水电梯级开发、新疆国际河流上实施的“635计划”及论证中的大西线调水工程,都引发了一些相关邻国不同程度的异议。因此,我国在国际河流开发过程中应考虑建立与之有效的信息服务体系,从信息服务的角度研究国家间的合作、水资源的利用和经济政治的发展等服务,而空间数据则是这一空间信息服务体系的基础和根本。随着我国社会经济的持续发展和周边国家环境的变化,各流域国逐步进入快速开发阶段,由于缺乏必要的基础数据指导水资源开发活动,在不同流域利益诉求存在差异的背景下,由开发引起的矛盾也会逐渐增多甚至激化。积累国际河流流域空间数据,并对这些数据加以知识组织处理,是对争端事件加以预警的有效途径,也是目前国际河流研究的核心议题。
1 研究现状
有效的国际河流管理必然建立在大量的基础数据信息之上,国际河流合作争端解决和合作开发各方的谈判也必须借助基础数据,因此,各个国家均将相关水文、环境、社会经济等数据视为重要的战略资源。目前国外关于国际河流基础数据的管理较为成熟,其高度重视国际河流信息系统建设与跨界影响监测[2-5]。国外研究主要集中在监测途径(如文本数据、调查访问、社会网络和网络数据等监测途径)和监测与分析技术两个方面[6-8]。国内对一般河流的数据管理研究较多,但针对国际河流的数据管理和情报监测的研究相对较少。综上所述,研究主要包括:①一般河流的数据管理和监测研究主要在水资源领域,如水库发电、航运数据的采集和分析、防洪决策系统、水功能的基础数据管理等。在众多的信息化技术和现代科技中使用最为广泛的是GIS,其他技术主要是一些技术融合方案[9-10]。②国际河流数据管理主要集中在数据库结构和功能、数据信息交换等方面[11],但对国际河流涉及到的数据界定并不完善。③国际河流数据共享管理方面的研究仅涉及流域组织合作机制框架下的小部分数据共享[12]。目前,我国对国际河流争端事件涉及到的利益主体及利益需求的研究关注不够,在语义标注、高维空间知识单元的关联计算和空间异构数据的融合方面在知识单元与知识内容的层面也面临一定的挑战性。笔者研究的空间数据知识组织即是对特定领域的大数据的知识组织。知识描述的主要研究内容包括编目、元数据和本体等,语义化描述是知识描述的发展趋势。笔者拟采用空间元数据、本体与关联数据等地理语义资源对空间数据加以语义标注,进而实现语义化的知识描述。
2 国际河流流域空间数据知识组织体系的构建
2.1 空间数据信息需求模型
国际河流水资源开发争端事件主要是指人类活动对自然和社会产生影响,进而对各利益主体在经济、政治、工程、生态等方面产生的作用。因此需要对国际河流流域利益主体及利益诉求方面加以确定,并在此基础上构建与其相对应的信息需求体系。信息需求模型如图1所示。
图1 信息需求模型
2.2 空间数据体系结构
流域空间数据是指与河流流域相关的一系列空间数据。以我国的争端事件为例,主要包括西南的水电开发引起的争端事件、西北的水资源配置引发的争端事件和东北的水污染引发的争端事件,而不同的争端事件背后所对应的空间数据关联有所不同。因此,需要在明确国际河流空间数据类型和特征的基础上,确定与之对应的国际河流空间数据的内容体系。
流域空间数据范围是面向水电开发的国际河流流域空间数据范围的基础,流域空间数据范围规划如表1所示。
表1 流域空间数据范围规划
然而,面向水电开发的国际河流流域空间数据较流域空间数据有其特殊性,其主要关注于水工程、水需求与水利用层面,因此,这一类数据的空间分析效果将直接影响到水电开发所引发争端事件的预警效果,如表2所示。
表2 面向水电开发的国际河流流域空间数据内容规划
(1)空间数据内容。空间数据的内容主要分为水资源、工程、水组织、水事件、水需求与水利用、经济等GIS专题层。
(2)空间数据结构。首先,研究显式描述的矢量数据结构与隐式描述的栅格数据所对应的专题层数据所需的数据编码方式;其次,借鉴“数字黄河”、“数字长江”和“数字清江”等地理信息系统专题数据库设计的内容,设计数据字段与数据结构;最后,研究如何实现数据字段与地理信息系统中空间数据结构的匹配与映射。
(3)数据模型。首先,采用基于关系的空间数据模型实现空间数据中位置数据与属性数据的处理;其次,采用面向对象的数据模型方法实现概念实体的模型化;最后,采用GIS数据模型的方法处理不确定描述对象的近似表达,从而构建目标模型和域模型。
(4)空间数据可视化。空间数据存在自然层次结构,可以以不同的粒度进行探索研究。因此需要利用可视化的方式将人类开发活动数据及影响与空间展示进行映射,实现模块化展示。
2.3 空间数据知识组织体系
空间数据的类型复杂多样,依据应用需求的不同,在前期需要通过矢量结构和栅格结构表述其不同类型的空间数据并做相应的存储处理。首先,GIS表达的是现实世界的时间和空间现象,具有空间自相关性。其次,空间数据中,同一地点的不同现象之间存在相关性,如两个场的数值之间、一个离散对象集的两个属性之间、相互交叠的离散对象的属性之间都具有相关性。最后,空间数据具有唯一性,GIS的目标是在不同的具体地理参照的数据之间建立因果联系,多元回归模型提供了一种关联空间变量及从样本推断出总体特征的重要手段,将空间数据用于建立空间分析的上层框架,对空间数据性质加以理解,可以利用归纳(从观察来推理)和演绎(从原则和理论来推理)的方法建立正确的空间描述表达模型。该体系的具体构建思路如图2所示。
图2 国际河流流域空间数据知识组织体系
(1)知识描述。空间数据具有空间信息领域的特点,比如在深度数据分析上,需要同时在空间和时间两个维度发掘数据之间的关联,进行时间轴和空间轴上的数据预测等。①采用基于概念的语义描述方法对空间元数据进行描述,确定空间元数据的描述标准,包括数字地理标识、覆盖范围、事件模式及空间参照系等信息。②地理语义资源的描述与演化模型的构建。首先,基于现有本体库、关联开放数据等资源,构建地理语义资源本体知识库;其次,基于形式化的描述实现地理语义有关空间关系的表达;最后,基于语义网服务发现方法,构建地理语义本体知识库更新演化算法及模型,实现语义资源的实时更新和动态维护。③空间数据与地理语义本体知识库的匹配与映射。首先,采用自然语言处理技术、知识单元抽取、关联识别技术实现空间数据与地理语义资源本体知识库的匹配;其次,研究解决匹配过程中的冲突与集成问题,并解决匹配过程中的质量控制问题。④空间数据语义标注。首先,整合ConnectME、Annomation等语义标注工具研究空间数据的标注方法、模型和具体的技术方案;其次,研究空间数据语义标注的集成方案;最后,研究空间数据语义标注的动态匹配机制。
(2)知识整序。知识组织的目的是序化,空间数据知识组织的最终目标是从有序的数据中发现知识。①知识单元的特征分析和知识单元抽取方法与模型。从复杂系统理论、知识结构和有序性原理出发,根据知识序化理论,按照空间数据的不同类型,分析其相对应的各类知识单元特征;结合人工智能、机器学习和自然语言处理等信息抽取技术,研究空间数据中各知识单元抽取的关键技术,提出适用于空间数据的知识单元抽取模型与方法。②空间数据的异构融合。采用基于映射模板的元数据集成方法对异构的空间数据加以集成,实现多格式、多类型、多尺度、海量分布式数据的集成。③空间数据的关联计算。基于传统的知识关联计算方法,通过文献调研和专家访谈研究空间数据知识关联的难点与关键性问题;采用多重关系建模、仿真的方法,研究高维空间数据中基于矩阵计算和知识关联计算之间的关系;基于传统的相似性、距离等关联计算方法研究适用于空间数据度量距离效应、空间尺度和空间距离的知识单元整合方法与模型。
(3)知识深度关联。①基于归纳学习的空间分布规则获取相关专题层的数据知识,实现知识单元因子事件的关联分析;②基于空间数据聚类的方法,将各专题层中知识对象间的相互作用与组织特征对应的数据集进行处理,实现各专题层之间的关联分析;③基于空间关联规则发现领域相关知识,实现多种形式空间数据的规则与算法效率的提高。
(4)多重表达的可视化。对争端事件现象的多重表达,即利用多源、多时空、多尺度地理信息,从不同层次、不同角度分析与认知地理现象,可以为GIS用户提供由整体到局部、由抽象到具体的事件关联空间关系,其也是地理空间信息服务质量(quality of geospatial information service, QoGIS)的基本要求。
3 结论
目前,要实现对国际河流水电开发与合作中争端事件的预警,需要对国际河流流域空间数据进行知识组织研究。通过空间数据知识组织的研究实现空间关联分析,从而达到预警的目的。然而该研究存在一些新的问题:如国际河流流域数据积累量的薄弱、数据相对分散及利用的不合理、各流域国利益主体及利益需求的差异等,这些问题大大降低了国际河流流域水电开发规划的合理性程度,进而无法有效避免可能出现的争端事件。
空间数据是实现国际河流流域争端事件预警监测的基础条件。数据是资产和战略资源,但失去控制和无组织的数据、信息、知识却不再是一种资源。国际河流水资源管理过程中会产生海量有价值的空间数据,但由于水资源管理各业务领域数据格式和编码的不同,从而难以实现空间数据的共享与利用。因此,规划国际河流流域空间数据的结构体系、描述空间数据、序化空间数据显得迫在眉睫。
(1)各流域国之间争端动因、争端需求和争端演化的研究是实现空间信息服务的基础。从信息服务的角度来看,影响国际河流流域整体开发和管理的根本原因在于各流域国利益主体间利益诉求的差异性。因此,分析清楚这些利益主体关注的焦点,便可以从根本上有效控制或者减少争端事件的发生。
(2)国际河流流域空间数据是实现争端事件诱发原因关联分析的基础。国际河流流域空间数据较一般的流域数据有其特殊性,因此,明确其结构体系,才能进一步从特定的水电开发争端预警角度对其进行空间关联分析。
(3)知识组织是实现空间数据描述与序化的有效手段,也是实现争端因素间关联分析的前提条件。空间数据较一般的数据而言,有其特有性,因此,构建一套适合于空间数据的知识组织体系,是实现争端预警的关键环节。