空间数据溯源的概念、模型与服务
2015-02-10乐鹏,郭霞,张晨晓,张明达
乐 鹏,郭 霞,张 晨 晓,张 明 达
(武汉大学测绘遥感信息工程国家重点实验室,湖北 武汉 430079)
0 引言
随着传感器平台的发展,人们及时快速获取大量地理空间数据的能力不断提高。地球上空现在有150多个地球观测卫星,这些卫星和无数的空基、陆基、海基传感器观测系统每天产生海量的地理空间数据[1]。数据系统也在不断发展用以支撑科学数据处理。
传统的地学数据产品通常由数据中心按照预定义的处理流程或工作流生成,在数据产品提供给用户使用之前,处理算法、工作流、数据产品等一般在内部通过严格的有效性检测,数据的可信度较高。随着新一代信息基础设施技术的发展,地球科学数据和数据处理资源在分布式环境下得以充分共享,地理信息网络服务在地理空间领域得到了广泛应用,地学数据和服务从网络中发现和动态聚合,由于空间数据分发和处理的广泛性、频繁性和不可预知性,空间数据溯源信息在空间数据产品追踪溯源、更新、可靠性评估中凸现其重要性,在国际上已经成为地球空间信息科学网络基础设施建设的基础问题。
数据溯源信息记录了数据产品的起源信息,为用户进行数据产品可用性和可靠性评估提供了重要参考信息。在科学研究领域数据溯源显得尤为重要,科学家需要根据溯源信息来判断数据的可靠性进而决定数据可否用于进一步的科学分析,数据溯源也可辅助用于解决信息基础设施中的相关问题,包括提高数据共享和数据处理过程的透明度,保证数据产品的可信度,记录数据处理服务提供者的信誉度,提高科学数据产品的可再现性等。本文主要讨论地理空间领域的数据溯源,阐述空间数据溯源的基本概念,对空间数据溯源的研究内容、研究领域和地学领域数据溯源研究类别进行了详细描述,从模型、层次、粒度和服务等方面探讨了空间数据溯源的关键研究问题。
1 空间数据溯源的概念
目前,数据溯源(data provenance)因应用领域不同而具有不同的定义。在数据库领域,数据溯源是指追溯数据及其在数据库间运动的起源[2];在科学工作流领域,数据溯源是追溯工作流中过程步骤、输入输出数据等信息的过程[3];在网络环境下,数据溯源是追溯产生网络资源的实体、活动及机构信息[4,5]。
与空间数据溯源相关的研究早期可以理解为数据志(data lineage)。20世纪80年代末90年代初,Lanter在GIS中针对数据志围绕地图图层的衍生过程开展了相关研究[6]。在《地理信息元数据》中国国家标准中,数据志记录了数据的历史沿革信息,包括获取或生产数据使用的原始资料说明、数据处理中的参数、步骤及负责单位的相关信息等。万维网联盟将数据溯源定义为记录数据生产、数据变化和数据传递过程中所涉及的个人、责任机构、数据实体以及相关活动等信息,是保证数据获得可靠性、建立信任和实现责任制的重要基础。维基百科中将数据溯源定义为科学工作流过程记录的发生在数据转换、数据分析及数据解释等过程中的历史数据。国内早期工作也将空间数据溯源称为空间数据起源[7]。
本文将空间数据溯源定义为空间数据产品的历史衍生信息。衍生信息包含的范围较广,包括工作流或网络环境下数据生产过程中使用的方法步骤、工作环境、数据来源、数据生产者等信息,甚至可包含数据生产者的制图行为、包含位置信息的传感器资源和用户自发地理信息等信息。在这些溯源信息的帮助下数据使用者可更为方便地了解数据产品具体的生产过程,有效评估数据产品的可信度与质量。
2 空间数据溯源概述
传统的数据溯源研究多集中在数据库系统领域[2,8,9],随着近几年信息基础设施的发展,科学工作流领域的数据溯源研究正在逐渐得到科学家的关注[10-13]。在服务科学中,《科学》杂志指出数据溯源是服务产品质量控制的重要元素[14];美国国家科学基金会工作组认为一个健壮稳定的数据基础设施应该具备支持数据溯源的能力[15]。多个国际会议都以此为主题展开研究讨论:数据溯源与标注研讨会(IPAW)(2002年至今)、数据溯源理论和实践研讨会(TaPP)(2009年至今)、数据溯源挑战研讨会(2006-2010),语义网与数据溯源管理专题讨论会(SWPM)(2009年至今)。W3C数据溯源工作组于2013年正式发布了数据溯源模型推荐标准[16]。
在地理信息科学领域,科学家也开始关注数据溯源技术与地理科学数据系统的结合应用。美国国家科学基金会地学部联合信息基础设施办公室启动大规模的“地球立方”计划筹备工作,地学数据溯源是其优先考虑的研究方向之一[17]。在地理信息科学网络信息基础设施建设中,空间数据溯源是一个关键研究挑战[18]。国际开放地理信息联盟OGC在第九、十阶段的网络服务互操作试验中先后开展数据溯源的相关研究。
2.1 空间数据溯源研究内容
(1)溯源建模。在不同应用领域,针对不同应用需求的数据溯源有着不同的建模和表达方法。数据溯源表达包括溯源模型建立和实现方法。溯源模型能够支持在数据产品之间的溯源关系查询和数据处理过程中的溯源信息查询,代表性的数据溯源模型有:W3C PROV Data Model (PROV-DM)[4]、ISO 19115 Lineage Model。
(2)溯源信息捕获。在数据量较小的情况下,使用人工或者自动化方式记录溯源信息都是可行的。然而在开放网络环境下由于数据量较大及数据处理操作频繁且复杂,使得人工捕获和记录溯源信息非常困难,因此如何高效自动地捕获数据溯源信息是数据溯源的一个重要研究内容。为实现自动捕获溯源信息,需要在科学工作流引擎中以及数据处理服务中添加相应的溯源信息捕获功能。
(3)溯源信息存储。溯源信息通常被看做是元数据的一种,并与其他的元数据紧密相关。溯源信息既可以存储在已有的元数据目录数据库中,也可以存储在独立的存储系统中,专门用于存储管理溯源信息的系统称作数据溯源仓库。这两种存储方式都应该支持溯源信息的分布式存储,由于溯源信息量很大,所以溯源信息存储系统的数据处理能力以及请求响应能力要足够强大才能满足开放网络环境下溯源查询的要求。
(4)溯源信息查询。溯源信息查询的设计应该考虑到查询接口、查询语言、可查询和可返回的溯源信息内容。查询接口定义了溯源查询的协议和操作方法;查询语言,比如结构化查询语言SQL,定义了数据类型;溯源信息内容取决于溯源模型和溯源信息的表达要求。
(5)溯源信息可视化。溯源信息可视化有助于用户更加清晰直观地了解数据产品的溯源信息。可视化界面的设计应该简洁易懂,用户通过简单的操作就可以查找到数据产品的溯源信息,溯源信息可视化还有助于用户更好地了解和评估数据产品。例如,孙子恒等开发了一个用于数据溯源查询可视化的原型系统GeoPWProv,可以实现不同级别的溯源信息导航和溯源信息可视化[19]。
(6)数据溯源应用。数据溯源应用包括数据质量评估、数据查询索引、数据产品拷贝和知识产权保护等[11]。在科学研究领域,数据质量评估是数据溯源的主要应用方向。数据溯源信息中的原始数据信息和历史衍生信息有助于用户评价最终数据产品的质量;在追溯数据产品生产的过程中查找发现错误异常;记录了数据生产过程中详细生产信息的工作流可以用来拷贝制作新的数据产品;包含了数据生产者信息的溯源信息可以用来保护数据生产者的知识产权。
2.2 数据溯源研究领域
(1)数据库。数据库领域的数据溯源记录了数据库中一个视图或者表的生成过程,包括使用的查询语句和查询参数。通过逆向视图的生成过程可以查询到视图中数据的源数据,进而可以选择更新视图或者删除视图。逆向视图或者表的生成过程是数据库领域中数据溯源的典型用法[8,9,11]。
(2)命令脚本。科学工作中脚本被广泛用于数据处理。科学工作流脚本本身可以进行一些简单的数据处理,将多个可执行命令和脚本结合起来可执行复杂的数据分析操作。在同一环境下,拥有数据处理功能的脚本的动作可以被脚本自动捕获。在基于脚本处理的环境中,Foster提出了Chimera系统结合分布式数据网格技术进行数据溯源应用[20];Bowers提出了科学工作流领域的Kepler系统[21]。
(3)服务。面向服务的架构允许资源和应用的分布式协同工作来进行数据处理和科学发现。科学工作流引擎能够将单独的服务串联起来形成服务链执行某一处理任务,工作流引擎在执行数据处理的同时也在捕获溯源信息,包括服务链上每一个服务使用的参数和服务的提供者等信息。Miles提出了跨领域应用的面向服务架构的数据溯源方法[22]。
(4)语义网。语义网技术包括资源描述框架RDF、网络本体语言OWL、SPARQL查询语言等。语义网技术的发展为数据共享提供了更加便捷有效的途径,同时也为数据溯源的发展提供了支撑[23]。语义网环境下的数据关联技术有助于更有效的信息查询整合[24],Zhao等提出用本体概念注释溯源日志[25]。Golbeck提出了溯源本体论,结合语义网络服务描述实现溯源信息表达查询[26]。
2.3 地学领域数据溯源研究类别(图1)
(1)地理信息系统。数据溯源在地学领域中的应用要追溯到20世纪90年代,Lanter最早提出在GIS中引入数据溯源的应用[6],Veregin等在GIS软件中进行空间分析的同时记录溯源信息,用以进行误差传播分析[27];乐鹏等提出在地理处理工作流中进行元数据追踪[28],使用元数据进行地理数据产品的可用性和可靠性评估[29],并开发了基于数据溯源信息的空间信息服务质量评价模型系统[30]。
(2)地球科学数据系统。地球科学数据系统需要长期保存管理大量的科学数据,数据溯源技术为更加有效存储管理这些数据提供支持[31],同时提高了数据集的可信度和可复演性[32]。Frew等在基于脚本的遥感数据处理工作流中添加溯源模块,实现遥感数据的溯源信息追踪[33];Tilmes等讨论了地球科学数据处理系统中的关键问题[34];Plale探讨了地球科学领域数据溯源功能设计的架构问题[35]。
(3)空间信息网络服务。地球科学领域的传统数据溯源研究多关注单机环境下的溯源信息捕获、表达和应用,然而单机环境下的数据溯源应用不支持分布式溯源信息查询共享。分布式环境下的面向服务架构为数据溯源发展提供了广阔前景[36]。在面向服务的分布式环境,数据资源和数据处理资源发展为以服务的形式提供给用户进行调用,由于数据和处理资源存储在分布式数据系统中,用户在分布式环境下进行科学数据分析处理时不必下载到本机,只需远程调用和处理这些数据资源即可[37]。狄黎平提出在网络服务工作流环境中将ISO19115和ISO19115-2溯源信息模型结合起来进行数据溯源建模[38];乐鹏提出使用基于CSW标准的OGC目录服务实现溯源信息共享[39],并通过扩展已有的空间目录服务注册模型实现溯源信息注册与发现[40]。
(4)对地观测传感网。数据溯源是传感网环境下的重要研究问题[41]。Panti用关联数据方法进行传感网数据的溯源建模和查询[42];Ledile利用溯源信息解决传感网数据存储中的数据命名和数据索引问题[43];Park等提出了一种跟踪传感网发布环境下传感网数据的变化过程的方法[44]。
3 关键研究问题
3.1 空间数据溯源模型
在地理科学领域中采用基于标准的溯源信息模型对溯源信息的处理及共享有重要意义。国际标准组织科技委员会为地理信息领域制定了一系列元数据标准。ISO 19115:2003定义了地理信息元数据标准。ISO 19115-2:2009扩充了ISO 19115:2003,在新标准中添加了图像和栅格数据元数据标准,为科学工作流数据溯源制定了专门的元数据类别。目前19115-1版本正在讨论中,其中Lineage已被从数据质量元数据包中移出,作为MD_Metadata直属的一个元数据包。ISO 19130:2010定义了地理定位图像传感器模型标准。ISO19130-2:2012补充添加了合成孔径雷达、干涉测量合成孔径雷达、光探测与测量、声呐等传感器的元数据标准,据此标准可得到记录某观测现象的传感器信息。ISO的溯源模型(图2)提供了一些简单的元素,用于描述地理数据生产过程中所涉及的过程步骤、输入输出数据及控制者等信息。
然而要全面记录地理科学数据生产以及处理过程中的溯源信息以实现地球科学数据的长久利用,仅有这些标准是不够的。其他组织通过扩展通用信息领域的溯源模型,实现了以互操作的方式进行地理科学数据产品溯源信息的存储、表达和共享。IPAW定义了主要用于科学工作流领域的开放溯源信息模型OPM。W3C组织在总结了OPM等数据溯源模型的基础上提出PROV-DM溯源模型[4],具有较好的通用性。为了实现在分布式环境下的溯源信息交换共享,通过建立模型间的映射(图3),将PROV-DM模型和ISO19115模型相结合进行数据溯源建模,两种模型的结合既满足了地理科学领域特殊的溯源信息表达需求,又实现了在分布式环境下的溯源信息共享要求[36]。
3.2 空间数据溯源层级
在面向服务的分布式环境中,地理空间数据产品经过空间处理服务生成,此环境下的数据溯源信息层次可以分为3层(图4):第一层是知识层数据溯源信息,由过程模型通过各处理节点间的控制流和数据流及空间信息服务类型和空间信息数据类型等信息抽象描述了数据产品的衍生过程;第二层是服务层数据溯源信息,其描述了数据产品经过哪些服务处理生成,既包括单个服务也包括由多个服务组成的服务链溯源信息;第三层是数据层数据溯源信息,包含了处理过程中的数据溯源信息,这些信息包括地学数据溯源数据类型、溯源数据类型及处理过程中应用的参数以及绑定值等信息。
知识层数据溯源信息记录了生成地理空间数据产品的处理模型信息,利用该层的信息,用户可查看处理模型的选择是否合适,如不合适可选择更换处理模型生成新的数据产品。服务层数据溯源信息具体描述了生成数据产品的服务链信息,得到服务类型信息,用户可结合服务性能和处理精度选择其他替代服务生成新的数据产品。数据层数据溯源信息有助于用户分析误差来源及误差传播等。
图4 空间数据溯源的3个层次Fig.4 A three-level view of geospatial data provenance
3.3 空间数据溯源粒度
捕获数据溯源信息时可以根据粒度的大小分别记录数据溯源信息。空间数据溯源的内容涉及不同空间数据类型、数据处理流程、空间处理算法、算法执行参数等,针对不同的空间数据类型,需要区分不同粒度的空间数据溯源。针对矢量数据,涉及地理要素集和要素层次的溯源信息。针对栅格数据,涉及文件和像素层次的溯源信息。具体而言:1)要素级别溯源,记录矢量图像上某一矢量要素的溯源信息。以矢量数据融合为例,对于融合产生的新数据,除了记录输入的源地理要素集和目标地理要素集外,往往需要记录细粒度溯源信息。包括几何和属性溯源信息,以查询融合结果中的地理要素是由哪两个地理要素通过何种融合处理生成,例如地理要素的几何数据来自哪个地理要素,几何融合算法参数(如最大距离)、属性数据来自源数据或目标数据中的哪个属性、属性融合方法参数(如编码转换)等。地理要素集可以理解为一个数据集,其溯源信息属于粗粒度,适用于地理要素集内的所有地理要素,而要素层次的溯源信息为单个地理要素所特有,属于细粒度的溯源信息。2)像素级别溯源,记录栅格影像上一个像元的溯源信息。针对栅格数据,以影像覆盖数据为例,一个全球的数字地形高程覆盖数据往往是由多个数字高程模型(DEM)传感器数据源联合生成,这些DEM数据源在空间范围、分辨率上存在不同,因此,在评价全球DEM数据某像素点上高程的精度时,用户需要追溯该点高程数据来自哪个数据源。在该应用中,需要记录像素级溯源信息。3)栅格影像AOI级别溯源,记录栅格影像上用户感兴趣区域的溯源信息。当部分区域来源一致时,可以建立基于区域(Area of Interest,AOI)的溯源记录(图5)。如果考虑更粗粒度,可以仅记录基于文件层次的溯源信息。
3.4 空间数据溯源服务
这些不同粒度的空间数据溯源信息,对传统的空间数据模型和GIS软件提出了挑战,在建立一个支持溯源的GIS时,需要考虑不同的表达策略、捕捉策略、存储策略和服务策略。现有的大多数数据系统并不支持数据溯源应用,随着信息基础设施在地理空间信息领域的发展,面向服务架构的数据溯源应用为空间数据溯源在信息基础设施中的发展提供了新的前景。
本文结合不同粒度的空间数据溯源信息,以开放式空间信息服务为实现环境,提出适应空间信息服务架构的空间数据溯源服务参考框架。一方面同时考虑地理要素集和要素层次的溯源信息共享,另一方面考虑在设计上实现与已有系统兼容,即与空间信息服务架构的融合。空间数据溯源的管理遵循面向服务思想(图6),溯源信息在空间数据处理服务以及服务链执行过程中被捕获,用户可以通过服务请求数据处理结果,服务链执行过程中的溯源信息被发布到网络目录服务中,传统的目录服务并不支持溯源信息相关的服务。通过扩展网络目录服务信息注册模型以兼容标准元数据目录服务接口为用户提供空间数据溯源服务。遵循一定标准的客户端通过元数据目录服务接口与目录服务进行通讯,发送溯源请求并得到返回结果。用户可以发送不同粒度的数据溯源请求来访问相应溯源信息:网络目录服务提供数据集级别的溯源信息服务,网络要素服务则提供要素级别的溯源信息服务。
本实验中,网络目录服务和网络要素服务分别由开 源 软 件 Omar[45]和 GeoServer[46]实 现。Omar提供了网络目录服务的接口,它采用PostgreSQL进行数据存储。GeoServer是一个开源GIS服务器,支持Shapefile格式或PostGIS表格形式的地理要素数据的发布。网络处理服务由空间信息处理服务平台GeoPW[47]提供。GeoPW提供了不同空间数据类型和格式的空间数据在线分析处理服务。空间信息处理服务执行的一般流程为:服务接收输入数据和运行参数,解析之后传给处理算法,并将算法执行结果重新发布为网络数据。不同层次的溯源信息在不同阶段进行捕获。数据集的溯源在算法外部捕获,记录处理服务的输入、输出、处理过程等信息;要素级别的溯源信息在算法内部捕获,记录单个要素的溯源信息。空间数据溯源服务原型系统的实现主要是对GeoPW的空间信息处理引擎进行扩展,对其执行日志进行语义标注,或通过服务代理收集各个空间信息服务提供的溯源信息。其中数据集级别的溯源信息遵循扩展的网络目录服务信息注册模型,可将其送往Omar后台数据库中,用户向该目录服务发送查询请求,即可从数据库中查找相应信息,将结果返回给用户界面。如图7显示了数据集层次的溯源信息。空间信息处理服务的输入数据可来自GeoServer提供的网络要素服务,在空间信息处理服务执行过程中,要素级别的溯源信息存放在地理要素数据的属性表中,通过对GeoServer的网络要素服务请求即可获得要素级别的溯源信息。本实验利用开源GIS工具集Geo Tools实现了要素级别溯源信息查询客户端。如图8演示了在客户端对要素溯源进行可视化的界面,用户可以点击查询相应要素的溯源信息,如图上弹出对话框所示。
图7 祖辈数据溯源Fig.7 Ancestor tracing of feature types
本文的空间数据溯源服务原型系统可与已有的空间信息服务架构兼容。在使用目录服务存储和管理地理要素集溯源信息时,对网络目录服务信息注册模型进行了针对地理数据溯源模型的扩展,从而能够基于互操作接口访问空间数据溯源信息。要素层次的溯源信息与现有地理要素数据结构耦合,在缩减溯源信息存储空间的同时,从溯源层面丰富了现有的地理要素模型,能利用现有的空间数据管理软件进行溯源查询。通过重用现有的数据模型及服务架构,该溯源服务原型系统既能实现地理要素集和要素层次溯源信息的自动捕获和共享,也为其他溯源系统的构建提供了可借鉴的方式。
4 结语
空间数据溯源是地理科学数据管理和处理的重要研究内容。本文详述了空间数据溯源的研究现状,包括空间数据溯源的概念、研究内容、研究领域、已有的成果以及关键研究问题。其中在关键研究问题中指出一个基于标准的数据溯源模型是实现科学数据产品间溯源信息共享的基础。不仅如此,文中提到了分布式环境下空间数据溯源的分层思想和溯源信息粒度理论,为数据溯源系统的设计提供了科学依据。地理空间领域信息基础设施的发展为数据溯源应用带来了新的挑战,文中提到的关键问题为空间数据溯源未来的发展提供了新的方向和指导方案。
[1] TATEM A J,GOETZ S J,HAY S I.Fifty years of earth-observation satellites views from space have led to countless advances on the ground in both scientific knowledge and daily life[J].A-merican Scientist,2008,96(5):390-398.
[2] BUNEMAN P,KHANNA S,WANG-CHIEW T.Why and Where:A Characterization of Data Provenance[M].Database Theory-ICDT 2001.Springer Berlin Heidelberg,2001.316-330.
[3] CHEBOTKO A,SIMMHAN Y,MISSIER P.Guest editorial:Scientific workflows,provenance and their applications[J].IJ Comput.Appl.,2011,18(3):130-132.
[4] MOREAU L,MISSIER P.“PROV-DM:The PROV Data Model”[EB/OL].http://www.w3.org/TR/prov-dm/,2012-12-31.
[5] GIL Y,GROTH P.Using provenance in the Semantic Web[J].Web Semantics:Science,Services and Agents on the World Wide Web,2011,9(2):147-148.
[6] LANTER D P.Design of a lineage-based meta-data base for GIS[J].Cartography and Geographic Information Systems,1991,18(4):255-261.
[7] 乐鹏,彭飞飞,龚健雅.基于SOA的空间数据起源研究[J].地理与地理信息科学,2010,26(3):6-10.
[8] WOODRUFF A,STONEBRAKER M.Supporting fine-grained data lineage in a database visualization environment[A].Data Engineering,1997.Proceedings 13th International Conference on IEEE,1997[C].91-102.
[9] CUI Y,WIDOM J,WIENER J L.Tracing the lineage of view data in a warehousing environment[J].ACM Transactions on Database Systems(TODS),2000,25(2):179-227.
[10] YUE P,BAUMANN P,BUGBEE K,et al.Towards intelligent GIServices[J].Earth Science Informatics,2015.DOI:10.1007/s12145-015-0229-z.
[11] SIMMHAN Y L,PLALE B,GANNON D.A survey of data provenance in e-science[J].ACM Sigmod Record,2005,34(3):31-36.
[12] YUE PENG,HE L L.Geospatial data provenance in cyberinfrastructure[A].Geoinformatics[C].17th International Conference on.IEEE,2009.1-4.
[13] DI L P,YUE P,RAMAPRIYAN H K,et al.Geoscience data provenance:An overview[J].Geoscience and Remote Sensing,IEEE Transactions on,2013,51(11):5065-5072.
[14] FOSTER I.Service-oriented science[J].Science,2005,308(5723):814-817.
[15] Task Force on Grand Challenges,NSF Advisory Committee for Cyberinfrastructure[R].Arlington,VA,USA,2011.116.
[16] W3C.W3C Provenance Working Group[EB/OL].www.w3.org/2011/prov/,2011-12-31.
[17] EarthCube[EB/OL].http://earthcube.ning.com,2011-12-18.
[18] ANSELIN L,REY S J.Spatial econometrics in an age of Cyber GIScience[J].International Journal of Geographical Information Science,2012,26(12):2211-2226.
[19] SUN Z H,YUE P,HU L,et al.GeoPWProv:Interleaving map and faceted metadata for provenance visualization and navigation[J].Geoscience and Remote Sensing,IEEE Transactions on,2013,51(11):5131-5136.
[20] FOSTER I,VOCKLER J,WILDE M,et al.Chimera:A virtual data system for representing,querying,and automating data derivation[A].Scientific and Statistical Database Management,2002[C].Proceedings.14th International Conference on.IEEE,2002.37-46.
[21] BOWERS S,MCPHILLIPS T,RIDDLE S,et al.Kepler/p POD:Scientific workflow and provenance support for assembling the tree of life[A].Provenance and Annotation of Data and Processes[C].Springer Berlin Heidelberg,2008.70-77.
[22] MILES S,GROTH P,BRANCO M,et al.The requirements of using provenance in e-science experiments[J].Journal of Grid Computing,2007,5(1):1-25.
[23] SAHOO S S,SHETH A,HENSON C.Semantic provenance for escience:Managing the deluge of scientific data[J].Internet Computing,IEEE,2008,12(4):46-54.
[24] YUAN J,YUE P,GONG J Y,et al.A linked data approach for geospatial data provenance[J].Geoscience and Remote Sensing,IEEE Transactions on,2013,51(11):5105-5112.
[25] ZHAO J,GOBLE C,GREENWOOD M,et al.Annotating,linking and browsing provenance logs for e-Science[A].Proc.of the Workshop on Semantic Web Technologies for Searching and Retrieving Scientific Data[C].2003.158-176.
[26] GOLBECK J,HENDLER J.A semantic web approach to the provenance challenge[J].Concurrency and Computation:Practice and Experience,2008,20(5):431-439.
[27] VEREGIN H,LANTER D P.Data-quality enhancement techniques in layer-based geographic information systems[J].Computers,Environment and Urban Systems,1995,19(1):23-36.
[28] YUE P,GONG J Y,DI L,et al.Automatic geospatial metadata generation for earth science virtual data products[J].Geoinformatica,2012,16(1):1-29.
[29] YUE P,GONG J Y,DI L.Augmenting geospatial data provenance through metadata tracking in geospatial service chaining[J].Computers & Geosciences,2010,36(3):270-281.
[30] YUE P,ZHANG M,TAN Z.A geoprocessing workflow system for environmental monitoring and integrated modelling[J].Environmental Modelling &Software,2015,69:128-140.
[31] BOSE R,REITSMA F.Advancing geospatial data curation[A].Proc.of PV Conf.Ensuring Long-term Preserv.Adding Value Sci.Tech.Data[C].Edinburgh,U.K.,2005.1-12.
[32] TILMES C,YESHA Y,HALEM M.Tracking provenance of earth science data[J].Earth Science Informatics,2010,3(1-2):59-65.
[33] FREW J,BOSE R.Earth system science workbench:A data management infrastructure for earth science products[A].Scientific and Statistical Database Management,2001[C].Proceedings.Thirteenth International Conference on.IEEE,2001.180-189.
[34] TILMES C,FLEIG A J.Provenance tracking in an earth science data processing system[A].Provenance and Annotation of Data and Processes[C].Springer Berlin Heidelberg,2008.221-228.
[35] PLALE B,CAO B,HERATH C,et al.Data provenance for preservation of digital geoscience data[J].Geological Society of America Special Papers,2011,482:125-137.
[36] HE L L,YUE P,DI L P,et al.Adding geospatial data provenance into SDI-a service-oriented approach[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2015,8(2):926-936.
[37] DI L,MCDONALD K.Next generation data and information systems for Earth sciences research[A].Proceedings of the First International Symposium on Digital Earth[C].Beijing,China:Science Press,1999,1:92-101.
[38] DI L,SHAO Y.Use of ISO 19115 and ISO 19115-2 lineage models for geospatial Web service provenance[A].Proc.of the IEEE IGARSS[C].Vancouver,Canada,2011.1-4.
[39] YUE P,WEI Y,DI L,et al.Sharing geospatial provenance in a service-oriented environment[J].Computers,Environment and Urban Systems,2011,35(4):333-343.
[40] YUE P,GONG J,DI L,et al.Semantic provenance registration and discovery using geospatial catalogue service[A].Proceedings 2nd International Workshop on the Role of Semantic Web in Provenance Management[C].Shanghai,China,2010.23-28.
[41] YUE P,GUO X,ZHANG M,et al.Extending PROV data model for provenance-aware sensor Web[A].Provenance and Annotation of Data and Processes[C].Springer International Publishing,2014.281-284.
[42] PATNI H K,SAHOO S S,HENSON C A,et al.Provenance aware linked sensor data[A].Proc.2nd Workshop Trust Privacy Social Semantic Web[C].2010.1-12.
[43] LEDLIE J,NG C,HOLLAND D A.Provenance-aware sensor data storage[A].Data Engineering Workshops,2005[C].21st International Conference on.IEEE,2005.1189.
[44] PARK U,HEIDEMANN J.Provenance in sensornet republishing[A].Provenance and Annotation of Data and Processes[C].Springer Berlin Heidelberg,2008.280-292.
[45] FREEBXML.The freebXML Registry 3.0(OMAR)-Documentation[EB/OL].http://sourceforge.net/projects/ebxmlrr/,2006-12-31.
[46] GeoServer.[EB/OL].http://geoserver.org/,2013-12-31.
[47] YUE P,GONG J,DI L,et al.GeoPW:Laying blocks for the geospatial processing web[J].Transactions in GIS,2010,14(6):755-772.