海洋时空过程数据模型及其原型系统构建研究
2012-08-14薛存金董庆
薛存金,董庆
(中国科学院数字地球重点实验室 中国科学院对地观测与数字地球科学中心,北京 100094)
随着“数字海洋”战略的提出与实施,海洋信息系统的基本理论(W right et al,1999;苏奋振等,2004;Su etal,2006)与系统平台(杨晓梅等,2002;杜云艳等,2004;陈戈等,2004)的研究逐渐成为研究热点,且其关键性技术也日臻完善 (苏奋振 等,2004;Su et al,2006;郑彦鹏等,2007)。但海洋信息系统的基础研究:海洋数据模型的研究却相对滞后,严重制约了海洋主题应用的分析与“数字海洋”战略的进一步实施。
海洋数据模型是海洋数据组织与分析的灵魂,也是海洋信息系统构建的基础。早期的海洋数据组织与存储基于静态的GIS数据模型(杜云艳等,2003;季民 等,2004;苏天等,2005;黄林丛等,2006),无法表达动态变化的海洋实体。随着对海洋数据的多重特性的研究(Wright et al,1997;苏奋振 等,2006a),发展了多种海洋数据模型(邵全琴,2001;仉天宇 等,2003;Wright etal,2007),解决了动态变化的海洋实体的组织与表达。但该类数据模型隔离了其内在联系,无法解决海洋实体连续动态变化的问题,尤其是动态变化模式与内在变化规律及机制的问题。
近年来,针对连续动态变化的问题,过程的思想被引入信息系统的构建与数据模型的研究。Clarmunt等(1997)讨论了时空过程的基本类型及基本时空过程的表达模式;过程信息系统阐述了时空过程的基本概念、范畴、框架体系及时空过程功能(苏奋振 等,2006b);时空过程的梯形分级描述框架根据时空粒度的差异,把时空演变过程分级抽象为4级分级描述单位(谢炯 等,2007;薛存金 等,2010)。上述研究为海洋时空过程数据模型的过程语义、分级抽象、过程数据结构的研究及原型系统的研发奠定了基础。
基于上述讨论,本文在海洋实体或现象过程特性与海洋数据过程组织分析的基础上,提出海洋时空过程数据模型思想,对海洋时空过程语义、海洋实体或现象的连续渐变表达机制及海洋数据组织结构进行探讨,并构建海洋时空过程数据模型原型系统,从而实现海洋实体或现象的过程化分析与应用。海洋时空过程数据模型的研究及其应用,一方面弥补了时空数据模型在连续动态变化表达上的不足,另一方面实现了海洋实体或现象的过程化组织与分析,为海洋实体或现象的预测预报及规律的揭示奠定基础。
1 海洋现象的过程特性
海洋现象时刻发生变化,具有“高速”动态特性。且海洋现象的动态变化,从其产生至消亡的生命周期内,是渐变连续的,呈现过程特性,与陆地上的瞬时变化(离散事件)存在明显差异,主要区别为:(1)海洋现象的动态性要比陆地上的动态性更加剧烈;(2)海洋现象的变化是渐变的过程,有其产生、成熟和消亡的生命阶段;而陆地上的变化是事件性的,事件一旦发上,则变化完成;(3)海洋现象的动态性及变化的连续性具有时空过程特性。海洋现象的前后时刻(阶段)的空间、属性信息存在明显差异,但又内在联系。比如涡旋,上一时刻(阶段)与下一时刻(阶段)涡旋的中心、边界、面积、涡度等都会发生变化,而且每个要素的变化都具有时态前后的连续性,且每一要素对涡旋的时空分析都至关重要。
海洋现象的过程特性是海洋数据的GIS存储组织设计的基础,基于离散事件(谢炯 等,2007;薛存金 等,2010)或离散过程 (苏奋振 等,2006b)的时空数据模型都无法从根本上解决海洋数据的表达与分析,因而,需要以过程为核心进行海洋数据的GIS组织。
2 海洋数据的过程组织
海洋现象的过程特性与GIS数据的离散存储存在矛盾,因而,海洋数据的过程存储前必须进行时态离散化。离散的时态海洋数据信息与海洋现象的时间尺度密切相关,适宜的时间尺度的确定对海洋数据的过程化组织至关重要。海洋现象过程的生命周期阶段:产生、发展、稳定、消弱、消亡阶段为海洋过程数据的离散化提供了时态间隔参考,根据具体的主题应用,利用时空聚合或插值实现适宜时态间隔的确定。此外,根据现象的过程特性,采用事件、规则、动力模型等多种演变机制,进行离散的时态海洋数据信息间关联组织,从而实现海洋数据的GIS过程组织,其BNF范式如下:
<Process>::= <PID><PType> <ProcessStageID><PTime(ts,te)><PFunctions>< PConstraints>
其中,Process:组织的海洋对象过程;PID:海洋对象过程的唯一标识符;PType:海洋对象过程类型,简单过程与复杂海洋对象过程,复杂海洋对象过程是简单过程的复合;<ProcessStageID>::=<ProductID>< Expand ID>< StableID>< Shrink ID><DestroyID>:海洋对象过程内部的子过程:产生、发展、稳定、消弱、消亡子过程的唯一标示符,子过程共同构成海洋对象过程;PTime(ts,te):海洋对象过程的生命周期,用来刻画海洋对象产生和消亡的时态信息;PFunctions:海洋对象过程操作,包括海洋事件、规则、动力模型、时空插值、时空聚合函数等,用来刻画海洋过程对象间的关系及内部演变序列;PConstraints:海洋对象过程的时空约束条件。
海洋对象过程的生命周期阶段(子过程)具有相同的内部组织结构,其BNF范式如下:
<SubProcess>::= <SPID>< Space(x,y,z,t)><Attributes(a,t)>< Time(ts,te)> <Pre,Next>
其中,SubProcess:海洋对象过程的子过程:产生、扩展、稳定、消弱和消亡子过程;<SPID::=< ProductID|Expand ID|StableID|ShrinkID|DestroyID>:海洋对象子过程唯一标识符;Space:子过程对象的空间信息(x,y,z)描述,及其随时间t变化的空间特性描述;Attributes:子过程对象的属性信息(a)描述,及其随时间t变化的非空间属性描述;Time:对象的时态性描述,记录子过程的生命周期;<Pre,Next>:子过程上一子过程与下一子过程指针,用来刻画过程间的内在联系。当 SPID为 ProductID时,Pre指向 NULL,Next指向Expand ID;当SPID为DestroyID时,Pre指向ShrinkID,Next指向NULL。
3 基于过程的海洋时空数据模型
3.1 海洋时空过程语义
在地球信息科学领域,海洋时空定义为海洋领域空间范围内时间演变序列,海洋过程定义为海洋现象或实体在整个生命周期内的连续渐变序列,同时结合 Clarmunt等 (1997)、苏奋振等 (2006b)和薛存金等(2010)的时空过程思想,则海洋时空过程定义为海洋领域内具有生命周期的连续渐变的海洋实体或现象的一种概念抽象。其内涵可从以下几方面理解:
(1)海洋时空过程是对满足特定条件的实体或现象的概念抽象,在现实世界中并不存在地理实体或现象与之对应。比如,海洋锋和涡旋并不是海洋时空过程,但在其完整的生命周期内可抽象为海洋时空过程,可采用面向对象技术与过程的BNF范式进行组织;
(2)海洋时空过程具有连续渐变的过程特性。这种过程不是特定的突发事件序列(Clarmunt et al,1997;Taciana etal,2004),也不是离散过程(谢炯等,2007)。利用离散事件序列或基于事件的数据模型(Peuquetetal,1995;李勇等,2007)组织海洋过程数据,会造成信息丢失,且无法揭示其内在的演变规律。这是海洋数据模型构建的背景,也是其必须考虑的核心内容;
(3)海洋时空过程的外在表现形式是海洋实体或现象连续渐变序列,信息能量的渐变则是其内在本质,需要海洋动力模型、海洋事件机制、海洋时空操作等实现;
(4)海洋时空过程具有完整的生命周期:产生、发展、稳定、消弱、消亡五个阶段,且在不同的生命阶段,信息能量的渐变机制不同。
海洋时空过程的内涵表明,构建的海洋数据模型满足:(1)刻画海洋实体或现象的连续渐变特性;(2)记录海洋实体或现象的连续渐变机制;与(3)包括海洋过程各个阶段的空间、时态、时空与过程的操作。
3.2 连续渐变表达机制
海洋现象的连续渐变表达是海洋数据模型构建的核心内容,其实现依靠海洋过程对象的分级抽象与逐级包含的思想和海洋过程内部的演变机制的实施。
海洋过程对象的生命演化包括产生、扩展、稳定、消弱与消亡阶段,称之为生命周期阶段。生命周期阶段有若干个演变序列构成,演变状态则是演变序列的载体。生命周期阶段间、演变序列间、演变状态间通过过程对象的演变机制关联,形成逐级包含的时空过程-生命周期阶段-演变序列-演变状态的分级结构。从面向对象技术与数据组织的角度分析,分级结构的海洋过程对象分级抽象为:过程对象、阶段对象、序列对象与状态对象(图1)。海洋过程内部的演变是信息能量的演变,可采用海洋动力模型、海洋事件机制、海洋时空操作等实现机制的形式化表达。从模型构建的角度分析,演变机制统一化为时空函数,并内置于模型内部。
图1 过程对象抽象及其关系
过程对象的分级抽象与逐级包含刻画了过程对象内部的层次结构与序列关系,是过程内部动力模型、事件机制与时空操作设计的前提,为连续渐变表达机制的实施奠定了基础。过程对象的ADT存储类型结构中的时空算子则是实现连续渐变表达机制的函数接口。因而,构建的海洋数据模型利用过程对象的分级抽象与逐级包含和过程对象的演变机制隐式记录海洋现象的连续渐变,而在底层存储结构中提供连续渐变机制实现的函数接口,从而实现海洋现象的过程对象与连续渐变机制的存储与表达。
3.3 海洋时空过程数据模型的组织结构
如前所述,基于过程的海洋对象组织结构不仅包括海洋过程对象系列,还包括海洋过程对象间的关联关系(包含关系与序列关系)和海洋过程对象的演变机制。海洋过程对象采用过程对象集表达,分别为过程对象(STPObject)、过程阶段对象(STPProduceObject、STPExpandObject、STPStableObject、STPShrinkObject、STPDestroyObject)、过程序列对象(STPSequneceObject)与过程状态对象(StateObject);海洋过程关联关系用关联集表达,记为RelationshipOfSTPObject;海洋过程对象的演变机制采用函数集STOperators表达,并集成于过程对象内部。图2给出海洋过程对象的组织结构。
海洋过程对象系列对应于底层存储的过程对象的对象-关系表,过程对象的空间、时态与属性信息采用抽象数据类型(Abastact Data Type,ADT)存储。不同的过程对象具有不同的ADT数据类型结构,分别为:ProcessObjectADT、ProcessStageObjectADT、 ProcessSequenceObjectADT 和 ProcessStateObjectADT。海洋过程对象演变机制的函数集内置于ADT内部,负责提供演变机制的函数接口。过程对象间关联关系采用关系表(RelationshipOfSTPObject)存储,以过程对象ID(PID、StageID、SequenceID)实现过程对象间的关联。图3给出海洋时空过程数据模型基于海洋过程对象集、关联集与函数集的存储视图结构。
图2 过程对象及其关系的存储结构
图3 海洋过程数据模型的存储视图结构
过程对象表(ProcessObjectTable)存储过程对象的元数据信息,包括过程名称及其时态信息,而过程的空间与属性信息存储在过程对象存储表(ObjectStorageTable)中,两者通过过程ID关联。过程阶段对象表(StageObjectTable)存储过程阶段对象的元数据信息,包括过程阶段对象的ID及前一阶段与后一阶段的ID、过程阶段对象的时态信息与过程阶段的特性标识。过程阶段对象的空间与属性信息存储在ObjectStorageTable中,两者通过过程阶段ID关联。过程对象关系表(ObjectRelatedTable)通过过程ID与过程阶段ID关联过程对象表与过程阶段对象表,保证了过程对象的连续渐变性;状态时间表(StateTimeTable)通过过程ID与过程阶段对象ID的关联,存储过程对象与过程阶段对象的时态信息。对象标识表(Object-TagTable)关联ObjectStorageTable与过程ID或过程阶段ID,保证了过程对象或过程阶段对象的空间、属性与时态信息的一体化存储与分析。过程对象存储表是过程对象或过程阶段对象的存储载体,存储过程对象的属性与空间信息。从地球信息科学的角度分析,海洋过程对象的空间信息要么基于矢量数据结构的点、线、面、体进行组织,要么基于栅格数据结构的像元进行组织,但无论是何种形式,都可抽象为同一的对象结构实现。对于基于栅格类型的对象结构,其属性信息标示在栅格像元上,对于基于矢量类型的对象结构,属性信息标示在对象的特征要素上。此外,过程阶段对象表隐式地存储过程对象的连续渐变表达机制实现接口,即函数类型(事件、动力模型与时空插值)接口,而在外部应用程序负责连续渐变机制的具体实现。
4 原型系统构建及其功能分析
4.1 原型系统构建技术流程
原型系统的技术实现流程如图4所示。
图4 原型系统技术流程
原型系统构建包括海洋时空过程数据库(MarineSTPDMGDB)构建和系统功能平台(MDMProtoTypeSystem)的 研 发 。MarineST PDMGDB负责海洋时空数据的过程化组织与存储,其基于Geodatabase9.2时空对象扩展组织存储结构如图5所示;而MDMProtoTypeSystem负责实现海洋现象的时空功能的分析及进一步演变规律的揭示,其功能框架结构如图6所示。
图5 M arineSTPDMGDB中数据组织结构
图6 MDMProtoTypeSystem功能框架
原型系统构建的关键技术包括海洋数据对象组织、海洋数据过程组织与海洋过程数据引擎。海洋数据的对象组织负责实现海量多源异质的海洋数据集到海洋对象数据集的转换;过程对象组织包括海洋对象数据集的过程对象的分级抽象与过程化组织存储;过程数据引擎负责实现数据库与功能平台之间过程对象的封装。
4.2 原型系统功能分析
原型系统4个功能模块框架结构(图6)中,过程对象获取是查询、分析及可视化功能实现的前提,由于底层数据库MarineSTPDMGDB直接存储过程状态对象,而过程阶段对象、过程对象的存储依靠对象关系表实现,因而,过程对象的获取、查询、分析及可视化的技术实现需要进行过程对象的封装。图7、图8与图9分别给出其技术实现流程。表1给出基于过程对象查询示例,图10给出查询结果基于多窗口的可视化分析。
基于多窗口的可视化分析结果表明:(1)冷涡1过程对象(ColdSwirl_1)在T11时刻以后消亡;(2)冷涡2过程对象 (ColdSwirl_2)在T14时刻以后消亡;(3)冷涡1过程对象在消亡过程中与冷涡2在衰减过程中在时空上相互重叠;并由此不能推断(4)冷涡1过程对象的消亡在一定程度上加剧了冷涡2过程对象的消亡。
图10 基于多窗口的时空过程对象可视化分析
表1 海洋时空过程查询示例
5 结论
随着海洋监测技术的发展,海洋数据海量与海洋信息匮乏之间的矛盾已成为“数字海洋”战略实施瓶颈问题之一,其根本原因是缺乏有效的数据结构进行海洋数据的组织与存储。海洋数据的GIS特性分析与时空过程数据模型在动态地理实体表达方面的研究,为海洋数据模型的研究奠定了基础。本文把海洋数据的过程特性应用于海洋数据模型的构建,一方面为海洋数据的过程化组织提供了理论支撑,另一面方面也为时空数据模型在连续变化地理实体的表达方面提供借鉴。目前,该模型的分级抽象和逐级包含的海洋时空过程语义已成功应用在南海中尺度涡过程的案例组织与表达(杨新忠等,2009)和ENSO过程与中国东南沿海降雨异常的过程分析(Xue etal,2012)。然而,鉴于海洋实体或现象的多维动态复杂性,设计的海洋时空过程数据模型目前仅实现了具有生命周期的连续渐变的海洋实体或现象的组织、表达与存储,而对于非周期性动态变化的海洋实体或现象,该模型还需要深入扩展。且该模型仅负责实现海洋现象连续渐变表达机制的程序接口,而连续渐变表达机制具体实现依靠海洋动力模型、海洋事件及海洋时空操作等,需要物理海洋学家的参与与设计。
Claramunt C,Parent C,Theriult M,1997.Design Patterns for Spatiotemporal Processes.Searching for Semantics:Data Mining,Reverse Engineering.New York:Chapman&Hall,415-428.
Peuquet D J,Duan N,1995.An event-based spatiotemporal datamodel(ESTDM)for temporal analysis of geographical data.International Journal of Geographical Information Systems,9(1):7-24.
Su Fenzhen,Yang Xiaomei,Xu Jun,et al,2006.Basic theory and key technologies for marine geographic information system.Acta O-ceanologicaSinica,25(2):80-86.
Taciana D,Gilberto C,Frederico F,etal,2004.Bottom-Up Development of Process-Based Ontologies.Third International Conference on Geographic Information Science.California:Regents of the University of California,64-67.
WrightD J,BartlettD,1999.Marine and Coastal Geographic Information Systems.London:Taylor&Francis,205-206.
WrightD J,BlongewiczM J,Halpin PN,etal.2007.Arcmarine:GIS for ablue planet.Redlands,CA:ESRIPress,9-20.
WrightD J,Goodchild M F,1997.Data from the deep:Implication for the GIS community.International journal of geographical information Science,11(6):523-528.
Xue Cunjin,Dong Qing,Xie Jiong,2012.Marine spatio-temporal process semantics and its applications-taking the El Nino Southern Oscilation process and Chinese rainfall anomaly as an example.Acta O-ceanologica Sinica,31(2):16-24.
陈戈,方朝阳,乔新,等,2004.一个基于卫星遥感数据的海洋大气地理信息系统平台软件-MAGIS.中国海洋大学学报,34(5):839-843.
杜云艳,苏奋振,杨晓梅,等,2004.中国海岸带及近海科学数据平台研究与开发.海洋学报,26(6):29-36.
杜云艳,杨晓梅,王敬贵,2003.中国海岸带及近海多源空间数据组合和运行的基础研究.海洋学报,25(5):29-36.
黄林丛,李莎,2006.南海海洋科学数据库数据管理和发布系统的设计与实现.热带海洋学报,25(1):71-75.
季民,靳奉祥,李云玲,等,2004.海洋GIS时空数据组织框架模型研究.山东科技大学学报(自然科学版),23(3):7-10.
李勇,陈少沛,谭建军,等,2007.事件驱动的城市公共交通时空数据模型研究.测绘学报,36(2):203-209.
邵全琴,2001.海洋GIS时空数据表达研究.北京:中国科学院地理科学与资源研究所.
苏奋振,仉天宇,杜云艳,等,2006a.海洋栅格时空层次聚合模型及其渔业应用.中国海洋大学学报,36(1):151-155.
苏奋振,周成虎,2006b.过程地理信息系统框架基础与原型构建.地理研究,25(3):477-484.
苏奋振,周成虎,杨晓梅,等,2004.海洋地理信息系统关键技术基础研究.海洋学报,26(6):21-28.
苏天赟,刘保华,翟世奎,等,2005.海底空间数据的集成与管理方法.高技术通讯,15(3):89-92.
谢炯,刘仁义,刘南,等,2007.一种时空过程的梯形分级描述框架及其建模实例.测绘学报,36(3):321-328.
薛存金,周成虎,苏奋振,等,2010.面向过程的时空数据模型研究.测绘学报,39(1):95-101.
杨晓梅,周成虎,骆剑承,等,2002.我国海岸带及近海卫星遥感应用信息系统构建和运行的基础研究.海洋学报,24(5):36-45.
杨新忠,杜云艳,苏奋振,等,2009.地理过程的案例表达与组织-以南海区海洋涡旋为例.地球信息科学学报,11(6):845-853.
仉天宇,周成虎,邵全琴,2003.海洋GIS数据模型与结构.地球信息科学,4:25-29.
郑彦鹏,刘保华,梁瑞才,等,2007.“数字海底”系统建模中的关键技术研究.海洋学报,29(1):81-85.