网格空间信息工作流研究
2011-07-15张富,周进
张 富,周 进
(华北水利水电学院,河南郑州 450011)
网格空间信息工作流研究
张 富,周 进
(华北水利水电学院,河南郑州 450011)
在现有Grid,Workflow,Web Service和OpenGIS等技术的基础上提出网格空间信息工作流的概念.给出了网格空间信息工作流的类型和技术特征.分析了网格空间信息工作流的体系结构和支持技术.
空间信息;网格;工作流;OpenGIS;Web Service
经历过WebGIS,ComGIS和 EmbedGIS等几个阶段的发展,GIS已经完成了功能与用户界面、功能与数据的分离,逐渐从一个大的混合体分离为若干个相互独立又能有机集成的可复用功能组件(服务),GIS的下一步进化将是功能和业务逻辑的分离,其重点是空间信息服务的建模问题[1].Ahmed等研究了GIS的空间过程支持问题[2].Argent等讨论了协同的决策支持过程模型及其应用[3].Coleman等开发了基于工作流的空间数据管理系统[4].Visser等研究了地理空间过程的语义问题以及和专业模型的集成方法[5].这些研究都是从某一个侧面进行的,没有一个统一的框架.
工作流是业务过程的一个计算机实现,是一种对工作进行优化的方法:通过加强各个工作之间的通信和交流,形成协同,从而达到优化.它反映业务过程的如下几方面的问题:业务过程要做什么,怎么做,由谁来做,做得怎么样[6].工作流最大的优点是实现了应用逻辑与过程逻辑的分离,可以在不修改具体功能的情况下,通过修改业务模型来改变系统功能.
因此,将工作流技术与GIS技术结合,建立空间信息工作流管理系统,提供对空间业务的定义、管理、执行和控制功能,可以使GIS发展中遇到的上述问题得到有效解决.而OpenGIS规范定义的分布式异构空间数据访问和互操作标准,为空间信息工作流的实现提供了互操作接口和协议方面的支持;Web Service技术的发展解决了分布式空间信息服务之间的通信和交互问题;网格为空间信息工作流的定义、执行提供了计算环境.
1 工作流技术
工作流技术发端于20世纪70年代中期办公自动化领域的研究工作,工作流思想最早出现在1968年Fritz Nordsieck利用信息技术实现工作流程自动化的想法[7].早期的工作流技术主要应用于图像处理领域和电子邮件领域.
1993年8月,工作流技术标准化的工业组织——工作流管理联盟(Workflow Management Coalition,WfMC)成立[8].1994 年,工作流管理联盟发布了用于工作流管理系统之间互操作的工作流参考模型,并相继制定了一系列工业标准.
目前对工作流没有完全统一的定义,对工作流的不同理解形成了不同的定义.
WfMC给工作流下的定义是:工作流是一类能够全部或者部分自动执行的业务过程,它根据一系列过程规则,文档、信息或任务能够在不同的执行者之间进行传递与执行[9].
清华大学的范玉顺教授给工作流下的定义是:工作流是一种构建业务过程的计算机化的模型,它是为了在计算机环境支持下实现业务过程集成与业务过程自动化而建立的可由工作流管理系统执行的业务过程[10].
虽然不同组织或个人给出的定义不同,但本质上差别并不大.工作流技术也可以看成是一种大粒度的编程模式,它们都是为了达到用户的某个目的对所用资源进行抽象并按照一定的逻辑关系协调执行,且都提供系统运行平台、开发平台和一定的建模工具与设计方法等.工作流可以成为应用程序之间的“黏合剂”.
2 网格空间信息工作流
如图1所示,网格空间信息工作流(Grid Spatial Information Workflow,GSIW)是空间信息工作流和网格相结合的产物,它处于科学工作流、网格工作流以及Web Service工作流的交叉部,它是建立在网格这一平台基础之上的一种新的空间信息应用形式.GSIW关注的是如何将网格环境下的空间信息业务过程用计算机能理解和执行的形式表达出来,进一步说,它关注如何准确表达用户的空间信息业务逻辑,如何对多个由网格资源来实现的活动进行协调,如何对运行在网格环境下的流程进行监控等一系列问题.
图1 GSIW工作流、Grid工作流、科学工作流以及Web Service工作流之间的关系
从整体上来讲,GSIW的研究还没有被正式提出,现有的研究主要集中在网格和空间信息服务的集成框架方面[11-12].笔者尝试以现有文献为基础给出网格空间信息工作流的定义并分析其体系结构.
目前国内合成材料市场消费保持较快增长,进口持续放缓,市场压力缓解,供需平稳。根据当前原油、煤炭等原材料价格趋势分析,后市合成材料市场价格将保持高位运行态势,涨势趋缓。
定义1 空间信息工作流(Spatial Information Workflow,SIW)是空间信息业务过程的一种计算机化的表示模型.它把一个完整的空间信息业务过程分解成定义良好的任务、角色、规则、活动、数据流和过程等元素来进行描述、建摸、执行和监控.这些元素包括完整的业务过程中每一个步骤的定义、步骤间的执行顺序、执行条件、数据流的路径、每一步骤由谁负责以及每个活动所需的应用程序和资源等,其目的是实现业务的集成、功能的增值(集成单一功能以形成新的、功能更强大的功能)、协同合作以及流程的自动化.
SIW是涉及多任务协调执行的活动,这些任务分别由不同的处理实体来完成.用来执行任务的处理实体可以是人,也可以是一个应用程序.
定义2 网格空间信息工作流(Grid Spatial Information Workflow,GSIW)是在网格环境下,利用网格来连接分布式的空间信息资源和服务,通过构建空间信息工作流来实现分布式空间信息资源的共享和协同合作.
GSIW与商业工作流的区别表现在:①GSIW以数据为中心,商业工作流是以指令和消息为中心;②GSIW的各个部分都是空间相关的,并受到空间语义的约束;③GSIW中的活动与子流程是以特定的空间操作或空间分析模型为主的,处理对象类型繁多、算法复杂[13].
GSIW的提出就是要打破传统GIS封闭性的体系结构,其示意图如图2所示.GSIW试图充分利用Grid这个开放的、分布的、共享和协作性的信息基础设施,虚拟化分布式的空间数据集、服务、模型和文档等数据和资源,使之能够在OGSA/WSRF框架内注册和发现;其实施途径是:扩展空间信息服务(GI Services)使之能够和OGSA/WSRF无缝集成;引入工作流的思想和方法,实现网格空间信息服务(Grid GI Services)的综合利用和知识发现,提供高级的空间信息经验服务(GI Experience Services)和空间信息知识服务(GI Knowledge Services);采用门户的方式作为应用的总入口,自下而上的构建空间信息应用,实现空间信息资源和服务的分布式管理、动态组合和按需集成.其最终目标就是要实现服务集成、功能增值、协同合作以及流程的自动化.
图2 网格空间信息工作流
按照应用类型的不同,GSIW可分为3种类型:
1)事务型.事务型GSIW是指数据格式转换、备份等事务性的空间信息过程.它按照预先定义好的流程,程序性地组合空间分析功能、命令或者服务,以达到对结构化的空间数据进行加工和处理的目的,通常不需要专业领域的知识.
2)决策型.决策型GSIW是指与空间操作和空间分析模型相关的辅助决策型应用(如区域规划、资源配置等).它通常是一个结构化、半结构化和非结构化知识的混合体,往往涉及多目标优化和多约束条件,必须综合运用业务知识、空间信息处理技术和有效的交互手段.
3)服务型.服务型工作流往往是以位置查询、地图浏览为主的服务型应用.其重点是地图服务、描绘服务、地址编码和匹配服务以及这些服务的组合.
3 网格空间信息工作流的体系结构
GSIW试图利用网格技术来连接和访问分散在不同地方的海量空间数据、模型、功能等资源,并能够根据不同的应用需求,实现资源的动态组合和按需集成.笔者提出了图3所示的GSIW体系架构.它包括4个层次,6个主要部分:空间信息资源、空间信息门户,网格空间信息工作流,WSRF,GSDAI和OGC Web Service.
图3 网格空间信息工作流的体系结构
3.1 空间信息资源
空间信息资源包括:空间数据资源、计算资源、存储资源、处理工具和软件以及用户.其特点是种类繁多、数据量大、处理复杂、共享困难.网格环境下,空间信息资源应用的需求可以概括为[14]:①一体化的空间信息资源组织;②海量空间信息共享;③高性能的协同分析处理;④分布式的空间数据服务与功能服务集成;⑤统一、高效、按需服务的应用环境.
3.2 空间信息语义
由于空间数据的内容和来源的差异,空间数据可能存储在分布且异构的数据库系统中,如何根据用户请求返回符合需求的空间数据是GSIW重点要解决的问题.在网格环境中,空间数据的存储有自身的复杂性,存在异源、异构等多种情况,采用传统的数据库访问方法很难满足网格用户的要求.GSDAI的目标是通过网格为空间数据访问和集成提供统一的服务接口.
3.3 空间信息语法
空间信息服务的应用贯穿空间信息获取、共享、分析、处理和应用的全流程,各种空间信息服务实现了各种空间信息分析和处理功能,通过将各种空间信息服务进行组合和集成,来动态地创建空间信息应用[14].
OpenGIS网络服务(OWS)是一个基于开放标准的在线空间信息服务框架,这个框架允许无缝集成在线地理处理和位置服务.OWS的目的是提供一个与厂商无关的互操作框架,该框架可以实现对各种地理数据、位置信息和分析处理功能的发现、存取、集成、分析、利用和可视化.
OWS定义了清晰的空间信息服务接口和交互规范,是从空间信息语法的角度来解决空间信息的共享和互操作问题.
3.4 空间信息语用
GSIW以一种新的结构、方法和技术来管理、访问、分析、整合分布的空间数据,实现空间信息的有效共享与互操作.
网格空间信息工作流在WS-Resource的基础上实现对资源的服务化、服务编排以及业务的建模.GSIW中,工作流管理是整个系统的核心,它实现了流程的解释和执行、任务的分配和调度.空间信息工作流试图从语用的角度来解决空间信息的共享和互操作问题.
3.5 空间信息门户
如图4所示,空间信息门户是整个系统功能的入口,提供空间数据和功能服务的发布、查询和访问功能以及元数据的收集更新和建立目录服务等.
图4 空间信息门户
利用空间信息门户,各种资源和服务就可以让任何用户在任何时间基于任何平台进行调用.
4 结语
Grid,OpenGIS和Workflow是GSIW的3个主要支撑技术,它们分别从资源连通、空间信息互操作接口标准和业务建模等方面为GSIW提供了构建思路.
网格空间信息工作流是面向空间信息领域的新的空间信息应用模式,其目标是业务集成、功能增值、协同合作以及流程的自动化.它代表着空间信息应用的发展方向.它能够将基于不同语言的,在不同平台上运行的各种空间信息分析处理程序集成起来.通过GSIW应用程序可以用标准的方式把应用程序功能和数据“暴露”出来,形成标准的应用接口,进而实现系统互操作和应用服务的集成.
GSIW作为一种新形式的空间信息应用主要用于以下几个方面:
1)需要跨机构、跨地域共享各类分布异构空间信息资源的应用.
2)需要对各种分布式空间信息资源进行远程调用、协同处理和任务建模的应用.
3)需要大量空间数据操作和分析计算的应用.
4)需要将空间信息和领域模型进行深度集成的应用.
[1]何勇.GIS过程建模与集成化研究[D].武汉:武汉大学遥感信息工程学院,2004.
[2]Zahid Ahmed,Len Wanger,Peter Kochevar.An intelligent visualization system for earth science data analysis[J].Journal of Visual Languages&Computing,1994,5(4):2-3.
[3]Argent R M,Grayson R B,Ewin S A.Integrated models for environmental management:issues of process and design[J].Environmental International,1999,25(6):693 -699.
[4]Coleman D J,Li S.Developing a groupware-based prototype to support geomatics production management[J].Computers Environment and Urban Systems,1999,23(4):315-331.
[5]Visser U,Stuckenschmidt H,Schuster C.Ontologies for geographic information processing[J].Computers & Geosciences,2002,28(1):103 -117.
[6]张绍华.网格工作流关键技术研究[D].上海:复旦大学计算机科学技术学院,2004.
[7]任莹.工作流管理系统访问控制技术研究[D].北京:清华大学软件学院,2005.
[8]刘斌.基于构件的动态工作流建模方法研究[D].青岛:中国海洋大学计算机科学系,2006.
[9]孙奕.工作流管理系统的研究与实现[D].郑州:解放军信息工程大学信息工程学院,2005.
[10]范玉顺.工作流管理技术基础[M].北京:清华大学出版社,2001:23-36.
[11]杨崇俊.网格及其对地理信息服务的影响[J].地理信息世界,2003,1(1):2 -3.
[12]金江军,潘懋.格网技术对 GIS发展的影响[J].地理与地理信息科学,2004,20(2):1 -2.
[13]Asif Akram,Rob Allan,David Meredith.Application of business process execution language to scientific workflows[J].Journal Special Issue Edited,2007,2:12 -14.
[14]唐宇.空间信息栅格(SIG)系统框架、服务体系与服务聚合技术研究[D].长沙:国防科学技术大学电子科学与工程学院,2004.
Research of Grid Spatial Information Workflow
ZHANG Fu,ZHOU Jin
(North China Institute of Water Conservancy and Hydroelectric Power,Zhengzhou 450011,China)
Based on the existing technologies of Grid,Workflow,Web Services and OpenGIS etc.,the concept of Grid Spatial Information Workflow(GSIW)was put forward.The types and technical characteristics of GSIW were presented as well as its structure and supporting technologies were analyzed.
spatial information;grid;workflow;OpenGIS;Web Service
1002-5634(2011)05-0027-04
2011-06-28
华北水利水电学院高层次人才科研启动项目(001321).
张 富(1977—),男,河南驻马店人,讲师,高级程序员,博士,主要从事规划GIS、图文工作流、信息安全方面的研究.
(责任编辑:蔡洪涛)