水利空间数据库建设探讨
2010-04-04宁方贵刘媛媛
宁方贵,刘媛媛
(水利部松辽水利委员会,吉林长春 130021)
1998年,著名的“数字地球”概念提出的同一年,张勇传院士在我国率先提出了“数字流域”的概念[1]。尽管诸如美国田纳西河、非洲尼罗河、欧洲多瑙河及我国的黄河、长江等大江大河都进行了数字流域的研究、工程建设及管理,并取得了一定的成就,但作为“数字地球”一个最近似的、完善的、结构体系庞大而全面的缩影,“数字流域”的概念和标准体系结构至今尚无定论。李纪人在《中国数字流域》一书中给予了如下定义:“‘数字流域’将是一个以流域空间信息为基础,以流域水循环机制为纽带,以流域水事务管理为驱动,融合流域内各种数字信息的系统平台,是对真实流域及其相关现象的统一的数字化重现”[2]。对流域的数字化重现和研究,基底在于流域空间及非空间数据的信息化及建立其上的流域模型,其发展根本立足于水利空间数据库的建设和有效使用。得益于飞速发展的数据库技术,水利专题空间数据库也进行了相当的建设,但受种种原因的牵制,目前大多数水利空间数据库都存在各种数据问题,有些仅为某单一项目服务,重复建设严重;有些建立后难于实际应用,形成数据闲置;社会化服务和产业化程度低,不能有效服务于多层次业务需求。避免进行表面化建设和尽快解决相应建设环境是水利空间数据库建设的当务之急,也是“数字流域”发展建设的根本所在。本文从建设中存在的问题和需要强化的方面对水利空间数据库建设进行了探讨。
1 建设中存在的问题
1.1 建设内容局限影响应用扩展
水利空间数据库建设一般仅需考虑存储内容,其数据存储模式及数据模型交由应用软件服务商考虑和提供。目前大部分数据库建设都以服务于对应项目为目的,专题专库,针对性较强,但扩展性低,通用度低,缺少在统一规划下,对流域基础信息与各类水利专题信息兼收并蓄,在行业内部跨专业建设,在行业间有选择的控制建设的数据库,既因重复性建设形成资金和资源浪费,又因业务分割导致割据式建设,没有形成以应用为推动,以服务多层次多部门业务需求为要求,以满足流域开发水资源保护利用综合效益最大化为优化目标的综合空间数据库,难以推动“水利信息化资源整合与共享”的进程和“数字流域”整体发展步伐。
1.2 成果展示影响数据有效性
通常使用的以某一比例尺成果图进行建设成果展示的方式使得建设中对展示效果的期望超过数据建设本身。在数据库建设中,往往没有考虑不同比例尺和分辨率对数据精度的要求和限制,对数据进行过度的精化或概化,并且由于数据来源和数据质量控制等因素,使数据建设中掺入大量无法追溯的人为干扰因素,可能导致类似于改变真实数据空间布置及产生设计上的二义性等问题。使用单一比例尺数据可能受到显示条件的限制,而使用多套比例尺数据又必须严格控制和规范其数据一致性、数据拓扑关系及空间匹配,否则将带来极大的数据混乱,这是项目建设中无法避免会遇到的问题之一。现实空间存在复杂性,任何数字化技术都不可能完全表达其本貌,纸质地图制作使用地图概括用于因地图比例尺变化引起的表示内容及复杂度的增减。GIS多尺度、多层面特性的介入,GIS软件数据分层存储和无极缩放、可控制显示条件的功能在一定程度上解决了比例缩放带来的要素之间的空间竞争,但单一比例下的缩放必然忽略空间要素增减的“有效性”。行业要义是软件供应商无法深刻理解的,通用型商业软件也无法做到合理衡量行业空间对象概括适用程度。只能由空间数据库建设者和使用者综合考虑数据来源、应用需求和质量控制等问题,形成存在合理冗余的匹配业务应用的空间数据库。如果忽略建设目标、数据精度及内涵,元数据及数据处理手段等配套文档记录,单方面从图形的连贯和美观来决定建设方案将会带来“内容矛盾”、“冗余建设”、“人为错误”等问题。
1.3 数据结构单一影响模型建设
当前建设中,数据结构仍然停滞在单一的简单数据结构层面,即点、线、面的矢量存储结构,栅格数据仅以图片的形式作为展示背景使用。矢量结构假定坐标空间为连续空间,通过记录坐标的方式对空间要素进行描述,当空间要素被描述为线或边界时,这种结构会呈现位置明显、结构紧凑等优点,合适用来描述水系数据。但对于连续性对象如流域土壤类型分布、温度分布、土壤墒情分布、冰雪覆盖范围等情况的描述及需要网络分析的如污染物流动、防洪预案中人员疏散和物质调集等应用需求就显得有些力不从心,并使得空间数据库陷入单纯提供分布展示的瓶颈和尴尬,使GIS在项目应用中浮于浅层展示功能而没有充分使用和发挥其空间分析功能。与栅格数据相比,矢量数据存储格式因软件环境不同而存在较大差异,数据格式转换中可能会带来错误和数据丢失。数据之间是分离的,并且,同种空间地物的不同存储结构将对应用产生不可预计的影响。另一方面,数据空间信息空洞,信息挖掘忽略空间本质而浮于表面;其对应的属性数据也仅限于空间位置、级别类型等,缺少对应于模型空间特性的属性,例如点的障碍度和可通过量极值、线的流量和允许方向、连通度及时间性质等,而这些信息对于进行流域内水量、水利工程等项目的科学实时联合调度,以获得在可持续发展前提下的利益最大化流域开发成果;应对突发事件及动态分析模拟等能够起到较大的支撑作用。
2 空间数据库建设尚需完善的几个方面
2.1 加强数据时间标记管理
多时相性常常被数据建设者作为数据拼接和融合问题去考虑,而忽略其作为GIS处理对象本身的特质。实际问题本身通常也是动态、具有时间维度的。数据库的时效应该是两面的。一方面,多渠道来源的数据进入数据库,必须严格规范其时间戳管理,为数据使用和更新提供时间标记保障;另一方面,大量自动测报系统的项目实施带来了急速增长的动态监测管理信息,水利工程建设带来的建筑物及相应设施空间信息变更、属性数据连续的问题,以及数据本身所具有的生命期、发生序列及消亡点,也要求其时间标记具有明确的语义。这种时间标记包含属性数据项时间标记、实体时间标记、数据库时间标记[3]等,不仅为数据溯源和数据更新维护提供了信息支持,也为有效管理具有时间变化特性的数据,对其进行历史状态重现、演变跟踪、趋势预测做好了准备。
2.2 强化对模型的联系和支持
目前空间数据库的数据组织和模型仍然是以面向地图为主,而不是面向客观空间实体及其时空关系[4];空间数据与属性数据处于弱联系状态。尽管两者在一定程度上实现了一体化存储,但并未得到实质上的有机融合;部分空间数据和信息尚未以更适当的方式进行建设和存储,数据表义模糊。这些问题的存在使得基于GIS建立的应用系统或流域模型存在数据库与模型库相互独立的情况。因此,应充分考虑业务需求,使空间数据库的建设有利于流域模型的建立与维护,使两者紧密结合、有效集成,在某一程度上为模型参数的精度和更新,模型的效率和适用性提供保障。
2.3 建立规范,打破策略信息壁垒
水利专题空间信息的标准和规范目前尚且存在大量空白,尽快有效填补这些空白是当前水利空间数据库建设亟待解决的重要的外部环境问题。这影响到数据建设和共享两方面的进程,应尽快建立具有实际指导意义的理论框架,并在此基础上引进共享机制。尽管已经实现了大量水利信息共享服务系统和公众信息服务系统,但信息壁垒,尤其是对研究和决策起重要作用的策略信息并没有得到良好的共享和使用。这里固然有部门业务利益垄断的原因,也有数据运营建设理念上的误区。在信任和诚信的前提下,打破信息壁垒,交换取得可靠的数据也是对潜在资源挖掘的一种增值行为。通过一系列数据资源共享及保密机制的协议和契约,形成数据资源的优势互补、优势相长、风险共担、水平式有效双向或多向流动。可以增强部门之间对彼此业务意图、需求和执行步骤的理解,分摊和控制建设成本,在一定程度上改变原有建设模式和建设步骤,产生利于知识经验分享和移动的宽松环境以及共同的可持续竞争优势。
2.4 面向集约产业化发展
水利空间数据库作为“数字流域”数据库集群建设的核心,它的有效建设和应用,对行业信息化、集约化发展有着不可替代的影响和作用。社会区域化、多极化发展在客观上要求在一定的地理范围内打破行业限制、消除分歧和障碍,促使数据资源在一定框架内自由流动和有机配置。流域管理机构作为所在流域的水行政主管部门,既有突出的专业特点,又与区域层面交叉重叠,需要从高层面综合考虑如何为防汛抗旱、水资源开发保护、水环境决策及与水相关的社会经济研究提供大量可靠的可高效访问的数据,从整体进行控制和理顺。因此应以流域机构为数据中心,协同区域分中心建设具有统一结构规划、数据组织标准化、数据含义清晰、研究单元合理、可同时满足商用价值与科研支持、现实领域问题分析解决能力的水利空间数据库,使其为行业集约化和社会化发展服务。
[1]王光谦,刘家宏 .数字流域模型=The DigitalW atershed Model[M].北京:科学出版社,2005.
[2]李纪人.中国数字流域[M].北京:电子工业出版社,2009,6.
[3]邬伦.地理信息系统-原理、方法和应用[M].北京:科学出版社,2001.
[4]吴信才.面向网络的新一代地理信息系统[M].北京:科学出版社,2009.