黑龙江土种数据库构建
——基于第二次土壤普查数据
2019-12-18
(中国科学院 东北地理与农业生态研究所 黑土区农业生态重点实验室,黑龙江 哈尔滨 150081)
0 引 言
土壤是人类及一切动植物赖以生存的自然资源,是人类获取食物等生活资料的生产基地,也是人类生息繁衍的场所[1]。土种是大比例尺土壤调查和制图的基本单元,也是土壤基本单元的系统资料。根据国务院国发1979-111号文件[2],1979年开始进行全国第二次土壤普查,黑龙江省同步进行,由土壤科技工作者按照国家统一要求的方法完成。
我国共完成2次土壤普查,第一次1958-1959年开始,是在农民群众认土、用土和改土经验上提出的。第二次土壤普查吸收了国内外当时土壤分类的优点,结合我国具体情况,既保留了土壤发生学的观点,又应用了诊断层的概念制定了全国统一的土壤分类方案,是土壤分类由定性向定量发展的里程碑[3]。黑龙江省第二次土壤普查经历了十年半的田间调查、采样和化验分析后完成,期间共计挖土壤剖面42.8万个,其中主剖面12.8万个,化验分析剖面7751个[4]。并于1990年10月出版了黑龙江土种,完成土壤志121册,专题调查报告165份,绘制土壤系列图件925幅。经研究分析,最终确定黑龙江省254个土种[5]。第二次土壤普查结束后,其成果被广泛应用于测土配方施肥、农业区划、土地利用规划、黑土资源保护、水土保持及环境保护等方面,为国家粮食安全、生态脆弱区的生态恢复以及环境保护等方面提供了重要的科学依据[6-9],但是这些宝贵的数据在使用数据库进行系统管理方面还略显不足。
本数据库主要针对第二次土壤普查的土种和典型剖面,完成了数据集和元数据集的建设。元数据集的建设参照了土壤科学数据元数据标准[10]和生态科学数据元数据标准[11]。 数据库共有7个部分组成,构建了一个以地点和土种为实体的土壤类型分布关系数据库,形成了中国土壤发生分类黑龙江土种E-R数据模型。
土种数据库建设的主要目的是以土壤最基本单元的数据为基础,逐步实现土壤多源数据的集成,形成多时段空间和属性数据融合,进而实现土壤调查数据的采集、存储、管理和维护;同时能够通过多种方式为科研人员提供准确的土壤信息。因此,建立该土种数据库是土壤学与现代信息科学相结合的具体应用,也是时代发展的必然趋势。对于土壤演变研究、指导农业生产和规划都具有重要的意义。
1 数据采集和处理方法
黑龙江土种数据库的主要数据资源来自《黑龙江土壤》[2]、《黑龙江土种》[5]、《中国土壤》[12]、《中国土种志》[13]等文献资料。数据库包括元数据集和属性数据集两部分内容。元数据集用以描述数据库中的数据内容、质量、来源和获得方法。属性数据集将收集的数据进行分类整理和补充,保持第二次土壤普查期间的原始分类和名称,完成属性表录入。参照相关资料建立了土壤发生分类和土壤系统分类对照表[1]。通过E-R模型的概念设计,数据库语言开发编程,构建了关系型的数据库系统。
1.1 黑龙江土种的划分依据
黑龙江省第二次土壤普查土种划分是依据盐化程度、碱化度、泥炭层厚度、表层有机质含量、碱化层出现深度、土体厚度及腐殖质层厚度等7个层次,3个指标/层来划分的(表1)[4]。
1.2 数据内容规范化
1.2.1 土壤分类规范化处理。目前我国有两种土壤分类方法,一种分类是土壤地理发生分类,另一种是中国土壤系统分类。这两个分类系统依据不同,从严格意义来讲很难准确比较,只能做到近似参比。数据库的建设考虑到在今后的研究中土壤分类会有更多的机会与国际接轨,为便于历史数据的使用,需要对不同的土壤分类进行参比时,可以参见引文[1,12]中相关列表和论述。
1.2.2 土种命名。黑龙江土壤分类的原则是以土壤发生分类的理论和原则为基础,把自然土壤和农业土壤统一起来进行分类。正确处理土壤分布的地带性和隐域性,土壤典型性和过渡性的关系。在进行土壤分类时,以成土条件、成土过程、剖面形态、土壤属性以及肥力特征等综合因素为依据,采取土类、亚类、土属、土种四级分类。
土种是土壤分类的基本单元,它是处于相同的或相似的景观部位以及类似的水热条件下,具有相对一致的土壤剖面形态特征和理化生物性质相似的一群土壤实体。按照土壤的发育程度,熟化程度和肥力水平来区分,并采用连续命名法的原则定义,也就是用一个短句把土种、土属、亚类及土类分类单元都概括起来,把土壤形成过程,主要特征和属性反映出来,从而看清它在土壤分类系统中的位置,在发生学上的联系和规律性,便于确定利用方向和改良措施。因此,土种一般具有相似的耕作施肥和栽培措施,土种之间主要表现为量上的差异。
1.2.3 土种的归属。土种的归属按照同一土类的土种不同土属顺序排序。土属在发生学上有相互联系,具有承上启下的作用。它既是土壤亚类的续分单元,也是土种共性归属的单位。土种的归属体现了土壤的母质状况、地形部位及侵蚀程度。在实际生产中相同的土种存在的问题和需要改进的措施表现更加一致。
1.2.4 土体构型的土层符号。土种志中定义的土层符号详细信息表2所示[13,15]。
表1 黑龙江省第二次土壤普查土种划分依据和指标Table 1 The standards and index of soil species of Heilongjiang Province in the second national soil survey
土种的描述,包括发生性状和养分性状。写明剖面构型同时说明1 m土体的质地层次构型。例如中层黄土质黑土土体构型为黑土层-淀积层-母质层,符号表示为A-B-C;剖面A 厚度30~50 cm,较疏松,有少量铁锰结核;B层紧实,铁锰结核,底层为黄土状土,有锈斑[5]。
土层后缀符号,表示土层的附加特征,以小写英文字母附注在主要土层符号的右下方。详细内容可参见表2的引文。
1.2.5 土壤理化性质定义。数据集土壤理化分析方法采用常规分析方法获得[16]。主要测有:有机质含量,全氮,全磷,全钾,pH,质地及总孔隙度等(表3)。
1.2.6 生产性状定义。能够反映出具体土种的生产性能,易种性,生产潜力及存在的问题。一般为耕性,适种作物,轮作制度,常年的产量,基础产量和肥料试验结果等,不描述区域宏观状况。
表2 土层符号Table 2 Soil layer symbols
表3 土壤理化分析方法表Table 3 Soil physical-chemical analysis
2 数据库的构建
数据库是一种按照数据结构实现数据组织、数据存储和数据管理的仓库,是用户接触与使用的最终形式。
数据模型(Data model)是用来描述数据的一组概念和定义,对某一类数据的结构、联系和约束的描述称为数据模式(Data schema)。诸如一个关系的属性表名称为关系模式,可以写成:REL(A1,A2…,Ak) 。式中:REL表示关系;A1,A2…,Ak表示在一个K度关系有K个属性,相应于k个域。用以表达数据信息的一组关系模式称为关系的数据库模式,相对应的这些关系的值域就称为一个关系数据库[17]。
2.1 数据库结构
参照相关土壤资源数据库的关系结构[3],本数据库构建了一个地点与土种的关系型数据库。该数据库可以通过地点及土壤类型等进行查询和管理,方便数据的保存和使用。
按照土壤发生分类,土类和亚类、亚类和土种是一对多的关系,土种和地点是多对多的关系。建立关系型数据库首先要明确各个数据集中对应的多种关系类型。
本数据库由7个数据集组成 。
(1)土种属性数据集
主要属性有:土类名称,亚类名称,土属名称,土种名称,土种代码。
(2)土壤基本信息数据集
主要属性有:土种名称,土种代码,土种归属及分布,耕地面积,主要特征,生产性能,植被,质地,理化性质平均值。
(3)典型剖面发生层数据集
主要属性有:具体地点,剖面代码,经纬度,发生层描述。
(4)典型剖面理化性质数据集
主要属性有:分层的理化性质指标,如有机质,全量和速效养分,质地,土壤机械组成等。
(5)地点与土种关系数据集
主要属性有:土种代码,土种名称,市县代码,市县名称。
(6)地点数据集
主要属性有:地点名称,地点代码,经度,纬度,行政区划变更名称等。
(7)典型剖面与土地利用关系数据集
主要属性有:土种名称,土种代码,土地利用,土地利用代码。
2.2 数据样本
表4和表5为数据集部分列表,说明了数据集的具体数据特征,可以根据土壤分类和地点查到土种,以及相关的各项属性。
表4 地点数据集Table 4 Location dataset
表5 典型剖面理化性质数据集 Table 5 Dataset of physical and chemical properties of typical section
3 数据库实现
实体-关系(Entity Relationship)模型,简称为E-R模型,它提供不受任何DBMS约束的面向用户的表达方法,在数据库设计中被广泛用作数据建模的工具[18-21]。
3.1 E-R模型设计
本数据库按照E-R模型进行设计,建立一个具有空间分布关系的土种关系型数据库,实现对地点,土壤类型,土种,或者地点+土种进行查找,浏览,统计。土种数据库E-R 关系概念模型的设计见图1,为了解土种的分布和属性提供便捷的数据资源。
图1 土种数据库E-R模型Fig.1 E-R model of soil species database
3.2 数据库开发
Access作为一款桌面数据库管理系统,是Microsoft Office众多的软件之一。Access采用模块化设计,整体数据库的设计与开发无需复杂的代码编写,且其视图界面非常友好,适用于简单的数据库建立开发[22-23]。
本数据库选用Access数据库进行管理,根据需求确定并搜集相应的数据资源后进行数据库的建立与实现:
(1)根据《土壤数据元数据国家标准》进行元数据的编写和编码;
(2)根据元数据,确定元数据和属性设计所需的关键字段;
(3)根据属性关键字段进行属性分类;
(4)根据元数据和属性的关键字段,设计元数据和属性的底层数据表;
(5)整理录入底层数据表,并建立相应的逻辑关系,即查询功能;
(6)进行交互界面——窗体的设计。
图2是具体数据库开发流程。
图2 黑龙江土种数据库构建流程图Fig.2 Construction of Heilongjiang soil resources database
数据存贮可以在Excel表格中录入数据,再转入到Access数据库中进行管理。可以实现属性数据的修改,增加,删除,数据查询,检索,打印和输出等。
数据库可以实现按照地点查询,按照土类或者土种剖面查询等功能,如图3示例。
图3 数据库查询结果Fig.3 Database query results
4 问题与讨论
全国第二次土壤普查是我国至今为止最为全面系统的土壤考察,获得了大量的土壤调查数据和资料,做出了大量的图件和规划。这些数据在土壤分布的自然条件、成因类型、理化性状、肥力分布、改良利用等研究方面,是一批非常有价值的数据资源,也是国家农业区划,制定土壤培肥政策,保护土壤资源的重要数据。在信息社会高度发达的今天,利用数据库技术将历史数据和现实数据系统管理并予以应用,是对研究漫长的土壤生态演变过程的有力支持。也为将来的土壤发生分类与中国土壤系统分类、美国土壤系统分类或WRB分类进行参比提供了可能。
由于年代久远,一些重要的资料很难收集。数据库建库中努力收集了第二次土壤普查采样的技术规程,方法,仔细核实了原始资料各数据字段、单位和数值;依据现行的计量单位进行了校正,并保留了计算过单位的原始数据和单位;对县市新旧名称进行了修正和核对,并建立了对比数据表;对缺失数据进行了设定规范;建立了数据库元数据文档,从而具备数据使用的可行性,保证了数据质量。
由于条件有限,土种数据库仅建立为关系型数据库,今后需要在此基础上,根据该数据资源的剖面分布,进一步构建土种空间数据库,使属性数据和空间数据相结合,更新数据资源,实现网络共享,为科学研究提供更加便捷的数据服务和支持。
致 谢
感谢著名土壤科学家张之一先生和蓝宏老师提供的第二次土壤普查的技术规程,并对文稿提出的宝贵修改意见。感谢“国家科技基础条件平台-国家地球系统科学数据共享服务平台-东北黑土科学数据中心(http://northeast.geodata.cn)”提供支撑。