APP下载

土壤调查成果制图软件设计与实现*

2022-04-03车紫进李会宾宋佳运

中国农业信息 2022年6期
关键词:样点制图插值

车紫进,李会宾,贾 曲,宋佳运,史 云

(中国农业科学院农业资源与农业区划研究所)

0 引言

在全国第三次土壤普查任务有序开展的背景下,根据厅级会议要求及相关文件《第三次全国土壤普查试点县成果清单及方法》,各省级单位以及县域级单位均需要根据三普采集样点成果清单进行成果提交,其中包含数据成果,数字化图件成果,文字成果,数据库成果,样品库成果。

其中数据成果与样品库是随样点采集过程自动形成,数据库成果是其他成果的数字化汇总,唯独数字图件成果的制作在基础数据完备的基础上还需要土壤学背景专家支撑和专业GIS 软件的辅助才能产出,是众多成果中得到性最困难的,偏偏这部分成果的质量好坏直接决定着“土壤家底的普查”的效果,又是最重要的。

目前根据与实际用户的访谈对接材料,发现在省级和县域级两级单位里存在这样问题:县域级缺少专家资源和财力,客观上无法在规定时间内完成数字成果产出,而省级虽然有农科院等专家支持,但是制图的效率是有限的,无法满足大量的县域要求。因此,需要一套流水线化的工具软件,来提高制图效率,降低使用门槛,同时,保证软件能够支持多人协同,在保证数据安全的前提下,进行便捷地数据共享,有效助力采样数据的成果产出。

土壤调查通常包括调查方案设计、土壤采样、土壤理化性状观测与分析、结果表达四部分内容,四部分工作内容中均涉及到方法问题。对于土壤调查,经过长期探索和实践,许多国家已经建立了规范性方法,以工作手册或国标形式对调查方案设计、土壤采样、土壤理化性状观测与分析方法、结果表达进行了规范[1-2]。近年来随着计算机技术的发展,在土壤调查过程中逐步以数字土壤制图的方法替代人工综合判图和绘图[3-4]。

数字土壤制图包括4个环节[5]:环境协同变量信息的生成,样点数据的获取,制图模型和方法的建立,土壤(调查)制图及验证。在4个环节中:①环境协同变量信息生成环节的效率瓶颈在于数据的清洗与准备,这个过程由于过于灵活,且面对的情况十分具体,尚无流程固化的可能;②样点数据的获取过程传统方式是通过文件交换,典型的有shapefile 文件,csv 文件,geopackage 文件等,在这个过程中可以通过网络接口同步的方式,提高数据交换的效率;③制图模型和方法的建立,这个环节需要较多的参数配置,且操作步骤繁琐,不仅对制图人员有较高的要求,而且往往也是效率瓶颈,因此如果能将计算参数固化和操作步骤原子化,理论上能够节约参数和计算流程配置的时间,从而提高制图效率[6];④土壤(调查)制图及验证也是一个必不可少的环节,在这个环节中,自动地进行计算结果的可视化,能够便于制图人员做结果确认和校准,从这个角度来说,也能够对整体制图效率起到提升作用。

土壤推理制图是以数学方法和空间分析为手段,利用土壤属性的空间自相关性和土壤-环境协变量关系,将点映射至面以体现土壤空间分布特征和规律的过程[7]。尽管大尺度数字土壤制图更多地借助于土壤近地传感、土壤光谱和卫星遥感技术,但野外采样点仍是至关重要的数据源。土壤样点的数量和布设规则将影响土壤空间推理模型的选择[8]。

数字土壤制图涉及比较复杂的土壤推测模型及数据准备过程,用户实际应用时通常需要借助特定的工具软件,根据其适用范围可将数字土壤制图软件分为两类。①通用的地统计软件工具,如Gstat,ArcGIS Geostatistical Analyst,GS plus等,这类软件是面向专业的地理信息系统分析人员设计和研发的,具有功能全面,强大的特点,如ArcGIS分析软件有500多个分析工具,并且支持使用python等语言进行定制化二次开发,能完成复杂的地理信息系统分析与制图需求。②专门用于数字土壤制图的软件,如FuzME,SoLIM Solutions,ArcSIE,TAL等,这类软件一般采用桌面端单机软件的设计方式,具有一定的定制化特点,但是面向用户对象仍然是以领域专家为主,同样具有很高的使用和学习成本[9]。

基于以上分析可以得出结论,已有的基于ArcGIS等专业的地理信息系统软件的制图方法具有专业性强、精度高、速度慢、效率低的特点,建模过程主要依赖于用户专业知识,导致非专家用户难以完成;软件的实现通常为单机版,用户安装配置较为繁琐,且算法库不易扩展,难以对固化算法有针对性地改进,而定制化开发软件又普遍缺少标准规范和工程化管理,无法满足广泛区域的土壤制图能力,尚缺少一款针对土壤调查数据且能够便捷部署,高效使用的制图软件系统。因此该文基于容器化技术、前后同构技术和WebGIS相关技术,开发高精度、自主可控的土壤调查成果制图软件,用于实现土壤调查成果的高效制图。

1 系统构建方法

该文中的制图软件需要满足两方面需求:①降低制图工作门槛,将图件成果的产出“流水线”化,只需投入操作员,按照流水线流程准备好相关数据,按部就班执行,就能够得到经过验证的规范制图成果;②提高制图效率,分析制图效率低的环节,有针对性地进行优化,固化计算流程和计算参数,能够显著提高制图效率。

基于样点的土壤制图方法,大致可概括为利用土壤—环境因子关系和土壤属性空间自相关性推测区域土壤的空间分布。利用土壤—环境因子关系进行制图主要利用机器学习、数据挖掘和数学模型等方法挖掘土壤属性与环境协变量的关系知识作为制图依据,利用土壤属性空间自相关性推测区域土壤的空间分布进行制图则利用给定的一组离散土壤样点建立目标属性的空间自相关模型,通过空间插值模型,如趋势面分析、克里金插值、样条函数、反距离加权法和最邻近法等制图。以上两者结合的制图法同时考虑了土壤属性的空间自相关特征和土壤与环境因子的关系,主要方法包括回归克里金插值、协同克里金插值和地理加权回归模型[10]。从模型的精度角度分析,土壤—环境模型制图法相对普通克里金法和线性回归模型更有效,回归克里金法能有效结合土壤—环境模型法和空间插值的优势,制度精度优于普通克里金法。基于土壤—环境因子间线性或非线性假设,近年来,广泛使用的方法包括线性回归模型、随机森林、决策树和人工神经网络模型等,这些模型的描述能力较低统计学方式更强,对于大量的样点数据具有很好的拟合效果[11]。文章中的土壤调查成果制图软件,基于python与typescript开发语言,对以上算法模型进行了重构实现,目的是能从更细粒度上把握算法执行细节,从而优化算法计算效率。

土壤调查成果制图软件的总体技术路线是在计算参数库、过程库和结果库基础上,采用矢量数据读写,公式计算,矢量与栅格互转化与结果可视化等技术步骤,进行土壤调查成果的分析与制图,形成一系列能够反映土壤质量,适宜性,肥力,物理与化学属性,障碍因素等信息的成果,整体技术路线图如图1所示。

图1 整体技术路线Fig.1 Technical route

2 系统实现

2.1 系统功能设计

该软件包含“土壤属性制图模块”“土壤质量评价模块”“农业利用适宜性评价模块”“土壤肥力评价模块”,等能够独立工作的功能模块,并且针对单一属性插值类型成果,集成改造了跨平台高效率算法(反比例加权,克里格插值,随机森林),研发形成了可独立部署的软件制图工具,满足“土壤类型图”“土壤属性图”“土壤障碍图”“土壤酸化图”“土壤盐碱地图”图件的制作,研发形成了组合性数据分析与制图总体系统,集成各个工具,形成总体系统平台产品,达到组合后的系统产品能够全面满足制图成果的产出,各个功能模块单独部署也能够独立完成某种特定图件制作,从而有效提高制图效率,系统的功能逻辑架构如图2所示。

图 2 功能逻辑架构Fig.2 Functional logic architecture

2.2 系统实现关键环节

2.2.1 核心算法实现

系统实现的关键环节之一是核心算法的实现,目前在土壤调查采样制图领域内,最经典的插值算法是反距离加权算法,该算法基于相近相似原理,其数学表示如下,反距离加权算法具有计算简单,易于理解解释的优点,但是其插值运算的方式会导致插值结果一般会围绕着采样点附近出现剧烈的数值突变,连续性较差,适用于洋点数量多且密集的采样情况[12]。

式(1)中,z0为某空间点上的插值结果,D为该空间点与第i个样点的距离,p为距离系数,n为样点个数;式(2)中x0与y0分别为某空间点在笛卡尔空间坐标系中的位置坐标,xi与yi分别是第i个样点在笛卡尔空间坐标系中的位置坐标

在此基础上,基于地统计学的克里格系列算法能够克服插值结果波动的问题,克里格插值算法是一种空间局部插值法,是以变异函数理论及其结构分析为基础,在有限区域内对区域化变量进行线性无偏最优估计的一种方法,其插值结果更加平滑,其核心原理的数学表示如下。

式(3)中,z0为某空间点上的插值结果,λi为第i个样点的计算权重,zi为第i个样点的观测值,n为样点个数;式(4)中,r为变异函数,λi为样点权重,Φ为计算常数项。

克里格算法已经能够较好的拟合采样结果,然而随着机器学习算法的发展,描述能力更强的算法模型如随机森林算法,在样点插值回归任务中也有了更好的表现,随机森林的本质是一种集成学习算法,是对原始数据进行S次等概率的有放回抽样得到的和原数据集大小相等的S个新的数据集集合,再将某个学习算法作用于这S个数据集得到S个分类器,综合这S个分类器进行投票决策即可得到最终的分类或回归的结果,其核心原理的数学表示如下[13]。

式(5)中,H代表目标分类器函数,T代表训练总次数,ht代表第t次训练的分类回归决策器函数,y代表样点的观测值。

系统采用了python开发语言实现了以上3种算法,并通过docker容器化方案进行了算法之间的依赖隔离,最后通过node.js 构建了算法的服务化接口用于基于HTTP/HTTPS 传输协议的算法调用。3 种算法为插值回归的基础,能够支撑多种土壤数据制图场景的开发。

2.2.2 可视化技术方案

为了能够直观地得到评价的可视化结果,需要有一套技术流程支持数据的计算,服务化,渲染,着色和最终呈现,技术路线图如图3所示。

图3 成果可视化技术路线Fig.3 Results visualization technology route

2.2.3 成果报告设计

为了让软件产出的分析成果报告能够在不同的数据使用场景中起到助力作用,让使用者能够利用多种GIS数据分析软件进行数据分析,软件设计了4种数据产出成果:①可视化结果,利用软件自带的渲染与数据处理引擎直观地可视化数据成果,支持自动与自定义两种区间着色方式,并能够通过监听鼠标在地图上的点击事件,获得某个评价单元上的综合评分信息;②技术报告,将评价过程所有中间参数存储下来,以技术报告形式展现出来,保证评价结果具有重放性;③综合报告,是综合评价过程中软件系统录入的信息,显示可编辑的结果报告,用于提高工具使用者的报告撰写效率;④以标准的数据共享格式存储的原始数据以及计算结果数据,用于数据存档以及与其他系统进行数据交换。

2.3 系统测试

“土壤调查成果制图软件”采用黑盒测试中等价类划分,边界值分析,错误推测等测试方法,分别通过了功能性测试,可靠性测试,易用性测试及用户界面测试,在软件的安全性,兼容性方面均得到了充分地测试和验证。

3 结论与讨论

土壤调查成果制图软件能够提高土壤调查数据分析与成果图产出的效率,本文的设计与实现表明:①土壤调查成果制图具有统一的模式,可以通过“插值回归—数据计算—渲染分析”3个环节统一描述。②土壤调查成果软件能够针对以上3个环节,通过固化计算过程的方式简化数据计算与数据处理的链路,从而提高制图过程的效率,降低软件使用的成本,扩大的软件使用对象的范围。

在“土壤调查成果制图软件”的开发中,主要应用了3种关键技术:①基于虚拟化的算法依赖隔离技术,该技术解决了算法开发难以跨平台和部署迁移困难的问题。②基于流处理的矢量与栅格文件读写技术,该技术解决了大文件读写时内存容量限制的问题。③基于webgl的栅格数据渲染着色技术,该技术缩短了栅格数据服务化过程中样式设置流程,解决了web应用中栅格数据样式更新的时效性问题。以上3种技术的组合成功地将算法及其执行环境的封装,大文件数据处理,和结果可视化3个维度统一组织起来,构建出了该软件的技术框架。

土壤调查成果制图软件研发过程中沉淀的关键技术在智慧农业的其他应用场景下均具有很强的应用潜力:①基于虚拟化的算法依赖隔离技术,该技术能够支撑多源算法的管理。②基于流处理的矢量与栅格文件读写技术,该技术能够支撑多种GIS 数据处理自动化流程的研发。③基于webgl的栅格数据渲染着色技术,该技术能够支撑不同的数据可视化模块的研发。

猜你喜欢

样点制图插值
小麦条锈病田间为害损失的初步分析
基于空间模拟退火算法的最优土壤采样尺度选择研究①
无声手枪如何消音?
基于Sinc插值与相关谱的纵横波速度比扫描方法
小明巡山记
基于分融策略的土壤采样设计方法*
二向反射模型在土地覆被制图中的应用
一种改进FFT多谱线插值谐波分析方法
基于四项最低旁瓣Nuttall窗的插值FFT谐波分析
工程制图课程教学改革探析