APP下载

基于贝叶斯最大熵和多源数据的作物需水量空间预测

2017-10-13王景雷康绍忠孙景生陈智芳

农业工程学报 2017年9期
关键词:需水量冬小麦站点

王景雷,康绍忠,孙景生,陈智芳,宋 妮



基于贝叶斯最大熵和多源数据的作物需水量空间预测

王景雷1,2,康绍忠1,3※,孙景生2,陈智芳2,宋 妮2

(1. 西北农林科技大学水利与建筑工程学院,杨凌 712100; 2. 中国农业科学院农田灌溉研究所,新乡 453002; 3. 中国农业大学水利与土木工程学院,北京 100083)

作物需水量是灌溉工程规划、设计和管理的重要基础数据,充分利用多源数据和先验知识,快速经济地获取精度较高的区域作物需水量对于区域水资源的优化配置具有重要意义。为精确预测作物需水量,该文以长系列实际监测和校核作物系数后计算得到的作物需水量为硬数据,利用硬数据确定获得最大熵的约束条件,根据软数据获取渠道的不同(部分年份缺失的站点数据、文献中获得的数据、利用灌溉试验数据库中的作物需水量资料,采用协同克立格方法获得的数据、考虑主要地形因子和主要气象要素的影响,采用主成分分析和地理加权回归(geographically weighted regression,GWR)方法获得作物需水量数据以及遥感数据),提出不同来源软数据的概率密度函数表达方法,采用贝叶斯最大熵(Bayesian maximum entropy,BME)方法对不同来源的作物需水量信息进行有机整合。结果表明:除硬数据+文献软数据外,其他数据整合呈现一致结果。华北地区冬小麦作物需水量在豫南地区较小,中部地区黄河北岸有连片的相对高值区,山东需水量相对较高,冀东北的乐亭、唐山附近有相对低值区。除硬数据+文献软数据比不整合的精度低9.41%外,其他软数据源均可不同程度地提高整合效果,硬数据+克立格软数据、硬数据+GWR软数据和硬数据+除文献数据外的其他软数据分别比不整合的精度提高85.33%、85.75%和91.69%。对考虑地形、气象等要素的多源数据进行整合可更好地反映冬小麦作物需水量空间分布的细节,显著提高估算精度,为稀疏监测站点地区水土资源的精准管理和优化配置提供数据支撑。

数据处理;回归;整合;作物需水量;贝叶斯理论;硬数据;软数据;先验信息

0 引 言

作物需水量是水土资源平衡计算、灌溉工程规划设计与运行管理中不可或缺的基础数据[1]。国内外提出了很多测定和估算作物需水量的方法[2-6]。这些方法在其各自的应用范围内虽然都有一定的精度,但也有各自的特点:通过布设监测站点测定的作物需水量精度较高,但受人力、物力、技术手段及外部大环境影响,数据存在缺失现象[7],如20世纪80年代建立的灌溉试验数据库,虽具有一定的系统性,但不少站点在个别时间仍有缺失现象。利用常规气象观测资料采用作物系数法计算的作物需水量,尽管也具有一定精度[8],但同样存在数据缺失问题。利用遥感获取的作物需水信息多是不同空间粒度的瞬时面数据,要想获得多年平均的整个生育期需水量必须进行时空尺度转换,在时空尺度转换过程中常常产生一定程度的不确定性[9]。另外,研究论文和课题报告也是作物需水信息来源之一,但其通常是某一具体年份的历史数据,缺乏系统性。综上所述,作物需水量数据来源多,存在时空错位,系列长度短等问题,导致不少数据难以满足灌溉工程规划、设计及精细管理的实际需求。

Christakos等[10-13]提出的贝叶斯最大熵(Bayesian maximum entropy,BME)方法由于具有坚实的理论基础,既可以利用实际监测的硬数据,又可以充分利用研究对象的内在结构和机理(先验知识),在土壤科学、环境等领域得到了快速应用:Douaik等[14]将实验室分析的土壤电导率与由野外探针获得的土壤表面电导率,采用线性模型获取的具有一定不确定性的数据进行融合,结果显示,采用 BME预测精度比只使用室内监测数据的普通克里格方法精度高;徐英等[15]利用农田土壤水分的采样数据与贝叶斯神经网络法生成的数据,采用BME方法对农田土壤水分和养分进行空间预测,取得了较好的估算效果;Lee等[16]利用历史监测的最小温度数据,将完全没有缺失的数据和部分缺失的数据进行融合,评估凤凰城市的热岛效应,结果表明,与未充分利用缺失数据的传统线性克里格方法相比,精度提高了35.28%。Yu等[17]将实际测定的台湾省台北市城区的PM10和PM2.5数据作为硬数据,根据不同土地利用类型面积与PM10和PM2.5含量之间的关系构建回归模型,计算获得的PM10和PM2.5作为软数据,对台北市的空气质量进行了时空分析;Zhang等[18]利用华北地区2003-2012年40个站点监测得到的年平均降雨量数据和8个考虑距海岸线距离、高程等因素得到的插补数据进行融合,得到了年降雨量的空间分布。

灌溉工程的规划设计要求数据系列不宜少于30 a[19],但目前严格满足该要求的站点却很有限,与此同时,国内相关部门进行了大量研究试验,采用不同的方法或技术手段获取了大量数据,如何充分利用这些宝贵的数据一直是让人头疼的难题。由于BME既可以利用严格满足规范设计要求,精度较高的硬数据,又可以根据监测属性所蕴含的先验知识对不同来源的软数据进行硬化处理,因此BME理论的提出及在其他领域的应用为不同来源作物需水量的有机整合提供了可行的技术手段和可资借鉴的数据整合框架。本文研究目的是在充分借鉴与作物需水量密切相关的土壤、气象等领域软数据获取及软硬数据整合经验的基础上,充分考虑数据获取来源及影响作物需水量的主要因素,将不同来源的数据采用BME方法进行有机整合,以期提高大区域作物需水量的估算精度。

1 贝叶斯最大熵方法概述

依据BME理论,目前能够获取的作物需水信息通常分为2类[10,20-21]:1)广义知识,主要包括作物需水信息及其影响因子的变化规律和统计数据等;2)特定知识,是针对某一特定时间、特定空间而言,例如为了研究某一尺度作物需水信息的空间分布,在研究空间内获取的监测点的作物需水量数据就是针对这个点的特定知识。特定知识既包含硬数据也包括软数据[10]。硬数据理论上要求是真实的没有误差的数据,但由于目前监测技术的限制,监测误差较小可以忽略不计的数据也可作为硬数据使用[21]。而软数据则指包含了一定不确定性的数据,如根据专家经验估算的数据,或是根据相关理论派生的数据、使用精度不高的仪器设备监测的数据等。广义知识与特定知识的集合=∪,构成了作物需水的全部信息,本文的研究目的就是利用BME对这些不同来源的作物需水量信息进行有效整合。BME分析包括3个阶段:先验阶段(知识获取)、中间阶段(知识表达及整合)和后验阶段(信息处理)[22-24]。

1.1 先验阶段

该阶段是基于最大熵原理从丰富的广义知识中找出包含信息量最大的先验分布,同时在先验阶段将定性的知识转化为定量的数学约束。其主要任务是利用广义知识求得最大信息熵,保证将最丰富的信息融入到以后的估计过程中[20-21]。基于Shannon定义的信息熵概念[25]

式中=[hard,soft,χ]表示区域上每个点的作物需水量数据集,hard表示硬数据点的需水量数据集,soft表示所有软数据点的需水量数据集,χ表示待估点的作物需水量数据集,f表示作物需水量x的先验概率密度函数。其数学期望可表示为

(2)

要从先验知识中获取最大的信息量,就必须熵值的数学期望最大,也即在一定的约束条件下,使式(2)需达到最大值。因此这一阶段的主要目的是在这些约束条件下,确定式(2)取得最大值时的先验概率密度函数

式中g取决于先验知识;c为约束条件的总个数,与χ总个数有关;为配分函数,其作用是正则化约束,可由式(4)计算

(4)

µ是第1个拉格朗日乘子,可由式(5)求得

1.2 中间阶段

该阶段的主要任务是以适当的形式表示在特定时间、特定空间获取的作物需水信息,这些信息包括硬数据和软数据,两者构成了特定知识。硬数据通常用hard=[1,…,]T表示,软数据用soft=[χ+1,…,]T表示,特定知识的数据用data=[hard,soft]T表示[20]。

1.2.1 硬数据

硬数据严格说来是没有任何误差的实际测定数据,但对于作物需水量来说很难做到。因此,此处的硬数据是指相对准确,且不确定性很小的数据。华北地区是中国重要的冬小麦生产基地,但受季风气候影响,小麦生育期降雨少,需要补充灌溉,为了指导冬小麦的科学灌溉,各省区布设了数量不等的试验站进行需水量和需水规律试验,建成了灌溉需水量数据库。由于全生育期的作物需水量多用于灌排工程的设计及管理,根据国家标准《灌溉与排水工程设计规范》要求[19],在进行灌溉设计保证率计算时,计算系列不宜少于30 a,但中国不少灌溉试验站点试验系列并没有达到规范要求,由于本文的目的是进行不同来源数据的整合,并且FAO-56推荐的利用常规气象要素计算作物需水量的作物系数法在中国华北地区也具有一定的精度,因此本文的硬数据也包括利用常规气象要素(最长系列:1954-2013年)计算得到的计算系列超过30 a的冬小麦需水量数据。华北冬小麦适宜种植区内共有52个站点满足硬数据的条件,具体分布如图1所示,由于这里的硬数据是实际测定或计算精度高的数据,因此52个点上作物需水量取这些硬数据值的概率为1,也即Prob[hard=hard]=1。

1.2.2软数据

1)文献软数据

国内不少专家进行了黄淮海冬麦区的作物需水量试验,以关键词“华北地区”和“冬小麦需水量”从中国知网(http://www.cnki.net)数据库中全文检索,查到相关文献211条,剔除不相关的文献后,剩余28篇论文,涉及到河南19个站点、河北5个站点、山东9个站点,山西1个站点,北京2个站点。这些数据尽管有些是试验得到的实测数据,但由于这些数据与试验数据库、气象数据估算得到的数据时间或空间上不一致,并且这些数据系列均小于30 a,因此对这些数据进行处理时,采用下列原则:如果同一站点的数据较多,则按区间数据处理,其最大最小值按所有试验或估算年份中的最大值、最小值,设第个站点的最大值为u,最小值为l,则Prob(lu)=1。若站点与硬数据点重复,在数据整合时予以删除。

2)部分年份数据缺失的软数据

在华北冬小麦适宜种植区内,有5个站点(定陶、垦利、平度、费县、陵县)的试验数据缺失较多,计算数据系列没有达到30 a,这些数据尽管蕴含了较多作物需水量信息,但却存在一定的不确定性,因此将这些数据作为包含不确定信息的软数据(站点分布详见图1),这些数据简称部分年份缺失软数据。

为了构建缺失数据的概率密度函数f,根据统计学原理,设第年的作物需水量为x,则从总体样本(年份)中选出任意(<)个样本,则个样本的数学期望可表示为

var()=(2)(1 −/) (7)

式中2为总体方差,在实际应用中,样本数多为有限样本,通常用它的无偏估计量s来代替,由于相关规范规定计算系列不少于30 a,因此取30。

由于=(x−)/var()满足分布[13],则软数据的概率密度函数f可表示为:

(9)

式中f为分布的函数。这里以定陶站为例说明方差的修正过程,定陶站共有19 a的数据,根据式(6)可计算出这19 a的数学期望(平均值)为420.02 mm,根据式(8)可得到有限样本的2=638.35,利用式(9)可得到定陶站的概率密度函数为f(soft)=0.285f(0.285x−119.67)。

3)基于灌溉试验数据库的克立格软数据

由于作物需水量近似认为区域化变量,大多服从正态分布[7],其概率密度函数表示为

以“灌溉试验数据库”中67个站点的(1961-1990年)作物需水量及其生育期内主要气象要素为数据源,利用ArcGIS地统计分析模块的协同克立格工具,以日照时数、风速和高程作为协同因子对作物需水量进行空间化处理,可得到整个华北冬小麦种植区的冬小麦需水量和标准差的空间分布栅格图。为了避免选择的点过于集聚,利用ArcGIS数据管理工具中的随机取样命令在整个华北冬麦区设置如下取样条件:选取数目500个,相邻站点距离不小于20 km,获得站点数目274个,然后利用ArcGIS的空间分析模块的采样工具获得这274个站点的平均值(数学期望)和标准差,得到平均值和标准差后,根据式(10)得到软数据的概率密度函数。这些软数据简称克立格软数据。

4)基于主成分分析和地理加权回归的作物需水量软数据

空间软数据虽然包含有不确定性的数据,但是,它一般与估计的目标变量具有不同程度的相关性,蕴藏着丰富的信息。例如作物需水量与气象因子密切相关,则作物需水量的空间分布很有可能受到气象要素主导,根据影响作物需水的主导因子与作物需水量的关系获得的数据就可以作为软数据。由于回归模型可以考虑地形和气象因素对作物需水量空间分布的影响,因此本文考虑研究区内67个站点(1961-2004年)的作物需水量为因变量,站点的宏观地形要素(经度、纬度和高程)、微观地形要素(坡度、坡向和遮蔽度)和对应生育期的主要气象要素(最高气温、最低气温、平均气温、风速、相对湿度、降雨、蒸发、日照时数、日较差)为自变量构建回归模型获取软数据。由于这些影响因子之间存在相关性,而相关性的存在违背了传统的全域回归分析中影响因子相互独立的基本假定,因此首先采用主成分分析(principal component analysis,PCA)方法消除这些影响因素之间的共线性,选取其中的5个主成分,然后采用地理加权回归方法(geographically weighted regression,GWR)得到不同空间的局域回归方程,以与协同克立格同样的限制条件获得的274个样点作为验证点,获得274个样点的平均值和标准差,具体过程和步骤详见文献[27]。在获得样点的平均值和标准差后,根据式(10)获得这些样点的概率密布函数,由于GWR方法采用的是局域回归分析,与全局回归分析相比,可以更好地反映空间变异性[27],利用此方法获得的软数据简称GWR软数据。

5)遥感软数据

随着遥感、遥测和信息技术的快速发展,大量传感器应用于作物需水量的监测,软数据的获取变得更为经济、高效。吴炳方等[28]利用MODIS遥感数据,采用ET-Watch模型对海河流域2002-2005年的蒸散进行了估算。茌伟伟等[29]采用ET-Watch模型和MODIS数据对大兴地区2002-2008年冬小麦蒸散进行了遥感反演并对SWAT模型得到的结果进行了验证。陈鹤等[30]采用2006-2008年的MODIS数据,利用SEBS模型对位山灌区2 a的冬小麦蒸散进行了估算,由于难以获取冬小麦整个生育期的数字化空间分布图,因此只选取有具体估算值及标准误差的站点作为遥感软数据。虽然遥感估算的需水量也具有一定的精度,但往往仅仅是1 a或几年的数据,很难构成系列,所以本文按区间软数据进行处理。例如河北馆陶县董固监测的冬小麦需水量分别为338.1、320、252.5和320 mm,则认为馆陶董固附近冬小麦的耗水量位于区间[252.5,338.1]的概率为1,也即Prob(252.5

1.3 后验阶段

该阶段的任务是综合中间阶段获取的特定知识,根据所有知识来修正根据广义知识得到的先验概率密度函数,从而得到后验条件概率密度函数,最终实现广义知识和特定知识的的整合,一般通过贝叶斯条件化来实现

后验概率密度函数通常用下式表示

1.4 整合结果及不确定性评价

整合结果用后验概率的数学期望来表示,其数学期望为

当软数据为概率性分布形式时,其数学期望可用式(14)[14,20]表示

(14)

整合结果的不确定性通常用方差来衡量

由于研究区内满足长系列的站点数目较少,不宜采用一组数据参与建模、另一组数据进行验证的方式,因此这里采用交叉验证(Leave-One-Out)方法[22,31-32]进行整合结果的精度评价。该方法的具体步骤是每次建模时留下1个样本作为验证集,其他-1个样本作为训练集,得到验证点的预测误差,经过次重复,即可得到以下5个评判指标的具体值:均方根误差(root mean square error,RMSE)、平均方差(average variance,AVAR)、标准平均误差(standardized mean error,SME)、误差绝对值的平均值(mean of absolute error,ABSMPE)和标准误差的均方根(root mean square of standardized error,RMSSE)。各个指标的具体计算公式详见文献[22]。通常来说,RMSE和AVAR指标越小,SME和ABSMPE越接近0,RMSSE越接近1,表明整合效果越好,RMSSE小于1表明整合值大于实际值,大于1则表明整合值小于实际值。

另外,为了比较不同数据源的整合效果,借鉴Lee[24]于2005年提出的方法,该方法建议采用不同数据源得到的方差减少的百分比表示整合精度的变化,计算公式见式(16)。

式中σ为方差,1,…,4分别代表不同数据源。

2 结果与分析

为了说明不同数据的整合效果,分别利用硬数据、硬数据+文献软数据、硬数据+克立格软数据、硬数据+GWR软数据和硬数据+除文献数据外的其他软数据进行了华北地区冬小麦需水量的空间化处理并加以比较分析。

2.1 华北地区冬小麦需水量的空间分布

根据不同的数据源,采用BMELIB软件,得到了作物需水信息整合结果,不同数据源的华北冬麦区作物需水量空间分布如图2所示。

从图2可知,5种数据源得到的空间分布结果,整体上呈现豫南地区作物需水量小,中部地区黄河北岸有连片的相对高值区,山东需水量相对较高,冀东北的乐亭、唐山附近有相对低值区。图2b与图2a相比,整体趋势相似,仅在豫西、豫西南、豫北的安阳和山东济南、惠民等地出现了高值区,榆社、邢台、长治等附近低值区连成一片。出现这种状况的主要原因是豫西、豫西南的数据主要来自文献[33],该文献是通过作物模型计算得到的2003-2012年的冬小麦需水量,豫西的卢氏和栾川的冬小麦需水量分别达到了515和539 mm,豫西南的西峡也达到了481 mm,初步怀疑该地区出现这种现象是2003-2012年冬小麦平均需水量较1954-2013年的平均需水量偏高造成的。为了佐证这个观点,笔者分析了具有长系列数据的豫西的孟津、豫南的信阳和固始这2个时间尺度的年平均冬小麦需水量,发现这3个站点2003-2012年平均冬小麦需水量分别达到了500.2、418.4和402.5 mm,而1954-2013年均需水量则分别只有487.4、391.7和390.1 mm,这些地方一方面硬数据缺乏,另一方面软数据计算时段的需水量值又较硬数据计算时段高,这正是图2b与图2a相比,在豫西、豫西南出现大面积高值区的原因。由于文献数据超过30 a序列的并不多,因此安阳附近很小面积的高值区(是滑县年份较短的数据造成[34])以及邢台、榆社、长治的低值区[35-36]均可能是由于文献数据与研究系列的不一致造成的。图2c、图2d与图2a相比,豫南地区整体上变化不大,山东的中部及西北部高值区连成一片,乐亭、唐山附近的低值区变小,北京以北、保定西北等研究区边缘部分出现了部分高值区,发生这些变化的主要原因是研究区边缘满足规范要求的硬数据站点稀疏,同时附近的硬数据站点作物需水量相对较低,导致图2a的研究区北部出现较大的低值区,加之图2c、图2d所利用的克立格软数据和GWR软数据是根据“灌溉试验数据库”提供的不同系列长度的历史数据通过空间化处理获得的,而通过查阅“灌溉试验数据库”发现,天津附近、山西北部的冬小麦需水量均超过了500 mm,而这些数据在目前仍具有一定的参考价值,因此导致图2c、图2d与图2a相比在研究区北部变化较大。同时图2c、图2d与图2a相比,研究区北部变得相对破碎,特别是北京-保定-石家庄-长治一线破碎程度增加较多,保定-饶阳低值区不再连成一片,被分割开,这些地方由于软数据的利用,使得数据源有所增加,减弱了单纯利用有限的硬数据进行空间化处理造成的平滑效应,更能反映作物需水量空间分布的变异性。由于图2e是将除了文献的其他所有的软数据参与整合,因此冬小麦需水量空间分布图细碎化更严重,表明对冬小麦需水量的空间分布解释能力更强。

2.2 不同数据源整合结果比较

分别将文献软数据、克立格软数据、GWR软数据、除文献数据外的其他软数据与硬数据进行整合,为了比较整合效果,没有软数据参与整合的相关指标也列于表1。从表1可知,文献数据参与整合后,6个指标中,其中SME、ABSMPE、RMSSE指标值均大于仅有硬数据的处理,其整合效果比没有软数据参与整合的估算精度(值)低9.41%,除此之外,其他不同来源数据的6个指标均要比单纯利用硬数据的空间处理效果要好。在整合精度方面,克立格软数据、GWR软数据、除文献数据外的其他软数据参与整合比整合前的精度分别提高85.33%、85.75%和91.69%均高于85%。利用文献软数据与硬数据整合的标准差指标均偏大,其原因可能是文献数据空间点相对比较集中,并且计算或通过试验获得的监测值与文中所用的硬数据监测和分析值时间尺度不一致所造成,这也从侧面说明尽管软数据允许具有一定的误差,但在利用软数据进行整合时,必须考虑软数据的获取及处理方式,在利用区间数据处理较少时间序列的软数据时,必须考虑所选时段在整体时段中的代表性(其最大、最小区间与整个分析时间序列的区间尽可能相近)。尽管其他数据源5个指标相差不大,但相对来说,利用除文献以外的软数据要比单纯利用一种或其他某几种的整合效果要好些,硬数据+GWR软数据要比硬数据+克立格软数据和硬数据+文献软数据的整合效果好,这可能是GWR方法可以综合考虑微地形和主要气象因素的影响,能够提供微地形或气象因子发生突变地方的冬小麦需水量的细节信息有关[27]。

表1 不同来源数据整合效果比较

3 结论与讨论

本文将实际测定和计算精度较高的长系列作物需水量监测数据作为硬数据,查阅相关文献得到的站点数据、灌溉试验数据库中,缺测数值较多的站点数据和利用不同的空间化处理结果获得的站点数据作为软数据,根据硬数据得到的均值或方差作为最大熵的约束条件,求取先验概率密度函数的具体表达方式,探讨了各种不同来源软数据及其概率密度的表达方法,根据贝叶斯条件概率公式对先验概率密度函数进行修正,得到后验概率分配函数,实现了多源作物需水信息的整合。研究结果表明,除了文献软数据外,软硬数据的整合比整合前精度提高均超过85%,具有较明显的整合效果。尽管不少专家和研究机构对华北地区冬小麦进行了大量研究,积累了相关文献,但这些数据多是根据具体任务针对某一特定条件得到的数据,并且缺乏长系列的连续观测,对于本文多年平均需水量的整合具有一定影响,整合效果反而不如整合前,这说明在进行数据整合前,必须加以甄别及预处理,否则可能适得其反。由于本文分析的是华北地区多年平均需水量,而遥感数据获取的多是瞬时的作物需水量,尽管一些专家也曾对华北地区的冬小麦整个生育期的需水量进行过相关研究,但由于研究序列大都较短,并且只有很少站点具有明确的具体值,因此本文没有单独将其作为软数据参与数据整合效果的比较分析,但这不影响遥感数据是快速获取软数据的性质,特别是对于时间尺度短、空间尺度大的区域,遥感数据仍是重要的可以加以整合利用的软数据。

[1] 陈玉民,郭国双,王广兴,等. 中国主要作物需水量与灌溉[M]. 北京:水利电力出版社,1995.

[2] 孙景生,熊运章,康绍忠. 农田蒸发蒸腾的研究方法与进展[J]. 灌溉排水,1993,13(4):36-38. Sun Jingsheng, Xiong Yunzhang, Kang Shaozhong. Progress and research method in evapotransipiration in cropland[J]. Irrigation and Drainage, 1993, 13(4): 36-38. (in Chinese with English abstract)

[3] 许迪,刘钰. 测定和估算田间作物腾发量方法研究综述[J]. 灌溉排水,1997,16(4):54-59.Xu Di, Liu Yu. Review of study on calculating and estimating methods on crop evapotanspiration[J]. Irrigation and Drainage, 1997, 16(4): 54-59. (in Chinese with English abstract)

[4] Rana G, Katerji N. Measurement and estimation of actual evapotranspiration in the field under Mediterranean climate:A review[J]. European Journal of Agronomy, 2000, 13(23): 125-153.

[5] 王景雷,孙景生,付明军,等. 区域作物需水量估算存在的主要问题及可能的解决途径[J]. 节水灌溉,2005(3):4-7.

Wang Jinglei, Sun Jingsheng, Fu Mingjun, et al. Existing problems and solving methods of regional crop water requirements evaluation[J]. Water Saving Irrigation, 2005(3): 4-7. (in Chinese with English abstract)

[6] Lin Wenjing, Su Zhongbo, Dong Hua, et al. Regional evapotranspiration estimation based on MODIS products and surface energy balance system (SEBS) in Hebei plain Northeastern China[J]. Journal of Remote Sensing, 2008, 12(4): 663-672.

[7] 王景雷,孙景生,刘祖贵,等. 作物需水量观测站点的优化设计[J]. 水利学报,2005,36(2):225-231. Wang Jinglei, Sun Jingsheng, Liu Zugui, et al. Optimal arrangement of observation stations for crop water requirement[J]. Journal of Hydraulic Engineering, 2005, 36(2): 225-231. (in Chinese with English abstract)

[8] 雷志栋,罗毅,杨诗秀,等. 利用常规气象资料模拟计算作物系数的探讨[J]. 农业工程学报,1999,15(3):119-122. Lei Zhidong, Luo Yi, Yang Shixiu, et al. Calculation of crop coefficient with meteorological data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 1999, 15(3): 119-122. (in Chinese with English abstract)

[9] 刘元波. 遥感反演区域蒸散的不确定性研究[C]//2009第五届苏皖两省大气探测、环境遥感与电子技术学术研讨会专辑. 江苏省气象学会、安徽省气象学会,2009:2.

[10] Christakos G. A Bayesian/maximum-entropy view to the spatial estimation problem[J]. Mathematical Geology, 1990, 22(7): 763-777.

[11] Christakos G, Li X. Bayesian maximum entropy analysis and mapping: A farewell to kriging estimators?[J]. Mathematical Geosciences, 1998, 30(4): 435-462.

[12] Serre M L, Christakos G. Modern geostatistics: Computational BME analysis in the light of uncertain physical knowledge–the Equus Beds study[J]. Stochastic Environmental Research and Risk Assessment, 1999, 13(1): 1-26.

[13] Christakos G, Serre M L. BME analysis of spatiotemporal particulate matter distributions in North Carolina[J]. Atmospheric Environment, 2000, 34(20): 3393-3406.

[14] Douaik A, Van Meirvenne M, Tóth T. Soil salinity mapping using spatio-temporal kriging and Bayesian maximum entropy with interval soft data[J].Geoderma, 2005, 128(23): 234-248.

[15] 徐英,夏冰. 综合BME和BNN法的农田土壤水分与养分分布空间插值[J]. 农业工程学报,2015,31(16):119-127. Xu Ying, Xia Bing. Spatial interpolation of soil moisture and nutrients using BME combined with BNN[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(16): 119-127. (in Chinese with English abstract)

[16] Lee S J, Balling R, Gober P. Bayesian maximum entropy mapping and the soft data problem in urban climate research[J]. Annals of the Association of American Geographers, 2008, 98(2): 309-322.

[17] Yu H L, Wang C H, Liu M C, et al. Estimation of fine particulate matter in Taipei using land use regression and Bayesian maximum entropy methods[J]. International Journal of Environmental Research and Public Health, 2011, 8(6): 2153-2169.

[18] Zhang Fushen, Yang Zhitao, Zhong Shaobo, et al. Exploring mean annual precipitation values (2003—2012) in a specific area (36°N-43°N, 113°E -120°E) using meteorological, elevational, and the nearest distance to coastline variables[J]. Advances in Meteorology, 2015, 2016(4): 1-13.

[19] 灌溉与排水工程设计规范:GB 50288-99[S]. 北京:中国计划出版社,1999.

[20] Douaik A. Evaluation of the Space-time Variability of Soil Salinity by Statistical, Geostatistical and Bayesian Maximum Entropy Methods[D]. Ghent: Ghent University, 2005.

[21] 张楚天. 贝叶斯最大熵方法时空预测关键问题研究与应用[D]. 武汉:华中农业大学,2016. Zhang Chutian. Research on Key Issues of Bayesian Maximum Entropy Spatiotemporal Prediction and Its Application[D]. Wuhan: Huazhong Agricultural University, 2016. (in Chinese with English abstract)

[22] Tesar M L L. A Comparison of Spatial Prediction Techniques Using Both Hard and Soft Data[D]. Lincoln: University of Nebraska-Lincoln, 2011.

[23] Serre M L. Environmental Spatiotemporal Mapping and Groundwater Flow Modeling Using the BME and ST Methods[D]. Chapel Hill: University of North Carolina, 1999.

[24] Lee S J. Models of Soft Data in Geostatistics and Their Application in Environmental and Health Mapping[D]. Chapel Hill: University of North Carolina, 2005.

[25] Shannon C E. A mathematical theory of communication[J]. The Bell System Technical Journal, 1948, 27: 379-423.

[26] Manly B F J. Statistics for Environmental Science and Management[M]. Boca Raton: CRC Press, 2008.

[27] Wang J L, Kang S Z, Sun J S, et al. Estimation of crop water requirement based on principal component analysis and geographically weighted regression[J]. Science Bulletin, 2013, 58(27): 3371-3379.

[28] 吴炳方,熊隽,闫娜娜,等. 基于遥感的区域蒸散量监测方法:ETWatch[J]. 水科学进展,2008,19(5):671-678. Wu Bingfang, Xiong Jun, Yan Nana, et al. ET-Watch for monitoring regional evapotranspiration with remote sensing[J]. Advances in Water Sciences, 2008, 19(5): 671-678. (in Chinese with English Abstract)

[29] 茌伟伟,刘钰,刘玉龙,等. 基于SWAT模型的区域蒸散发模拟及遥感验证[J]. 中国水利水电科学研究院学报,2013,11(3):167-175. Chi Weiwei, Liu Yu, Liu Yulong, et al. SWAT-based simulation for regional evapotranspiration and verification by means of remote sensing[J]. Journal of China Institute of Water Resources and Hydropower Research, 2013, 11(3): 167-175. (in Chinese with English abstract)

[30] 陈鹤,杨大文,刘钰,等. 基于遥感模型的华北平原农田区蒸散发量估算[J]. 灌溉排水学报,2014,33(4):21-25. Chen He, Yang Dawen, Liu Yu, et al. Cropland evapotranspiration estimation based on remote sensing model in the north china plain[J]. Journal of Irrigation and Drainage, 2014, 33(4): 21-25. (in Chinese with English abstract)

[31] 于雷,洪永胜,耿雷,等. 基于偏最小二乘回归的土壤有机质含量高光谱估算[J]. 农业工程学报,2015,31(14):103-109. Yu Lei, Hong Yongsheng, Geng Lei, et al. Hyperspectral estimation of soil organic matter content based on partial least squares regression[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(14): 103-109. (in Chinese with English abstract)

[32] 陈鹏飞,杨飞,杜佳. 基于环境减灾卫星时序归一化植被指数的冬小麦产量估测[J]. 农业工程学报,2013,29(11):124-131.

Chen Pengfei, Yang Fei, Du Jia. Yield forecasting for winter wheat using time series NDVI from HJ satellite[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2013, 29(11): 124-131. (in Chinese with English abstract)

[33] 陈丹丹,李国强,张杰,等. 基于DSSAT 模型的河南省冬小麦需水量分析[J]. 河南农业科学,2017,46(2):153-160. Chen Dandan, Li Guoqiang, Zhang Jie, et al. Analysis on water demand of winter wheat in henan province based on DSSAT model[J]. Journal of henan agricultural sciences, 2017, 46(2): 153-160. (in Chinese with English abstract)

[34] 孙现领. 基于冬小麦产量与蒸发量相关性研究的安阳节水农业探讨[D]. 重庆:西南大学,2012. Sun Xianling. Studies Based on Winter Wheat Yield and the Evaporation Correlation Water-saving Agriculture in Anyang[D]. Chongqing: Southwest University, 2012. (in Chinese with English abstract)

[35] 梁薇. 冬小麦经济节水灌溉制度的研究[D]. 邯郸:河北工程大学,2007. Liang Wei. Study on Economical Water-saving Irrigation Schedule for Winter Wheat[D]. Handan: Hebei University of Engineering, 2007. (in Chinese with English abstract)

[36] 杨计刚. 河北省临漳县冬小麦科学灌溉制度研究[D]. 邯郸:河北工程大学,2010.Yang Jigang. The Study of Winter Wheat Science Irrigation in Linzhang City Heibei Province[D]. Handan: Hebei University of Engineering, 2010. (in Chinese with English abstract)

Spatial prediction of crop water requirement based on Bayesian maximum entropy and multi-source data

Wang Jinglei1,2, Kang Shaozhong1,3※, Sun Jingsheng2, Chen Zhifang2, Song Ni2

(1.,,712100,; 2.,,453002,; 3.,,100083,)

Crop water requirement is an important basic data for planning, design and management of irrigation engineering. Obtaining high-precision regional crop water requirement prediction using multi-source data and the priori knowledge has great significance for optimal allocation of regional water resources. In the paper, multisource data was integrated using the Bayesian maximum entropy (BME) method for crop water requirement prediction. A long series of crop water requirement measured and calculated by using the crop coefficients adjusted for actual measurement, were taken as the hard data. The soft data included the missing data in partial years for some stations, literature data, the Kriging interpolation data considering the main influence elements of crop water requirement, the crop water requirement data based on the principal component analysis (PCA) and geographically weighted regression (GWR) method, and the remote sensing data. For the soft data from different sources, the expression method of probability density function was put forward and the crop water requirement information from different sources was well integrated using the BME method. Hard data for the period of 1954-2013were collected from measurements from the irrigation stations in North China. Soft data for winter wheat in North China were also collected by searching literatures and the others. The results showed that spatial distribution of crop water requirement in North China was almost consistent for the hard data, hard data + Kriging soft data, hard data + GWR soft data and hard data + the soft data except for literature data. In the southern Henan had smaller crop water requirement, but the middle part (northern part of the Yellow River) of the North China was relatively high. The crop water requirement was relatively high in Shandong but low in the northeast of Hebei such as Leting, Tangshan. The results from hard data + literature soft data were slightly different from the others and the difference might be because the time periods used were different. In general, the integration accuracy of hard data + literature soft data was 9.41% lower than that based on hard data only. Hard data integrated with the other soft data could improve the integration effect. In particular, the integration accuracy of hard data + Kriging soft data, hard data + GWR soft data and hard data + the soft data except for literature data increased by 85.33%, 85.75% and 91.69%, respectively. The integration of multi-source data through considering the terrain, meteorological factors and etc, can could better reflect the spatial distribution of crop water requirements for winter wheat, and significantly improve the estimation accuracy of crop water requirement for winter wheat. The presented method provided the most important basic data for the precise management and optimization of water and soil resources in the region with sparse monitoring stations. In the paper, we need pay attention to some questions in the soft data processing. The partially missing data of some stations need amend the variance calculation results. In order to avoid the agglomeration phenomenon, the selection of interpolation data need adopt the method of random sampling, and at the same time, the distance between adjacent samplings must be limited, should not be too far or near, and 20 km was advisable. In order to avoid too big error and uncertainty, the literature data must be screened and pretreatment, otherwise, the integration effect may be affected.

data processing; regression; integration; crop water requirement; BME; hard data; soft data; prior information

10.11975/j.issn.1002-6819.2017.09.013

O212.8; S165+.22

A

1002-6819(2017)-09-0099-08

2017-04-09

2017-04-20

水利部公益性行业科研专项经费项目(201501016);国家自然科学基金(51609245);中央级科研院所基本科研业务费专项(FIRI2016-09);河南省基础与前沿技术研究(162300410168)

王景雷,男,河南通许人,研究员,主要从事节水灌溉及作物用水要素的空间变异性研究。新乡 中国农业科学院农田灌溉研究所,453002。Email:firiwjl@126.com

康绍忠,男,湖南桃源人,中国工程院院士,教授,博士,主要从事农业节水与水资源可持续利用研究。北京 中国农业大学水利与土木工程学院,100083。Email:kangshaozhong@tom.com

王景雷,康绍忠,孙景生,陈智芳,宋 妮.基于贝叶斯最大熵和多源数据的作物需水量空间预测[J]. 农业工程学报,2017,33(9):99-106. doi:10.11975/j.issn.1002-6819.2017.09.013 http://www.tcsae.org

Wang Jinglei, Kang Shaozhong, Sun Jingsheng, Chen Zhifang, Song Ni. Spatial prediction of crop water requirement based on Bayesian maximum entropy and multi-source data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(9): 99-106. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2017.09.013 http://www.tcsae.org

猜你喜欢

需水量冬小麦站点
基于Sentinel-1A数据的冬小麦种植面积提取
不误农时打好冬小麦春管“第一仗”
南京城市中心区生态需水量探析
辽河流域生态需水量计算及水资源分配研究
基于Web站点的SQL注入分析与防范
贵州番茄需水量时空分布特征
积极开展远程教育示范站点评比活动
成都市生态需水量研究
首届欧洲自行车共享站点协商会召开
甘肃冬小麦田