灌区种植结构反演优化与土壤盐分空间分布协同解析
2023-06-20张敬晓蔡甲冰常宏芳肖春安
张敬晓 蔡甲冰 许 迪 常宏芳 肖春安
(1.中国水利水电科学研究院流域水循环模拟与调控国家重点实验室, 北京 100038;2.河北水利电力学院水利工程系, 沧州 061001)
0 引言
准确、高效获取灌区作物种植结构对于区域作物长势监测[1]、估产分析[2]、需耗水管理以及精量灌溉决策等具有重要意义[3]。利用传统的层级管理方式与地面调查方法确定灌区土地利用方式与作物种植的空间信息受到一定限制[4]。遥感技术具有覆盖范围大、探测周期短、现势性强和费用成本低等优点,被广泛应用于对地观测研究中,成为当前大尺度范围内提取作物种植结构的主流技术和方法[5-7]。
根据遥感数据源不同,种植结构提取方法可以分为单一时相影像法和时间序列影像法两类[8]。单一时相影像法利用作物“关键物候期”中高分辨率遥感影像丰富的结构、纹理、几何等信息,从面向对象的角度将具有相似特征的多个像元聚合为一类,进而根据不同对象的空间特征差异对农作物进行识别和区分[9]。该方法能够识别作物生长过程中自身特有的物候状态,具有较高的分类精度和应用价值[10]。但是由于不同作物在类似物候期交叉时段影像上的光谱特征相似性较高或受背景地物干扰,可能会出现“同物异谱、同谱异物”现象,给结果带来一定的不确定性[11]。时间序列影像法较为完整地描述了作物生长状态的周期性变化,能够依据特征参量的时序变化对不同作物的季相节律和物候特征进行精细刻画与表征[12],通过设定每类作物最佳区分点的敏感参量与关键阈值实现对种植结构的精确提取[2]。特征参量可以根据灌区特点进行灵活选取与设置,从多角度寻求不同作物的光谱特征差异以达到农作物精准识别的效果,但其中也有一定的主观性与不确定性;另外,覆盖作物全生育期的时间序列遥感影像受阴雨天气影响,难以高效获取[13]。可见受灌区地域、作物、天气等条件限制,两种方法有不同的适用性与限制性。在作物种植分散、种类繁多、农田破碎化严重的灌区,迫切需要适用性强、准确性高、方便快捷的提取方法。
土壤盐分是限制作物生长的环境因子,不同作物对土壤盐分具有不同的适应性和耐受性,因而农作物种植结构与土壤盐分互为影响、相互作用。例如在内蒙古河套灌区土壤盐渍化严重,轻度、中度和重度盐渍化耕地分别占灌区总面积的29.8%、17.2%和9.2%[14],与农作物种植结构呈现出纷繁复杂的耦合协同关系。针对该问题,前人在土壤盐分空间分布与作物生长关系、不同土地利用类型下土壤盐分时空分布特征、植被覆盖度与土壤盐分时空耦合等方面开展了大量研究[15-21]。种植结构与土壤盐分的协同程度与发展关系直接关乎灌区水土生态质量与农业可持续发展,但由于二者同时存在较大的时空变异性,这为其耦合协同研究带来了较大挑战。因此,在灌域尺度上联动种植结构提取与土壤盐分空间分析,并定量耦合二者的协同关系是需要进一步深入开展的研究。
本文选取内蒙古河套灌区永济灌域为研究区,利用2021—2022年生育期Landsat 8 OLI遥感数据,构建基于时间序列影像的决策树和基于单一时相影像的支持向量机、随机森林3种模型,对作物种植结构进行提取和对比分析,以期获取复杂种植结构条件下准确、高效的遥感监测分类方法;并结合灌区土壤盐分实测数据及其空间异质特征,对种植结构与土壤盐分的协同关系进行深入探讨和分析。以探明灌区种植结构与土壤盐分的协同发展程度,为优化灌区农作物种植结构、改善区域水土环境、促进农业可持续发展等提供参考。
1 材料与方法
1.1 研究区概况
永济灌域位于内蒙古河套平原中部(107°13′~107°42′E,40°36′~41°13′N),东与义长灌域为邻,西与解放闸灌域毗连,南临黄河与伊克昭盟隔河相望,北抵阴山与乌拉特中旗接壤;南北长60 km,东西宽40 km,总土地面积1.836×105hm2,是河套灌区引黄灌溉大型灌域之一。本区属于温带大陆性气候,干旱少雨,蒸发强烈,且地下水埋藏较浅,土壤盐渍化严重。研究区多年平均降水量125.2 mm,主要集中在6—9月;多年平均蒸发量为1 999~2 346 mm 之间,是典型的“无灌溉就无农业”地区。灌域内种植的农作物包括玉米、葵花、小麦、葫芦、辣椒、番茄、西瓜等,主要农作物物候历如表1所示[22]。
表1 研究区主要农作物物候历Tab.1 Phenological calendar of main crops in study area
1.2 数据获取与处理
1.2.1地面观测数据
(1)灌域种植结构调查
以合济试验站(107°16′48″E,40°44′24″N)为起止点,分别于2021年7月10—12日、2022年6月25—28日在研究区进行种植结构调查。调查划定东、西、南3条路线,围绕均匀分布在灌域内的40个土壤盐分监测点展开(图1)。调查时手持GPS沿路获取各采样点的经度、纬度、海拔等信息,同时记录作物类型、种植密度、种植面积、作物长势等内容,调查样方与Landsat 8 OLI影像像元大小保持一致(30 m×30 m)。由于番茄、辣椒、西瓜等作物种植分散、面积相对于主粮较小,且生育期接近,调查时统一归类为其他作物。最终确定的土地利用类型为:葵花、玉米、小麦、小麦套种玉米(套种)、其他作物,以及水体、裸地/荒地共7大类。
图1 2021—2022年永济灌域种植结构调查路线 与土壤盐分监测点Fig.1 Field survey routes and sampling sites of soil salinity during 2021—2022 in Yongji Sub-irrigation Area
2021年完成实地采样点320个,其中葵花70个、玉米68个、小麦24个、套种20个、其他作物58个、水体30个、裸地/荒地50个。在2021年调查结果的基础上,2022年进行了更详细的路线规划与方案优化,完成实地采样点多达1 006个,其中葵花199个、玉米329个、小麦90个、套种24个、其他作物284个、水体30个、裸地/荒地50个。分别在2021、2022年调查结果中随机选取153、767个样点用于构建训练样本感兴趣区,剩余样点为验证样本,用于分类结果验证与精度评价。
(2)灌域土壤盐分监测
2021—2022年在永济灌域内均匀布置40个土壤盐分监测点(图1),于作物生育期内(5—9月)定期进行土样采集与测定。土样采集深度为0~10 cm、10~20 cm、20~40 cm和40~60 cm,采集频率为1次/月。土样采集后带回实验室,经风干、研磨、过筛等处理后,配置土水比1∶5土壤溶液,过滤后用电导率仪(DDS-307A型,上海佑科仪器公司)测定土壤溶液电导率,并通过经验公式转换为土壤含盐量[23-24],即
SSC=0.288 2EC1∶5+0.018 3
(1)
式中SSC——土壤含盐量,g/(100 g),记为%
EC1∶5——土水比1∶5土壤溶液电导率,dS/m
每个监测点取3个重复,取平均值代表该点土壤盐分。该区域土壤盐渍化的等级划分为非盐化土(0~0.2%)、轻盐化土(0.2%~0.4%)、中盐化土(0.4%~0.6%)、重盐化土(0.6%~1.0%)和盐土(>1.0%)[24]。
1.2.2卫星遥感数据
(1)数据来源及预处理
Landsat 8 OLI影像来源于美国地质勘查局网站(http:∥glovis.usgs.gov/)。选取2021—2022年生育期内覆盖研究区的26期遥感影像,时间序列分别为:2021年5月12日、5月28日、6月13日、7月31日、8月16日、9月17日,2022年4月13日、5月31日、6月16日、7月18日、8月19日、9月4日、9月20日,行列号为129/31和129/32。利用ENVI 5.6软件对遥感影像进行辐射定标、大气校正、图形镶嵌等预处理,并利用研究区矢量文件进行裁剪,得到研究区Landsat 8 OLI影像。
(2)植被指数计算
遥感影像中地物光谱的波段反射率差异是遥感识别地物信息的物理基础[25-26]。利用ENVI 5.6对Landsat 8 OLI过境时刻的玉米、葵花、小麦、套种和其他作物5种作物的光谱特征进行提取,通过分析不同作物在不同波段呈现出的反射率差异,作为农作物识别、提取的主要依据。
近红外和红光波段的反差是对植物较敏感的度量,常用这两个波段反射率的比值、差分、线性组合等各种组合构建多种植被指数来增强或揭示隐含的植物信息[27]。参考文献[28-32],本文选取归一化植被指数(Normalized difference vegetation index,NDVI)、差值植被指数(Difference vegetation index,DVI)来反映不同作物的光谱特征差异。同一作物由于周围环境、种植模式、管理方式等因素存在差异,各采样点长势不一,分别计算不同作物各采样点植被指数的平均值。植被指数计算式为
(2)
DVI=RNIR-RR
(3)
式中NDVI——归一化植被指数
DVI——差值植被指数
RNIR——近红外波段反射率
RR——红光波段反射率
1.3 研究方法
1.3.1地物分类模型
(1)决策树
决策树分类模型主要基于遥感影像等空间数据,通过对其进行逻辑推理、数理统计、综合分析和归纳总结,采用自顶而下的递归方式,形成分类规则进行分类[33]。该模型通过分析像元特征值,设定每个节点合适的阈值,从而进行分层、逐次比较归类[8]。本文利用Landsat 8 OLI时间序列影像数据获取不同作物的光谱特征信息,结合农作物物候信息,确定不同作物的分类规则和阈值设定,建立决策树分类模型。
(2)支持向量机
支持向量机是基于统计学习理论提出的一种二分类算法。模型采用间隔最大化原理,在提高样本分类精度的同时,通过非线性变换将低维空间中的难于线性划分的样本映射到高维特征空间,然后在高维特征空间中寻求最优分类超平面,使分类风险上界最小,从而实现样本空间的非线性分类,在高维空间中构造出最优分类器[34]。其中,适当的核函数可以使模型有效实现非线性变换。支持向量机模型极大程度地减少了传统分类算法中存在的过学习、局部极小点等问题,具有较高的准确性和鲁棒性[35]。
(3)随机森林
随机森林基于bagging集成学习策略,利用多棵决策树实现对数据样本的准确分类,是决策树的升级模型。模型包含两个随机过程:一是输入数据随机,二是分类特征随机选取[36],通过组合多棵决策树的预算结果,进行投票判断,得到最终结果,预测准确率一般较高[37]。已有研究表明,随机森林可以处理高维数据并且适用于大量数据的分类运算,尤其在高维数据分类中,更能体现出速度快、精度高、稳定性好的优势[38-39]。
1.3.2反距离权重插值
反距离权重(Inverse distance weighted, IDW)插值是一种根据已知数据集假定评估任意点s0预测值的空间插值方法[40]。该方法简单快速、易于计算,较Kriging插值可以更直观地反映区域和局部趋势变化[41]。定义为[42]
(4)
其中
(5)
Z(si)——已知点位si的实测值
λi——权重n——样点数量
d(si,s0)——样点和样点之间的欧氏距离
p——指定幂值,取(1,3)
1.3.3半方差函数理论模型
土壤盐分的空间变异程度受结构性因素(气候、地形、土壤母质、水文地质条件等)和随机性因素(种植结构、灌溉制度、管理措施等)共同影响。作为地统计学中的特有工具和分析基础,半方差函数理论模型是评估其空间变异程度的最有效方法。本文利用半方差函数理论模型对永济灌域土壤盐分空间结构进行分析,其函数表达式为[43]
(6)
式中γ(h)——半方差函数
z(xi)、z(xi+h)——间隔为h的2个观测点的实测值
N(h)——以h为步长所有观测点的成对数目
函数分析中主要涉及块金值C0、基台值C+C0、变程A、块基比(块金系数)C0/(C+C0)等参数,以块基比C0/(C+C0)来表征土壤盐分的空间变异程度。若C0/(C+C0)<25%,为强空间相关性,主要受结构性因素影响;若25%≤C0/(C+C0)≤75%,为中等空间相关性,受结构性和随机性因素共同影响;若C0/(C+C0)>75%,为弱空间相关性,受随机因素影响大。理论模型主要包括:Linear、Exponential、Spherical、Gaussian,具体介绍见文献[44]。
1.3.4耦合协调度模型
耦合协调度是在耦合度和协调度的基础上,描述系统或要素彼此相互作用、协调一致的程度,体现系统之间相互关联程度强弱与协调状况好坏。灌区作物种植结构与土壤盐分互为影响,相互作用,故本文以耦合协调度衡量其协同关系。耦合协调度计算式为[45]
(7)
其中
T=af(x)+bg(x)
(8)
(9)
式中D——耦合协调度
T、C——种植结构与土壤盐分两系统的耦合度、协调度
a、b——权重,取a=b=0.5[46]
f(x)、g(x)——种植结构、土壤盐分的Simpson多样性指数
Simpson多样性指数引自生态学中的优势度指数,是指从一个群落中连续两次抽样所得到的个体数属于同一种的概率,计算公式为[46]
(10)
式中Isimpson——Simpson多样性指数,取[0, 1)
S——研究时段内灌域种植结构(土壤盐分)的作物类型(盐渍等级)数量
qi——第i种作物(盐渍等级)的播种面积(占地面积)占农作物总面积的比例
根据耦合协调度,可以判定其耦合协调程度。若0 利用混淆矩阵对农作物种植结构提取结果进行精度评价,评价指标包括总体精度、Kappa系数、制图精度、用户精度,4种指标越大,农作物种植信息提取效果越好[8]。利用决定系数R2对半方差函数理论模型的拟合结果进行评价分析,R2越大,模型拟合效果越好。 2.1.1地物分类模型的分类规则 (1)决策树 综合训练样本叠加波段与特征参量的时间序列数据,获取不同地物的敏感性差异,是决策树模型建立分类规则的主要依据。利用NDVI最大值合成(Maximum value composite,MVC)图像可以对植被、裸地和水体进行有效区分,关键阈值分别设置为0.35、0,效果较为理想。图2为不同作物的波段反射率和特征参量(NDVI、DVI)变化曲线。 图2 不同作物的波段反射率和特征参量变化曲线Fig.2 Changes of band reflectance and spectral characteristic curves on different crops 由图2可知,5、6月小麦、套种的NDVI明显高于葵花、玉米和其他作物;7、8月因小麦收获,NDVI又低于以上3类作物;同时小麦、套种在2021年5月28日与7月31日的DVI差值也呈现一定不同,据此对小麦、套种进行提取。6月上中旬葵花处于播种—出苗期,而玉米和瓜菜等其他作物处于快速生长期,故葵花NDVI、DVI较玉米和其他作物偏小;2021年8月16日葵花在b5(近红外)波段反射率较玉米和其他作物偏大,据此提取葵花的种植信息。8月中下旬瓜菜等其他作物处于成熟衰老阶段,NDVI显著降低;9月玉米开始成熟衰老,NDVI开始降低,但至9月中旬玉米NDVI仍然显著大于瓜菜等其他作物;同时2021年7月31日玉米在b4(红光)波段反射率最低,根据上述特征提取玉米、其他作物的种植信息。 基于以上不同作物的波段反射率和特征参量变化差异,经过反复试验确定合理阈值,建立2021、2022年研究区决策树模型分类规则,如图3所示。图中:NDVIMVC表示研究区NDVI最大值合成图像值;NDVI20210613表示2021年6月13日的NDVI值,其他类同;DVI20210731-20210528表示研究区2021年7月31日与5月28日DVI的差值;Rb5-20210816表示研究区2021年8月16日遥感影像b5(近红外)波段反射率,其他类同。 图3 决策树模型分类规则Fig.3 Classification rules of decision tree model (2)支持向量机、随机森林 支持向量机、随机森林模型为机器学习算法,基于单一时相影像开展。作物“关键物候期”的遥感影像可以提供待分作物与背景光谱的最大差异,是建立农作物分类规则的基础。7月中下旬,小麦处于成熟—收获阶段,玉米处于抽雄—乳熟阶段,葵花处于现蕾—开花阶段,瓜菜等其他作物处于结果—成熟阶段,是农作物物候特征差异明显的一个阶段。2022年小麦收获后大多再植白菜、甘蓝等蔬菜作物,导致9月上中旬该田块的物候特征明显,此时玉米处于乳熟—成熟阶段,葵花处于开花—成熟阶段,而瓜菜等其他作物处于成熟—收获阶段,是农作物物候特征差异明显的另一个阶段。 受卫星影像质量影响,分别选取2021年7月31日、2022年9月4日的Landsat 8 OLI影像作为遥感数据源,将训练样本输入相应的分类器进行监督分类,分类器自动捕获训练样本中的光谱特征差异,建立对应的分类规则。 2.1.2种植结构提取最优模型遴选及其精度评价 利用验证样本分别计算基于决策树、支持向量机、随机森林模型提取种植结构的总体精度和Kappa系数(表2),对3种模型进行总体性评价。表2显示,3种模型的分类精度由大到小为随机森林、决策树、支持向量机。随机森林模型的总体精度、Kappa系数分别为92.81%、0.91(2021年)和91.64%、0.89(2022年),为3种模型中精度最高。因此,选定随机森林模型作为永济灌域农作物种植结构提取的最优模型,提取结果如图4所示。 图4 2021—2022年研究区基于随机森林模型的 种植结构提取结果Fig.4 Results of crop patterns inversed by random forest model in study area during 2021—2022 表2 3种农作物分类模型提取精度Tab.2 Accuracy of three models in extracting crop planting information 在选定最优模型(随机森林)的基础上,进一步计算不同地物分类结果的混淆矩阵(表3),对分类精度进行评价。表3显示,用户精度、制图精度分别在86.67%、75.00%(2021年)和76.19%、71.43%(2022年)以上,处于较高水平;其平均值分别为93.91%、91.46%(2021年)和91.60%、90.35%(2022年),平均用户精度大于平均制图精度,即漏分误差大于错分误差。具体来看,葵花、玉米的用户精度和制图精度均在90%以上,大于小麦、套种和其他作物。这可能是由于葵花、玉米的种植面积相对较大,训练样本较小麦、套种和其他作物对真实地物的代表性更强,分类效果更好。总体上,灌域内农作物种植结构遥感提取结果与灌域内真实的农作物空间分布情况基本一致。 表3 基于随机森林模型的农作物种植结构提取验证结果混淆矩阵Tab.3 Confusion matrix of crop planting structure extracted by random forest model 2.1.3农作物空间分布特征 综合农作物种植结构提取结果(图4)及种植面积变化(图5)可以看出,5类作物在灌域内空间异质特征明显,不同作物种植面积差异较大,且2021、2022年发生一定变化。玉米、葵花是灌域内的主植作物;其中玉米主要分布在灌域南部,葵花遍布整个灌域,在北部地带更加密集;种植面积分别为51 394.05、63 952.56 hm2(2021年),74 540.97、41 714.46 hm2(2022年)。受当地市场经济影响,2022年种植比例较2021年玉米增长9.94个百分点,葵花降低16.02个百分点。小麦种植面积相对较小,零星分布在灌域内,2022年较2021年增长2.74个百分点。套种作为一种典型的高产种植模式,在灌域内也有一定分布,2021、2022年种植比例分别为0.77%、0.34%,变化不大。葫芦、辣椒、番茄、西瓜等其他作物是灌域内主要的经济作物,分布以中南部地区为主,2021、2022年种植比例依次为25.78%、29.55%,2022年较2021年有小幅提升。 图5 2021—2022年研究区主植作物种植面积变化Fig.5 Changes of main crops planting area in study area during 2021—2022 2.2.1土壤盐分空间分布特征 受地下水埋深浅、蒸发强烈等因素影响,灌域内土壤呈现出较强的盐渍化现象,尤其以表层明显。本文利用反距离权重法对2021、2022年5—9月研究区表层(0~10 cm)土壤含盐量进行空间插值与展布,如图6所示。可以看出,5—9月研究区土壤含盐量呈先减小后增大的变化趋势;总体上呈“北部重,中、南部轻”的空间分布特征。北部土壤含盐量在0.4%以上,多为重度盐碱土;中、南部地区土壤含盐量基本处于0.4%以下,为中、轻度盐碱土,尤其以西南地带最轻。 2021年与2022年5月土壤盐分空间差别较大,体现为2021年土壤含盐量高于2022年,分析认为是由于采样时间与农田灌溉程度的差异所致。2021年5月土样采集在农田春汇前进行,表层积盐严重;而2022年5月取样正值农田春汇,较多田块已进行充分灌溉,盐渍化有一定程度改良。同样原因,2022年生育初期(5月)较2021年生育末期(9月)土壤盐渍化有较大程度改善,再次说明播前灌溉(春汇)可以达到洗盐、脱盐效果。2022年9月土壤含盐量表现为南部大于北部,与2021年相反。经过实地调查分析认为,这可能是由于2022年灌域北部葵花种植、收获时间较南部地区晚,至9月中下旬,南部地区因作物大面积收获而地表裸露,强烈的蒸发作用导致地表积盐严重;北部地区作物此时大多处于成熟期,地表被作物覆盖,但叶片较多枯萎、脱落,植被蒸腾与土壤蒸发作用相对较弱,盐分积聚也相对较少。 2.2.2土壤盐分空间结构分析 为探明灌域范围内土壤盐分的空间变异特性,利用地统计学理论进行半方差函数的计算、模拟、分析和检验,如表4所示。可以看出,除2022年5月外,决定系数R2在0.311~0.869之间,理论模型拟合良好,表明土壤盐分的半方差函数适用于Gaussian模型。2022年5月,由于取样时间正值农田春汇,较多采样点因灌水而未采集,导致本次取样可用结果少,模拟精度差。整体来看,土壤盐分的块金值C0和基台值(C0+C)均为正值,因此受随机因素、固有变异及采样误差引起的变异不容忽视。块基比C0/(C0+C)处于0.053~0.344(2021年)、0.058~0.498(2022年),土壤盐分为“中—强”空间自相关,说明土壤盐分主要受结构性因素影响,同时随机性因素也是不可忽视的一部分。种植结构是随机性因素中的重要因子,作物的耐盐程度、吸耗水特性等都对土壤盐分运移产生影响。因此,有必要进一步对种植结构与土壤盐分的协同关系进行深入探讨和分析。 表4 半方差函数模型参数统计Tab.4 Statistics of semi-variance function model parameters 2.3.1种植结构与土壤盐分的相互作用 土壤盐分对种植结构具有限制式选择性。主要体现在葵花以北部重度盐渍化地带种植为主,玉米、小麦、套种和其他作物主要分布在盐碱化较轻的中、南部地带(图4、6)。因此土壤盐分一定程度上限定了不同作物的空间格局。 种植结构对土壤盐分具有适应式选择性。图7为研究区主要作物对土壤盐分的适应程度,为去除系统误差带来的异常值,研究设置[2%, 98%]的置信区间。可以看出,葵花、玉米、小麦、套种4种作物在2021、2022年种植区域内土壤含盐量平均值分别为:0.377%、0.358%、0.246%、0.259%,0.328%、0.319%、0.246%、0.248%,作物耐盐能力由大到小为葵花、玉米、套种、小麦。其他作物由于包含辣椒、番茄、西瓜、葫芦等多种瓜菜作物,在遥感影像中存在大量混合像元,导致统计结果存在较大误差。 图7 研究区主要作物种植区域土壤盐分变化Fig.7 Changes of soil salinity in main crop planting area of study area 2.3.2种植结构与土壤盐分的耦合协调度分析 表5为2021—2022年研究区作物种植结构与土壤盐分的耦合协调度。可以看出,2021、2022年灌域种植结构与土壤盐分耦合度T分别为0.617、0.623,表明种植结构与土壤盐分互为影响、相互制约,耦合性能良好;协调度C均为0.995,说明两系统在相互作用的关系中系统协调性较高;耦合协调度D分别为0.784、0.787,表明种植结构与土壤盐分为高度耦合协调。因此,观测期内研究区作物种植结构与土壤盐分空间分布均衡、发展协调。该结果一定程度上可以为灌区作物种植结构优化与土壤盐分调控提供指导意见。 表5 2021—2022年研究区作物种植结构与土壤 盐分的耦合协调度Tab.5 Coupling coordination degree between crop patterns and soil salinity during 2021—2022 in study area 灌区农作物种植结构特征提取在服务区域农业生产、保障粮食安全及推动区域农业经济发展方面发挥了重要作用。利用Landsat 8 OLI多时相遥感数据,通过筛选敏感波段、构建特征参量,结合不同作物的物候信息等,分别建立决策树、支持向量机、随机森林3种分类模型,对永济灌域农作物种植结构进行准确提取。3种分类模型对农作物的典型季相节律、物候变化及遥感影像的多波段光谱特征进行了不同程度利用,提取结果可以反映灌域内农作物种植结构的真实情况。通过对比分析,随机森林模型对于农作物的空间分布刻画更加精细,提取精度最高,因此选定随机森林模型作为永济灌域种植结构提取的最优模型。 关键阈值是决策树模型构建的重要环节,但基于已有经验和专家知识的确定方法具有一定的人为主观性。另外,由于研究区作物长势不一,基于监测点同一作物统计分析得到的植被指数仅代表研究区平均水平,偏离平均水平较大的异常值也为研究结果增加了不确定性。支持向量机和随机森林分类模型是机器学习中常见的监督分类方法,主要是根据训练样本建立判别分类的函数,获取分类规则,进而根据分类规则进行分类。模型在根据样本训练过程中难免会产生误差,根据误差再对自身参数进行反复调整,直至精度达到最佳。因此,选择合适的训练样本是机器学习进行准确监督分类的关键。本文支持向量机分类精度处于3种分类方法中最低,可能是由于训练样本的选取、遥感影像的选取等在支持向量机分类算法中并非最优方案,影响了模型准确性。 农田土壤盐渍化程度是农田生态环境的主要影响因子之一,而农作物的空间格局分布与农田生态环境密切相关,因此探究农作物种植结构与灌区土壤盐分空间分布的协同关系有助于反映不同作物对盐渍胁迫的适应程度,进而为区域作物种植结构优化提供决策依据。结果显示,葵花在研究区北部重度盐碱地中种植较多,对于盐渍胁迫的适应性更强,而玉米、小麦、套种和其他作物则主要分布在盐渍化较轻的中、南部地带,该结果与白亮亮等[47]、童文杰[48]研究结果一致。结果将为政府农业部门、灌溉部门等调整、优化种植结构,制定防灾减灾应对策略,改善区域生态环境以及促进区域作物产量与品质高效协同发展提供技术支撑。 (1)3种地物分类模型的种植结构提取精度由大到小为随机森林、决策树、支持向量机。2021、2022年随机森林模型的总体精度、Kappa系数分别为92.81%、0.91和91.64%、0.89,为3种模型中精度最高。因此,选定随机森林作为永济灌域作物种植结构提取的最优模型。 (2)灌域内土壤盐分呈“北部重,中、南部轻”的空间分布特征。2021、2022年土壤盐分的半方差函数适用于Gaussian模型,块基比C0/(C0+C)分别处于0.053~0.344、0.058~0.498,土壤盐分空间自相关在“中—强”等级变化。因此,土壤盐分空间变异主要受结构性因素影响,同时随机性因素也不容忽视。种植结构作为随机性因素中的重要因子,有必要进一步加强其与土壤盐分的协同关系分析。 (3)受土壤盐分制约,葵花以北部地带种植为主,玉米、小麦、套种和瓜菜等其他作物主要分布在中、南部地带。2021、2022年葵花、玉米、小麦、套种4种作物种植区域内的土壤含盐量平均值分别为:0.377%、0.358%、0.246%、0.259%,0.328%、0.319%、0.246%、0.248%,作物的耐盐能力由大到小为葵花、玉米、套种、小麦。 (4)2021、2022年研究区作物种植结构与土壤盐分耦合协调度D分别为0.784、0.787,为高度耦合协调。因此,观测期内研究区作物种植结构与土壤盐分空间分布均衡、发展协调。研究结果一定程度上可以为灌区优化作物种植结构、改善土壤环境等提供技术支撑与指导意见。1.4 评价指标
2 结果与分析
2.1 灌区作物种植结构特征提取
2.2 土壤盐分空间异质特征
2.3 种植结构与土壤盐分的协同关系
3 讨论
4 结论