基于灰色系统理论的挠力河流域净耕地面积预测
2021-08-09陈竹书冯晓娟
周 浩, 陈竹书, 冯晓娟
(1.湖南师范大学 资源与环境科学学院, 湖南 长沙 410081;2.益阳市烟草专卖局, 湖南 益阳 413002; 3.嵩山少林武术职业学院, 河南 登封 452470)
耕地监测既是农作物产量估算、农业资源综合利用基础,又是政府部门对耕地利用与管理的依据[1]。遥感技术拥有信息丰富、覆盖面广、实用性强和可周期性获取等特点[2-3],已成为当前对耕地监测的最主要手段。一方面受遥感影像空间分辨率、同物易谱和同谱异物等影响[4],实际存在的小地物(主要包括:沟渠、小径、机耕道、简易公路、坟地和池塘等)易被纳入耕地[5],另一方面,由于部分小地物遥感影像的像元宽度远大于实际宽度,耕地面积常被夸大[6]。因此,如何剔除小地物影响、实现净耕地提取具有重要现实意义[7-8]。
国内外学者针对净耕地提取做了大量工作,如运用实地抽样手段开展区域小地物信息提取工作,进而间接提取净耕地利用信息[9];探索如道路等线状地物对实际耕地面积的影响机理,以提高耕地遥感监测精度[10-13];开展遥感影像对小地物实际宽度和解译宽度影响的研究,通过扣除小地物实现农作物面积精准估算[1];运用算法技术来自动提取农田线状工程地物信息,以实现耕地的精细化提取[14-15]。但纵观现有研究,学者们多通过实地抽样调查或结合高精度影像、航片来剔除小地物对耕地面积影响[16-19],可推广性有限。如何在有限的数据条件下实现净耕地面积提取显得尤为重要。现代数理统计观认为[8],客观系统总是有关联和有整体功能的,作为表征系统行为特征的数据,总是蕴涵着某种统计规律。中国实行国土用途管制及规划管理制度,土地利用面积具有内生“灰色”规律,通过对土地利用面积“部分”已知信息的二次生成和挖掘,去认识和研究土地利用面积变化规律。当前已有相关学者注意到灰色系统理论应用于土地或耕地利用信息提取的可行性,如通过灰色关联度模型分析耕地利用变化驱动因子并选用不同灰色系统模型定量模拟耕地需求量[9,16];运用灰色系统GM(1,1)模型预测和验证区域有效耕地面积[8]。但值得注意的是,以上灰色系统模型应用研究中多存在灰色区间划分偏主观、缺乏围绕净旱地和净水田提取的系统性方案等问题,不利于实际工作的推广。
挠力河流域为中国重要商品粮生产基地,自21世纪初以来,随着“两江一湖”土地整治和高标准基本农田建设工程的实施,该流域耕地及其内部结构快速变化,田间道路、沟渠系统等发生了较大改变[20]。鉴于此,本文以挠力河流域作为净耕地提取案例区,在基础土地利用调查数据支持下,运用灰色系统理论来提取该流域的净旱地和净水田利用信息。
1 研究区概况与数据来源
挠力河流域位于中国黑龙江省三江平原腹地,地理范围为131°31′—134°10′ E,45°43′—47°45′ N,东南以完达山为界,东与乌苏里江相接,流域面积约为2.49×106hm2(图1)。挠力河流域历经了多次大规模土地利用开发,耕地面积持续上升,呈现出“三山一水六分田”的土地利用特点。该流域耕地分为旱地和水田,水浇地面积极少,主要分布于内外七星河腹地、干流沿岸及友谊地区[20]。
图1 挠力河流域地形及水系分布
基础土地利用数据及道路、田间沟渠等小地物信息数据均获取自当地自然资源部门所提供的土地利用变更调查矢量数据库(2018年)。通过对流域境内的4县(富锦县、友谊县、集贤县和宝清县)3区(宝山区、尖山区和四方台区)数据库的拼接、裁剪等处理,得到基础耕地利用数据(即未进行耕地净提取的初始耕地利用数据)及线状地物信息;行政区划、水系等基础地理信息数据均来自于中国科学院资源环境科学数据中心(http:∥www.resdc.cn)。
2 研究方法
2.1 研究思路
区别于经典数理统计论,灰色系统理论把一切随机变化过程视作一定范围内变化的、与时间有关的灰色量及灰色过程,其研究对象为“贫”信息不确定性系统[21]。通过对数据一定方式处理,使其成为有规律的时间序列“模块”数据,进而找出其“灰色量”变化规律。考虑到净耕地原始斑块面积的未知性,通过对非耕地斑块(除耕地外的土地利用斑块)面积的一次或多次累加处理以增强数据列的规律性,进而构建灰色系统模型来预测非耕地面积,将区域总面积减去非耕地面积即可得到净耕地面积。同时,中国实行国土空间用途管制及规划管理制度,土地利用面积表征着对应用地的开发程度及利用方式,除建设用地中特殊地块外,部分建设项目由于其规模、性质等原因,占地面积较大,但从区域宏观角度来看,该部分地块面积比例较小,将其排除后,土地利用斑块面积将呈较强的规律性特征。
基于此,提出净耕地预测思路:①在土地利用变更调查数据支持下,提取非耕地斑块面积信息,根据系统建模需要,对范围内非耕地斑块面积从大到小或从小到大进行排序;②斑块面积区间的划分影响着预测结果的准确性,通过建立和比较不同突变模型的分析结果,以确定面积突变奇点(对应为建筑项目用地或大片林地);③确定合适等额间距并对其范围内的非耕地斑块面积进行一次或多次累加处理,将得到规律性递增的一组数据,选取不同阶灰色预测模型或其他预测模型进行非耕地面积预测,最终确定面积预测模型;④根据非耕地面积数据来测算净耕地面积,倘若不同预测模型的预测效果均较好,可综合预测结果以提高预测精度。基于净耕地系数数据,结合土地利用变更调查数据库中沟渠、农村道路等线状地物信息,对其进行空间信息加权处理,得到净耕地二次空间分布数据。技术流程见图2。
图2 净耕地预测技术流程
2.2 数值方法
2.2.1 净耕地系数 净耕地系数是指单位面积空间内净耕地面积占耕地毛面积的比例系数[8]。计算公式为:
(1)
式中:η为净耕地系数;Ai为单位面积的耕地或耕地斑块内净耕地面积(hm2);Am为耕地毛面积(hm2);f为小地物类型;Af为第f种小地物的面积(hm2)。
2.2.2 突变检测 突变是指变量从某一统计特性到另一个统计特性的急剧变化过程,一般通过检验均值、方差、回归系数和事件发生概率等指数有无突然变化来判定[22]。土地利用斑块面积突变是指面积较大的建筑项目用地或大片林地导致的由非耕地斑块面积组成的序列数据统计特征急剧变化过程。考虑到需剔除的面积较大的非耕地斑块数量较小,且与其他用地斑块面积差异明显,多种方法均可实现面积序列突变检测。Pettitt法为经典的非参数检验方法,该方法利用秩序列来检测数据序列突变点,当其秩处于最高水平,且通过对应的显著性检验(p<0.05),则认为该秩所对应的点为数据序列突变点[23],本文选用该方法进行斑块面积序列的突变点检测。
2.2.3 灰色动态(GM)建模 灰色GM建模以灰色模块理论为基础,通过对无规律的原始数据处理,形成有规律“模块”序列数据,其几何意义为生成的序列数据在时间和数据二维平面上所形成的连续曲线与其横坐标的总称。由已知数据构成的模块称为白色模块,由白色模块外推到未来的模块,即由预测值构成的模块,称为灰色模块[21]。
由于数据多为随机且无规律性,给定的原始数据列(公式2)不能直接用于建模,若将该原始数据列进行一次累加处理,可获得新的数据列(公式3),新生成的数据列为单调增长曲线,增强了原始数据的规律性,弱化了随机性。倘若累加次数越多,其规律性将更强,随机性更弱,为建立合适的数理动态模型提供了必要中间信息。其中随机量视作一定范围内变化的灰色量,随机过程为一定幅区和一定时区的灰色过程。通过灰数的生成、数据的不同取舍和不同级残差模型的补充,来调整、修正和提高模型的精度。对于高阶系统GM(n,h),可由一阶的GM(1,h)模型建立状态方程解决[22]。
(2)
(3)
对模型模拟精度验证是研究模型可靠性的必要过程。当前常用的精度验证方法是对模型进行后验差检验,即先计算数据离差s1及残差的离差s2,再计算后验比c=s1/s2及小误差概率p,根据c和p完成模型诊断,当p>0.95和c<0.35时,模型可靠。模型的构建及精度验证均通过DPS 7.5软件实现[24]。
3 结果与分析
3.1 基础耕地分布特征分析
如图3所示,2018年,挠力河流域基础耕地的总面积是1.48×106hm2,垦殖率达到62.61%。基础旱地面积为9.29×105hm2,占耕地总面积的62.67%,且多位于流域的南部平原地区和内七星河上游地带。基础水田面积为5.53×105hm2,对应的水田化系数是37.33%,处于水田化中期阶段。相对于旱地而言,水田多分布于地势平坦、灌溉条件较好的地区(图3):①挠力河干流的下游北岸,该地区以国营农场(主要为七星农场、创业农场、红卫农场和胜利农场)为主,农业现代化程度较高;②内外七星河流域腹地及友谊县境内,该地区水田斑块破碎,家庭农场和农户个体为主要的水田利用管理主体;③挠力河干流的中段东岸,该地区为八五二和八五三国营农场所在地,坡度、灌溉条件较好。
图3 挠力河流域基础耕地空间分布特征
3.2 斑块面积区间划分特征分析
3.2.1 突变检测 对非水田斑块(除了水田的土地利用斑块)和非旱地斑块(除了旱地的土地利用斑块)面积按从小到大顺序排列以构造对应面积数据序列,采用Pettitt突变检测法进行非旱地和非水田斑块面积的突变检测。结果显示:①挠力河流域非旱地斑块数为19 813,并于第19 632位序发生有效突变,且p<0.05,具有统计学上的意义,对应的斑块面积为2.01×102hm2;②非水田斑块对应的斑块数为21 568,在第20 958位序发生突变,p<0.05,对应的斑块面积为2.00×102hm2。
表1 挠力河流域非旱地斑块的分区段面积统计
基础非旱地和非水田面积区间的统计规律性弱,巨大斑块(位于1区间段的非旱地和非水田斑块)多位于流域南部、东南部以及东部地区,一般为山地丘陵区的连片林地以及干流周边耕地地块,斑块面积大(非旱地和非水田的1区间段面积分别占流域总面积的37.33%和71.06%),第8和第10区间段的斑块面积也较大(表2和图4)。
表2 挠力河流域非水田斑块的分区段面积统计
图4 挠力河流域土地利用斑块面积变化特征
3.3 净耕地面积预测
对各区间段斑块面积进行一次累加处理,数据集规律性特征显著增强(图5)。因此,采用不同预测模型进行净耕地面积预测。
图5 挠力河流域土地利用斑块面积累加特征
3.3.1 灰色系统预测 对累加处理后的区间数据进行单变量GM建模。但由于模型阶数的不同,导致预测精度存在差别,通过比较不同灰阶预测精度,确定最优灰色系统预测模型以进行非旱地和非水田面积预测。对于高阶灰色预测模型GM(1,N)而言,数据样本数偏少(10个),预测可信度差。因此选用GM(1,1)和GM(2,1)模型来进行非旱地和非水田的面积灰色预测。
3.3.2 其他拟合预测 根据累加数据序列走势(图5),分别采用一元线性预测、二元线性预测和非线性预测中指数曲线预测方法对挠力河流域非旱地和非水田的斑块面积进行研究,并对比验证不同趋势预测方法的精度(表3)。预测结果显示,线性预测和指数曲线预测方法均具有较高的可信度。非旱地面积预测的决定系数均超过0.85,其中二元线性预测的决定系数达到0.96,预测方程为y=(1.24×107)x2+(1.33×107)x+(1.31×1010),指数曲线预测决定系数为0.89,精度偏低;非水田的线性和指数曲线预测方法也具有较高的预测精度,其中二元线性预测精度最高,对应预测方程为y=(1.36×107)x2-(5.58×106)x+(1.98×1010),R2=0.97。因此,选用二元线性预测法进行非旱地和非水田面积趋势预测。
表3 挠力河流域非旱地和非水田趋势测算对比特征
3.4 净耕地面积预测及验证
3.4.1 净耕地面积预测 从理论上来讲,非旱地和非水田面积是灰色系统的N值无限趋近于11或趋势预测的x值无线趋近于0时的模型预测值。当GM(1,1)的t值无限趋近于11时,非旱地和非水田面积预测值分别为1 310 956.63 hm2和1 980 505.34 hm2。当多项式预测法的x值无限趋近于0时,非旱地和非水田的趋势预测值分别为1 311 821.13 hm2和1 982 083.22 hm2。考虑到GM(1,1)和多项式预测法预测精度均较高,综合二者结果将会有效提高净耕地面积预测精度,取二者平均值作为非旱地和非水田面积的预测结果,即分别是1 311 388.88 hm2和1 981 294.28 hm2。
3.4.2 预测结果验证 土地利用变更调查数据中挠力河流域总面积为2 368 135.35 hm2,其中达到图4标准的所有非旱地面积为1 285 957.70 hm2,非水田面积1 973 681.32 hm2,对应的旱地和水田面积依次为1 082 177.64 hm2和394 454.03 hm2,而预测得到的非旱地和非水田面积依次为1 311 388.88 hm2和1 981 294.28 hm2,净旱地和净水田面积为1 056 746.47 hm2和386 841.07 hm2,对应的净旱地系数和净水田系数分别是97.65%和98.07%。挠力河流域位于三江平原腹地,境内垦区与农区并存,垦区内小径、简易公路等地物信息的空间分布密度低,且其水田分布率显著高于农区,即对应的净面积系数应高于旱地,与预测结果相符;流域境内垦区的耕地斑块规整,其田间沟渠面积为25 102.74 hm2,占耕地和田间沟渠总面积的1.67%,但倘若考虑其他田间信息影像,净耕地系数应低于98.33%,而预测的净耕地系数均值为97.91%,预测结果与实际情形基本相符。
4 讨论与结论
4.1 结 论
在排除面积较大的特殊地块下,土地利用斑块面积存在“灰色”特点,可通过等额面积区间非耕地斑块面积的一次或多次累加处理,以增强数据序列的数理回归特征,进而提取净耕地面积。本文以挠力河流域为研究区,在非旱地和非水田的斑块面积区间Pettitt突变检测基础上,划分合适的区间段以进行灰色模拟预测和多方法趋势拟合,最终预测流域旱地和水田的净面积依次为1 056 746.47 hm2和386 841.07 hm2,对应的净旱地系数和净水田系数分别是97.65%和98.07%,预测结果与实际情形基本相符。因此,灰色理论假设可应用于旱地和水田面积精准提取,能较好地模拟净旱地和净水田面积信息,进而确定对应净旱地系数和净水田系数。
4.2 讨 论
数量和空间管理是国土空间管理的战略方向。灰色系统理论能够较好地实现净耕地面积提取目标,但由于小地物尚未达到上图标准,净耕地的空间信息表达存在困难。本文仅从面积数值上对净耕地利用信息进行预测研究。但对于沟渠、田间道路等线状地物密度高的地区而言,其小地物信息更为丰富,因此可尝试结合土地利用变更调查数据库中现有道路、田间沟渠等数据信息来对净耕地分布信息间接表达,以进行耕地精细化研究。如在栅格尺度下来计算线状地物的空间密度,对该密度信息进行min-max标准化处理,然后运用栅格图层叠加算法,在保证空间化的净旱地系数和净水田系数均值不变前提下,实现净耕地系数空间表达,然后采用自然裂点分级法划分净耕地系数程度等级,以探索净耕地的空间分布特点。
《土地利用现状分类》中耕地一般包括南方宽度<1.0 m,北方宽度<2.0 m固定的沟、渠、路和地坎(埂)等有机组成部分,然而传统实地抽样手段多难以准确区分上述耕地有机组成部分。本文提出的基于灰色系统理论净耕地提取思路,通过预测其他非耕地面积来间接预测净耕地面积,能够有效解决上述问题。同时,本文基于现有土地利用变更调查数据库中耕地数量及空间分布特征,来精细提取净耕地面积信息,但对应于土地利用调查中存在小地物易纳入耕地的情形,其他非耕地调查中也存在小片耕地被纳入非耕地情形,后续可配合抽样调查以进一步完善净耕地提取的研究角度和思路。