APP下载

基于多元回归方程的重点监测湖库水域面积时空变化分析*

2022-07-20广州市城市规划勘测设计研究院刘复

数字技术与应用 2022年6期
关键词:湖库南四湖回归方程

广州市城市规划勘测设计研究院 刘复

以水利部水文局信息中心在全国范围内的重点监测湖库为研究对象,基于高分一号卫星影像提取的水体矢量数据,引入空间自相关原理建立多元回归分析模型拟合湖库水域面积变化趋势,建立了湖库水域面积时空变化规律的回归模型。通过南四湖及其周边湖库面积变化的相关性建立了反映目标湖库与周边湖库水域面积变化趋势的多元回归模型,实现了监测频度较低的湖库水域面积变化的回归拟合,试验结果表明,此方法可以解决由高分影像条带性分布导致的条带间大型湖库监测频数较低的情况,并可推广到任意一组在空间距离较近的湖库上。

水体时空变化动态监测是遥感应用于资源与环境变化研究的一个热点方向。及时、准确地获得水体变化信息可以为水资源保护、利用和可持续发展提供有力的支持,而遥感技术的快速、高覆盖度和周期性等特点则使水体动态变化监测成为了可能。我国在卫星遥感方面的研制在最近几年进步速度较快,拥有较高空间分辨率的高分卫星影像已投入民用,用于水体提取和分析效果较好,接下来也有望将成为国内水资源分析与监测的主要数据来源。

1 问题分析

本课题的实验数据为通过高分影像提取的全国重点监测湖库矢量文件,时间来源为2017 年,以旬为组织形式共计36 期。高分影像能以较高精度快速捕获地物的变化信息,但生产过程中尚有几点问题存在。

(1)高分卫星对地观测时,其影像呈明显的条带型分布,在这种不均匀的覆盖条件下,同一区域内各湖库的监测频数可能有较大分异。同时,影像边缘有可能正好将一个完整湖库切成两个部分,这对于水利部门重点关心的大型湖泊而言司空见惯,导致某些大型湖库的记录数少于其周边小型湖库。(2)为保证水体提取的准确度,只选用云量小于10%的影像。我国幅员辽阔,气候条件千差万别,北方地区日照较充足,而南方地区大部分时间湿热多雨,故北方湖库被监测到的次数明显多于南方,另外同一湖库夏季(6 ~9 月)的记录数也会远少于其他诸月。

故本实验解决的问题是,应用地理空间自相关和多元回归分析原理,建立实验区内大型湖泊与其周围的中小型湖库的时空面积变化关系,通过周边湖库的面积变化推测出所选大型湖泊的面积变化趋势,以解决水利部门的监测需求。

2 关键技术

2.1 数据分析方法

2.1.1 多元回归分析原理

多元回归分析是指通过回归方程,建立一个因变量和其他一个或多个自变量之间线性或非线性数学模型数量关系式,并利用样本数据进行分析的统计分析方法。

误差的平方写成矩阵形式如式(2)所示:

求导后展开并化简如式(3)所示:

然而,当回归模型中的自变量之间存在较高线性相关关系时,最小二乘回归建立的模型将可能产生较大的失真现象。本实验所选用的数据为水域面积变化数据,正是基于同一空间范围内水域面积变化大致相关这一结论进行分析,所以此处需要采用岭回归分析法对多元回归模型进行改良。通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法,这种方法对病态数据的拟合要强于最小二乘法。岭回归通过引入正则改正项来避免过拟合,在原先的B 的最小二乘估计中加一个小扰动λI,解决了原先无法求广义逆的情况,使得问题稳定并得以求解,如式(4)所示:

2.1.2 R 语言

R 是专门面向统计分析与制图的语言,其本身集成了大量统计计算模型与绘图包,具有高度可拓展性,其本身包含高效的数据存取与处理机制、完备的计算操作符集合、大量统一的数据分析中间件以及支持多种显示环境的制图图形工具。同时,R 语言是一种简单高效的编程语言,包含条件语句、循环,递归函数以及输入输出机制。

2.2 总体技术路线

本实验的总体技术路线图如图1 所示。

图1 总体技术路线图Fig.1 Overall technical roadmap

3 湖库面积时空变化多元回归分析

3.1 实验区选择

本实验选择南四湖(微山湖、昭阳湖、独山湖和南阳湖)湖区作为研究对象。选择其周边云龙湖水库、崔贺庄水库、西苇水库、马河水库、户主水库、岩马水库、石嘴子水库、书房水库、周村水库、双河水库、会宝岭水库合计11 个水库于2017 年全年的监测记录作为多元回归分析的自变量。相对于其他大型湖泊而言,这一地区的监测记录较为丰富,各湖全年记录除南四湖本身外均超过20 条,符合本实验的应用场景。实验区湖库空间分布如图2 所示。

图2 实验区湖库空间分布图Fig.2 Spatial distribution of lakes and reservoirs in the experimental area

3.2 多元回归建模

实验采用岭回归的分析方法,每做完一步回归,都需检验各个自变量的显著性,剔除不显著的变量后重新进行回归分析,直至全部自变量均显著为止,此时的模型自变量之间扰动程度最小,模型最优。

回归模型结果如下所示。

从图中第一列为模型基本参数,其中Intercept 为截距,其他11 项为各个湖库的系数,另外最后一列为显著性检验情况,下方显示了模型的其他参数,包括岭参数λ 为0.1958722、模型自由度2.949、方差2.39 和残差3.508。由结果可见,部分湖库的参数为负值,这说明在此模型内对应的自变量与因变量呈现负相关,无法通过显著性检验结果,故接下来需剔除未通过检验的变量并重新进行岭回归分析。此迭代工作直至全部自变量呈现显著为止。多次迭代后模型最终只保留x、x两个变量,其具体参数如下所示。

可见模型自由度降为1.943,方差降为1.89,残差降为1.997,所有变量均通过假设性检验。故可得因变量与自变量的回归方程如式(5)所示:

其中,

x

x

分别对应云龙湖水库和西苇水库,只要这两个湖库有对应旬的记录,即可通过此方程即可求得南四湖的同一时段的水域面积。

在本例中,南四湖记录缺失且云龙湖水库和西苇水库均有记录的情况共有6 旬,可补齐6 个记录,其全年记录情况如表1 所示,单位为平方千米。其中黑色字代表南四湖原有记录,红色字代表通过多元回归模型求得的记录,灰色字NaN 代表缺失值。

3.3 结论与分析

本章实验的目的是研究由周边的湖库水域面积的变化趋势预测指定湖库的水域面积变化趋势的方法,实验从水域面积空间自相关出发,最终用岭回归的方法求解了南四湖与其周边湖库水域面积变化的多元回归方程。在进行回归分析时,由于需要避免自变量间相关性较强导致模型拟合精度下降的问题,需要在回归过程中进行迭代剔除自变量的计算,故最先输入的11 个周边湖库最终只有上述2 个被计入回归方程。从空间分布上看,南四湖呈西北-东南向条带型分布,这两个湖库分别位于南四湖湖区的北部与南部,空间距离较远,所以两者分别与南四湖湖区的北部与南部呈现较强的空间相关,符合构造多元回归方程的条件和本实验的应用场景。

从表1 看,南四湖17 年全年原有记录16 条,回归方程的应用可以再增添6 条记录,使总数达到22 条。另外,南四湖、云龙湖水库和西苇水库均有记录的旬数为10 旬,故可通过回归方程计算其原有记录与预测记录的差异情况,如表2 所示。

表1 按回归方程求得的南四湖面积表(km2)Tab.1 Area of Nansi Lake calculated by regression equation (km2)

表2 南四湖面积原值与预测值比较(km2)Tab.2 Comparison between original value and predicted value of Nansi Lake area (km2)

其中原值序列平均值722.1959,方差32174.67。预测值序列平均值718.2069,方差32951.16,从数据上看无较大差异,且已知进行回归分析时各个自变量均已通过显著性检验,故可认为该回归方程能较好地预测出南四湖的面积变化情况,符合实验的目标。

此方法是针对预先提取好的、以旬为序的水体矢量进行变化趋势预测的一种实验方法,如前所述,由于云量问题,本实验的数据记录大多集中在冬春季节,每年7 ~10 月记录奇缺。在实验数据源不改变的情况下,该方法对每年冬春季的数据有较佳的拟合效果,在夏季则很难有发挥空间,后续可以通过应用微波遥感的影像补充夏季的水体提取记录,实现此方法的完整应用。

本方法也可以应用于解决由高分影像条带性分布导致的条带间湖库监测频数较低的情况,并可推广到任意一组在空间距离较近的湖库上,只需保证自变量记录数较充足即可。

4 结语

本章从监测结果产生的具体问题入手,应用地理空间自相关原理,以南四湖为例,基于多元回归分析的岭回归方法,由大型湖库周边的小型湖库水域面积的变化情况求解反映此大型湖库的水域面积变化趋势的多元回归方程,保证了模型的最优化。此方法只需保证自变量记录数较充足即可计算记录相对较少的因变量,可帮助水利部门掌握记录数不足的重点监测湖库的水域面积变化情况。

引用

[1] 李景刚,李纪人,黄诗峰.近10年来洞庭湖区水面面积变化遥感监测分析[J].中国水利水电科学研究院学报,2010,8(3):201-207.

[2] 成晨,傅文学,胡召玲.基于遥感技术的近30年中亚地区主要湖泊变化[J].国土资源遥感,2015,27(1):146-152.

猜你喜欢

湖库南四湖回归方程
不忘初心创沂沭泗基建新篇 除险加固保南四湖治水安澜
采用直线回归方程预测桑瘿蚊防治适期
湖库富营养化形成原因和处理策略
走进回归分析,让回归方程不再是你高考的绊脚石
卫星测高数据筛选方法研究
秀山县湖库水质特征分析及富营养化评价
沂沭泗河洪水东调南下续建工程南四湖湖西大堤加固工程(山东实施段)暨南四湖二级坝闸下西段股河上段剩余工程通过竣工验收
加强生态清洁小流域建设 推进湖库型水源地水土保持工作
南四湖水资源管理浅议
南四湖过水区不同施肥模式下农田养分径流特征的初步研究