APP下载

基于偏最小二乘回归方法的北京水资源短缺预测

2022-04-20

河南科学 2022年3期
关键词:用水量用水水资源

刘 佳

(天津大学管理与经济学部,天津 300072)

水资源是国家经济和社会发展的重要战略资源,是人类赖以生存和发展的基本条件[1]. 北京作为我国的首都,地处温带季风气候区域,降水量受气候变化的影响非常大,每年的降水量差异很大,并且人口众多,水资源短缺现象严重. 近年来,随着北京经济的高速发展,愈来愈多的人才涌入北京,水资源紧张的问题日益突出[2],给北京水资源的利用带来了巨大压力,在某种程度上也导致北京水资源的短缺[3].北京在国家“十四五”规划期间,北京水资源短缺问题是否会对北京的整体发展带来阻碍,水资源的短缺是否更加严重,北京水资源短缺受哪些因素影响,这是本文需要研究的重点.

1 文献综述

水资源作为全球各个国家重要的自然资源,受到各个国家和地区的科研机构与学者的广泛关注,诸多学者对水资源短缺进行了研究. Strang[4]认为水资源短缺主要与城市所在的位置相关,气候类型与城市周边是否有河流对城市水资源短缺的意义重大,并且各产业用水的比重对城市水资源短缺也起着十分重要的作用. Mankad等[5]通过研究雨水集蓄在城市中的水资源短缺预防作用发现,在大城市中合理运用雨水集蓄可以作为一种应急方式来应对城市中突发的水资源短缺情况;阎晓东和孙才志[6]采用源-汇系统理论,通过分析中国30个地区的水足迹转移量,结合生态网络分析模型分析,认为水资源短缺与经济发展程度正相关,北京与天津对水转移有非常大的依赖性;Baguma等[7]以家庭访问的方式搜集乌干达的水资源数据,以乌干达水资源短缺为研究对象,从微观角度出发,以家庭为单位进行水资源数据搜集并进行分析,认为乌干达的降水量、家庭成员多少、家庭蓄水能力的高低会对乌干达水资源短缺造成直接影响;Gohari等[8]对伊朗汝德河流域进行系统分析,采用系统动力学方法整体研究汝德河流子流域的系统作用,对汝德河流域附近的区域性水资源短缺提出可操作性的建议政策;金银雪[9]表示在20世纪以来,全球的用水量增长了6倍以上,并且当前全球的用水量仍然在以1%的速度增长,水资源短缺情况因全球气候变暖而变得更加严重,温室效应破坏了长久以来的水循环系统,造成了水资源短缺加剧;Praskievice和Luo[10]通过研究河流流量对水资源短缺的动态关系,发现非季节性的河流断流不仅会因水资源短缺造成不可估量的损失,甚至会对原有的水资源供应体系造成不可逆的损害.

综上可知,水资源短缺的因素众多,并且相互关系复杂[11-12],在研究水资源短缺预测的文献中,并没有涉及影响因素之间的相互关系. 在有关水资源短缺影响因素分析的文献中,也没有系统地研究未来水资源短缺的预测. 为弥补该研究的不足,本文应用偏最小二乘回归方法,分析北京水资源短缺各影响因素相互关系,并对各影响因素进行预测分析,为北京水资源短缺未来决策提供依据支持.

2 北京水资源短缺建模

本文综合考虑到社会经济发展、产业结构比重的调整、城市人口增长、水资源总量以及相关气候影响因素,以北京市为研究对象,选取GDP(x1,亿元)、降水量(x2,mm)、平均气温(x3,℃)、工业用水(x4,亿m3)、第三产业用水(x5,亿m3)、人口数量(x6,万人)、水资源总量(x7,亿m3)、农业用水量(x8,亿m3)、总用水量(x9,亿m3)为自变量,北京人均缺水量(y,m3)为主要分析因素,通过最小偏二乘回归进行分析建立偏最小二乘回归分析模型,对北京水资源短缺进行预测分析.

偏最小二乘回归可以有效地规避多重影响因素的共线性,可以实现多元线性回归、关键影响因素分析等功能,能够较好地完成共线性影响因素建模分析.

2.1 方差膨胀因子

根据最小偏二乘回归的建模方法,定义自变量xi表达为:

其中:VIF为方差膨胀因子,R2j是以xj的复测定系数.

2.2 偏最小二乘回归模型

设水资源短缺为因变量y,集合{x1,x2,…,xp} 为自变量.

将自变量样本矩阵X和因变量样本矩阵Y中的观测值根据做标准化处理,即

在此基础上,作X0和Y0在t1上的回归:

作Y0关于m个主成分的回归,得到

因为t1,t2,…,tm均为X0的线性组合,所以式(3)可表示成如下形式:

2.3 变量投影重要性指标

第j个解释变量投影重要性指标VIPj由式(6)确定:

从变量投影重要性指标的计算过程可以看出,xj对y的解释能力是通过th来反映的. 若th对y的解释能力很强,而且,xj在对主成分th中又起到了重要的作用,则xj对y的解释能力就很大. 另外,th对变量x1,x2,…,xk的解释能力则可通过式Rd(X,th)=r2(X,th)来反映.

3 实证分析

本文选取北京市1979—2020年的人均缺水量(以北京人均水资源数据量与国际标准1000 m3/人的差额计算)及相关时间序列数据,进行标量表示进行建模.

3.1 共线性诊断

表1中的时间序列数据分别对应相应的影响因素. 将主影响因素与自变量影响因素进行方差膨胀因子的共线性诊断,结果见表2、表3.

表1 北京市1979—2020年水资源短缺量与各项影响因素指标Tab.1 Annul data(from 1979 to 2020)of water resource shortage and indicators of various influencing factors in Beijing

续表

表2 主影响因素相关系数表Tab.2 Correlation coefficient table of main influencing factors

表3 方差膨胀因子分析Tab.3 Analysis of variance inflation factor

表3可知主影响因素与自变量之间存在显著相关性. 因自变量的方差膨胀因子均大于10,说明自变量影响因素的多重共线性严重[16-17].

3.2 方程确定

根据SIMCA-P预算可知,水资源短缺解释能力为97.77%. 最小偏二乘回归方程确定为:

从回归结果来看,GDP(x1)、平均气温(x3)、工业用水(x4)、第三产业用水(x5)、人口数量(x6)、总用水量(x9)这六个因素都对北京水资源短缺有正向影响,这说明北京经济发展、人口增多、工业和第三产业的发展以及平均气温的增高都会使北京缺水情况更加严重. 农业用水量(x8)的系数为负值,表明北京市在城镇化进程中,大量的农业用地转化为居住用地,相对于单纯的农业用水而言,大量涌入北京的居民用水的消耗量会更大,这也是北京农业用水逐渐减少和第三产业用水不断增长的原因. 因此,北京的城镇化进程在一定程度上降低了农业用水量,却大大增加了第三产业的用水量,加剧了北京水资源的消耗. 降水量(x2)、水资源总量(x7)与水资源短缺负相关,显示降水量的增多与水资源总量的增加会在一定程度上缓解北京水资源短缺的压力.

偏最小二乘回归模型的因变量与主成分之间的是否存在现行关系可以由t1/u1的图形显示(u1表示因变量,t1表示主成分自变量). 根据图1所示,两者存在一定的线性关系. 在双主成分提取前提下,t1/t2(双主成分的线性关系验证)分成椭圆图,可见无数据点在椭圆外(图2),说明无特异点,证明所构建的偏最小二乘回归模型稳定[18-19].

图1 t1/u1平面图Fig.1 Planar graph of t1/u1

图2 主成分自变量椭圆图Fig.2 Ellipse diagram of principal component independent variable

3.3 变量投影重要性指标分析

通过自变量投影指标重要性计算可知,x7、x2、x5、x4、x6的重要性指标值大于1,其他指标值皆小于1,说明在本模型中,这5个指标是构成北京水资源短缺量变化的最重要影响因素. 其中,水资源总量(x7)对北京水资源短缺的解释作用最大,说明北京水资源总量的大小是影响北京水资源短缺最重要的原因.

表4 变量投影重要性指标Tab.4 Variable importance projection index

降水量(x2)是影响北京缺水量的第二大因素,由此可见北京每年的降水情况很大程度上决定着北京缺水量的大小. 第三产业用水(x5)、工业用水(x4)、人口数量(x6)和GDP(x1)四个因素对北京水资源短缺的解释作用也比较显著,这表明北京经济的发展与人口的增长加剧了北京水资源的短缺,第三产业用水量和工业用水量也随之增长,北京水资源消耗增加. 农业用水量(x8)与北京水资源短缺负相关,表明北京城镇化发展的过程中,加剧了水资源的短缺. 平均气温(x3)的升高与总用水量(x9)的增加会加重北京水资源的短缺程度.

图3 VIP直方图Fig.3 Histogram of variable importance projection

3.4 拟合效果分析

回归方程可以对自变量与因变量的影响因素进行拟合分析,以结果均值的绝对百分比误差(MAPE)和均方百分比误差(MSPE)来呈现[20]. 从表5 的计算结果来看,两个数值均在5%以下,显示了非常高的预测精度.

表5 预测误差指标Tab.5 Prediction error index

3.5 对十二五期间水资源短缺的预测

利用离散二阶差分方程对北京市未来3年2021—2023 年的水资源短缺影响因素进行预测[21],得到结果如表6所示.

表6 水资源短缺影响因素预测数据Tab.6 Prediction data of influencing factors of water resource shortage

利用最小偏二乘回归,对北京未来3 年2020—2022年的缺水量情况进行预测分析,得到:2021年北京市人均缺水量为838.83 m3,2022年人均缺水量为848.71 m3,2023年北京市人均缺水量为846.18 m3.

4 结论与启示

本文系统分析了北京水资源短缺的影响因素,基于北京1979—2020年的各项所需数据,应用最小偏二乘回归分析,得到如下结论:

1)GDP、平均气温、工业用水、第三产业用水、人口数量、总用水量这六种因素都与北京人均缺水量正相关,说明北京经济发展、人口增多、工业和第三产业的发展以及平均气温的增高会加剧北京的缺水程度. 农业用水量对北京水资源短缺有负向影响,从一个侧面说明了北京城镇化过程中,农业人口数量的减少与城市人口的增多增加了北京的水资源消耗量,导致更严重的水资源短缺;降水量、水资源总量与水资源短缺负相关,说明北京降水量的增多与水资源总量的增加会在一定程度上缓解北京水资源短缺的压力.

2)通过变量投影重要性指标分析可知,水资源总量对北京水资源短缺的解释作用最大,而降水量是影响北京缺水量的第二大因素. 第三产业用水、工业用水、人口数量和GDP四个因素对北京水资源短缺的解释作用也比较显著,这表明北京产业经济的发展与人口的增长,加剧了北京水资源的短缺.

3)预测结果可知,北京2023年人均缺水量将达到846.18 m3,还未达到近年来的人均缺水高峰值(1999年的人均886.89 m3),从数据上看,北京缺水量虽然严重,但是供水量差额不大,仍在可接受的范围之内. 经本文拟合度分析可知,预测结果通过回归方程的拟合度分析表明,最小偏二乘回归分析的预测结果(MAPE)与(MSPE)的误差数都在5%以下,预测精准度很高. 模型对主影响因素的解释度高达97.77%,模型分析效果显著.

针对北京未来人均缺水量的发展趋势,结合本文的分析结果,得到如下启示:

1)北京2023年的人均缺水量为846.18 m3,虽然没有达到历史最高点,但是北京作为我国的首都,人口的净流入整体也呈现增长的趋势,人口增多的分母拉动效应也会降低北京人均水资源的占有量,造成水资源短缺;另外,因为当前疫情的出现,北京居民对生活品质要求也逐渐提高,人均用水的需求量也会呈现上升趋势. 因此,保证城市供水量的稳定供应,在一定程度上控制北京人口规模,是北京减缓水资源短缺的重要途径[22].

2)由文章分析可知,北京总用水量对用北京水资源短缺的解释效果并不明显. 用水总量代表着城市的水资源消耗能力. 为更好地缓解北京2023年水资源需求的压力,北京需要进一步提升北京居民水资源的保护意识,加大对水资源相关生态环境的保护,提倡合理用水与节约用水,保障正常生活用水,提高过度用水门槛,实行阶梯水资源价格,从而保证北京经济与社会的正常发展.

本文与之前的研究相比,创新之处在于精度较高地定量预测了北京未来几年的缺水量,并同时对水资源短缺的影响因素进行分析研究. 笔者在选取影响因素时,曾考虑将污水处理率作为影响因素指标,然而因数据搜集困难的原因,无法更系统地分析水资源短缺影响因素,这是本研究的不足之处.

猜你喜欢

用水量用水水资源
生态水利工程在水资源保护中的运用
水资源(部级优课)
校园宿舍洗浴用水余热回收节能分析
你的用水量是多少?
节约洗碗用水
你的用水量是多少?
澳大利亚研发出新型农业传感器可预测农作物用水量
水资源配置的现状及对策初探
王佩:为半干旱地区集聚水资源
Units 13—14重难点☆解☆析