基于主成分分析和多元线性回归的黑龙江省用水效率研究
2023-02-20李治军
李治军,姚 蓉
(1.黑龙江大学 水利电力学院,哈尔滨 150080;2.寒区地下水研究所,哈尔滨 150080)
1 概 述
万元GDP用水量在横向上能宏观反映国家、地区或行业总体经济的用水情况,纵向上可以反映国家、地区或行业总体经济用水效率的变化情况和节水发展成就[1]。黑龙江省万元GDP用水量是一个统计数据,数值比较高,2010年的中央文件指出要落实用水效率控制红线,杜绝用水浪费,增强对用水定额和计划的管理[2]。以万元GDP用水量作为重要的水资源宏观定额指标[3],约束不断增长的用水需求,促进用水效率的提高。朱慧峰等[4]采用指数模型预测和年下降率模型预测法,指数分解方法在水资源领域的应用具有一定的价值,但对万元GDP用水量的分析还需进一步的深化和系统化。佟金萍等[5]采用Laspeyres指数及其完全分解方法,构建万元GDP用水量的完全分解模型。王鸿翔等[6]利用主成分分析法对宁夏水资源承载力进行了研究。
2 研究区概况
黑龙江省位于我国东北部,辖区总面积473 000km2。黑龙江省属于寒温带与温带大陆性季风气候,夏季温热多雨,春季低温干旱;多年平均地表水资源量为686×108m3,多年平均降水量为465.68mm,多年平均地下水资源量为297.44×108m3。
3 黑龙江省万元GDP用水量评价体系构建
本文研究指标体系构建遵循全面性、客观性、可获得性的建立原则[7],利用理论分析和专家咨询相结合的方法,对影响黑龙江省万元GDP用水量的主要因素进行分析、比较,再综合专家意见和研究区域实际情况进行调整。
黑龙江省万元GDP用水量评价体系可分为4个类型:人口因素、资源因素、经济因素、技术因素,一共选取12个影响因子,具体内容见表1。
表1 黑龙江省万元GDP用水量影响因子
4 模型构建与计算
由于黑龙江省万元GDP用水量的影响因素众多,本次研究建立基于主成分分析的多元线性回归模型,分析出黑龙江省万元GDP用水量最主要的影响因素,为后面黑龙江省万元GDP用水量调控提供参考依据。
4.1 主成分分析法与多元线性回归
由于黑龙江省万元GDP用水量的影响因子较多,并且各影响因子之间都有较强的相关性。如果直接建立线性回归方程,会造成一部分数据丢失,会形成模型的多重共线,造成虚假回归,不利于黑龙江省万元GDP用水量调控研究。所以,利用主成分分析对各影响因素进行降维处理[8],将原来具有一定相关性的变量转化为少数彼此独立的综合变量,保留了原来信息。
多元线性回归模型是一个研究变量之间作用关系比较成熟的模型[9]。根据主成分分析的结果,把得到的主因子作为自变量,万元GDP用水量作为因变量进行逐步回归,建立回归模型。
4.2 模型计算
根据2007-2020年黑龙江省统计年鉴、国家统计局数据、黑龙江省水资源公报,收集黑龙江省2007-2020年GDP、用水量和其各影响因子数据。另外,本文中选取的各影响因子的度量单位不同,可用下式对其进行标准化处理:
i=1,2,…,n;j=1,2,…,p
(1)
利用spss26中描述统计对原始数据进行标准化处理,然后再对标准化的数据进行主成分分析,降维处理。从表2可以看出,大多因子都在90%以上。表3中,显示各因子总方差。本次研究中选取两个主成分,前两个因子的累积贡献率达到90.665%,效果比较好。
表2 标准化后因子方差提取
表3 解释的总方差
表4 主成分得分系数
根据得到的主因子得分系数(表4),将12个影响因素的数据代入,得到:
f1=-0.972x1+0.983x2+0.685x3+0.615x4+0.679x5+0.989x6+0.964x7-0.986x8+0.964x9-0.987x10+0.852x11+0.980x12
(2)
f2=0.100x1-0.059x2+0.701x3+0.127x4+0.701x5-0.035x6-0.035x7+0.141x8-0.190x9+0.130x10-0.300x11-0.106x12
(3)
利用spss26和Excel,根据主因子得分系数和标准化后的数据,最终得到表5。将前面主成分分析过的两个主因子作为自变量,黑龙江省万元GDP用水量作为因变量,将数据导入spss26中做多元线性回归,结果见表6、表7。R2为0.893,回归曲线拟合程度很好,模型精度比较高。
表5 2007-2020年两个主因子数据
表6 回归模型
由表7以及表4的两个主因子的得分系数,则可以得出因变量黑龙江省万元GDP用水量和其12个影响因素之间的回归方程为:
表7 回归系数
Y=0.906x1-0.920x2-0.708x3-0.590x4-0.703x5-0.927x6-0.904x7+0.915x8-0.890x9+0.917x10-0.774x11-0.913x12
(4)
5 结 论
1)由模型回归方程可知,对黑龙江省万元GDP用水量影响最大的因子是城镇化率和人均灌溉面积。
2)人均灌溉面积对黑龙江省万元GDP用水量影响较大。这是由于黑龙江省是农业大省,为保证国家的粮食需求,需要大量的灌溉用水,随着该指标增加,万元GDP用水量也随之增大。
3)城镇化率和总人口是宏观经济发展的指标,未来要加强城乡规划管理,节约用水,提高用水效率。