基于回归模型的昌平区污水处理量影响因素研究
2019-09-10高明王达
高明 王达
摘要:昌平区经济社会快速发展的同时,区域的污水处理量也在不断增长,昌平区2017年污水处理量为9479万m,较2008年的2585万m 增长了6894万m,污水处理量呈逐年上升趋势。经济社会发展的多方面因素均对区域污水量的增加造成了一定影响,本文通过统计学的回归模型,结合主成分分析方法,对昌平区污水处理量的影响因素进行研究,结果表明用水量、常住人口、地区生产总值、万元GDP水耗4个因素均是影响污水量的主要因素,在今后的水资源管理和污水治理中,可从以上方面几入手,严格控制人口规模,不断强化用水监管和水资源的的合理高效利用,实现地区的可持续发展。
关键词:污水处理量;回归分析;影响因素
1 引言
昌平区是首都北京的后花园,被誉为“京师之枕”、“股肱重地”,是首都发展的重要组成部分。近年来,随着昌平区人口的不断增加,以及经济社会的快速发展,区域用水量和污水处理量也在不断增长,水环境和水生态质量有待进一步提升。为探索区域污水处理量的发展趋势,研究并分析影响污水量的各种外在因素,本文以2008-2017年的昌平区处理污水量和经济社会发展的相关数据为基础,采用线性回归的统计方法,建立模型,寻找区域污水处理量的主要影响因素,为提高昌平区提高污水处理能力,进一步节约和保护水资源提供参考。
2 基本情况
2.1区域基本情况
昌平区位于北京市西北部,总面积1352平方千米,年平均气温11.8℃,平均降水量550.3毫米,全年水资源总量2.7亿立方米。全区有21个镇街,2017年底常住人口为206.3万人,其中常住外来人口105.5万人,地区生产总值839.7亿元。截止2017年底,全区已建成集中供水厂22座,建成供水主管网1186km,日供水能力达到35万m;建成排水管网总长度1104 km,污水处理能力达到40.2万m/d,污水处理率达到88.7%。
2.2污水处理量情况
2008-2017年,随着昌平区年用水总量的不断增加,污水处理量也由2008年的2585万m 提高到2017年的9479万m,增长了6894m,呈现逐年上升趋势。同时,再生水利用量也在不断提高,由2008年的623万m 提高到2017年的5220万m,增长了4597万m。
3.评价方法
影响昌平区污水处理量的因素有很多,研究影响因素的经典统计学方法就是回归方法,本文拟采用回归分析的方法,同时结合主成分分析法,探索各因素对污水处理量的影响效果,并进行分析和评价。
3.1回归分析的基本原理
回归分析是重点考察一个特定的变量(因变量),而把其他变量(自变量)看作影响这一变量的因素,并通过适当的数学模型将变量间的关系表达出来的一种方法[2]。
3.2回归分析的基本步骤
(1)确定回归方程中的解释变量(自变量x)和被解释变量(因变量y),以及变量间的相关关系。
(2)确定模型,通过观察散点图,确定线性或非线性的拟合模型。
(3)建立模型,根据收集到的数据和上述确定的回归模型,在一定的统计拟合准则下估计出模型中的参数,得到明确的回归模型。
(4)对模型进行检验和评估。
3.3主成分分析的基本原理
主成分分析是通过考察变量之间的相关性,找到少数几个主成分来代表原来的多个变量,同时使它们尽可能保留原始变量的信息,从而达到数据降维的目的。主成分分析能够有效消除各影响因素间信息的重叠,避免主观随意性。
3.4主成分分析的主要步骤
(1)对数据进行标准化。消除由于量纲的不同造成对评价结果的影响。
(2)选取主成分。对标准化后的数据进行主成分计算,当成分特征值大于1且方差累计贡献率大于85%时,确定主成分个数p。
(3)确定主成分表达式并计算得分。
(4)计算出主成分得分后,用主成分作自变量,与原有的因变量构建新的模型,再将原始自变量带入该模型,得出原始变量与因变量之间的关系程度。
4.昌平区污水处理量影响因素分析
4.1数据来源
随着昌平区经济社会的快速发展,区域污水处理量由2008年的2585万m 提高到2017年的9479万m,与此同时,全区年用水总量由1.74亿m增长至2.45亿m,常住人口由94.2萬增长至206.3万,地区生产总值由316.2亿元增长至839.7亿元,均与污水处理量成正比关系;而万元GDP水耗由2008年的55m下降至2017年的29m,降低了47%,与污水处理量成反比关系。
4.2相关关系分析
首先对因变量污水处理量与4个自变量进行相关性分析见表2,可以看出相关系数均在0.8以上,接近于1,显著性均小于0.05,表示用水量、常住人口、地区生产总值、万元GDP水耗4个自变量与污水处理量的关系通过统计方法检验,关系十分密切,可以作为影响因素进行分析。同时我们也看到,4个自变量间的相关关系也均在0.7以上,个别达到了0.9以上,说明自变量间具有一定的重复信息,如果进行多元回归分析,会造成一定的多重共线性,对解释因变量造成影响。
4.3主成分降维
为避免多重共线性造成的分析误差,可通过主成分分析法对4个自变量进行降维,找到少数几个主成分来代表原来的多个变量,同时使它们尽可能保留原始变量的信息,有效消除各影响因素间信息的重叠[2]。本文采用SPSS统计软件进行自动计算,得到各成分初始特征值和解释的方差,由表3可知,共提取了1个主成分,方差贡献率累计达到88.962%,表示可以反映原始变量88.962%的信息,能够较好的代表原始变量。
成分矩阵反映了选取的主成分与原始变量的关系程度,从表4可知,选取的主成分与用水量、常住人口、地区生产总值呈很大的正相关性,与万元GDP水耗有很大的负相关性。根据公式,可得到主成分和各指标的线性组合如下:
F=0.903X+0.947X+0.966X-0.956X(1)
4.4 建立回归模型
为进一步解释选取的主成分与昌平区污水处理量的关系,将提取的主成分F的得分作为自变量,历年污水处理量作为因变量,进行一元线性回归分析,得到判定系数R方为0.891,表示模型拟合较好,方差分析显著性水平Sig.接近于0,表示自变量与因变量线性关系显著,相关参数如表5:
可得到标准化回归方程:
Y=2027.955F+5363.09 (2)
將(1)式带入上述回归方程,得出昌平区污水处理量与其4个影响因素的回归方程:
Y=1831X+1920X+1959 X-1939X+5363.09 (3)
5.结论与建议
5.1结论
本文利用回归分析的基本思路,结合主成分分析方法,对昌平区污水处理量的影响因素进行分析,结果显示,选取的4个因素均与污水处理量有较大相关性,通过回归方程分析,可以得到影响污水处理量的因素排名分别是地区生产总值、万元GDP水耗、常住人口和用水量,其中用水量、常住人口和地区生产总值均为正向影响,而万元GDP水耗则为负向影响,从总体来看,各因素间的影响力比较平均,均占有相当一部分的比重,在实践中应统筹加以重视和考虑。
5.2建议
污水处理是实现区域经济社会的可持续发展的基础性保障工作,对于缓解水资源紧张状况、改善区域水生态环境具有重要意义。昌平区要深入落实《北京市第二个污水治理和再生水利用三年行动方案》,积极开展截污治污工作,对污水排放和治理需要进一步强化约束和引导。一是强化区域用水总量控制,将用水指标逐级分解落实,引导全社会节约用水,从源头上减少污水排放。二是要严格控制人口,坚持落实首都人口承接和疏解功能,防止区域人口无序过快增长,缓解首都人口资源和环境的矛盾;三是在发展区域经济的同时,合理调整产业结构,对一些高耗水、高污染的工业企业予以清退,提高高水资源使用效率,促进区域的可持续发展。
参考文献:
[1] 昌平区统计局.昌平区统计年鉴(2008-2017)[A].2017.
[2] 贾俊平.统计学[M]. 北京:中国人民大学出版社,2014.
[3] 时立文.统计分析——从入门到精通[M].北京:清华大学出版社,2012.
(作者单位:北京市昌平区水务局)