APP下载

西安市主城区蒸散发量预测模型研究

2020-10-14陈舒怡

水利科学与寒区工程 2020年5期
关键词:皮尔逊蒸发量因变量

曲 彤,陈舒怡,王 璞

(西安理工大学 水利水电学院,陕西 西安 710048)

城市水资源通常是指可供城市用水的地表水体和地下水体中每年可得到补给恢复的淡水量,它对城市的发展尤为重要。研究城市水资源量动态变化是合理利用城市水资源的基础。而与城市水资源量息息相关的则是城区的蒸散发量,研究城区下垫面的蒸散发量进而预测出城区蒸散发量的时间变化规律,可为城市用水决策提供参考,从而保证城市水资源的合理利用。王萍等[1]通过卫星遥感数据反演或估算地表温度、植被指数以及地表通量等方法研究了城市热岛效应以及城市绿地对实际蒸散发的空间格局的影响。赵春江等[2]将传统方法与遥感结合研究了农田蒸散发时空特征。

以上研究仅局限在农业土地蒸散发的估算和城市下垫面条件、人类活动导致热岛效应、地表升温、土地利用及植被覆盖等方面,而对于城市主城区的蒸散发时间变化特征以及各类气候因子对蒸发能力影响等方面研究较少。本文综合考虑了相关气候因子随时间的规律性变化对主城区蒸散发的影响并挖掘分析了大量的数据,通过多元分析确定影响因子与蒸发量的相关性,从中选出主导因子,综合各自的权重、将其定量化引入模型预测主城区蒸散发量的变化,为水资源管理部门的决策提供参考。

1 研究方法

1.1 研究区概况

西安市所属流域为黄河流域,位于黄河中游的关中盆地,地理位置为:北纬34°18′、东经108°59′、海拔为398 m,属于暖湿带大陆性季风气候,在一年中冷暖干湿四季分明。本次研究所采集的数据是1956年1月1日—2005年12月31日陕西省西安站50 a的每日天气数据,以及2007年1月1日—2008年12月31日的109 572条天气数据。各年的天气数据主要包括气温、湿度、风速等,所有的数据均来自于国家气象网。本文对数据的处理分成两部分,将1956—2005年的实测数据作为模型建立的基础,而另外的2007年和2008年的数据作为预测模型验证的依据。

1.2 研究方法

(1)时间特性分析。 时间特性分析是用气候倾向率与突变分析的原理对蒸散发量进行趋势分析和变异诊断,以检查序列的趋势性和连续性。气候倾向率反应气候要素的变化趋势,即通过将气候变量与对应时间之间建立一元回归方程进行定量分析[3-4],突变分析是对气候变化的不连续性进行分析,常用累积距平曲线来确定[5]。

(2)影响因子多元分析。 选择影响蒸散发量的若干影响因子,设置置信度并利用JMP软件计算影响因子与蒸散发量的相关系数,基于计算结果,确定主导因子分析并建立模型。

(3)模型建立与求解。 结合蒸散发量时间特性,根据影响因子分析的结果建立多种模型,通过MATLAB实现并进行比选,选择最优模型并进行检验。

1.3 蒸散发量时间特性结果

(1)趋势性分析。 蒸散发量随时间变化曲线如图1。可以看出蒸散发量年际有下降趋势,蒸散发量倾向率为-21.8 mm/10 a,说明到2005年为止过去近50 a间蒸发量减少了109 mm,这种趋势与全国其他地方的研究一致[6]。

图1 1956—2005年蒸发量与时间关系图

(2)突变分析。利用气候要素累积距平曲线方法[7]计算得到1978年的年蒸散发量距平值达到累计最大,1978年之前蒸发量较多,1978年之后蒸发量较少,为检验该年蒸发量是否发生突变,计算信噪比为1.73>1,故1978年为突变年份。

1.4 蒸散发量影响因子多元分析

表1 部分因子及其相关系数表

2 建立蒸散发量的偏最小二乘法回归模型

2.1 基本思想

在已知各种影响因子X(x1、x2……)(自变量)的条件下,这些因素会导致Y(y1、y2……)(因变量)产生一定规律的变化,偏最小二乘回归是解决自变量与因变量之间具体关系问题的方法[8-9]。

2.2 建模原理

设有q个因变量{y1,…,yq}和p个自变量{x1,…xp}。假设n个样本点,构成自变量与因变量的数据集X={x1,…xp}和Y={y1,…,yq}。分别在X与Y中提取出成分t1和u1(其中t1是x1,x2…xp,的线形组合,u1是y1,y2,…,yq,的线形组合)。提取要求如下:

(1) 应尽可能大地携带各自数据集中的变异信息。

(2)t1与u1的相关程度能够达到最大。

这两个要求保证了t1和u1既具代表性又具有较强的解释能力。在t1和u1被提取后,模型分别实施X对t1的回归和Y对u1的回归。如果结果具有较高的精度,满足给定的要求,则停止计算;否则利用残余信息进行第二次成分提取并重复上述步骤,直到精度满足给定要求为止。若最终对X共提取了m个成分t1,t2…tm模型将通过实施yk对t1,t2…tm的回归,然后再表达成yk关于原变量x1,x2…xp的回归方程,k=1,2,…,q。

2.3 MATLAB实现

表2 主程序应用数据

利用MATLAB中最小二乘回归方程对该问题进行求解,选取四个相关因子的分析,程序运行的结果,得到了四变量方法提出的成分个数为3个,且交叉的有效性为:-0.008 025。由程序得到选取变量的系数依次为0.1340、-0.0162、0.3698、0.1396、且得到一个无变量的常数项为0.3215。最后得出的模型如式(1)所示:

0.3698Ux+0.1396n

(1)

2.4 PLS模型验证

选取2007年以及2008年数据验证预测模型是否成立。图2为实测值与预测值的拟合图。可以看出实测值与预测值具有较好的对应关系。

图2 预测值与实际值关系图(图中点值为实际值,曲线为预测值)

其中点代表2007年以及2008年的实测蒸散发量,直线则代表了建立模型关系得到的预测值。

2.5 考虑皮尔逊相关系数建立模型

在统计学中,皮尔逊相关系数(Pearson correlation coefficient),又称皮尔逊积矩相关系数(Pearson product-moment correlation coefficient),用于衡量自变量X与因变量Y的相关程度,X和Y之间的皮尔逊相关系数定义为二者的协方差和标准差的商,如式(2)所示:

(2)

式(2)定义了总体相关系数,估算样本的协方差和标准差,可得到皮尔逊相关系数r=0.9638,计算方法见式(3):

(3)

图3为考虑皮尔逊相关约束条件的四变量预测值与实际值关系图。

图3 四变量预测值与实际值关系图(图中点值为实际值,曲线为预测值)

2.6 模型对比评价

2.6.1 建立三变量模型

由四个影响因子得出的交叉有效性为-0.008 025。即可选取除日平均风速影响因素的其余影响因子建立三变量模型。

运行结果为提出的成分的个数仍为3个,且交叉有效性为0.001 824,由程序得到选取变量的系数依次为0.1402、-0.0212、0.1222,且得到一个无变量的常数项为1.1768。

最后得出的三变量的模型如式(4)所示:

(4)

利用皮尔逊相关的约束条件对三变量模型进行相关系数r的检验,根据程序运行结果可得预测值及r,并与实际值进行对比。最后得到预测值和实际值之间的r值,r=0.9201。

图4为三变量模型下加入皮尔逊相关约束条件的预测值与实际值的比较。

图4 三变量预测值与实际值关系图(图中点值为实际值,曲线为预测值)

2.6.2 四变量模型与三变量模型的对比及分析

根据皮尔逊相关约束条件下预测值与实际值的对比可以看出:相较于某些点来说,四变量的预测值更加接近于实际值,显然三变量模型产生的误差要更大。

对比二者的相关系数r来看,三变量模型中的r=0.9201小于四变量模型中的r=0.9638,即四变量的预测值与实际值相关性更加高。

由此可知,采取四变量模型去进行预测结果更精准。

3 讨论与结论

以蒸散发量作为因变量,通过偏最小二乘法模型,分别对三变量和四变量的情况进行研究,通过相关性对比,认为四变量得到的模型结果拟合效果更好。

在最终的模型中,相对湿度呈负相关关系,因此可以认为西安市城区降雨较多时,导致相对湿度较大,此时蒸发量会减小。在其他条件相同的情况下,平均风速对于整个蒸发量的影响较大,温度及其日照时数对于蒸发的影响大致相同。其上述结论,均符合生活实际情况。最后,本文基于实际生活中较易获得的部分气象因子,再基于模型检验的前提之下,给出了一个较为利于计算的线性回归模型。

20世纪50年代以来,由于受太阳周期活动,温室气体的温室效应等各种因素对气候的综合影响,根据对中国现代气候变化的研究[10],西安市未来气温可能升高,而年降水并不发生明显变化,导致西安市整个的相对湿度下降,根据所建立的模型而言,未来西安市的蒸散发量可能会提高。

由于人类的干预,中国的年平均风速存在区域下降的现象[11,但对于西安地区,即黄河中游附近,风速在21世纪较其他地区风速大。由本文预测模型可以看出,平均风速一项所占比重较大,未来西安市的风速可能会有所升高,导致蒸发量的提高。

日照的变化主要是云等多种因子导致太阳辐射的变化[12],加之人类的干预,空气中气溶胶的含量增多,导致日照时数趋于减少,但总体来看日照仍很丰富。

综上,西安市主城区未来可能存在温度的升高,湿度下降,风速的上升的情况,这三类因素导致西安市蒸发量会有上升的趋势,虽然日照时数可能存在减小,但就其影响力而言并不能使蒸发量减少。

猜你喜欢

皮尔逊蒸发量因变量
近36年来渭河定西段蒸发量时空变化及演变趋势研究
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
现代统计学之父:卡尔·皮尔逊
现代统计学之父:卡尔·皮尔逊
Excel在水文学教学中的应用
卡方分布的探源
1958—2013年沽源县蒸发量变化特征分析
偏最小二乘回归方法
谈谈如何讲解多元复合函数的求导法则
1981—2010年菏泽市定陶区蒸发量变化特征分析