回归方法预测碧流河水库以上年平均降水量
2021-08-24王延超唐永美
王延超,唐永美
(1.辽宁省大连水文局,辽宁大连116023;2.松辽水利委员会水文局黑龙江上游水文水资源中心,黑龙江黑河164300)
1 流域概况
碧流河水库位于辽东半岛南部的碧流河干流上。碧流河流域面积为2 814 km2,碧流河水库以上控制流域面积为2 085 km2,占全流域的74.1%。碧流河流域属温带季风区,降水量主要集中在汛期,而且年际变化较大,旱涝灾害频繁。随着气候变化,人口增长,经济社会的发展,水资源供需矛盾不断加大。碧流河水库的降水预报工作可为大连市的水资源调度和水旱灾害防御等工作的决策提供科学依据。
2 资料
2.1 气象因子
由1977—2010年74项气象环流因子,从提前一年的74项气象因子中挑选因子建立模型。
2.2 降水量资料
由1978—2011年碧流河水库以上流域11个雨量站年降水量资料,采用算数平均值法计算流域年平均降水量。
3 模型
3.1 模型原理
3.1.1 多元线性回归原理
多元线性回归[1]是将全部预报因子一次性引入回归方程的方法。
3.1.2 逐步回归原理
逐步回归法按对预报对象影响显著的程度逐步挑选因子。方差贡献是衡量因子对预报对象重要性的指标,要求当次挑选出的因子是能使残差平方和下降最多的一个,并且通过指定信度的显著性检验——F检验。如果后面的因子引入后会引起前面因子对预报对象的显著作用减小,则在已建立的过渡方程中把这一因子剔除。每引入或剔除一个因子都要做相应的F检验,直至方程既不能引入也不能剔除为止。
3.1.3 后向逐步剔除回归原理
后向逐步剔除回归是将预报因子一次性引入回归方程中,再逐步进行剔除,即每一步先要计算因子的方差贡献,挑选其中未剔除因子中方差贡献最小者进行给定信度下的F检验(即剔除检验),若通过检验则剔除该因子,否则不剔除。最后,直到回归方程中的因子均不能通过剔除检验,或者均通过剔除检验而全被剔除时,回归结束。
3.2 模型的建立
根据74项大气环流指数的资料,通过求单相关系数[1]的方法,计算前期各月大气环流因子与碧流河水库以上流域年平均降水量序列的相关系数。从中挑选出信度在0.05以上的对碧流河水库以上流域年平均降水量影响较大的因子,分别建立多元回归模型和后向逐步剔除回归模型。
多元回归模型方程:
逐步回归模型方程:
后向逐步剔除回归模型方程:
式中:y为碧流河水库以上流域年平均降水量,mm;x1为提前一年7月北美副高面积指数;x2为提前一年7月亚洲区极涡面积指数;x3为提前一年7月北半球极涡面积指数;x4为提前一年8月亚洲区极涡面积指数;x5为提前一年9月北半球副高脊线;x6为提前一年9月东太平洋副高脊线;x7为提前一年10月北非副高脊线;x8为提前一年10月北半球副高北界;x9为提前一年10月北非大西洋北美副高北界;x10为提前一年10月南海副高北界;x11为提前一年11月太阳黑子。
3.3 模型拟合及预报
定义:相对误差=(输出值-实测值)/实测值×100%;拟合相对误差不大于20%为通过;拟合通过率为相对误差不大于20%的个数占总数的比例;拟合合格率不小于70%的方程可以用作预报;预报相对误差不大于30%为通过。
各模型拟合通过率及预报相对误差结果见表1。
表1 降水量模型拟合预报结果表%
由表1可知,3种模型拟合通过率均大于70%,均可用做预报,采用2008—2011年资料进行试预报,预报精度最高为逐步回归模型,4年预报均通过,多元线性回归与后向逐步剔除回归模型4年中均有1年预报不通过。
综合考虑模型的拟合和预报结果,逐步回归模型更适用于碧流河以上流域年平均降水量预测。
4 影响因子分析
由逐步回归模型可见,挑选出的东太平洋副高脊线、太阳黑子、南海副高北界和北美副高面积指数与年平均降水量均呈负相关。
副热带高压代表了暖空气势力,它与水汽输送带紧密相连,是影响降水的重要因素。前一年9月东太平洋副高脊线位置纬度越高时,碧流河水库以上流域年平均降水量越少;前一年10月南海副高北界纬度越高时,碧流河水库以上流域年平均降水量越少;前一年7月北美副高面积越大,碧流河水库以上流域年平均降水量越少。
太阳黑子是太阳活动强弱的标志,前一年11月太阳黑子数越多,碧流河水库以上流域年平均降水量就越少。
5 结语
1)3种模型的拟合精度都达到标准,可以用来预报。逐步回归模型具有更高的预报精度,可以在预报中有一定的实际应用价值。
2)前期的东太平洋副高脊线位置、太阳黑子数、南海副高北界和北美副高面积指数等气象因子对碧流河水库以上流域年降水量的影响较大。