基于PCA的自由跌水溢洪道冲刷深度计算模型
2018-10-21王俊张凯
王俊 张凯
摘要:针对采用量纲分析结合多元线性回归建立公式的方法无法解决变量之间存在较高相关性的问题,而神经网络、支持向量机等软计算方法在处理高维变量时也会出现误差较大的缺点。本文提出了一种基于主成分回归的自由跌水平衡冲刷深度计算模型。用收集到的数据对模型进行验证和精度分析;结果表明,该模型计算精度高,为准确计算自由跌水平衡冲刷深度提供一条有效的途径。
关键词:自由跌水;溢洪道;冲刷深度;PCA;预测
溢洪道的自由溢流往往会对下游河床产生非常高的冲击力,在溢洪道的基础周围形成冲刷坑,这些冲刷坑的不断发展,有可能破坏堰坝基础结构,危及大坝的稳定性。因此,确定溢洪道下游的冲刷深度是至关重要的。目前,采用量纲分析结合多元线性回归建立公式的方法无法解决变量之间存在较高相关性的问题,而神经网络、支持向量机等软计算方法在处理高维变量时也会出现误差较大的缺点。为此,在充分参考前人的研究的基础上[1,2],本文基于主成分回归原理构建了一种利用主成分回归分析来预测自由跌水溢洪道冲刷深度的模型。
1 主成分回归分析[3-5]
主成分回归分析是是回归系数参数的一种线性有偏估计,同其它有偏估计,如岭估计等一样,是为了克服最小二乘估计在设计阵病态时表现出的不稳定性而提出的。
在采用最小二乘估计的多元线性回归分析中,如果自变量间会在较高程度的相关性,则会使各回归系数估计的方差很大,较严重的多重共线性会导致不能准确地解释因变量的变化。主成分回归分析通过对高维变量进行降维处理,可用少数几个相互独立的主成分的线性组合来表示存在较高相关性的指标,这些主成分线性组合能够反映原来多个实测指标的主要信息。通过对标准化的因变量和主成分进行回归,进而建立标准化线性方程。再对回归方程进行参数重组,将标准化线性方程转化为原因变量和原自变量的表达式,得到最终回归预测方程。
2.实例分析
主成分分析法可以排除影响因子共存中相互重复的信息,减少输入量并滤去噪音[4]。这里我们选择河槽单宽流量q、堰顶上水头h0、冲刷前的下游水深h、泥沙中值粒径d50为自变量;平衡冲刷深度S为因变量。以文献1中的114组试验数据为基础,利用Matlab编程对随机选取的85组数据进行主成分回归分析。
经计算,相关系数矩阵的四个特征值依次为2.4377,0.9732,0.5829,0.0059;最后一个特征值接近于零,前三个主成分的累积贡献率达到0.9985。于是我们略去第4个主成分,得到三个主成分:
3.模型检验
利用未用到的29组模型试验数据对得到的计算模型进行检验,检验结果如图1所示。由图1可以看出,数据点基本上沿线的两侧分布,且偏离程度较小。利用相对误差进行误差分析的结果显示(见图1),绝大多数数据点都分布在相对误差为已内,只有个别点的误差超过了20%;另外,相关系数的计算结果高达到91.86%。这说明本文的方法在預测自由跌水溢洪道冲刷深度时,精度较高,适用性较强。
4结论
为提高自由跌水溢洪道冲刷深度的预测准确度,针对采用量纲分析建立经验公式以及神经网络、支持向量机等方法的缺点;结合已有研究成果,本文构建了基于PCA的自由跌水溢洪道冲刷深度计算模型。误差分析结果表明,本模型具有较高的预测精度,为工程实际以及科学研究中预测自由跌水溢洪道冲刷深度提供了一种新方法。
参考文献:
[1]DAgostino V,Ferro V. Scour on Alluvial Bed Downstream of Grade-Control Structures[J]. Journal of Hydraulic Engineering,2004,130(1):24-37.
[2]DAgostino,V. Indagine sullo scavo a valle di opere trasversali mediante modello fisico a fondo mobile.Energ. Elettr,1994,71(2),37–51.
[3]司守奎,孙兆亮. 数学建模算法与应用.第2版[M]. 国防工业出版社,2015.
[4]聂敏,刘志辉,刘洋,等. 基于PCA和BP神经网络的径流预测[J]. 中国沙漠,2016,36(4):1144-1152.
[5]卢艳丽,白由路,杨俐苹,等. 基于主成分回归分析的土壤有机质高光谱预测与模型验证[J]. 植物营养与肥料学报,2008,14(6):1076-1082.