APP下载

基于小波变换的降雨时间序列去噪方法研究

2023-05-26李东升马金锋饶凯锋王晓燕

人民长江 2023年5期
关键词:小波基小波降雨

李东升 马金锋 饶凯锋 王晓燕

摘要:

小波变换在降雨时间序列数据的去噪方面具有显著的优势,可有效提高降雨时间序列预测的准确性。为确定降雨时间序列小波去噪过程中小波基函数、分解尺度以及阈值估计方法的选择,实现最优去噪,以国家气象科学数据中心2008~2018年的日降雨时间序列为基础数据,以中国5个不同气候类型的省份为研究区域,基于复合指标T对57种小波基函数的去噪效果进行评价,并评价去噪过程中可能的分解尺度和常用阈值估计方法。结果表明:7~10阶的Daubechies小波是去噪效果最好的小波基函数组,最小T值在0.326 4~0.422 8 之间,Symlets小波族的去噪效果最差;最优的分解尺度为3级,最小T值范围为 0.184 4~0.252 6;混合阈值和Steins无偏风险估计阈值的去噪效果最好,最小T值在0.377 3~0.435 9之间。研究成果可为中国境内降雨时间序列和其他水文气象时间序列的去噪方法提供参考。

关 键 词:

降雨时间序列; 小波去噪; 最优去噪; 最优小波基函数; 小波变换

中图法分类号: P332

文献标志码: A

DOI:10.16232/j.cnki.1001-4179.2023.05.018

0 引 言

降雨過程是水文循环的主要环节,降雨量直接影响地表水资源的变化。降雨时间序列的准确预测在日常生活、自然灾害预防、水资源规划管理等方面具有现实的指导意义。统计法是常用的降雨预测方法,以大量的历史数据为基础,通过挖掘降雨自身的变化规律进行预测[1]。如贺玉琪等[2]选用1951~2005年的降雨数据,构建BRR-SVR模型,对降雨数据进行分析预测。然而受气象等各方面因素影响,实际监测得到的降雨时间序列总是存在一定的噪声[3]。时间序列的本质被噪声掩盖,对含有噪声的时间序列进行分析计算,不能反映其真实的变化特征。研究表明,时间序列去噪方法可以有效消除数据噪声,提高预测精度[4]。

常用去噪方法包括:主成分分析法、经验模态分解、经验正交函数以及小波变换等方法[5-6]。其中,离散小波变换方法具有多分辨率分析的能力,对离散非平稳信号具有良好的去噪能力,因此被广泛应用于水文气象时间序列去噪。Nourani等[7]基于小波去噪与极限学习机和最小二乘支持向量机的耦合模型预测站点径流量,发现去噪后预测模型的相关系数提高了0.03,预测精度更好。Nury等[8]对孟加拉东北部的温度时间序列进行小波去噪,以去噪后的时间序列作为ARIMA和ANN模型的输入,对比了二者的预测结果,结果发现小波去噪-ARIMA耦合模型具有更高的预测精度。张欣欣[9]和桑秀丽等[10]分别基于小波变换对降雨进行去噪处理,利用去噪数据进行趋势分析或预测,均得到了满意的结果。

小波基函数、分解尺度以及阈值估计方法的选择决定了小波去噪的质量。目前,多数学者仅凭借经验进行3种参数的选择,或仅对一种参数进行简单对比。例如,Nayak等[11]构建小波-人工神经网络模型进行降雨-径流模拟,采用db5小波与3级分解对时间序列进行预处理;Altunkaynak等[12]对降雨时间序列进行小波3级分解,作为预测模型的输入数据;赵文举[13]与许磊[14]等分别指定sym4与db5小波作为小波基函数进行降雨时间序列的去噪处理;

Nourani等[7]对比了db3~5小波,并开展了8级分解的去噪实验。目前,大量的小波去噪研究中,由于所采用的小波基函数数量较少,且并未进行分解尺度与阈值估计方法的对比分析,不能保证获得最优的小波去噪结果。尤其,针对降雨时间序列的最优小波去噪的研究较少,极大限制了降雨时间序列数据的应用。

本文基于小波变换方法开展了相对完整的降雨时间序列最优去噪对比研究。对可进行离散变换的小波族,即Daubechies(db)、Symlets(sym)、Coiflet(coif)、BiorSplines(bior)和ReverseBior(rbio),以及常用的阈值估计方法,即通用阈值、Steins无偏风险估计阈值、混合阈值、极小极大阈值和贝叶斯阈值,以及不同分解尺度进行对比评估。本文旨在识别适合降雨时间序列小波分解的最优分解尺度,识别降雨时间序列最优去噪效果的阈值估计方法,基于小波分解尺度与阈值估计方法,识别最优去噪小波基函数,实现降雨时间序列的最优小波去噪。

1 数据与方法

1.1 实验数据

时间序列波形与小波波形的相似程度决定了小波去噪的质量,因此需要不同幅度与频率的降雨时间序列进行去噪实验以确定最优小波基函数[15]。本文所使用数据来源于国家气象科学数据中心(http:∥data.cma.cn),选取2008~2018年日降雨数据构建数据集。随着气候类型的改变,不同地区的降雨量与降雨频率不同,进而影响降雨时间序列的波形。为了确保实验结果的普适性,根据中国气候区域划分,选择5个不同区域的气象站点进行研究,分别为海南、重庆、山东、青海与宁夏站点。降雨数据的统计参数与气候区域如表1所列。

1.2 离散小波去噪

小波变换能够在不同尺度下,利用小波函数Ψ(t)

一般情况下,离散小波去噪分为3步:① 选择小波基函数和分解尺度k,将原始降雨时间序列分解为高频系数与低频系数;② 噪声大多存在于高频系数中[16],需确定合理的阈值与阈值函数进行高频系数的阈值化处理;③ 将阈值化的高频系数与低频系数重建,得到去噪后降雨时间序列。

1.2.1 小波分解

小波函数具有正则性、紧支撑性、对称性等特性[17],其中具有紧支撑性可获得合适的时频分辨率。由于降雨时间序列为离散数据,对于PyWavelets支持的14种小波函数族,排除不能进行离散小波变换和不具备紧支撑性的小波函数族后,选择10个Daubechies小波、9个Symlets小波、8个Coiflet小波、15个BiorSplines 小波以及15个ReverseBior小波,共57种常见的小波基函数进行研究,所有的小波基函数如表2所列。在本文中,分解尺度选择1~6级。最大分解尺度为kmax=log2NNcoeff-1,其中,N为降雨时间序列的长度,Ncoeff为小波函数滤波器长度[18]。

2 结果与讨论

2.1 不同分解尺度的去噪效果

本文研究了降雨时间序列离散小波去噪过程中不同分解尺度(1~6级)的去噪效果,选择通用阈值与57种小波基函数对原始降雨序列进行去噪。不同地区降雨时间序列在不同尺度下去噪的T值结果如图1所示,5个地区的T值变化趋势相同。随着分解尺度的增大,T值的平均水平呈先减小后增大的变化趋势,其中1级最大,3级最小,中位数范围分别为0.606 8~0.645 5和0.257 3~0.295 8。表3对比了5个区域气象站点数据各分解尺度的最优去噪结果。所有站点的最小T值均来自3级分解(rbio3.1出现异常值,不考虑),在0.184 4~0.252 6之间。以上结果表明,3级分解的降雨时间序列去噪效果最好;1级分解去噪效果最差,不建议应用于去噪实验中,该结果与王涛等[17]的结果一致。

2.2 不同阈值估计方法的去噪效果

选择57种小波基函数,对降雨时间序列进行3级分解,探讨常用的5种阈值估计方法的去噪效果。各阈值估计方法复合指标T箱型图如图2所示,rbio3.1出现异常值,排除其T值。本文发现所有地区Steins阈值与混合阈值的T值相等。这是因为混合阈值结合了固定阈值和Steins阈值两种阈值方法,并根据信号的信噪比大小确定具体阈值[30]。当信号的信噪比较大时,混合阈值应用Steins阈值。因此,降雨时间序列的信噪比较大,噪声相对较少。对于降雨时间序列的离散小波去噪,本文认为应采用较保守的阈值估计方法进行阈值计算,避免丢失真实信号成分。

图2中,所有站点Steins阈值、混合阈值、贝叶斯阈值的T值均较小,其次为极小极大阈值,通用阈值的T值最大。对比贝叶斯阈值,Steins阈值与混合阈值的波动程度较大,去噪效果不稳定,但后二者T值平均水平较低,在0.401 5~0.466 4之间。

T值具体结果如图3所示,由图3可知:① 重庆和青海站点的结果中,Steins阈值与混合阈值(由于结果相同,下文以混合阈值统称)的T值小于贝叶斯阈值,最低T值分别为0.377 3,0.396 0,去噪效果最优;② 海南站点的结果显示,在db族、sym族和coif族小波中混合阈值较优,bior和rbio族小波中贝叶斯阈值较优,就整体而言,混合阈值在db族、sym族和coif族小波中的结果更小,分别为0.394 1,0.393 1,0.392 8;③ 山东站点的混合阈值与贝叶斯阈值去噪效果相近,但每个小波族中的最小T值出自混合阈值,其范围在0.400 0~0.549 2 之间;④ 宁夏站点的最小T值为0.435 9,出现在混合阈值的db6小波。综上所述,混合阈值与Steins阈值的去噪效果最好;与保守的阈值估计方法不同,通用阈值过大,存在过度去噪风险,去噪效果最差,这与郭晓霞等[31]的实验结果一致。

2.3 不同小波基函数的去噪效果

选择去噪效果最优的混合阈值以及3级分解,采用57种小波基函数对降雨时间序列进行实验,以研究小波去噪的最优小波基函数。由于没有适用于所有信号的通用小波基函数[27],因此,构建能够适应不同波形且均取得较好去噪效果的最优小波组合。本文将T值最小的前5个小波基函数视为最优小波基函数,具体实验结果如表4所列。

由表4可以看出,25个最小T值中,db族小波最多,占比44%;sym族小波最少,无最优小波。db族小波在海南、重庆和山东地区得到了最小T值,去噪效果最优,在青海与宁夏地区也取得了很好的去噪效果。所以,db族小波适用于所有地区降雨时间序列去噪且效果良好。其中,最小T值主要来自db7~10小波,范围在0.326 4~0.422 8之间。除重庆地区以外,coif6~7小波的去噪效果较好,在宁夏地区coif6小波得到了最小T值0.370 8。该族小波的去噪效果仅次于db族小波。其次,bior3.5、rbio1.5也表现出了很好的去噪效果。sym族小波T值較大,去噪效果最差。综上所述,db族小波具有更好的适用性与去噪效果,db7~10小波为最优小波基函数。db族小波常用于水文气象的小波研究[32-33],Nalley等[34]将db5~10小波作为首选进行降雨时间序列的离散小波变换。本文结果与前人研究中小波基函数的选择一致,并在此基础上明确最优小波范围。

3 验证与分析

将本文结果应用于降雨时间序列预测,该数据来源于国家气象科学数据中心,选择北京市气象站点2008~2018年的日降雨数据。在选用3级分解和启发式阈值的基础上,利用db7~10小波基函数进行降雨时间序列去噪,得到去噪降雨时间序列。许浩然等[35]构建了Prophet降雨时间序列预测模型,成功证明其在降雨预测方面的适用性。本文选用Prophet模型,将数据集按照8∶2的比例划分为训练集和验证集,对原始数据与去噪后数据进行预测,并以均方根误差(RMSE)和平均绝对误差(MAE)为评价标准,进行预测精度对比,评价结果见表5。

由表5可知,db7小波去噪数据的RMSE为74.622,MAE为30.908,相比其他数据预测结果均为最低,误差相对较小,且去噪后数据的预测精度均优于原始数据,证明小波去噪可有效提高降雨时间序列的预测效果。

4 结 论

基于小波变换的降雨时间序列去噪的质量,取决于去噪过程中小波基函数、分解尺度和阈值估计方法的选择。本文以国家气象科学数据中心日降雨数据为基础数据,以中国5个不同气候类型的省份为研究区,基于复合评价指标T评估降雨时间序列去噪中57种典型小波基函数的去噪效果,探讨小波基函数、分解尺度和阈值估计方法的最优组合,以实现降雨时间序列的最优去噪。主要结论如下:

(1) db7~10被认为是最优小波基函数,T值范围为0.326 4~0.422 8。coif6~7,bior3.5,rbio1.5的去噪效果与适用性次之,T值在0.319 3~0.443 7之间。sym族小波表现较差,因此,不建议应用于降雨时间序列去噪。

(2) 降雨时间序列去噪的最优分解尺度为3级,最小T值范围为0.184 4~0.252 6;1级的去噪效果最差,最小T值范围为0.530 1~0.558 4。

(3) 降雨时间序列的小波去噪适合较保守的阈值估计方法。混合阈值与Steins无偏风险估计阈值的去噪效果最好,最小T值为0.377 3~0.435 9;贝叶斯阈值的性能次之,最小T值在0.411 3~0.440 8之间。

本文推荐db7~10、混合阈值或Steins无偏风险估计阈值、3级分解的组合作为基于小波的降雨時间序列的最优去噪组合。该组合去噪效果良好,适用性强,可有效提高降雨时间序列预测精度。本文研究成果可为中国境内降雨和其他水文气象时间序列的小波去噪方法提供参考。同时,本文使用常规的软阈值函数进行阈值处理,这种方法在追求平滑过渡的同时,降低了去噪信号与原信号的相似度,建议下一步进行改进阈值函数的对比研究,以进一步优化去噪效果。

参考文献:

[1] 王乐,张方伟,闵要武,等.基于多气候因子的长江流域长期降水预测研究[J].人民长江,2021,52(7):81-87.

[2] 贺玉琪,王栋,王远坤.BRR-SVR月降水量预测优化模型[J].水利学报,2019,50(12):1529-1537.

[3] 桑燕芳,王栋,吴吉春,等.水文序列分析中基于信息熵理论的消噪方法[J].水利学报,2009,40(8):919-926.

[4] BARZEGAR R,AALAMI M T,ADAMOWSKI J.Coupling a hybrid CNN-LSTM deep learning model with a boundary corrected maximal overlap discrete wavelet transform for multiscale lake water level forecasting[J].Journal of Hydrology,2021,598:126196.

[5] MORADI M.Wavelet transform approach for denoising and decomposition of satellite-derived ocean color time-series:selection of optimal mother wavelet[J].Advances in Space Research,2022,69(7):2724-2744.

[6] 张镇涛.基于小波变换和深度学习的电能质量扰动信号去噪与识别研究[D].南昌:南昌大学,2021.

[7] NOURANI V,ANDALIB G,SADIKOGLU F.Multi-station streamflow forecasting using wavelet denoising and artificial intelligence models[J].Procedia Computer Science,2017,120:617-624.

[8] NURY A H,HASAN K,ALAM M J B.Comparative study of wavelet-ARIMA and wavelet-ANN models for temperature time series data in northeastern Bangladesh[J].Journal of King Saud University-Science,2017,29(1):47-61.

[9] 张欣欣.基于小波分析的吉林西部平原区降雨演变周期分析[J].黑龙江水利科技,2022,50(1):28-33.

[10] 桑秀丽,苏俞真,肖汉杰,等.基于0-1测试方法的含噪声降雨-径流时间序列混沌特征分析[J].云南大学学报,2014,36(2):233-240.

[11] NAYAK P C,VENKATESH B,KRISHNA B,et al.Rainfall-runoff modeling using conceptual,data driven,and wavelet based computing approach[J].Journal of Hydrology,2013,493:57-67.

[12] ALTUNKAYNAK A,NIGUSSIE T A.Prediction of daily rainfall by a hybrid wavelet-season-neuro technique[J].Journal of Hydrology,2015,529:287-301.

[13] 赵文举,刘茜,李宗礼,等.基于小波去噪和WNN-ARIMA组合模型的年径流预测[J].数学的实践与认识,2022,52(1):172-178.

[14] 许磊.顾及数据与模型不确定性的降雨时空预测分析及处理方法研究[D].武汉:武汉大学,2021.

[15] 张炳达,刘庆,刘长胜.选取最优小波进行局放脉冲的提取和消噪[J].高电压技术,2003,29(4):14-16.

[16] 李麒,朱光平.基于SWT和SVR的重力坝变形预测研究[J].人民长江,2021,52(11):169-174.

[17] 王涛,田林亚,候建梅,等.基于小波分析的变形监测数据去噪效果对比研究[J].勘察科学技术,2017(4):15-18.

[18] LEE G R,GOMMERS R,WASELEWSKI F,et al.PyWavelets:a Python package for wavelet analysis[J].Journal of Open Source Software,2019,4(36):1237.

[19] 王新,朱高中.一种新型小波阈值法在信号消噪中的应用研究[J].高电压技术,2008,34(2):342-345.

[20] ZHANG D,ZHAO H,YANG J.Signal denoising of double-beam and double-scattering laser doppler velocimetry based on wavelet layering[J].Optik,2020,202:163-174.

[21] 邓祎昕,郭华玲,郑宾,等.基于小波模糊阈值去噪方法在MEMS加速度计去噪中的应用[J].国外电子测量技术,2021,40(8):134-138.

[22] 尚晓清,王军锋,宋国乡.基于Bayesian估计和Wiener滤波的阈值去噪方法[J].光子学报,2003,32(7):889-891.

[23] 郑敏敏,高小榕,谢海鹤.心电信号小波去噪的改进算法研究[J].中国生物医学工程学报,2017,36(1):114-118.

[24] 陈强,黄声享,王韦.小波去噪效果评价的另一指标[J].测绘信息与工程,2008,33(5):13-14.

[25] AGGARWAL R,KARAN S J,KUMAR G V,et al.Noise reduction of speech signal using wavelet transform with modified universal threshold[J].International Journal of Computer Applications,2011,20(5):14-19.

[26] PATIL R.Noise reduction using wavelet transform and singular vector decomposition[J].Procedia Computer Science,2015,54:849-853.

[27] PHINYOMARK A,LIMSAKUL C,PHUKPATTARANONT P.An optimal wavelet function based on wavelet denoising for multifunction myoelectric control[J].ECTI Transactions on Electrical Engineering,2009,2:1098-1101.

[28] 王奉偉,周世健,罗亦泳.自适应LMD融合新小波阈值函数的信号去噪[J].人民长江,2016,47(13):97-101.

[29] 朱建军,章浙涛,匡翠林,等.一种可靠的小波去噪质量评价指标[J].武汉大学学报(信息科学版),2015,40(5):688-694.

[30] 王睿家.磁性源电磁法发射机发射电流测量系统设计与实现[D].长春:吉林大学,2017.

[31] 郭晓霞,杨慧中.基于多阈值的小波包去噪[C]∥第二十七届中国控制会议论文集,昆明,2008.

[32] WU C,ZHANG X,WANG W,et al.Groundwater level modeling framework by combining the wavelet transform with a long short-term memory data-driven model[J].Science of the Total Environment,2021,783:146948.

[33] QUILTY J,ADAMOWSKI J.A maximal overlap discrete wavelet packet transform integrated approach for rainfall forecasting-a case study in the Awash River Basin(Ethiopia)[J].Environmental Modelling & Software,2021,144:105-119.

[34] NALLEY D,ADAMOWSKI J,KHALIL B.Using discrete wavelet transforms to analyze trends in streamflow and precipitation in Quebec and Ontario(1954-2008)[J].Journal of Hydrology,2012,475:204-228.

[35] 许浩然,陈中举,杨兆前,等.基于Prophet模型的湖北省月降水量预测[J].节水灌溉,2022(2):7-12.

(编辑:谢玲娴)

Abstract:

The wavelet transform has remarkable advantages in denoising of precipitation time-series data,and can effectively improve the accuracy of precipitation time-series prediction.In order to determine the selection of wavelet basis function,decomposition scale and threshold estimation method in the process of wavelet denoising of precipitation time-series and achieve optimal denoising effect,the daily precipitation time-series from 2008 to 2018 of the National Meteorological Science Data Center were used as the basis data,and the five provinces with different climate types in China were selected as the study areas.Based on the composite index T,the denoising effects of 57 kinds of wavelet basis functions were evaluated,and the possible decomposition scales and common threshold estimation methods in the denoising process were also evaluated.The results showed that the Daubechies of 7~10 order was the best wavelet basis function group,and the minimum T values ranged from 0326 4 to 0422 8.Wavelet functions from the Symlets wavelet family showed poor performance.Moreover,the optimal decomposition scale was 3-level,and the minimum T values were between 01844 and 02526.Heursure threshold and Stein unbiased risk estimation threshold had the best denoising effect,and the minimum T values were between 0377 3 and 0435 9.The research results can provide a reference for denoising methods for precipitation time-series in China and other hydrometeorological time series.

Key words:

precipitation time-series;wavelet denoising;optimal denoising;optimal wavelet function;wavelet transform

猜你喜欢

小波基小波降雨
构造Daubechies小波的一些注记
基于MATLAB的小波降噪研究
利用小波变换分析电能质量扰动问题中的电压骤升影响
小波阈值图像去噪中小波基选择
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
沧州市2016年“7.19~7.22”与“8.24~8.25”降雨对比研究
小波非参数回归分析方法的实现及比较研究*
红黏土降雨入渗的定量分析
南方降雨不断主因厄尔尼诺
基于FPGA小波变换核的设计