不同窗口长度的奇异谱分析研究
2014-11-13单文广
单文广
摘 要: 窗口的长度是一个非常关键的调整参数的奇异谱分析(SSA)技术。为在SSA应用中找到窗口长度的最佳值,可使用周期谱图分析法进行SSA窗口长度的选择。佛罗里达州的降水数据含有一些潜在的周期性,使用周期谱分析方法的应用方法确定窗口长度,提取降水时间序列的潜在降雨周期,能有效进行降水预报分析,结果成功确认周期谱分析可以在SSA应用中选择窗口长度提供有效的帮助。
关键词: 奇异谱分析(SSA) 窗口长度 线性递推公式(LRFS) 周期谱分析
奇异谱分析(SSA)是在许多科学研究领域进行时间序列分析的可靠的技术创新。SSA技术由Broomhead和King(1986a,1986b)首次提出,其已经成为应用不同的单一和多变量时间序列分析领域的一个有效的工具。Allen和Smith(1996)阐明了SSA的基本格式与调节振荡的研究,探索了在蒙特卡罗算法和记录的变化。Yiou(2000)等人应用扩展的方法,对非平稳时间序列包括间歇性使用小波分析的多尺度方差发散的概念进行研究。Marques(2006)等人应用SSA方法和水文时间序列,研究单一时间序列其主要信息的分解能力及相关的预报技巧。Baratta(2003)等人提出SSA新的发展技术应用于台伯河流域的降雨时间序列的预报。目前,SSA技术已运用于各应用领域。
根据SSA算法的一般结构,其有两个基本的和重要的参数:窗口长度L和SSA特征值数r,参数L和R的选择取决于所要分析的数据。L和R的正确的选择影响着时间序列的有效的分解。Elsner和Tsonis(1996)做了一些关于SSA应用中常规参数选择的探讨。Mahmoudvand和Zokaei(2012)研究了Hankel矩阵的奇异值的性能,获得了最佳的结果参数值。
值得注意的是,L的变化会影响SSA方法中重建组分的可分特性。为找到应用中窗口长度L最优值,我们用周期谱分析的方法进行SSA窗口长度L选择研究,通过使用周期谱分析方法应用于佛羅里达州的降水数据获得潜在的周期,然后应用SSA技术提取降雨时间序列的周期,比较在不同的窗口长度L的预测结果。
1.方法和数据
1.1奇异谱分析
SSA的主要目的是分解几个组件系列组,算法主要描述遵循Golyandina(2001)等人的方法。若对于一时间序列X=(x■,x■,…,x■),窗口长度为L,且1 Y=[Y■,Y■,…,Y■]=x■ x■ … x■x■ x■ … x■x■ x■ … x■… … ?埙 …x■ x■ … x■(1) 然后对其进行经验正交展开,得出前几个特性向量即可表示序列周期振荡的主要模态和趋势,可用来识别和描述序列中蕴含的各种线性或非线性振荡信号,而相对应的时间系数则表示相应周期的长期变化特征。由于经过奇异谱分解,序列的频域信号被分解为具有单一循环周期的时域信号,因此可按下式重建各个振荡分量序列。 f■=■■e■■ for 1≤k 由此表明,SSA算法的应用需要选择两个参数:窗口的长度L和特征向量数量r。 1.2周期谱分析 周期谱是一个信号的谱密度估计,周期谱分析能够找出哪些频率包括在系列中。一个序列(x■,x■,…,x■),周期谱的定义可以描述为: P(T)=■■x(n)e■■(3) 方程表明谱密度估计和嵌入式周期之间的关系,可以表明哪些期间应视为主要周期。 1.3线性递归公式 线性递归公式的理论和相关的特征多项式是众所周知、广泛使用的。根据定义,一个非零序列X■=(x■,x■,…,x■)可由一个线性递推公式(LRF)表示为: x■=■a■x■(3) LRF的特点是可应用于各种广泛的模型并依赖于不同的滞后变量。 1.4数据 在目前的研究中,使用的数据是某地的月平均降水资料,从1981年1月到2012年12月。如图1所示,32年(1981-2012)月降水的奇异的时间序列数据,其中28年的记录是用来分析的,最近4年的记录用来验证预测的。 图1 月降水量 2.结果与讨论 本研究中使用月降水资料,28年(N=336)。为了描述降水时间序列特性,研究了不同的窗口长度L的奇异谱分析。长度为N的测试数据,以N/2=168和N/3=112作为窗口长度。为了找到可能的嵌入式周期,周期谱分析法被应用到的原始数据,如图2所示,有四个明显的周期谱峰,对应于周期T■=12、T■=21、T■=44和T■=81。 图2 降水时间序列的周期谱图 这些可能的固有周期为可选的窗口长度的值。基于这些选择的窗口长度L对时滞排列矩阵进行奇异谱,得到有序的主成分。图3显示了第一主成分和相关的贡献率分析:从波动趋势平稳随L的变化,以及相应的贡献率下降。 图3 观察值和第一主成分及 SSA方法的主要特点是能够很好地分离不同的组件。在大多数情况下,所占百分数小的成分通常对应噪声成分,所以这些主成分都能正确地描述该系列的总趋势。在不同的窗口长度下,重建这些主成分和原来的时间序列进行对比,如图4所示。 图4 观测值与拟合值 在图4中,模拟的时间序列很好地拟合了原始时间序列,结果如表1所示。 表1 拟合序列各项参数 基于这些主要成分的时间序列分析中,LRF分别应用到主成分的时间序列并对主成分进行了预测,然后这些新的主成分形成了4年的降水预报(2009-2012)。图5显示了观测值与预测值的对比分析。 图5 降雨观察和预测对比图 图5充分表明,此方法能够很好地预测降水的变化随着季节趋势性的演化特征。为了评估并比较预测的性能,使用以下定量验证方法:根均方误差(RMSE)、决定系数(R2)和平均绝对误差(MAE)。统计验证对比结果如表2所示。 表2 预测结果对比 从以上数据和验证的标准可发现,窗口长度L=81的预测,表现出更好的性能。 3.结语 以上应用SSA和LRF方法对降水时间序列进行了预测。降水时间序列的周期谱分析表明,一些可能的固有周期可作为可选的窗口长度,并且这些主要成分很好地拟合了原始时间序列。图形的对比和预测结果的比较表明,窗口的长度L=81的预测为最好的参数选择。结果表明在SSA应用中,周期谱分析法能够很好地选择窗口长度,并进行复杂的时间序列预测。