APP下载

相空间重构和参数统一求解的石油价格预测

2013-07-22孙善辉张祖峰

计算机工程与应用 2013年23期
关键词:石油价格相空间宿州

孙善辉,李 鸿,张祖峰

1.宿州学院 智能信息处理实验室,安徽 宿州 234000

2.宿州学院 数学与统计学院,安徽 宿州 234000

3.宿州学院 信息工程学院,安徽 宿州 234000

相空间重构和参数统一求解的石油价格预测

孙善辉1,2,李 鸿3,张祖峰2

1.宿州学院 智能信息处理实验室,安徽 宿州 234000

2.宿州学院 数学与统计学院,安徽 宿州 234000

3.宿州学院 信息工程学院,安徽 宿州 234000

1 引言

石油作为一种主要能源,对一个国家政治稳定、经济发展起着至关重要的作用,石油价格受到军事、政治、经济和外交等因素综合影响,具有随机性、突变性和混沌性等变化特点,因此石油价格预测一直是预测领域中的研究热点[1]。

基于混沌理论的石油价格预测主要包括相空间重构和预测算法两个重要内容,两者相互联系,相互影响,共同作用于石油价格预测模型的预测结果。为了提高石油价格预测精度,综合考虑相空间重构和预测算法之间的内在联系,本文提出一种基于相空间重构和预测算法参数统一求解的石油价格预测模型(PSR-LSSVM),并采用大庆石油价格数据对模型性能进行仿真实验,以检验本文模型的可行性和优越性。

2 相关研究工作

石油价格已经被证明是一个低维的混沌时间序列[2]。相空空间重构是混沌时间预测的基础,可以挖掘隐藏于混沌吸引子中的演化规律。相空间重构时,时间延迟(τ)和嵌入维(m)的选取至关重要,直接影响到后继石油价格的预测精度[3]。对于参数τ和m的选取,目前主要有两种思想:(1)τ和m分别、单独求解。如首先采用自相关法、互信息法等来确定τ,然后采用G-P方法、伪最近邻域法等来确定m,然而自相关法仅能提取时间序列间的线性相关性;互信息法虽能反映出系统的多种整体性关系,但这些关系只是高维相空间在二维空间中的投影,仅反映出重构相空间中相邻两重构坐标的独立性,而不能保证所有重构坐标间的整体独立性。且在大多数的方法中,为了确定最佳的τ,需要先确定m,而为了确定m又需事先固定τ,这必将造成矛盾[4]。(2)τ和m统一求解。如Broomhead等提出了时间窗口法;Kim等提出的C-C法,τ和m统一求解利用τ、m间的相互关系,使重构后的石油价格时间序列更加准确反映石油价格变化趋势,因此当τ、m常采用统一求解的思想[5]。当前,石油价格预测算法主要采用神经网络和支持向量机等机器算法[6-7],由于最小二乘支持向量机(LSSVM)具有训练速度快,泛化能力优异等优点,因此本文选择LSSVM作为石油价格预测算法,而LSSVM预测性能与其参数的选择密切相关[8]。在基于LSSVM的石油价格预测预测模型中,其预测精度由相空间重构和LSSVM共同确定,但目前石油价格预测没有考虑两者之间的联系,完全割裂两者之间的内在联系,导致τ和m的选取与LSSVM参数不匹配,难以建立整体性能最优的石油价格预测模型。

3 相空间重构和最小二乘支持向量机

3.1 相空间重构理论

设时间序列{xi},其时间间隔为∆t(单位时间),那么对于n个变量的动力系统有:

通过消元法,使其变换为一个n阶非线性微分方程:

变换后,新轨迹为:

式(3)描述了与原时间序列同胚的动力学系统,它由x(t)加上 (n-1)阶导数 x(1)(t),x(2)(t),…,x(n-1)(t)构成的相空间重组,代替这种连续变量x(t)和它的导数,并可考虑不连续的时间序列和它的 n-1时滞位移

只要将时间延迟τ选作时间序列的时间尺度,将会保证延滞坐标线性无关。

设单变量时间序列为{x(ti),i=1,2,…,n},时间延迟为τ=k∆t,k=1,2,…,则可将该时间序列延拓成 m维相空间:

式中,Xi(t)为m维相空间中的一个相点。

任一相点Xi(t)有m个分量,m满足条件:

m维相空间中的一个相点表示系统在某个瞬时后的状态,而相点的连线构成了点在相空间中的轨迹,这条“轨线”便表示了系统状态随时间的演化。于是在m维相空间中得到了一个相型,原则上讲,就有了足够的信息把时间序列的动态特性展现在多维相空间上来进行考察[9]。

根据Takens定理,由合适的嵌入维数m和时间延迟τ重构的相空间,其在嵌入空间中的“轨线”与原系统是动力学等价的,因此有:

式中,T为预测步长,f()为重构的预测模型。

根据式(6),可以通过已知时间序列求出满足式(6)的f(),就可以得到一个预测模型。

3.2 最小二乘支持向量机

对于训练样本集{(xi,yi)},i=1,2,…,n,xi和 yi分别表示样本输入和输出,通过非线性映射函数Φ()将样本映射到高维特征空间,从而获得最优线性回归函数:

式中,w为特征空间的权值向量,b为偏置量。

根据结构风险最小化原则,式(7)问题求解的LSSVM回归模型为:

式中,γ为正则化参数;ei为误差。

通过引入拉格朗日乘子将式(8)转变为对偶空间优化问题,即

式中,αi为拉格朗日乘子。

根据Mercer条件,核函数定义如下:

选择RBF核函数作为LSSVM核函数,RBF核函数定义如下:

式中,σ为核函数宽度[10]。

最后LSSVM回归模型为:

在LSSVM建模过程中,参数γ、σ对预测结果产生影响,当前LSSVM算法均没有考虑γ、σ和τ、m间的联系,建立的预测模型存在一定的缺陷。为了克服该缺陷,本文提出τ、m和γ、σ的统一求解思想。

4 石油价格预测模型参数统一求解

τ、m和γ、σ的统一求解是一个多参数组合优化问题,遗传算法(GA)具有智能性搜索、并行式计算和全局优化等优点的仿生算法能够在较短时间找到全局最优解[11],因此本文采用GA算法对τ、m和γ、σ进行统一求解。

4.1 个体编码设计

为了便于进行交叉和变异操作,GA的个体采用二进制编码,每一个体包括τ、m和γ、σ四部分。由于个体采用二进制编码,在进行石油价格预测与建模时,通过式(13)将参数转换为十进制数。

式中,p表示参数的十进制值;pmin和 pmax表示参数的最小值和最大值;l表示个体二进制长度;d表示参数的二进制位串的十进制值。

4.2 适应度函数设计

粒子的优劣通过适应度函数值来评价,相空重构和预测算法参数统一求解目标是提高石油价格的预测精度,因此采用石油价格预测精度作为粒子的适应度函数,即有:

式中,accuracy表示在参数τ、m和γ、σ下的石油价格预测精度。

4.3 石油价格预测模型参数统一求解过程

(1)收集石油价格时间序列数据,由于LSSVM对0到1之间的数据最为敏感,因此对石油价格进行归一化预处理,具体为:

最后需要对石油价格预测结果进行反归一化处理,恢复真实预测值,具体公式如下:

(2)采用随机方法产生初始化种群,每一个体由τ、m和γ、σ四部分组成。

(3)对个体进行反编码,根据τ和m对石油价格时间序列进行重构,LSSVM根据参数γ、σ石油价格时间序列训练集进行学习,建立相应的石油价格预测模型,计算每一个体的适应度值。

(4)判断是否满足算法的结束条件,若满足结束条件,则停止优化,并对最优个体对进行反编码,得到最优的τ、m和γ、σ,并转至步骤(6)。

(5)对个体进行选择、交叉、变异等遗传操作,产生下一代种群,返回步骤(3)对参数继续进行优化。

(6)根据最优参数τ、m重构石油价格时间序列,LSSVM采用γ、σ对石油价格训练集进行学习,建立最优的石油价格预测模型,并对测试集进行预测,得到石油价格预测结果。

石油价格预测模型的建立流程如图1所示。

图1 石油价格预测模型建立流程

5 仿真实验

5.1 数据来源

采用2001年1月31日至2013年4月30日的大庆石油月平均价格作为仿真对象,共收集到160个数据,它们组成石油价格时间序列如图2所示。前100个数据作为训练集,后60个数据作为测试集。

图2 石油价格时间序列

5.2 对比模型及评价标准

为了使PSR-LSSVM的石油价格预测模型的结果具有可比性,选择两种对比模型,分别为:(1)互信息法和虚假邻点法分别求解τ、m,GA优化LSSVM参数γ、σ的石油价格预测模型(LSSVM);(2)首先采用C-C求解τ、m,然后采用GA优化LSSVM参数γ、σ的石油价格预测模型(CC-LSSVM)。采用均方误差(RMSE)、平均相对百分比误差(MPAE)作为模型预测结果优劣的评价标准。

5.3 模型实现

5.3.1 LSSVM的建模过程

对于图2的石油价格时间序列,采用互信息法求其互信息函数,取其第一个极小值点作为延迟时间,由图3可知,当τ取3时,得到第一个极小值,此时τ即为时间延迟。

图3 互信息法求时间延迟

通过虚假最近邻点法求嵌入维数,结果如图4所示,所求嵌入维数为4。用小数据量法计算大庆石油月平均价格时间序列的最大Lyapunov指数为1.163,表明大庆石油月平均价格时间序列具有混沌性。

图4 虚假邻点法求嵌入维数

根据τ=3,m=4对石油价格时间序进行重构,然后将重构的石油价格时间序列训练集输入到LSSVM进行学习,采用GA对γ、σ进行优化,得到最优的γ=20.12,σ=1.43,从而建立基于LSSVM的石油价格预测模型。

5.3.2 CC-LSSVM的建模过程

对于石油价格时间序列,使用CC方法进行相空间重构。图5为C-C方法计算延迟时间τ,从图中可以看出,∆Sˉ(t)的第1个近似极小值是4,Sˉ(t)的第1个近似零点也是4,于是确定延迟时间τ=4作为石油价格时间序列的时间延迟。

图5 C-C法计算石油价格时间序列的时间延迟

图6给出了采用C-C方法计算石油价格时间序列的Scor(t)曲线,可以看出Scor(t)大约在t=18时取得全局最小点,依据τw=(m-1)τ,因而取m=4。

图6 C-C法计算石油价格时间序列的Scor(t)曲线

根据τ=4,m=4对石油价格时间序列进行重构,然后将重构的石油价格时间序列训练集输入到LSSVM进行学习,采用GA对γ、σ进行优化,得到最优的γ=147.55,σ= 1.55,从而建立基于CC-LSSVM的石油价格预测模型。

5.3.3 PSR-LSSVM的建模过程

根据上述石油价格预测模型参数统一求解过程,得到PSR-LSSVM的最优参数为:τ=1,m=5,γ=176.45,σ=6.22,根据最优参数,建立基于PSR-LSSVM的石油价格预测模型。从而得到3种石油价格预测模型的参数见表1。

表1 石油价格预测模型的参数

5 .4 结果与分析

5.4.1 模型的泛化能力对比

根据建立的LSSVM、CC-LSSVM和PSR-LSSVM预测模型对石油价格训练集进行拟合,得到的拟合结果如图7所示。

图7 各模型对石油价格训练集拟合结果

从图7可知,在所有预测模型中,PSR-LSSVM的拟合效果最好,其拟合结果与石油价格期望输出相当吻合。这主要是由于PSR-LSSVM通过对相空间重构的参数τ,m与LSSVM的参数γ,σ进行统一求解,挖掘了相空间重构和LSSVM之间的内在联系,可以更加准确地拟合石油价格复杂的变化趋势,进一步提高了石油价格拟合精度,对比结果表明,将PSR-LSSVM用于石油价格建模的思想是可行的、有效的,性能明显优于τ,m与γ,σ分别、单独优化的石油价格预测模型。

5.4.2 模型的泛化能力对比

评价一个预测模型性能的优劣,主要考察其预测能力而非拟合能力,因此,分别用LSSVM、CC-LSSVM和PSR-LSSVM的石油价格预测模型对测试集进行预测,得到的预测结果如图8所示。从图8可知,PSR-LSSVM的预测性能要优于对比模型,预测结果与实际石油价格值更加吻合,是一种预测精度高、泛化能力强的石油价格预测模型。

图8 各模型对石油价格测试集的预测结果

各种模型的预测拟合和预测误差见表2。从表2各种评价标准可知,PSR-LSSVM预测结果误差远远小于LSSVM和CC-LSSVM,预测精度得以提高,综合对比结果表明,PSR-LSSVM对相空间重构和预测算法参数进行统一求解,可以提高石油价格的预测精度,克服传统分开、单独优化难以找到全局最优参数的缺陷,预测结果更加可靠。

表2 不同石油价格预测模型的性能对比

6 结束语

石油价格具有时变性、混沌性,在石油价格建模预测过程中需要对相空间进行重构和对预测算法的参数进行优化,为此,充分利用两者之间的联系,挖掘出石油价格复杂的变化趋势,提出了一种基于PSR-LSSVM的石油价格预测模型。仿真实验结果表明,相对于对比模型,PSR-LSSVM提高了石油价格预测精度,研究成果对于具有混沌特性的石油价格建模和预测具有重要的理论和实践意义。

[1]杜光年,刘志斌.石油价格波动分析与预测方法研究[D].长沙:湖南大学出版社,2006.

[2]朱小梅,郭志钢.石油价格预测算法的仿真研究[J].计算机仿真,2011,28(6):361-364.

[3]葛根,王洪礼,许佳.小波分频技术和混沌时间序列在国际石油价格预测中的应用[J].系统工程与理论实践,2009,29(7):64-69.

[4]马红光,李夕海,王国华.相空间重构中嵌入维和时间延迟的选择[J].西安交通大学学报,2004,38(4):335-338.

[5]张春涛,马千里,彭宏.基于信息熵优化相空间重构参数的混沌时间序列预测[J].物理学报,2010,59(11):7623-7629.

[6]Farooq M,Mahdi N.Forecasting output using oil prices:a cascaded artificialneuralnetwork approach[J].Journalof Economics and Business,2006,58(2):168-180.

[7]吴虹,尹华.ARIMA与SVM组合模型的石油价格预测[J].计算机仿真,2010,27(5):264-266.

[8]陈帅,朱建宁,潘俊.最小二乘支持向量机的参数优化及其应用[J].华东理工大学学报:自然科学版,2008,34(2):278-282.

[9]祝金荣,何永秀.基于混沌理论和支持向量机的电价预测[J].华东电力,2008,36(5):16-20.

[10]刘立霞,马军海.基于LS-SVM的石油期货价格预测研究[J].计算机工程与应用,2008,44(32):230-231.

[11]Huang C L,Wang C J.A GA-based feature selection and parametersoptimization forsupportvectormachines[J]. Expert Systems with Applications,2006,31:231-240.

SUN Shanhui1,2,LI Hong3,ZHANG Zufeng2

1.Laboratory of Intelligent Information Processing,Suzhou University,Suzhou,Anhui 234000,China
2.College of Mathematics and Statistics,Suzhou University,Suzhou,Anhui 234000,China
3.College of Information Engineering,Suzhou University,Suzhou,Anhui 234000,China

In order to improve the predicting accuracy oil price,a novel oil price predicting model is proposed based on unified solving parameters phase space reconstruction and predicting algorithm according to relation between phase space reconstruction and predicting algorithm.The least square support vector machine is selected as the predicting algorithm of oil price,and the parameters of phase space reconstruction and LSSVM are taken as individuals of the genetic algorithm,and the optimal delay time,embedding dimension and LSSVM parameters are obtained through selection,crossover and mutation evolutionary mechanism,the predicting model of oil prices is established and the performance of predicting model is tested by Daqing oil price time series.The results show that the proposed model obtains higher predicting accuracy than the models which phase space reconstruction and LSSVM are optimized independently,and it provides a new research idea for the predicting problem of chaotic time series.

oil price;least squares support vector machine;phase space reconstruction;unified solving;modeling and predictions

为了提高石油价格预测精度,利用相空间重构和预测算法参数之间的相互联系,提出一种基于相空间重构和预测算法参数统一求解的石油价格预测模型(PSR-LSSVM)。选择最小二乘支持向量机作为石油价格预测算法,将相空间重构和LSSVM参数作为遗传算法的个体,通过选择、交叉和变异等进化机制找到最优的时间延迟、嵌入维和LSSVM参数,根据最优参数建立石油价格预测模型,并通过大庆石油价格时间序列对模型性能进行测试。结果表明,相对于独立优化相空间重构和LSSVM参数的石油价格预测模型,PSR-LSSVM获得了更高的石油价格预测精度,为具有混沌性的时间序列预测问题提供了一种新的研究思路。

石油价格;最小二乘支持向量机;相空间重构;统一求解;建模预测

A

TP391

10.3778/j.issn.1002-8331.1308-0068

SUN Shanhui,LI Hong,ZHANG Zufeng.Oil price predicting based on unified solving by phase space reconstruction and parameters.Computer Engineering and Applications,2013,49(23):247-251.

安徽省高校优秀青年人才基金项目(No.2012SQRL202);宿州学院智能信息处理实验室开放课题(No.2013YKF15)。

孙善辉(1979—),男,讲师,主要研究领域为分形几何及其应用;李鸿(1965—),男,博士生,教授,主要研究领域为数据挖掘、算法设计与分析;张祖峰(1979—),男,博士,讲师,主要研究领域为分数阶微分方程。

2013-08-07

2013-09-23

1002-8331(2013)23-0247-05

猜你喜欢

石油价格相空间宿州
安徽宿州灵璧县:多措并举发展特色产业
束团相空间分布重建技术在西安200 MeV质子应用装置的应用
宿州学院
宿州绿地城基坑防洪安全设计
石油价格沉底
经济增长对石油需求及石油价格影响的计量分析
非对易空间中的三维谐振子Wigner函数
“钻”研40年 宿州地下终于挖出钻石
基于相空间重构的电磁继电器电性能参数预测研究
相空间重构和支持向量机结合的电力负荷预测模型研究