APP下载

时间序列挖掘与预测研究

2014-10-21蒲倩

新校园·上旬刊 2014年9期
关键词:预测分析

蒲倩

摘 要:时间序列作为一种常用的数据类型,已经在各类数据的分析中得到了广泛使用。在面对这些海量数据时,需要采取新技术筛选出其中有用的数据,数据挖掘技术正是基于这一背景产生的。在数据挖掘技术中,时间序列挖掘是关键技术。本文主要分析时间序列挖掘与预测方式。

关键词:时间序列挖掘;预测;分析

一、时间序列挖掘与预测分析

时间序列模式挖掘作为数据挖掘中最为重要的问题,在现实生活与生产中已经得到了广泛的应用。时间序列即按照时间顺序来获取观测值的方式。在日常生活中,很多数据都是以时间序列出现的,这些数据对于相邻观测值具有依赖性特征,时间序列挖掘与预测模式与依赖性特征有着密切的关系,其研究内容包括相似性搜索、趋势分析、周期模式挖掘、序列模式挖掘等。

1.相似性搜索

相似性搜索即找出数据库中与相关条件相似的数据,在这些序列中,包括子序列匹配与整体序列匹配两种方式。这些序列的应用范围十分广泛,其中,数据变换是核心。数据变换就是从时间域到频率域的分析,一般使用欧式距离来计算,在计算时,需要先确定好变换矩阵,再确定相关计算数据。

在经过DWT以及DFT变化之后,可以使用傅里叶细数来制造出多维索引,再将数据提供给系统,就能够检索出查询序列之间的距离,通过实际距离的查询即可完成后处理工作。在匹配子序列时,将序列分割成为一定长度的片段,每一个片段对应不同的线索,序列可以使用最小边界矩形表示。要想搜索到更长的匹配序列,可以使用多片组装算法进行。

2.趋势分析

趋势分析可以应用在长期或者趋势变化、循环变动或循环变化、季节性变动或者季节性变化、非规则或者随机变化集中类型的数据预测中。这些数据有着季节性、非规则性、循环性以及趋势性特征,能够使用不同的变量进行表示,这样即可帮助人们制订出长期预测或者短期预测。

3.周期模式挖掘

周期模式挖掘即在数据库中寻找重复出现模式的一种预测模式,周期模式能够应用在交通数据、行星轨道数据、能源消耗数据、季节性数据等数据模式的预测中。按照问题类型的不同,周期模式能够分为挖掘全周期模式、挖掘部分周期模式以及挖掘循环模式几种。

二、时间序列预测统计学基础

1.时间序列统计学特征分析

时间序列的统计学特征包括均值函数、自协方差函数与自相关函数三种。

均值函数:对于t而言,时间序列均值函数如下:μt=U[x1]Δ■xf1(x)dx;自协方差函数:y=Cov(xt,xy)ΔE[x1-Ex2(xi-Exi+1)]

2.时间序列平稳性分析

在时间序列分析时,常常存在平稳时间序列,这种平稳定会在时间的推移下出现相应的变化。若时间序列中各项随机变量是一种独立性关系,且存在相同分布,就是独立同分布序列,其常见的序列类型有白噪声序列,白噪声序列和独立同分布序列之间是一种独立的关系。

三、时间序列分段线性表示

在时间序列数据挖掘研究内容中,相似性搜索是其中的重要内容,在进行计算时,需要遵循Keogh度量准则,这能够很好地反映出各项内容,但是在反应时间轴比例时需要额外考虑到周期问题。在进行时间序列相似性搜索时,可以对其进行聚类分析。目前,这种方式已经在各个领域中得到了广泛的使用,如在图像处理、模式识别、数据分析工作中,虽然聚类分析能够应用在时间序列分析中,但是与图像处理、模式识别、数据分析工作相比,时间序列数据量较大,使用该种分析方法会提高计算开销,为了减少开销,就需要对实践序列开展分段线性化处理,该种模式更加适宜应用于普通数据挖掘算法计算中。

目前,时间序列数据多应用在气象数据、金融数据的计算中,这些数据会受到各种因素的影响,存在较大的随机性与偶然性,因此,有学者针对这些计算提出时间序列长记忆性问题。其他研究者也提出了遗传算法、神经网络算法、卡尔曼滤波算法等一系列的计算方法,在使用这些算法来计算复杂系统时,需要建立好相应的模型,使用表征模型特征进行表达。但是,若系统较为复杂,也存在短期波动,使用一个模型很难计算出具体的精度与效率,而丢弃数据也会影响历史数据,降低计算精度,而应用大量例数数据也会影响计算时间与预测效率。为了提升数据计算的精度,就可以使用时序预测方法或者多层次数据分解法,使用平滑因子来拆解序列,这就能够为后续建模的开展奠定好坚实的基础。对于拆解完成的序列,可以使用相应的采样频率,这不仅会提升计算精度,也能够在一定程度上降低计算的复杂性。

总之,时间序列作为一种常用的数据类型,已经在各类数据的分析中得到了广泛的使用。在使用时间序列挖掘与预测方式时,需要针对具体的问题建立好相应的模型,这样才能够达到理想的计算成效。

参考文献:

[1]张德干,郝先臣,徐凌宇,杜庆东,赵海.基于小波理论的数据挖掘方法研究[J].小型微型计算机系统,2001(8).

[2]李锁花.时间序列挖掘技术及其在短期电力负荷预测中的应用研究[D].南京:東南大学,2006.

猜你喜欢

预测分析
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
隐蔽失效适航要求符合性验证分析
不可预测
电力系统不平衡分析
不必预测未来,只需把握现在
电力系统及其自动化发展趋势分析
中西医结合治疗抑郁症100例分析