基于分布式架构的时间序列局部相似检测算法
2017-01-13林炀江育娥林劼
计算机应用 2016年12期
关键词:时间序列
林炀+江育娥+林劼
摘 要:基于动态时间规整算法思想的CrossMatch算法可以用来解决序列间的部分相似问题,但是由于算法时间空间复杂度过高,需要消耗大量的计算资源,因此无法应用于长序列之间的计算。针对以上问题,提出了一个基于分布式平台上的时间序列局部相似性检测算法。将CrossMatch算法实现在了分布式框架上,解决了计算资源不足的问题。首先需要对序列进行切分,分别放置在不同的节点上;其次,各节点分别处理各自序列的相似部分;最后,通过对结果进行汇总并拼接,找出序列间的局部相似。实验结果表明,该算法在准确性上和CrossMatch相近,在时间上也有提升。改进后的分布式算法不仅解决了单机无法处理的长序列计算问题,而且可以通过增加并行计算节点数提高运行速度。
关键词:动态时间规整;MapReduce;时间序列;局部相似性;并行化
中图分类号: TP301.6;TP311.1
文献标志码:A
文章编号:1001-9081(2016)12-3285-07