APP下载

金融时间序列K线形态的Motif模式挖掘研究

2018-03-23车文刚权鹏宇周志元

软件 2018年2期
关键词:收盘价乌鸦股票

龙 婧,车文刚,权鹏宇,周志元

(1. 昆明理工大学 信息工程与自动化学院,云南 昆明 650500;2. 昆明理工大学 云南省计算机技术应用重点实验室,云南 昆明 650500)

0 引言

金融数据中心存放并管理着企业核心的金融业务数据,包括:系统业务数据、交易痕迹数据、客户行为数据等等。这些数据涉及企业运营的方方面面,是企业的核心信息资产[1]。金融市场作为一个复杂的系统,不仅仅是一个互动的参与人数众多的制度,也受到政治,文化和经济等诸多因素的影响[2]。而时间序列是一种与数据点有关的序列[3],股票时间序列既包括开盘价、收盘价、最高价和最低价,也包括在交易日进行的股票价格的连续测量值,即成交量。股票时间序列中所蕴含的信息对股票投资者的决策起着关键性作用,这也决定了对股票时间序列的研究随着数据挖掘技术的深入而成为热点研究问题。

但是,由于传统的时间序列方法及其变化更倾向于关注价格和转折点而不是其他变化的信息变量,如开盘价、收盘价、最高价和最低价。这就很难发现股价波动模式的准确性和完整性,而对于投资者,他们真正关心的是股价的反转点。总而言之,虽然股票时间序列中奇异点的预测研究在证券市场已经存在,但针对该奇异点判断K线形态motif模式识别,以此对大盘的趋势分析却还并不是很完善。例如,文献[4]将模式识别算法用到网络流量分类研究中证明其吞吐率和扩展性,文献[5]采用d-近邻聚类的聚类算法检测时间序列奇异点,文献[6]用小波变换模极大值检测时间序列的奇异点,文献[7]取局部异常因子作为判断值检测时间序列奇异点,文献[8]采用子系联合的方法研究时间序列的 Motif挖掘和异常检测,文献[9]将motif定义在基于MapReduce的图案检索算法中检测基因调控关系。然而,这些研究只能得到股票价格出现最大波动的时刻t,将这些 t值聚类作为奇异点,却并不知道该时刻时间序列呈现的K线形态motif模式,也对股票后期走势的影响无法判定。所以新的方法和技术在金融领域的研究是非常迫切的,数据挖掘和人工智能技术的深入开发对反转点发现、K线形态motif模式的研究和股票价格的预测也都是非常重要的。

在本文中,我将介绍并应用一个可行的和有效的技术分析框架–K线形态图–股票时间序列。结合基序理论和短期趋势聚类的思想,得到股票时间序列的反转点和反转点前的K线形态的特征序列,定为 motif模式。并应用时间序列的短期趋势理论判断motif模式对股票后期趋势的影响。

1 相关的定义

研究股票时间序列,在特定的交易日 t内,总是能够发现在相同交易期的一组股票中有相同的定向运动。在股市波动过程中,这组股票将在这些交易日内获得收益或发生损失,我们称这种股市波动为股票短期趋势[10]。如果在这些交易日内至少有两种或多种股票具有类似行为,这种趋势被认为是短期趋势的基序。

定义1. K线反转形态:K线反转形态图形表示股价的原有走势将要有逆转的趋势,也就是将要减缓原先的股价走势方向,但是下一步的趋势不定。例如,原来的上升趋势变成下降趋势,原来的下降趋势将变成上升趋势,或者原来的上升或下降将变成一段平稳的图形后再发生下一步的变化。

定义2. 短期趋势:我们通过s S = X[ ti-1, ti+3]来表示X部分,其中,i-1和i+3分别是在[ti-1, ti+3]期间内的开始和结束日指数。如果在[ti-1, ti+3]期间内,ci-1< ci和 ci< ci+1< ci+2< ci+3,通常认为时间序列X在 4个交易日内具有短期增长趋势;如果在[ti-1, ti+3]期间内, ci-1< ci和 ci<ci+1<ci+2<ci+3,那么认为时间序列X在4个交易日内具有短期下跌趋势。 ti点被定义为短期趋势的转折点。

定义3. 基序理论:基序一般指构成任何一种特征序列的基本结构。而本文将基序理论结合短期趋势得出一种短期趋势的基序,即如果在 的股票时间序列中对于 k=1,2,3,…n而言存在 Sk=Xk[ti-1,ti+3]的两个或多个类似部分,这个具有相同短期趋势模式的类似部分被定义为短期趋势的基序。

定义4. Motif模式:如果在的股票时间序列中对于 k=1,2,3,…,n而言存在的两个或多个类似部分或片段,则这个具有相同短期趋势模式的类似部分或片段被定义为短期趋势的时间序列模式。

2 K线反转形态的算法与检测

K线反转形态种类繁多,其中既包括最初的反转形态,也包括在股票中出现的组合反转形态。而本文将以红三兵三乌鸦这种顶部反转和底部反转的典型形态为例来研究K线反转形态的motif模式,通过MATLAB软件完成数值计算和模式挖掘。结合以上定义可得算法如下:

算法1:判断增长趋势算法

步骤1:从 的任何一个交易日中获取X(ti, oi, ci,hi, li)的一个股票时间序列,比较第i天和第i-1天的股票收盘价,如果 ci-1> ci,转到第2步;否则增加到第二天并返回到第1步。

步骤2:比较第i+1天和第i天的股票价格,如果 ci+1> ci,转到第3步;否则增加i到第二天并返回到第1步。

步骤3:比较第i+2天和第i+1天的股票价格,如果 ci+2>ci+1,转到第4步;否则增加 到第二天并返回到第1步。

步骤4:比较第i+3天和第i+2天的股票价格,如果 ci+3>ci+2,转到第5步;否则增加 到第二天并返回到第1步。

步骤 5:检测到一个短期的增长趋势,判断增长趋势之后是否存在三乌鸦顶部反转形态,并结合算法3。

算法2:短期下跌趋势算法

带有上述任何一种股票价格的类似算法将被使用,其中,比计算结果大的替代比计算结果小的.步骤 5:检测到一个短期的下跌趋势,判断下跌趋势之后是否存在红三兵底部反转形态,结合算法4。

算法3:红三兵底部反转形态检测算法

红三兵是连续三日的小阳线组合,在股票中属于高开高走的反转形态组合。选取某一个交易日 i得到的股票时间序列 X ( ti, ci, oi, hi, li)。

步骤1:把第i天的收盘价 ci与第i-1天的收盘价 ci-1进行比较,如果 ci>ci-1,则把第i天的开盘价 oi与第i-1天的开盘价 oi-1和收盘价 ci-1同时进行比较,如果 oi-1< oi< ci-1,则转到步骤2;否则增加i到第二天并返回到步骤1。

步骤2:把第i天的收盘价 ci与第i+1天的收盘价 ci+1进行比较,如果 ci+1> ci,则把第 i+1天的开盘价 oi+1与第 i天的开盘价 oi和收盘价 ci同时进行比较,如果 oi< oi+1< ci,则转到步骤 3;否则增加i到第二天并返回到步骤1。

步骤3:若选取的时间序列交易日i即满足步骤1,又满足步骤2,则判断检测到一个红三兵反转形态。

算法4:三乌鸦顶部反转形态检测算法

三乌鸦是连续三日的小阴线组合,在股票中属于低开低走的反转形态组合。选取某一个交易日 i得到的股票时间序列 X ( ti, ci, oi, hi, li)。

步骤1:把第i天的收盘价 ci与第i-1天的收盘价 ci-1进行比较,如果 ci<ci-1,则把第i天的开盘价 oi与第i-1天的开盘价 oi-1和收盘价 ci-1同时进行比较,如果 ci-1< oi<oi-1,则转到步骤2;否则增加i到第二天并返回到步骤1。

步骤2:把第i天的收盘价 ci与第i+1天的收盘价 ci+1进行比较,如果 ci+1< ci,则把第 i+1天的开盘价 oi+1与第 i天的开盘价 oi和收盘价 ci同时进行比较,如果 ci<oi+1< oi,则转到步骤 3;否则增加i到第二天并返回到步骤1。

步骤3:若选取的时间序列交易日即满足步骤1,又满足步骤2,则判断检测到一个三乌鸦反转形态。

集合算法3、算法4得到红三兵三乌鸦K线反转形态如图1所示:

3 短期趋势基序的检测算法—motif模式

一般而言,结合短期趋势理论的股票时间序列中的基序是一种频繁出现在时间顺序中的模式,而这种时间顺序对预测股票短期趋势和价格非常有用。在本节中,我们提出了一种用于找到股票时间序列中与短期趋势有关的这些基序的算法。并以此得到对应K线反转形态的motif模式。

步骤1:取X(ti, yi)的股票时间序列,检测短期趋势并记住持续时间。

步骤2:取X(ti, yi)的另一个股票时间序列,检测短期趋势并进行比较在相同时间周期内是否存在有时间序列的相似部分。如果是的话,转到第三步,否则转到第二步。

图1 红三兵三乌鸦K线反转形态图Fig.1 K-line reversal morphology of three Red soldiers and three Crows

步骤 3:记住检测到类似部分的段数,然后返回到第2步。

步骤4:检测到的股票时间序列的基序。

以上证A股为例,随机抽取n只股票,通过上述算法,找到了相应的股票时间序列中红三兵三乌鸦K线反转形态的motif模式,以及以5天为一个短期趋势检测周期的移动平均线结果图。如图 2,图3,图4,图5所示。

图2 红三兵反转形态motif模式图Fig.2 The Motif pattern of three Red soldiers

4 实证分析

结合短期趋势理念,检测股票K线反转形态的motif模式,并判断该motif模式对股票趋势的影响。本文选取上证A股中含有红三兵三乌鸦motif模式的100支股票在2015年12月至2016年12月连续一年的日收盘价数据进行实验,以出现 motif模式后的一周为短期趋势检测的时间段。采用特征指标进行短期趋势预测,以成交量为度量标尺,收益率计算公式如(1)(2)(3)所示:

图3 三乌鸦反转形态motif模式图Fig.3 The Motif pattern of three Crows

图4 红三兵特殊形态motif模式图Fig.4 The special Motif pattern of three Red soldiers

图5 短期趋势检测的移动平均线图Fig.5 Moving average of short-term trend detected

计算短期趋势一周 t时间内股票收益率序列记为γ:

计算出现红三兵三乌鸦反转形态motif模式的t时间内股票收益率序列记为γ′:

将得到的两个时间段内的股票收益率进行对比,得到判断股票短期趋势的幅度δ:

通过提出的方法进行实验,检测得到了1248个红三兵三乌鸦形态段数,其中红三兵形态697个,三乌鸦形态551个。以二个月为时间段对其进行分类,总共分为6个时间段,其统计表如表1所示:

表1 红三兵三乌鸦形态次数统计表Tab.1 The statistics table of three Red soldiers and three Crows morphological

由数据表分析可知:上证A股在最近一年的股票波动较大,尤其是在2016年8-12月之间,其红三兵三乌鸦形态出现的频率相对较多,说明股票的反转强度较大。在某种程度上,股票收盘价随着股票价格的波动而变化,所以收盘价的变化也影响着股价变化,进而判断股票趋势[11]。

为了进一步证实本文提出的股市预警方法的有效性,提取红三兵三乌鸦形态 motif模式对应的日收盘价,代入公式(1)(2)(3)。计算结果如表2,表3,表4所示,由数据表分析可知:红三兵motif模式后对应的收盘价在一个短期趋势内上升的次数远大于下降的次数,其比率达到 93.5%,则红三兵属于底部反转形态,其后期趋势看涨的说法的准确性较高,这为投资者买入提供预警。同理,三乌鸦motif模式后对应的收盘价在一个短期趋势内下降的次数圆大于上升的次数,其比率占 93.3%,则三乌鸦属于顶部反转形态,后市看跌,为投资者及时卖出提供预警。

表2 红三兵形态收盘价趋势统计表Tab.2 Statistical table of close price in three Red soldiers

表3 三乌鸦形态收盘价趋势统计表Tab.3 Statistical table of close price in three Crows

表4 股票后期趋势及占比Tab.4 Late trend and ratio of stocks

5 结论

到目前为止,针对股票时间序列中存在的影响投资者决策的因素或特征等方面的研究,国内外学者都不胜其数。而由于数据挖掘技术或算法存在的局限性,很多文献中只是提出了检测股票时间序列中的奇异点位置,而针对股票的趋势分析也只是一个模糊理论,例如文献[12]张悦等人利用层次聚类分析判断奇异点。同时,日本的蜡烛图图表也一直是K线形态最直接的反映和参照,所以本文就是应用蜡烛图图表技术,结合基序理论和短期趋势聚类的思想,提出了一种检测K线反转形态的motif模式的有意义检测法,将次应用在股价反转预测中,为投资者提供一个预警。

[1] 信怀义, 安卫杰. 金融数据中心数据备份必要性及其机制研究[J]. 软件, 2015, 36(12): 72-75.

[2] Lan Q, Zhang D, Xiong L. Reversal Pattern Discovery in Financial Time Series Based on Fuzzy Candlestick Lines[J].Systems Engineering Procedia, 2011, 2: 182-190.

[3] Lee C H L, Liu A, Chen W S. Pattern discovery of fuzzy time series for financial prediction[J]. IEEE Transactions on Knowledge & Data Engineering, 2006, 18(5): 613-625.

[4] 渠文龙. 模式识别算法在网络流量分类中的应用[J]. 软件,2013, 34(3): 72-79.

[5] 赵庆江, 柑桔, 车文刚. 基于奇异点的证券时间序列趋势模型估计[C]. 第三十一届中国控制会议, 2012.

[6] Xiao-di Liu, Wen-gang Che, and Qing-jiang Zhao, “Analysis of outliers and public information arrivals using wavelet transform modulus Maximum,” The 2nd IEEE International Conference on Information and Financial Engineering,September 2010, pp. 176-179.

[7] 付强, 车文刚. 基于滑动窗口的奇异点数据挖掘算法研究[J], 江西科学, 2011, 29(2).

[8] Lin Y, Mccool M D, Ghorbani A A. Time Series Motif Discovery and Anomaly Detection Based on Subseries Join[J]. Iaeng International Journal of Computer Science,2010, 37(3): 259-271.

[9] Huo H, Lin S, Yu Q, et al. An algorithm for motif finding based on MapReduce[J]. China Sciencepaper, 2012.

[10] Che W. The Motif Detection of Short-term Tendency in Stock Time Series[C]// International Conference on Applied Science and Engineering Innovation. 2015.

[11] 林明德, 陈进忠. 股市技术分析完全操作手册[M]. 广东: 广东经济出版社, 2001.

[12] Yue Zhang, Jie Liu, and Hang Li, “An outlier detection algorithm based on clustering analysis,” The 1st International Conference on Pervasive Computing, Signal Processing and Applications, pp. 1126-1128, September 2010.

猜你喜欢

收盘价乌鸦股票
小乌鸦
股神榜
股神榜
股神榜
乌鸦喝水后传
本周创出今年以来新高的股票
本周创出今年以来新高的股票
股神榜
本周连续上涨3天以上的股票
近期连续涨、跌3天以上的股票