基于马尔科夫链的股票预判实证研究
2017-09-08骆佳磊
骆佳磊
【摘 要】本文通过用马尔科夫过程对股票进行预判分析,随后使用隐马尔科夫链,通过模型的训练,获取每日的隐藏状态,分析发现存在优势隐藏状态,这对择时策略有重要参考意义。
【关键词】科尔科夫链;股票预判;隐藏状态
马尔科夫链是一种重要的信号识别方式。广泛使用在语音识别,文字和图像识别分析领域。而马尔科夫在财经方面的应用,也有不少国内外的研究文献,展现了大量的研究成果和技术经验。本文将着重对国内股票进行基于马尔科夫过程和隐马尔科夫链的对股票预判进行实证研究。
一、马尔科夫过程
马尔科夫过程是指随机过程中当前的状态只与事物前一个状态有关,与过去的状态均没有任何关联。其数学定义为随机过程{X(t),t∈T}的状态空间,如果对任意n个时刻,t1﹤t2﹤t3﹤tn-1﹤tn∈T,满足P{X(tn) 二、基于马尔科夫过程的上证指数预测分析 首先获取了上证综指自2015年8月19日至2017年5月12日的指数涨跌幅数据,其中涨跌幅的计算为:(C-Ct-1 )/Ct-1 。根据当日收盘后的涨跌幅,将状态划分为5类: Pij的概率计算方式Pij=Nij/∑Ni。Nij为从i到j发生的频次, Ni为从状态i到0至5全部频次。据历史数据进行频率计算获得一步转移矩阵如下: 由上表可以看到,转移矩阵从1,2,3状态转移到1,2,3状态的概率分布处于整个整个概率分布的集中区域,这和实践认知基本一致。5月12日的状态为1,通过该马尔科夫过程预判15日最大概率的状态为2,而实际15日的涨幅0.22%,确实落在了状态2空间域,这说明基于大量数据统计的该马尔科夫过程是具有一定的参考价值的。同时后续要需要进行大量的修正和验证,以提高模型预测的准确性和稳定性。 三、隱马尔科夫链(hidden Maerkov chain) 隐马尔科夫链,简称HMM,是一种基于输出信息来识别隐藏信息的技术,一个完整的HMM可以描述为:λ={N,π,A,μ },其中N为隐含状态数,π,为初始概率分布矩阵,A为隐含状态间的概率转移矩阵,μ为输出层的概率分布矩阵。我们将参数导入模型,并形成上述矩阵后,进行迭代训练后获取隐藏状态。 四、基于HMM的股票实证分析 首先对源数据进行标准化处理:standard_x=(x-mean)/std。将标准化处理后的日收益率R,成交量变化率R_VOL作为参数,导入sklearn开发的hmm模型进行训练,训练后的结果在分别2-5个状态下的分布图,发现状态3是比较理想的状态,对走势的判断也比较合理。 根据图上的内容,可以看到蓝色(状态0)状态应该对应上升趋势,红色(状态2)多半出现在底部或者下跌通道中,所以我们可以认为蓝色代表强势状态,红色的弱势状态,而绿色(状态1)表明是一些中性用点。我们对5月13日至24日的这段时间进行模型预测,预测的状态分为[0 0 0 0 0 1 0],表明处于相对强势状态,而实际情况这段时间累计下跌0.68%,整个市场环境处于政策严控下,市场弱势震荡格局下。从模型的指导思路来说,当前反而是建仓的较佳点位,应该开始逐步建仓。 对三种状态的日收益率进行累加计算,,可以看到状态0在2016年的2月前,状态0的累计收益率能明显和状态1、2进行区分。而2016年2月后的行情,三种状态的相互胶着,收益率区间变化很小,意味着行情处于小幅震荡中,即时是行情处于状态0也无法获取超额收益。从后验的角度来说,选择状态0的择时策略效果明显优于1、2。 五、小结 通过分析发现隐藏状态确实存在优势状态,这对择时策略能够提供积极的参考意义。在实际操作中,结合马尔科夫过程和隐马尔科夫链进行综合预测能取得更好的效果。本文在指标筛选和算法优化方面均未作深入,后续如果能有改进的话,预测的精度将会进一步提高。 参考文献: [1]章晨.基于马尔科夫链的股票价格涨跌幅的预测[J].商业经济2010[11]. [2]余文利、廖建平、马文龙.一种新的基于隐马尔科夫模型的股票价格时间序列预测方法[J].计算机应用与软件2010[6].