基于加权马尔可夫模型的股票预测
2021-07-23程丽娟冯洁明
程丽娟,冯洁明
(岭南师范学院 数学与统计学院,广东 湛江 524048)
在金融市场中,股票市场可以合理配置市场资源,控制市场金融风险.对股票走势的研究,主要有现代统计学分析法和神经网络预测法[1-3].孟坤和李丽运用ARMA模型对上证指数日收盘价进行拟合静态预测[4];陈倩文将ARMA模型和GARCH模型结合对沪深300股指期货价格进行预测[5].Kim和Shin将神经网络模型和遗传算法相结合预测股票价格[6].
笔者选取中国联通(600050)2020年7月1日至2020年9月18日的股票日收盘价,通过均值-标准差分级法对股票日收盘价进行状态分级,使用加权马尔可夫模型对未来3天日收盘价区间进行预测,并使用模糊集理论的级别特征值对收盘价进行预测.为了提高模型的适用性,分别选取2020年7月1日至2020年9月18日及2019年12月2日至2020年2月28日的上证指数和恒瑞医药的收盘价对未来3天的数据进行预测,预测效果较好.
1 加权马尔可夫链预测
1.1 加权马尔可夫链
使用马尔可夫模型预测股票时,通常考虑前一时刻股票价格对后一时刻的影响,但前若干天的股票价格也可能对当前时刻的价格有影响.因此,以各阶自相关系数作为前若干天对当天状态的影响权重,最后用各状态加权求和的概率来预测当天股票收盘价所处的状态[7].
1.2 模糊集理论预测
由加权马尔可夫模型预测得到股票日收盘价所处的区间,使用模糊集理论中的级别特征值计算出具体的股票日收盘价.对各状态赋予权重,根据权重公式计算出级别特征值,将级别特征值与预测状态进行比较,得出股票日收盘价.权重公式为:
其中pi表示第i级别的预测概率,η表示最大概率作用系数,通常η=2[8].级别特征值公式为:
计算股票日收盘价X方法有两种,方法一为:
其中i与max{pi,i∈S}的i对应,Ti和Bi分别指状态i对应区间的上下限.
方法二为:
其中i是级别特征值H的整数部分,Ti+1和Bi+1分别是指状态i+1对应区间的上下限.
2 实证分析
笔者选取中国联通(600050)2020年7月1日至2020年9月18日共58天的股票日收盘价作为研究序列,用加权马尔可夫模型对其进行预测,数据来源于网易财经网.
(1)这58天的中国联通股票日收盘价的均值X=5.1821,标准差σ=0.137 7.
(2)根据均值-标准差分级法对中国联通股票的日收盘价进行状态划分(见表1).
表1 中国联通股票日收盘价状态划分
(3)根据(2)得到的状态分级表,对2020年7月1日至2020年9月18日共58天的中国联通股票日收盘价序列进行状态划分,结果见图1.
图1 中国联通股票天数状态图
(4)一步转移频数矩阵和一步转移概率矩阵为:
(5)由一步转移频数矩阵可以得到边际概率值为:p1=7/57,p2=15/57,p3=18/57,p4=7/57,p5=7/57.统计量χ2的值,见表2.
表2 统计量χ2的计算过程
由表2可以得到统计量χ2=72.03>,则该股票的日收盘价序列通过马氏性检验.
(6)各阶自相关系数rk和标准化的各阶自相关系数wk,见表3.
表3 1~5阶的自相关系数和各步长权重
(7)由一步转移概率矩阵P(1)可以得到2~5阶的转移概率矩阵.
(8)根据前5天的中国联通股票日收盘价及对应的状态转移概率矩阵对2020年9月21日的日收盘价及所处的状态进行预测,结果见表4.
表4 2020年3月2日中国联通股票日收盘价预测
由表4可得:max{pi,i∈S}=0.84,其中i=2,即这一天股票的日收盘价在5.04到5.11之间,由历史资料得知,中国联通2020年9月21日的日收盘价实际值为5.06,说明预测结果与实际情况相符.把9月21日的日收盘价5.06代入原序列,重复步骤(1)~(8),得到9月22日的股票价格区间.
3 模糊集理论预测及适用性
3.1 预测
使用模糊集理论中的级别特征值预测股票的日收盘价.根据公式(1)、(2)计算得到级别特征值为2.951 8.分别使用方法一和方法二得到股票未来3天的预测结果,见表5.
表5 未来3天的股票日收盘价的预测
方法一预测结果比加权马尔可夫模型预测的区间要小,这是因为方法一计算预测值的公式仅仅与状态区间的上限或下限有关(见表5).而方法二预测结果的相对误差明显比方法一小,说明基于方法二的加权马尔可夫模型预测效果更好.
3.2 模型的适用性
由于前文只对中国联通1支股票进行预测,且选取的数据只包含正常周期的数据,不包含春节假期以及特殊情况的数据,为了提高模型的适用性,笔者还分别选取2020年7月1日至2020年9月18日以及2019年12月2日至2020年2月28日的上证指数和恒瑞医药的数据对未来3天的数据进行预测,结果见表6和表7.
表6 上证指数未来3天的股票日收盘价预测
表7 恒瑞医药未来3天的股票日收盘价预测
由表6、表7可知,使用加权马尔可夫模型对股票进行预测,分别对正常周期的数据和疫情期间以及春节的数据进行预测,方法二的预测效果较好.
4 结语
通过对中国联通2020年7月1日至2020年9月18日共58天的股票日收盘价序列进行χ2检验,得到α=0.05时满足马氏性.使用加权马尔可夫模型预测得到9月21日的收盘价状态为下跌,股价区间为[5.04,5.11),实际值为5.06元,在预测区间内.使用模糊集理论的级别特征值得到这3天的预测价格与实际价格的相对误差为0.99%、1.99%和1.80%,说明该模型对股票价格的短期预测效果较好.为了提高模型的适用性,分别选取2020年7月1日至2020年9月18日以及2019年12月2日至2020年2月28日的上证指数和恒瑞医药的数据对未来3天的数据进行预测,预测效果较好,说明模型的适应性较强.