基于ANFIS的股指期货波动率预测
2019-12-02耿立艳张占福
耿立艳 张占福
摘 要:将自适应神经模糊推理系统(ANFIS)引入到股指期货合约收益波动率预测中,构建基于四维输入变量的ANFIS股指期货波动率预测模型。将前一期的收益波动率、开盘价格、最高价格、收盘价格作为输入变量,以当期收益波动率作为输出变量。以沪深300指数高频期货合约为例进行实证研究。根据RMSE、MAE、HRMSE、MPE、Theil、LLF和LELF值,四维输入变量ANFIS的高频收益波动率预测性能优于RBFNN和一维输入变量ANFIS。
关键词:股指期货;波动率;预测;自适应神经模糊推理系统
中图分类号:F830 TP183文献标志码:A
1引言
随着人工智能技术的不断发展,人工神经网络在金融波动率预测领域得到应用[1-2]。但在实际应用中,人工神经网络由于自身的一些缺陷,难以得到推广。自适应神经模糊推理系统(ANFIS) [3]是以T-S型模糊推理系统[4]为基础构建的一种自适应神经网络。ANFIS既具有神经网络的自学习、自适应能力,在功能上又与模糊推理系统等效,其隶属度函数参数与结论参数均能够通过数据样本的训练实现自主确定和更新[5]。因此,ANFIS不需要专家的经验与知识建模,更适应用于特性难以掌握的复杂系统建模。此外,ANFIS理论上能够以任意精度逼近任意非线性连续函数,充分利用这一优势可实现高精度的非线性逼近与预测[6]。考虑到金融市场波动的复杂性与非线性特点,本文将ANFIS引入到金融资产收益波动率研究中,构建波动率的ANFIS预测模型,并通过沪深300指数期货的实证研究检验ANFIS有效性。
2金融波动率的ANFIS预测模型
构建ANFIS时,首先要选取合适的输入变量和输出变量。本部分要解决的是金融资产收益波动率的预测问题,所以将ANFIS的输出变量设为金融资产收益波动率的当期值,预测值则由ANFIS训练出的参数与规则外推下一期的收益波动率。由于收益波动率数据无法从金融市场交易数据中直接获得,这里以股指收益平方的当期值及前四期的移动平均值之和作为收益波动率的估计值。输入变量的选取应当包含尽可能多的相关历史信息量,以体现不同影响因素对输出变量产生的作用。进行金融资产收益波动率预测时,通常是根据金融市场的历史数据进行建模与预测,这里将前一期的收益波动率、开盘价格、最高价格、收盘价格作为输入变量。基于四维输入变量的ANFIS表达式如下:
其中,和分别为ANFIS的输出变量和输入变量;代表第期的收益波动率;代表第期的收益波动率;分别为第时期的开盘价格、最高价格和最低价格;表示输入变量与输出变量之间的非线性关系,即ANFIS通过一些模糊规则,建立它们之间的非线性映射关系。
四维输入变量ANFIS预测波动率的步骤设计如下:
步骤1:数据预处理。以开盘价格、最高价格、收盘价格、前一期的收益波动率作为输入变量、当期收益波动率作为输出变量,分别对输入变量和输出变量的原始数据进行预处理;将预处理后的数据样本分为两部分:训练样本集和检验样本集,训练样本集用于构建ANFIS,检验样本集用于检验ANFIS-的预测性能。
步骤2:ANFIS隶属度函数选择。根据经验选择隶属度函数的类型和数目,生成初始的ANFIS,通过反复试验选择最优的隶属度函数类型和数目。
步骤3:ANFIS構建。利用训练样本集训练ANFIS,确定隶属度函数参数与结论参数,根据获得的参数构建ANFIS。
步骤4:ANFIS预测。基于检验样本集,利用构建的ANFIS预测波动率,并将得到的预测值反归一化为原始波动率的预测值。
3实证研究
3.1 数据选取与描述
以中国金融期货交易所沪深300指数期货合约(Hushen 300 index futures contract, HS300IFC)为研究对象,选取时间跨度为2011年1月31日到2011年3月4日的5分钟交易数据,共包括958组观测值,每组观测值包括开盘价格,最高价格,最低价格,收盘价格,成交量五个观测量。根据连续复合对数收益率公式计算HS300IFC收益,得到957个数据样本,计算公式如下:
(2)
其中,为五分钟收益,和为第个五分钟和第个五分钟的收盘价格。
表1为HS300IFC收益序列描述性统计量。由表1可知,首先,HS300IFC收益序列的均值和中位数相对较小,仅为0.0077和0.0160,而标准误差则相对较大,为0.1664,表明HS300IFC收益序列的数据趋于集中,偏离均值的程度较大,反映出HS300IFC收益序列具有较大的波动性特征;其次,从偏度和峰度可以看出,HS300IFC收益序列的偏度小于零、峰度大于正态分布的峰度值3,说明HS300IFC收益序列是左偏的,且凸起的程度高于标准正态分布,同时J-B统计量显示,HS300IFC收益序列在1%、5%和10%水平下都显著拒绝零假设,可以得出,HS300IFC收益序列呈现出“尖峰厚尾”且向左偏的非正态分布;第三,HS300IFC收益序列的LB(16)统计量在1%、5%和10%水平下均显著拒绝了零假设,说明HS300IFC收益序列不存在线性自相关性,为白噪声序列;从LB2(16)统计量可以看出,HS300IFC收益平方序列在1%、5%和10%水平下显著拒绝了非自相关性假设,表明HS300IFC收益序列具有非线性自相关性;最后,HS300IFC收益序列的LM(16)统计量在1%、5%和10%水平下均显著拒绝零假设,这就拒绝了不存在ARCH效应的原假设,说明HS300IFC收益序列存在“波动聚集性”特征,因此,LM检验结果与偏度和峰度的检验结果是一致的。
注:J-B表示Jarque-Bera正態性检验;LB(16)和LB2(16)分别表示对收益序列和收益平方序列作滞后16阶的Ljung-Box序列相关性检验;LM(16)代表对收益平方序列作滞后20阶的ARCH检验;*、**和***分别代表统计量在1%、5%和10%水平下显著。
3.2 ANFIS学习与预测
首先,将输入变量和输出变量的原始数据样本均归一化到[0,1]区间,再分为两个部分:前600组数据作为训练样本集,后358组数据作为检验样本集。其次,选择隶属度函数。输出变量隶属度函数的类型只有两种:常数和线性函数,这里为输出变量选择线性函数;输入变量隶属度函数类型与数目的选择,目前尚无统一的方法。研究发现,T-S型模糊推理系统更适合采用非线性隶属度函数[7],因而这里为四个输入变量选择非线性隶属度函数。经过多次试验,将输入变量的隶属度函数选为双边高斯型隶属度函数,同时,为输入变量的模糊集设置四种模糊变量:低于、等于、中等、高于。输入变量隶属度函数的数目通常根据训练数据的多少和输入变量的维数确定,通过试验,选取2个输入变量隶属度函数。第三,采用模糊聚类法划分输入变量空间,生成初始的参数化ANFIS结构。将训练次数设为100次,根据训练样本集训练ANFIS,采用误差最小作为停止收敛准则,即当误差不再变化时结束训练。最后,利用训练好的ANFIS向前一步预测HS300IFC收益波动率,以减少累计误差。再将预测值反归一化为原始波动率的预测值。
为验证ANFIS的有效性,基于相同的训练样本集与检验样本集,构建径向基神经网络(RBFNN)预测HS300IFC收益波动率,并将RBFNN的预测结果与ANFIS相比较。其中,RBFNN的结构由输入、输出变量维数确定,即输入层包含4个结点、输出层有1个结点,隐含层包含2个结点;自由度设为5,期望误差设为0.00001。
3.3 .结果分析与比较
以股指收益平方的当期值及前四期的移动平均值之和作为真实波动率的估计值,选用选用均方根误差(RMSE)、平均绝对误差(MAE)、异方差调整的均方根误差(HRMSE)、平均百分比误差(MPE)、西尔统计量(Theil)、对数损失函数(LLF)和线性指数损失函数(LELF)七项指标评价ANFIS和RBFNN模型的预测性能七项评价指标值越小,表明模型的预测性能越好。
表2为ANFIS和RBFNN预测性能比较结果。由表2可知,在所选择的样本期内, ANFIS对HS300IFC的RMSE、MAE、HRMSE、MPE、Theil、LLF和LELF均小于RBFNN的对应值,因此,根据所考察的评价指标,ANFIS的HS300IFC收益波动率预测性能优于RBFNN。
图1为HS300IFC收益波动率预测值比较曲线图。由图1可以看出,ANFIS和RBFNN均较好地预测出HS300IFC收益波动率的变化特征,相比于RBFNN,ANFIS则更准确地捕捉到了HS300IFC收益波动率的某些峰值和谷值。
图1 HS300IFC收益波动率预测值比较曲线图
为进一步验证ANFIS的有效性,基于相同的训练样本集与检验样本集,将前一期的收益波动率作为输入变量,构建基于一维输入变量的ANFIS预测当期波动率。为使预测结果具有可比性,将一维输入变量ANFIS的输出变量隶属度函数、输入变量隶属度函数与数目、模糊规则、训练次数等参数设置为与四维变量ANFIS相同。
表3为不同维输入变量的ANFIS预测性能比较结果。由表3可知,在所选择的样本期内,四维输入变量ANFIS对HS300IFC收益波动率预测性能明显优于一维输入变量ANFIS,表现在其RMSE、MAE、HRMSE、MPE、Theil、LLF和LELF值均明显小于一维输入变量ANFIS的对应值。
图2不同输入变量ANFIS收益波动率预测值比较曲线图
图2为不同维输入变量ANFIS收益波动率预测值比较曲线图。由图2可以看出,基于四维输入变量的ANFIS获得了比一维输入变量的ANFIS更接近于实际值的预测值,且更准确地捕捉到了HS300IFC收益波动率的峰值和谷值。因此,从提高波动率预测精度角度出发,本文构建的四维输入变量ANFIS预测模型更加合理,是一种有效的高频股指期货收益波动率预测方法。
四、结论
本文将ANFIS直接用于高频股指期货收益波动率预测。鉴于高频股指期货收益波动率的复杂性和非线性特点,以前一期的收益波动率、开盘价格、最高价格、收盘价格作为输入变量,构建基于四维输入变量的ANFIS。实证研究结果表明,四维输入变量ANFIS的高頻股指期货收益波动率预测性能优于RBFNN和一维输入变量ANFIS,获得了比一维输入变量的ANFIS更接近于实际值的预测值,且更准确地捕捉到了收益波动率的峰值和谷值,为高频股指期货波动率预测提供一种新思路。
参考文献
- LAHMIRI S. Modeling and predicting historical volatility in exchange rate markets[J]. Physica A: Statistical mechanics and its applications, 2017, 471: 387-395.
- MO H, WANG J. Volatility degree forecasting of stock market by stochastic time strength neural network[J]. Mathematical problems in engineering, 2013: 1-11.
- JANGJSR. ANFIS: Adaptive-network-based fuzzy inference systems[J]. IEEE Transactions on systems, man and cybernetics, 1993, 23(3): 665-685.
- TAKAGI T, SUGENO M, Fuzzy identification of systems and its applications to modeling and control[J]. IEEE Transactions on systems, man and cybernetics, 1985, 15: 116-132.
- 张志军.PSA-ANFIS方法及其在矿山岩土工程灾害预测中的应用[D].中南大学博士学位论文, 2008.
- 高隽.人工神经网络原理及仿真实例[M].北京: 机械工业出版社, 2005.
- 张浩炯,余岳峰,王强.应用自适应神经模糊推理系统(ANFIS)进行建模与真[J].计算机仿真, 2002, 199(4) :47-49.
基金项目:河北省2018年度引进留学人员资助项目(编号:C201820)。
作者简介:通讯作者:耿立艳(1979-),女,天津宝坻人,博士后,教授,硕士生导师,研究方向:金融工程。