基于GAM模型的中国螺纹钢期货价格预测研究
2021-11-01李文君
李文君
关键词:螺纹钢期货价格 CAM模型 预测
一、引言
期货是一种金融工具,对于经济的平稳运行起着重要作用。随着市场对螺纹钢需求的不断扩大,信息不通畅、交易市场不透明所带来的螺纹钢价格变动风险不断扩大,为了规避价格变动带来的风险,2009年我国推出了螺纹钢期货。螺纹钢期货自上市以来已有十多年,在这期间我国钢铁行业发生了较人的变化,2012年钢铁行业供人于求,面临经营困难,2016年供给侧结构性改革又为钢铁行业带来了希望,螺纹钢期货的价格曾一度剧烈波动,如何规避价格波动所带来的市場危机亟待解决。螺纹钢期货是否发挥了其规避风险的能力、引导现货价格的作用,如何对期货价格做出准确的预测以便国家根据期货价格的变化出台相关政策来调整供求关系,钢铁企业怎样合理安排生产、机构投资者与个人投资者理性投资是我们所要解决的问题。
螺纹钢期货价格在一定程度上是对未来螺纹钢现货市场供需情况的一个体现,对螺纹钢现货价格具有一定的引导作用。在市场价格出现恶意变动时,螺纹钢期货价格发现功能能够适当减弱其引发的价格风险,同时对于提高市场的透明度、建立公平公正的期货市场有着重要意义。进行螺纹钢期货价格研究能够检验螺纹钢期货是否起到了规避风险、引导现货价格的作用,同时钢铁企业、投资者、政府可以根据研究结果对未来的决策做进一步的规范。GAM模型可以最大限度地拟合变量值,很好地刻画自变量和因变量之间的非线性关系,对于高频波动的期货价格能够有一个很好的刻画,基于此,本文采用GAM模型对螺纹钢期货价格预测进行研究,为钢铁企业、投资者、政府更好地把握市场,进行稳健决策提供依据。
二、GAM模型介绍
线性模型简单、直观、便于理解,解释性能和推断理论相对成熟,但是,在现实生活中,模型的线性假设只是对真实函数的一种近似,通常近似效果不理想,甚至违背实际情况,从而很人一部分模型难以用线性模型进行刻画。
1990年,Hastie和Tibshirani扩展了加性模型的应用范围,提出了广义加性模型(CJeneral-izeci Ad(iitive Mo(iels,简称为CAM模型),它是广义线性模型的扩展,是一种自由灵活的统计模型,可以最大限度地拟合各变量的散点图,使其光滑化,用来探测非线性同归的影响,直接处理响应变量与多个解释变量之间的非线性关系,GAM模型允许在单个解释变量和响应变量之间建立灵活的关系。
三、数据选择与处理
在对影响螺纹钢期货价格的因素进行分析时,本文从以下三个方面选取变量作为影响螺纹钢期货价格的因素进行分析。
(1)供给相关变量:螺纹钢产量、螺纹钢社会库存量、钢材进口量。
(2)需求相关变量:房地产开发投资额、房屋新开工面积同比增速、钢材出口量。
(3)期货市场相关变量:持仓量、成交量。
成交量、持仓量数据来自上海期货交易所官网,侠给和需求因素相关变量数据来自西本新干线( http://www.96369.net/indices/67)。以螺纹钢主力合约收盘价格作为螺纹钢期货价格,价格选取的均为日价格。供给和需求因素相关变量数据与期货价格数据存在着不同的时问频率问题,为了解决这一问题,对于非日度数据如螺纹钢产量、螺纹钢社会库存量、房地产开发投资额、房屋新开工面积、钢材进出口量进行如下处理:月度数据度量的是一个月内的产量、投资、进出口量总量,因此在对月度数据处理时,首先取得月度数据的均值,然后进行线性插值,将月度数据转化为日度数据进行分析,对于周库存数据是直接做线性插值转化为日度数据进行分析。
对数据时间段的选取仍要考虑成交量对数据的影响问题,2016年之前的期货成交量较少,期货发展不稳定,影响预测模型,因此各变量数据选择范围与期货价格数据范围一致,取2016年1月4日至2019年12月31日的数据进行分析。表1所示为各指标变量在论文中的表示。
四、螺纹钢期货价格影响因素分析
1.相关性分析
建立螺纹钢期货价格预测模型之前,首先需要对影响螺纹钢期货价格的各因素与螺纹钢期货价格之间的相关性进行判断。因为各因素均不服从正态分布,所以采用spearman相关系数法,表2为各影响因素与期货价格以及价格波动率之间的相关系数。
根据表2可知,螺纹钢期货价格与钢材出口量高度负相关,但与其他各因素之间的相关系数均较低,说明螺纹钢期货价格与其他各影响因素之见的线性关系很小,因此可采用非线性模型进行拟合。变量间的相关关系还需要进一步的分析。表2中持仓量、钢材出口量与螺纹钢期货价格的波动相关性相对较强,说明持仓量与钢材出口量的变化会引起螺纹钢期货价格的剧烈波动。
2.灰色关联分析
为了进一步对期货价格与各因素之间的关系进行研究,为期货价格预测提供理论依据,接下来将计算期货价格与各因素之问的关联度,以此判断各变量与期货价格的关联程度。关联度是考察变量间的关联程度,如果两个变量同步变化且变化趋势一致,则可以说明两个变量间关联程度较高。表3所示为期货价格与各变量之间的关联度。
关联度越接近1说明各自变量与螺纹钢期货价格这一因变量的关联程度越高,对螺纹钢期货价格变动的影响越大。上述结果表明各变量与螺纹钢期货价格之间的关联度均很高,说明各变量对螺纹钢期货价格变动均会产生较大影响。
3.变量解释程度分析
为深入探讨各影响因素与螺纹钢期货价格的关系,首先利用GAM模型对单个解释变量进行拟合分析,各变量对螺纹钢期货价格的解释程度如表4所示。
表4中的EDF为解释变量光滑化时的自由度,理论上,当自由度接近1时,表示变量间近似为线性关系;当自由度大于1时,则表示变量间为曲线关系,根据表4可知各变量与螺纹钢期货价格之间的EDF值均大于1,说明各变量与螺纹钢期货价格之间的关系不是线性关系,不能建立线性回归模型,建立广义可加模型是合理的。
由表4可知,对螺纹钢期货价格的解释程度最主要集中在房地产开发投资、房屋新开工面积以及钢材出口量上。因为螺纹钢是建筑房屋最主要的材料且主要应用于房屋建筑,因此螺纹钢期货价格由二者解释程度较高。进出口作为调节供需关系的一个方面对期货价格的解释程度钢材出口量占85. 8%,而钢材进口量只占15. 3%。根据第二部分对我国钢材进口量分析巾发现,我国钢材进口景一直稳定在一个水平上,波动幅度很小。这就很好地说明了钢材进口量对期货价格的解释程度仅占15. 3%,而钢材出口量并不稳定且存在着较火的波动,说明我国钢材出口量是根据国内供需现状一直进行调节的。因此钢材出口量对期货价格的解释程度为85. 8%是符合实际情况的。根据第二部分对螺纹钢持仓量的分析可知在2009年至2016年年初,螺纹钢持仓量一直在一个低水平波动,有一定的上升趋势,2016年至今持仓量一直在一个较高水平波动,没有明显的上升或者下降趋势,这就解释了持仓量的解释程度只有2. 35%,处在一个较低的解释水平。
图1所示曲线为螺纹钢期货价格与各影响因素拟合的效应曲线图,其中实线为拟合的曲线,虚线表示两倍标准差曲线。图1中曲线反映的是各影响因素对螺纹钢期货价格的人体趋势。
图1(左上)中所示,当螺纹钢社会库存量在400万吨以下时,随着库存量的增加,螺纹钢期货的价格是在不断下降的;当螺纹钢库存量达到400万吨之后,随着库存量的增加,期货价格也是在不断上涨的。螺纹钢产量(右上)和房地产开发投资额(左下)与期货价格的变动关系较为复杂,曲线也很接近,均是先上升然后小幅同落再上升。这是因为现有的期货价格是在对市场新信息的综合分析之后得到的一个合理价格,这个价格受到多方面因素的影响。期货价格与房屋新开工面积同比增速(右下)拟合的曲线图是在房屋新开工面积增加时,螺纹钢期货价格小幅降低然后迅速增长,接着出现了小幅下降,然后迅速下降。
在图2钢材进口量(左)与螺纹钢期货价格拟合图显示,当钢材进口量大于3.1万吨时,随着钢材进口量的增加螺纹钢期货价格不断提高。钢材进口增加,说明国内钢材供不应求,螺纹钢期货市场针对这一新信息作出反应,期货价格上涨。钢材出口量(右)与期货价格的拟合图显示随着钢材出口量的增加,螺纹钢期货价格在不断降低。钢材出口量增加说明我国供火于求,这与2012年我国出现的产能过剩现象相一致。产能过剩对于期货市场是一个不利的消息,投资者对于未来钢铁行业的发展是不看好的,螺纹钢期货市场针对这一信息及时作出反应,期货价格下降。
随着持仓量(左)的不断增加,期货价格在不断上升,中间虽然存在着小幅的下降,但是螺纹钢期货价格总体上是呈现上升趋势的。随着成交量(右)的增加,期货价格是先上升再下降然后缓慢上升。螺纹钢期货价格随着成交量的变化呈现出先上升再下降然后缓慢上升的趋势,可能是在各成交量所对应的同时期其他影响因素对螺纹钢期货价格的影响更火(见图3)。
五、GAM模型建立
首先将所有变量纳入CAM模型的白变量中,建立Model 1进行分析。在拟合的Model 1中钢材进口量这一变量并不显著,因此采用后向剔除法将钢材进口量因素剔除重新建立Model 2。并将新建立的Model 2与Model 1进行方差分析比较,比较结果如表5所示。
与Model 1进行比较,剔除钢材进口量这一因素使得偏差显著增加,因此剔除钢材进口量这一因素不合理,此时考虑变量间的交互作用影响。钢材进口量的变化取决于我国钢材的产量,当产量不足时进口量会增加,因此考虑钢材进口量与螺纹钢产量的交互作用,将交互项纳入变量建立Model 3进行分析。Model 3的结果表明在将钢材进口量与螺纹钢产量的交互项纳入变量建模之后,鋼材进口量不再显著,说明交互项的存在抵消了钢材进口量的影响,因此剔除钢材进口量这一变量,重新建立Model 4分析。
新的模型中房地产开发投资额这一变量在给定显著性水平0. 01的情况下显著,其他变量均在给定显著性水平0. 001的情况下显著,考虑剔除房地产开发投资额这一变量建立新的Mociel 5,并对Model 4和Moclel 5进行分析,判断剔除房地产开发投资额这一变量是否合理。
检验结果表明剔除房地产开发投资额之后使得偏差显著增加(见表6),因此剔除房地产开发投资额这一因素不合理,此时考虑变量间的交瓦作用影响。房地产开发投资额在一定程度上受到房屋新开工面积的影响,因此,考虑需求因素房地产开发投资额与房屋新开工面积同比增速之间的交互作用影响,将这一交互项纳入变量建立模型分析,结果表明各变量均显著,所以建立Model 6作为最终的模型进行分析。
六、模型检验
模型拟合之后还需要对其进行检验,因为GAM模型是广义线性模型的延伸,因此对于线性模型的检验方法仍然适用于CJAM模型。
模型检验结果各变量均显著,因此最终建立的模型为Model 6,纳入模型巾的变量为螺纹钢社会库存量、房屋新开工面积同比增速、成交量、持仓量、螺纹钢产量和钢材进口量的交瓦项、钢材出口量、房地产开发投资额和房屋新开T面积同比增速的交互项。各解释变量在给定0. 001的显著性水平下均是显著的,模型的R2为0. 917,拟合效果很好,表明螺纹钢期货价格变动的92%均可以用模型来说明。
在表7中各光滑函数的F检验均显著,说明拟合的光滑函数通过了显著性检验,常数项通过了T检验,说明模型的系数检验也通过了,还需要对模型的正态性及异方差性进行检验。
根据图4结果表明残差服从正态分布,验证了模型的实用性,而残差图中各点比较均匀地分布在0的两侧,没有明显的趋势性,BP检验也通过,证明了模型通过异方差性检验。利用通过检验的模型对螺纹钢期货价格进行样本内预测,同时对2019年12月23日至31日的螺纹钢期货价格数据进行样本外预测。
七、螺纹钢期货价格预测与评价
1.螺纹钢期货价格预测
通过以上模型的拟合结果对期货价格进行样本内预测,预测结果与真实值比较如图5所示。可以直观地看到真实值与预测值整体上走势是一致的,在某些点出现较人偏差。
为了探究模型的实用性,选取2019年12月23日至31日的期货价格数据作为预测数据集,利用拟合的GAM模型对样本外的期货价格进行预测,并对预测结果进行分析(见表8)。
2.螺纹钢期货价格预测模型评价
为了进一步分析预测结果与真实值的差距选用压轴同归法( RMA)来进行同归分析以评估预测结果。根据压轴同归法建立螺纹钢期货价格预测值与真实观测值之间的简单线性回归模型,以此来对GAM模型的预测结果进行简单评判。
如图6所示压轴同归拟合图,其中黑色散点与红色拟合线表示的是以预测值为自变量拟合的散点图与拟合线,蓝色散点和绿色拟合线表示以真实值为自变量的拟合直线。当两条直线重合且位于图上对角线上时,表示预测值与真实值是完全一致的,在图6中当期货价格偏高或者偏低时两条直线的重合度不高,当螺纹钢期货价格处于中间值时,两条直线的重合度较高,说明预测得较为准确。
为了进一步检验GAM模型的实用性与有效性,采用神经网络模型对螺纹钢期货价格进行样本外预测,并与GAM模型预测结果进行比较。
图7中GAM代表广义加性模型对2019年12月23日至31日的期貨价格的预测结果,BP代表神经网络模型的预测结果,TRUE代表螺纹钢期货价格的真实值。根据图中结果表明神经网络模型预测结果比较平缓,未能很好地表现冉期货价格的波动趋势及走势。而广义加性模型对期货价格波动及走势拟合得更好。
如表9所示,在分析样本外预测结果时,仍然采用预测相对误差值反映预测结果的可信程度。在利用CJAM模型进行样本外预测时,预测相对误差最大值为1. 54%,预测相对误差最小值为0. 09%,说明CAM模型的预测值与真实值的偏差不会太大。虽然神经网络模型预测相对误差最小值较小,但是最大值较大,说明神经网络模型预测结果相较于GAM模型不稳定,GAM模型预测结果更为稳定。
八、结论
本文选取现在广泛应用的神经网络模型对螺纹钢期货价格预测进行研究,分别从供给、需求和期货市场的方面进行考虑,分析影响螺纹钢期货价格的供给及需求因素以及影响螺纹钢期货价格波动的相关因素,并探讨螺纹钢期货价格、期货价格波动率与各因素之间的关系。基于变量问的非线性关系,本文选取了CJAM模型进行研究,并与神经网络模型进行对比分析。研究结果表明两种模型的预测结果均比较好,GAM模型预测精准度较神经网络模型略低,但是GAM模型预测值很好地刻画了螺纹钢期货价格的波动与走势,同时能够很好地解释各影响因素与螺纹钢期货价格的关系。
样本内预测结果表明各模型对变量间的信息利用程度较高,拟合结果较好。但是样本外预测结果整体较样本内预测结果偏差,其原因可能是由于螺纹钢期货价格单向引导现货价格。在对螺纹钢期货价格与现货价格引导关系研究时,格兰杰因果检验结果表明螺纹钢期货价格单向引导现货价格,这就会造成现货市场遭受恶意控制,但未能引导期货市场,造成期现货市场的失衡。同时国家政策下预对于期货市场的影响很大,会对期货价格变动产生影响。