APP下载

基于SVM和多特征融合的沪铜期货价格预测分析

2014-09-04崔云翔

2014年21期
关键词:支持向量机

崔云翔

摘要:本文利用支持向量机(SVM)机器学习算法,融合宏观经济数据、上海现货铜价格、LME期铜价格和美元汇率来研究预测上海期货交易所铜期货价格。通过上海期货交易所cu1402合约210天交易数据和同期相关经济数据,来预测铜期货每日最高价、最低价、开盘价和收盘价。模型结果显示,对上海期货交易所铜期货cu1402合约价格预测存在一个25天左右的累计平均误差最小的规律。另外,也对影响沪铜期货每日最高价、最低价、开盘价和收盘价的经济数据分别作了分析,其中沪铜期货价格的历史数据、铜现货价格和LME铜期货价格都对沪铜四种价格预测存在重要影响作用。

关键词:支持向量机;多特征融合;沪铜期货;价格预测

一、研究背景和目的

铜是人类最早发现的金属之一,被广泛应用到电气电子工业、机械制造、化学工业、建筑工业、医学和国防工业等。在中国,铜在有色金属材料的消费量近次于铝。随着我国经济快速稳步发展,已成为全球铜消费最大的国家。我国作为铜资源相对短缺国家,每年需进口大量铜矿。但由于铜市的价格波动,对消费者、生产与经营者的利益造成了重大影响。因此,通过研究铜期货价格规律,可以一定程度上规避价格风险,稳定经济健康发展。

本文研究的内容是基于SVM统计机器学习方法,融合宏观经济因素、铜现货、LME铜期货价格和美元汇率来研究上海铜期货价格预测。

二、相關工作介绍

目前国内学者对于沪铜期货价格研究关注于两个方面:一是研究国外期铜和上海期铜价格的相关关系;二是研究上海铜现货价格与上海期铜价格的相关关系。

蒋序标[1]研究伦敦金属交易所(LME)和上海期货交易所(SHFE)期货铜的价格引导关系。其结论为伦敦铜期货价格只单向滞后引导沪铜期货价格, 沪铜期货对于伦敦铜期货价格无滞后价格引导关系。芮执多[2]将SHFE、LME和纽约商业交易所(COMEX)中铜期货价格联动关系做了动态分析。其结论为LME的铜期货定价能力最强,而SHFE也具有了一定的国际影响力。田新民[3]通过协整方法及因果关系分析研究沪铜与伦铜的价格引导关系,得出伦敦金融交易所铜期货价格对于上海期货交易所的铜期货价格具有主导作用的结论。同时,SHFE的铜期货价格的影响力也在增强。刘勃[4]通过协整与向量自回归方法,研究伦敦金属交易所期铜、上海期货交易所期铜和上海铜现货价格之间的关系。实证显示,上述三者因素具有长期均衡关系,并且伦敦期铜价格具有主导价格发现作用。赵亮[5]通过Granger协整分析,得出沪铜期货与伦敦铜期货价格具有协整关系,并且沪铜期货价格对于伦敦铜期货价格具有一定的影响作用。王淑娴[6]通过分析伦敦铜期货价格、上海铝期货价格、燃油期货价格和江西铜业股票价格,得出沪铜价格的主要影响因素是伦敦铜期货价格的结论。方燕[7]通过对沪铜期货价格与现货价格的实证分析,得出沪铜期货价格与现货价格在长期与短期具有不同的影响系数。顾浩[8]通过实证方法,分析得出沪铜期货与现货价格存在协整关系,并研究了存在协整关系的原因。

三、本文工作介绍

本文通过SVM统计机器学习方法,融合宏观经济因素(包括居民消费者价格指数(CPI)、工业品出产价格指数(PPI)、采购经理人指数(PMI)、城镇固定资产投资、工业增加值增长、货币供应量、海关进出口增减情况、全国股票交易统计和新增信贷数据)、铜现货价格、LME铜期货价格和美元汇率多特征因素,分析预测上海铜期货价格变动。

数据采用上海期货交易所铜期货合约cu1402在2013年2月19日至2013年12月30日的交易数据,其包括每日的开盘价、最高价、最低价、收盘价、结算价、成交量、成交金额等。铜现货价格采用同期上海期货交易所沪铜连续交易数据,其包括每日开盘价、最高价、最低价、收盘价和成交量。宏观经济因素采用同期数据包括居民消费者价格指数(全国、城镇、农村的当月、同比增长、环比增长和累计增长)、工业品出产价格指数(当月、当月同比增长和累计)、采购经理人指数(制造业、非制造业的指数、同比增长)、城镇固定资产投资(当月、同比增长、环比增长、自年初累计)、工业增加值增长(同比增长和累计增长)、货币供应量(流通中的现金M0、货币M1、货币和准货币M2的数量、同比增长和环比增长)、海关进出口增减情况一览表(当月出口、当月进口、累计出口和累计进口的金额、同比增长和环比增长)、全国股票交易(上海、深圳的发行总股本、市价总值、成交金额、成交量、A股最高综合股指指数和A股最低综合股价指数)和新增信贷数据(当月、同比增长、环比增长和累计)。LME铜期货数据采用同期数据包括当日的开盘价、收盘价、最高价、最低价和成交量。美元汇率采用同期数据包括当日的收盘价、开盘价、最高价、最低价和百分比变化。模型输入数据包括以上特征,输出数据为预测下一日的开盘价、最高价、最低价和收盘价。

支持向量机(support vector machines,SVM)是一种二类分类模型。其基本模型是定义在特征空间上的间隔最大的线性分类器。因此,支持向量机的学习策略就是间隔最大化,可看作是一个求解凸二次规划的问题。支持向量机包括线性可分支持向量机、线性支持向量机和非线性支持向量机。

本文采用非线性支持向量机,使用核技巧和软间隔最大化来学习模型。其中,核函数在当输入空间为欧式空间、特征空间为希尔伯特空间时,表示从输入空间映射到特征空间得到的特征向量间的内积。因此,通过使用核函数将输入空间中的非线性分类问题转换为在高维特征空间学习线性分类问题。

四、模型结果

采用SVM方法训练测试模型,其中输入的多特征包括当日沪期铜合约cu1402数据、宏观经济数据、铜现货价格、LME铜期货价格和美元汇率,预测下一天沪期铜合约cu1402的开盘价、最高价、最低价和收盘价。

从预测结果可以看出,在向前预测25天之内的沪铜价格时,累计平均误差最小,在500元~600元之间。以25天为分界线,预测超过25天沪铜价格时,随着时间推移累计平均误差不断变大。其原因有两点:一是时间推移,各种条件已发生变化,因此训练的模型的预测有效降低;二是铜期货合约后期成交量变化和成交金额会变化较大,由于沪期铜在后期之后交易波动变大,训练模型的有效性较低。

也得知预测25天内,价格累计平均误差随着时间推移,不断减小。其原因是在较小一段时间内,随着时间推移,输入的特征因素对于未来期铜的价格的累计误差减小。从开盘价、收盘价、最高价和最低价预测上看,都存在一个大约向前25天左右的累计平均误差最小。因此,此模型在使用时,可基于未来25天预测情况进行投资,实现累计平均误差最小,也即风险最小。

五、输入特征重要性分析

利用logistic回归方法,分析影响开盘价、最高价、最低价和收盘价预测准确度的输入特征。

重要的输入特征为沪铜期货历史每日开盘价、最高价、最低价、收盘价、结算价、涨跌1(收盘价-前一日结算价)、涨跌2(结算价-前一日结算价)、成交量、成交金额和持仓量,居民消费者价格指数,工业品出厂价格指数的当月和当月同比增长,采购经理人指数,城镇固定资产投资同比增长,货币供应量M2的同比增长,深圳股票交易所发行总股本和成交量,上海交易所最高和最低的综合股价指数,当月新增信貸数据,沪铜现货历史每日收盘价、开盘价、最高价和最低价,LME铜期货历史每日收盘价、开盘价、最高价、最低价和成交量,美元汇率的历史每日收盘价、开盘价、最高价和百分比变化。

六、下一步工作

需要进一步降低价格预测的误差,一方面可以选择更多输入特征,另一方面使用更有效的算法。另外,可以考虑如何将此模型融入到实际交易策略中,来辅助交易判断。(作者单位:对外经济贸易大学金融学院)

参考文献

[1]蒋序标,周志明.LME与SHFE期铜价格引导关系实证研究.系统工程,2004(9).

[2]芮执多.SHFE、LME和COMEX中铜期货价格联动研究.统计与信息论坛,2009(3).

[3]田新民,沈小刚.SHFE与LME期铜价格因果关系分析.首都经济贸易大学学报,2005(3).

[4]刘勃.国内外铜期货价格与国内铜现货价格动态关系实证研究——基于LME与SFE铜期货市场与国内铜市场的实证分析.华北金融,2007(7).

[5]赵亮,刘莉亚.国内外铜期货市场的关系研究.统计与决策,2006(20).

[6]王淑娴.沪铜期货价格相关因素的实证分析.硕士论文.华中师范大学,2011.

[7]方燕,庞小利.沪铜期货价格与现货价格波动关系的实证分析.价格理论与实践,2012(10).

[8]顾浩,张学东,于晓娟.沪铜期货与现货协整关系分析.科技情报开发与经济,2012(22).

猜你喜欢

支持向量机
基于支持向量回归机的电能质量评估
基于智能优化算法选择特征的网络入侵检测
数据挖掘技术在电厂经济性分析系统中的应用Q
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
管理类研究生支持向量机预测决策实验教学研究