基于机器学习的证券公司风险预测模型对比研究
2018-05-14李雅坤
李雅坤
上市证券公司的风险预警模型能够为政府监管、证券公司稳健发展以及投资者研判提供模型依据。本文在公司风险管理指标体系的基础上,利用已有的决策树、随机森林、支持向量机和贝叶斯网络等机器学习方法,构建多个风险预警模型并同传统的计量模型进行比较。
随着2008年全球金融危机以及近年来证券市场上违规操作、信用违约的不断发生,风险管理成为了金融行业特别是证券行业重点关注的问题,证券公司的风险管控水平不但影响着证券公司的经营效益和投资者的利益,也关系着证券行业乃至整个资本市场的稳定发展。
2016年12月30日证券业协会发布《证券公司全面风险管理规范》,要求证券公司建立健全与自身发展相适应的全面风险管理体系。全面风险管理指证券公司全员参与,对经营中面临的各类风险进行识别、评估、监控、应对的全程管理。因此,对各类风险的识别和预警是构建全面风险管理的起点。十八大以后,在相应国务院简政放权的政策下,中国证监会加强了事中及事后监管,事前监管则需依靠各证券公司的自律,这进一步提升了对各证券公司风险预警的要求。截止2017年6月,我国共有证券公司128家,证券公司作为金融类公司,其经营状况和市场价值受风险影响较大,预判和预警上市证券公司风险状况有利于证券市场投资者研判上市证券公司的投资价值。
无论是从证券业监管角度,还是证券公司自我监督以及投资者研判投资价值方面,上市证券公司风险测度及预警都有着现实意义。
一、数据来源
现行的风险指标体系是证监会2016年6月16日颁布的新的风险指标体系,各个证券公司在2016年的年报中均采用了新的指标体系,并在2015的财务数据基础上按新的指标体系公布了各项的风险指标值。本文使用的指标体系部分指标即来源于证券协会最新颁布的指标体系。
二、描述性统计
2015、2016年各上市证券公司的二级指标均符合证券协会要求,即在二级指标体系方面不存在预警状况。此外根据证券业协会公布的证券公司分类标准,共有A、B、C、D、E 5个大类,A、B、C类表示证券公司能够正常经营,但风险管理水平递减,D和E类表示该证券公司面临的风险可能超过其承载能力。本文以该分类结果作为总体风险参考,考察预警模型的正确率。
2015年33家上市证券公司被证券业协会评为A级,4家上市证券公司被评为B级,2016年只有19家上市证券公司被评为A级,16家被评为B级,2家被评为C级,共有17家上市公司评级下调,表明上市证券公司从2015年到2016年风险状况总体呈下滑趋势,各证券公司应当加强风险管理水平。
三、机器学习建模
本文以构建的上市证券公司风险指标作为特征变量,证券业协会公布的证券公司分类作为类标签。构建的风险指标体系依据2016年证监会2016年6月16日颁布新的风险指标体系,从数据的可得性角度考虑,仅有2016年及调整后的2015年上市证券公司年报可提供数据。证券公司分类旨在综合考量证券公司的风险管理能力、市场竞争力及合规管理能力,是证券业协会对各证券公司提升风控和合规能力的监督措施,在一段时间内标准不宜变动,故2015年及2016年的类标签有可比性,因此本文将2015年、2016年上市证券公司样本合为一个样本,以增大样本量。本文构建的证券公司风险指标均为相对指标,不受通货膨胀等因素影响,且在建模前的预处理阶段均采用归一化处理,因此在不同年间有可比性,综上,本文的建模样本较为合理。为了比较不同机器学习方法的优劣性,本文首先采用十折交叉验证方式得到各方法的正确率,在此基础上,再各自计算10次取平均得到各方法下的正确率,为了同传统计量方法作对比,还加入了多项logit回归,以上操作均在WEKA3.8.1上實现,最终结果见表:
总体上,由于样本容量较小,各方法的正确率均不够高,但都大于33%,说明各模型均有一定的预测能力,各机器学习方法明显优于多项logit回归。随机森林的正确率最高,说明集成学习方法在建立上市证券公司风险预警模型时,正确率最高,适用性最好。
四、结论及不足
通过理论讨论及对不同机器学习方法在构建预警模型的实证比较,本文发现机器学习方法适用于证券公司风险预警模型的构建,并且在预判正确率方面好于传统的logit回归方法,本文的研究成果为进一步研究上市证券公司风险预警模型提供了参考。此外,信用风险及操作风险的预警程度不够,缺少各证券公司的客户数据及交易操作数据,导致在衡量证券公司整体风险时缺乏来自各证券公司客户行为及交易操作的信息,将来自客户层面和公司层面的相关风险指标结合在一起,所构建的风险指标体系可能会更加合理、全面,也将有利于进一步建立动态风险预警模型。(作者单位为山西财经大学信息管理学院)