APP下载

基于支持向量机方法的企业信用评级研究

2019-04-04王星星

科学与财富 2019年6期
关键词:企业信用信用风险评级

摘要:由于企业信用评级具有小样本、非线性、高维数等问题,传统的评级方法并不能很好地适用。采用支持向量机方法来对评级指标体系进行特征选择,建立上市企业信用评级模型,对上海证券交易所中813家上市企业进行实证研究,结果显示,通过支持向量机进行特征选择的支持向量机具有较高的预测准确度。

关键词:支持向量机;信用评级

一、引言

我国企业长期面临着严重的金融风险,而风险评估是否科学合理,关系着我国股市承担的风险的大小。本文通过建立风险评估的指标体系,运用支持向量机构建的评估模型对收集的355家金融风险样本进行训练和检验,建立起企业信用风险评级模型。基于支持向量机的企业信用风险评级模型,将有助于企业更好地评估其信用风险,从而采取更加有效的风险处理措施。

国外对支持向量机(SVM)的预测效果进行了大量的研究。CHEN运用不同的机器学习方法建立了商业银行风险预警的模型,最终得到机器向量机模型的预测效果和准确率是最高的。国内对支持向量机的应用主要体现在对银行信贷风险的识别与分类上。而余晨曦等人在进行贷款违约判定中,用到了非线性的支持向量机,得到了较好的判定结果。

综上,已有相关研究在对构建完整的上市企业信用指标评价体系的研究缺乏系统的研究,而且相关研究缺乏实证支持。针对这一问题,本文以上市企业为对象,对其进行信用评级。作为一项实证研究,一方面,可以系统性地探讨上市企业信用风险情况;另一方面,通过对研究方法进行改进和完善,可以实现系统考察上市企业所面临的信用风险问题,为相关监管部门等提供决策依据。

当前已经有许多算法将SVM推广到多类分类问题,可以将它们大致分为两大类:间接法和直接法。由于直接法将参数求解合并到一个最优化问题中,可以“一次性”地实现多类分类,应用起来十分简洁,因此本文使用第二类方法。

二、模型概述

支持向量机(SVM)是统计学习理论核心算法,由前苏联学者Vapink于1974年提出。该方法是以VC维理论和风险最小化为基础的,通过核函数技术,来研究小样本数据下机器学习的规律。

SVM方法是从线性可分情况下最优分类面发展而来的。其主要思想是输入样本数据以某种非线性函数关系映射到一个特征空间中,在此特征空间中构造最优分类超平面,使两类(多类)样本在此特征空间中可分。

当前已经有许多算法将SVM推广到多类分类问题,可以将它们大致分为两大类:间接法和直接法。由于直接法将参数求解合并到一个最优化问题中,可以“一次性”地实现多类分类,应用起来十分简洁,因此本文使用第二类方法。

三、指标构建及数据说明

1、企业信用评级等级

企业的信用评级是根据万得一致预测评级(截至指定交易日,各机构对该证券投资评级的算术平均值),将其划分到相应的信用等级。其中,“-1”表示上市企业信用低,违约风险高,投资价值低;“0”表示上市企业信用一般,违约风险一般,投资价值一般;“1”表示上市企业信用高,违约风险较低,有较高的投资价值。

2、金融风险评估指标体系构建

确定全面合理的評估指标体系是信用风险评估的基础,因此,选择科学有效的评估指标体系对于比较准确地评估信用风险是非常重要的。本文借鉴传统风险评估的基本框架,在变量的选择方面,从营运能力、盈利能力、偿债能力、成长能力4个方面选取财务变量综合度量上市公司财务状况,包括以下指标:每股收益、每股净资产、净资产收益率、总资产净利率、销售净利率、流动比率、速动比率、产权比率、权益乘数、长期债务与营运资金比率、存货周转率、应收帐款周转率、流动资产周转率、营运资本周转率、总资产周转率、基本每股收益(同比增长率)、净利润(同比增长率)、净资产(同比增长率)、总资产(同比增长率)共计19个指标。

3、数据处理

将来自2017年上市企业年度数据,剔除缺失值后的样本总量为 813家企业。其中,各指标数据来源于wind金融数据库。本文预计用到多个指标,其量纲和数量级不同,为了保证结果的可靠性,在建立SVM模型前,先对数据进行归一化处理,将数据归化至[0,1]之间。

其中,在具体数据处理中,由于企业预测评级分类代码为“1”的数据样本占大多数,而企业预测评级分类代码为“0”和“-1”的数据样本比例较低。由于后两个等级的样本太少,难以收集充足的数据,根据我国实际情况,本文将对原来的一些等级进行合并,最终得到本文中所采用的企业信用评级等级。同时,在财务指标选择上,由于缺失值太多,删除了2个指标。

四、实证研究及结果分析

根据评级指标体系,选取在上海和深圳证券上市交易企业的财务数据来建立上市企业信用评级模型。在建立评级模型前,要对数据进行预处理。通过筛选、删除有特征值缺失的数据样本后,共得到813家有效的企业债主体财务数据样本,其中评级等级为1、0的分别占729家、44家,等级为-1的占39家。本文中的数据来源于wind金融数据库。

利用R语言对SVM模型确定最优参数。模型对数据集的评级分类准确率为89.8%。该数据集整体评级分类准确率较高,在“1”等级上,其分类性能取得了最好的效果;但在预测“-1”等级和“0”等级的样本数据时分类性能较差,正确率均偏低,这降低了整体的预测正确率。其可能的原因是:一是由于金融数据一般是含有模糊、不确定性信息的,导致“1”等级与“-1”,“0”两个等级的界限并不明显,影响了分类正确性。二是由于在财务指标选取上,只是依据传统的定性分析方法,没有进行进一步处理,导致财务指标的一致性和稳定性较差。

五、总结

作为风险管理与控制的手段,信用评级对证券市场的发展至关重要。支持向量机是一种被证明是优良的新型算法,已被应用于多方面的分类与回归问题。针对企业信用风险评估中面临的小样本、非线性、高维数等问题以及样本数据指标多、噪声复杂的特点,本文提出了一种基于支持向量机的企业信用评级模型。该方法利用财务指标,结合SVM建立评级模型,对数据进行分类。实验结果表明,通过支持向量机进行特征选择的支持向量机具有较高的预测准确度。

当然,本文针对直接法,通过求解该最优化问题“一次性”地实现多类分类,尽管看起来简洁,但是实际应用中,由于变量过多,训练速度和分类精度都不是有很好的效果。

参考文献:

[1].陈军飞,张强.基于随机森林-支持向量机的企业债主体信用评级研究[J].证券市场,2016,(3):80-84.

[2].沈沛龙,周浩.基于支持向量机理论的中小企业信用风险预测研究[J].国际金融研究,2010,(8):77-85.

[3].刘志刚,李德仁,秦前清,史文中.支持向量机在多类分类问题中的推广[J].计算机工程与应用,2003,(7):10-13

[4].陈朝晖,胡玉芳.基于SVM的我国商业银行风险预警研究[J].武汉理工大学学报(信息与管理工程版),2012,(4):504-508

作者简介:

王星星(1992-),女,河北石家庄人,山西财经大学2016(金融学)学术硕士研究生,研究方向:金融投资与风险管理.

猜你喜欢

企业信用信用风险评级
扬州市稳步推进安全生产领域企业信用修复
泰州市推行企业信用修复全链条服务模式
“涉军”企业信用评价扩大试点工作即将启动
“涉军”企业信用评论扩大试点工作即将启动
浅析我国商业银行信用风险管理
分析师最新给予买入评级的公司
京东商城电子商务信用风险防范策略
个人信用风险评分的指标选择研究
信用风险的诱发成因及对策思考
创投概念股评级一览表