APP下载

上市公司退市风险预警研究
——基于主成分分析的支持向量机预测模型

2020-10-10方扶星

铜陵学院学报 2020年4期
关键词:分类器线性显著性

曹 强 方扶星

(安徽财经大学,安徽 蚌埠233030)

一、引言

随着经济全球化的高速发展以及市场环境的变化多端,上市公司外部发展环境的不确定性急剧增加。面对这样的不确定性,上市公司如何及时发现并规避退市风险将直接影响着公司的可持续发展,而退市风险预警系统作为证券市场退市机制的核心内容,一直以来引起了学者们的广泛研究和关注。Xie等[1]通过比较支持向量机(SVM)和数据包络分析(MDA)对于上市公司的财务困境预测,实证结果表明支持向量机的预测结果较好;Mselmi等[2]结合偏最小二乘法提出了支持向量机混合模型,发现债偿能力对于纳斯达克上市公司的退市风险影响最大。虽然偏最小二乘法能够通过最小平方和寻找数据的最佳函数匹配,但该方法只能进行线性估计,应用于非线性的财务数据会产生一定的数学偏差。主成分分析法借助于正交变换,将财务变量相关的原随机向量转化成其分量不相关的新随机变量,然后对多为变量系统进行降维处理,能够显著降低非线性财务数据的降维损失。另外,基于非线性核函数(Nonlinear kernel)的支持向量机分类器能够避开局部极小值的干扰,从而减少模型的系统偏差。因此,本文通过构建基于主成分分析的支持向量机模型预测我国上市公司的退市风险,对完善中国证券市场的退市风险预警机制具有重要意义[3]。

二、研究设计

(一)研究样本选取

本文研究的上市公司源自于我国A股市场,其中被交易所处以退市风险警示(ST)的公司139家,非ST公司239家。同时本文所搜集的数据来自于样本378家上市公司2018年第四季度财务报表,并将ST和非ST公司的数据随机分为两个子集:70%的数据用于拟合支持向量机模型,余下30%的数据对模型进行交叉验证。由于描述公司财务状况的指标繁多,本文参照鲍新中和杨宜[4]的经验选取了退市风险预警实证研究中较为常用(引用频次超过50)的21项指标,这些指标分别从债偿能力、盈利能力、发展能力和每股指标四个方面较为全面的反映了我国A股上市公司的发展状况,预警指标如表1所示。

由于初步确定的21项指标较多,部分指标可能不够显著并且存在着交叉重复。本文通过显著性检验进行指标分辨能力筛选,并利用主成分分析对剩余指标进行降维处理,将多个指标合并成几个主成分,确保财务指标的显著性以及预警指标的简洁性。

表1 财务指标体系

(二)显著性检验

K-S正态性检验是常用的多元正态性检验方法,能够对数据进行定量检验,因此本文采用K-S正态性检验来验证各财务指标是否服从正态分布[5]。由表2结果可知,各变量指标的显著性水平均小于0.05,此时各财务指标均不服从正态分布。表2为KS正态性检验结果及显著性水平。

表2 K-S正态性检验

对K-S正态性检验中不服从正态分布的财务指标需要进行非参数检验。SPSS25.0提供的方法多种多样,其中最为常用的是Kruskal-Wallis(H检验),用来检验多个独立样本是否具有显著性差异。因此,对不服从正态分布的财务指标进行K-W非参数检验验证其是否存在显著性差异。检验结果如表3所示。

由表3中的结果可知,只有财务指标X7、X20的渐近显著性大于0.05,表明其对ST公司和非ST公司的区分不显著。综合K-S正态性检验和K-W非参数检验结果可知,财务指标X 1-X6、X8-X19和X21具有显著性特征并且能够显著区分ST公司和非ST公司。

(三)主成分分析

经过显著性检验后的财务指标虽然保证了较高的分辨能力,但如果直接用来拟合支持向量分类器会导致系统信息冗余,而且输入变量过多会导致拟合支持向量分类器时产生维度灾难问题[6]。鉴于此,本文对上述19项财务指标进行主成分分析,相关系数矩阵的前六个特征根及其贡献率如表4所示。

可以看出前5个特征根的贡献率均为10%以上,累计贡献率达到了71%,主成分分析效果较好。因此本文选取前5个主成分构建预警指标体系,前5个主成分对应的特征向量如表5所示,从主成分的系数可以看出,第一主成分(CR)主要反映了上市公司的盈利能力;第二主成分(NA)主要反映了上市公司的债偿能力;第三主成分(OM)主要反映了上市公司每股指标;第四主成分(NIROS)主要反映了上市公司的利息保障倍数和资本累计率;第五主成分(ROTA)主要反映了上市公司的营业利润率和资本保值增值率。

三、基于主成分分析的支持向量机模型

支持向量机(Support Vector Machine,SVM)是一种能够同时用于分类和回归的统计方法。SVM的原理是将低维特征空间投影到高维中,从而在高维特征空间中实现线性可分[7]。在分类问题上,它通过寻求将特征空间的最优超平面来将其一分为二。本文随机选取70%的样本数据拟合支持向量分类器,并且基于线性核函数和非线性核函数分别找出特征空间的最优超平面,建立最优支持向量分类器并使用剩余30%的样本进行交叉验证。

表3 Kruskal-Wallis(H检验)

表4 主成分分析结果

表5 5个主成分对应的特征向量

(一)模型的建立

首先将区分上市公司是否被ST的5个主成分作为支持向量机分类器的预测变量,设定观测样为[ai,yi](i=1,2,…,378),其中ai∈R5,yi=1,为无退市风险,yi=0有退市风险,即公司股票被处以退市风险警示的企业。我们将观测样本的70%用作训练集,剩余样本用作测试集。拟合支持向量分类器就是要找一个最优分类面(最优超平面)(ω*x)+b=0,其中x=[x1,x2,x3,x4,x5]T,ω∈R5,b∈R,ω,b待定,满足如下条件:

即有yi[(ω*ai)-b]≥1,i=1,2,…,378,其中,满足方程(ω*ai)+b±1的样本为支持向量。要使两类总体到分类面的距离最大,则有

基于此建立SVM预测模型:

这是一个凸线性规划问题,可以求得最优值对应的ω*,b*,得到分类函数

引入线性核函数(ai*x)得到最终的分类函数表达式如下:

实际上,非线性核函数可以将原样本空间线性不可分的向量转化到高维特征空间中线性可分的向量,所以将线性核函数(ai*x)换成一般的核函数K(x,y),可得到一般分类函数的表达式为

(二)模型的求解

1.数据预处理

第i(i=1,2,…,378)个样本的第j(j=1,2,3,4,5)个主成分的取值记为aij。对于给定的378个训练样本,首先计算它们的均值向量μ=[μ1,μ2,μ3,μ4,μ5]和标准差向量σ=[σ1,σ2,σ3,σ4,σ5],对于所有样本点数据利用如下公式进行标准化处理:

对应地,称

2.核函数的选取

核函数(kernel)的一般形式为K(x,y)=<f(x),f(y)>,其中x,y为n维,f为n维到m维的映射,<f(x),f(y)>表示内积在用SVM处理问题时,如果数据线性不可分,希望通过将输入空间内线性不可分的数据映射到一个高维的特征空间内,使数据在特征空间内是线性可分的,这个映射记作。接下来的优化问题中就会有内积,这个内积的计算维度会非常大,而核函数可以帮我们很快地做一些计算,否则需要在高维空间中进行计算。常用的核函数有线性核函数(Linear kernel)和非线性核函数(Radial kernel)接下来便选取这两种核函数拟合支持向量分类器[8]。

首先选取线性核函数(Linear kernel)拟合支持向量分类器,设置一系列cost值,cost值的取值范围为[0.01,0.1,0.5,1,5,10],通过交叉验证法选择最优的cost。结果显示,在cost=1时,交叉验证的错误率最低,模型的拟合效果最佳。同时使用命令plot画出一对变量的决策边界,如图1所示。

图1 线性支持向量分类器

主成分CR与主成分OM分别反映了上市公司的盈利能力和每股指标,此时使用最优线性模型对测试集进行测试,结果显示,分类错误率为0.1348。本文预警指标体系选取的4项每股指标均为正向指标,当每股指标的标准化数值越大,每股指标的实际数值也就越大,从而上市公司的盈利能力也就越好,面临退市风险警示的概率可能性就越低。图二的最优超平面恰好将数据集分为左下角和右上角两个部分,与实际情况相吻合,右上角的上市公司很少被除以退市风险警示,而左下角的上市公司大部分都被处以了退市风险警示。

接下来选取非线性核函数(Non-linear kernel)拟合支持向量分类器,设置一系列cost值和gamma值,同样通过交叉验证法选择最合适的cost,进而用最优模型对测试集进行预测。结果显示,在cost=10,gamma=2时,交叉验证的错误率最低,模型的拟合效果最佳。同时可以使用命令plot画出一对变量的决策边界,如图2所示。

图2 非线性支持向量分类器

此时使用最优模型对测试集进行测试,结果显示,分类错误率为0.115,0,非线性核函数拟合支持向量分类器的预测效果要优于线性核函数拟合的支持向量分类器,正确分类率达到了89.50%。这是因为各个经济指标之间不是单纯的线性关系,还受到边际递减效应的影响,随着每股指标按单位数值逐渐增加时,盈利能力的增加会越来越小。因此,非线性支持向量分类器的最优超平面呈单支双曲线状,预测效果相较于线性支持向量分类器会更好。

(三)Logistic回归模型的预测效果对比

图3 为Logit模型、线性判别分析模型(LDA)、二次判别分析模型(QDA)和朴素贝叶斯模型(Naive Bayes)的ROC曲线图[9]。通过对比图1和图2可知,非线性支持向量机预测模型的分类效果明显优于传统的Logistic回归模型,对上市公司退市风险预警的准确性提高了5.29%。

图3 4种模型的ROC曲线

四、上市公司退市风险控制意见

(一)加强上市公司资产质量管理

上市公司的资产质量是衡量一个企业能否稳定运营发展的重要指标,良好的资产质量可以使企业保持生机活力并拥有广阔的发展空间,在市场调研的基础上,企业有针对性地根据客户群体的消费习惯,提供更优质的售后服务。与此同时,加强企业的成本管理,有利于提高上市公司产品的市场占有率和企业利润率,保证资金的良性循环,提高企业的抗风险能力。

(二)加强上市公司内部控制管理

对上市公司内部控制的管理,首要任务是为全体员工树立退市风险防范意识,形成退市风险管理文化。同时积极执行全面预算控制,将企业经营收益最大化作为发展的战略目标,调整资源统筹全局对企业的各项经营活动预算进行成本-效益分析管理,提高资金的利用率以及时间价值,帮助上市公司管理层掌控企业发展动向,真正实现经营收益最大化和有效控制退市风险的目标。

(三)建立上市公司退市风险预警机制

退市风险预警是一种运用科学统计方法,帮助企业管理者了解内部经营状况和风险状态的管理手段。通过对企业内部财务数据收集整理,对其退市风险状态进行实时监督,便于管理层采取针对性的风险控制措施。本文通过构建非线性支持向量机模型和Logistic回归模型对我国上市公司的退市风险进行实证分析,即使在不考虑多元正态性检验的前提下,非线性支持向量机模型的性能仍然普遍优于传统的Logistic回归分析[10]。总之,合理的退市风险预警具有较强的监督作用,有助于企业找到退市风险发生的根本原因,从而采取相应的对策和措施,在风险进一步恶化之前及时解决问题。

猜你喜欢

分类器线性显著性
对统计结果解释和表达的要求
学贯中西(6):阐述ML分类器的工作流程
一种结合多尺度特征融合与像素损失加权的显著性目标检测方法
二阶整线性递归数列的性质及应用
线性回归方程的求解与应用
基于朴素Bayes组合的简易集成分类器①
基于特征选择的SVM选择性集成学习方法
基于区域特征聚类的RGBD显著性物体检测
基于显著性权重融合的图像拼接算法
非齐次线性微分方程的常数变易法