基于SOM聚类和宽度学习系统的财务危机预测方法
2022-04-20荘芳芳
荘芳芳
(昆明市交通技工学校,财务科,云南,昆明 650000)
0 引言
企业的财务状态不仅决定了企业的发展,而且还影响着整体经济走势[1]。基于企业历史及当期财务数据预测财务危机具有十分重要的现实意义,已经成为判定企业经营状况,调制投资策略的重要依据[2-3]。
企业财务危机的预测是一个二分类问题,即将企业状态划分为正常财务或危机财务,研究人员已经提出多种企业财务危机预测方法[4]。文献[5]在COX模型的基础上,通过引入惩罚组变量选择CMCP方法,筛选出了对企业财务危机预测关键财务指标。文献[6]提出了一种基于粒子群优化算法与核极限学习机的企业财务危机预测方法,降低了财务预测过程中参数优化与特征选择之间的矛盾。文献[7]提出了基于静态财务指标的动态财务指标,并构建了深度神经网络框架财务危机预测模型。
本文提出一种集成财务危机预测模型。该模型首先采用自组织映射(SOM)聚类处理初始财务数据,根据财务数据状态将企业划分为不同的组;然后针对不同财务状态,基于宽度学习系统构建基分类器,训练完成后采用逐步向前集成方法搭建集成分类器,预测企业财务状态。实证分析结果验证该模型的有效性和准确性。
1 基于SOM的财务数据聚类
1.1 SOM聚类原理
图1给出了SOM映射网络的拓扑结构,整个网络包括2部分:输入层和竞争层(又称输出层)[8]。网络输入层由N个节点神经元组成,负责接收输入数据;网络竞争层由一个排列成R行C列的神经元矩阵构成。网络运行过程中,竞争层中的神经元每个时刻仅有一个被激活,在相互竞争中获得优先激活权,被激活的神经元表示了对当前输入数据的分类结果。
图1 SOM聚类结构
为了更加精准地获取财务数据在短期内的波动特征,首先将财务数据转化为时间序列,即各个时刻t对应的财务数据为x(t)∈RN,其中N表示财务危机预测中输入样本数据的特征维数,然后利用SOM聚类处理输入财务数据。根据SOM聚类原理,如果不同时间段的历史财务数据与未来的变动趋势具有较大差异,就会被划分至不同的SOM聚类中,后续将采用不同的预测模型以更好地匹配其变化趋势。
1.2 SOM聚类实现
针对财务数据聚类分析问题,SOM聚类步骤如下。
步骤1:参数初始化。设置最大聚类迭代次数K,并令k=1,随机化竞争层中神经元之间的权值向量ωi∈RN。输入数据与权值向量归一化,将输入样本x∈RN和竞争层权值向量进行归一化处理。
步骤2:神经元竞争。采用欧氏距离比较竞争层中所有神经元对应的权值向量ωi与输入层的输入向量x,将与输入向量距离最近的神经元作为竞争获胜神经元,获胜神经元权值向量权值向量记为ωc,神经元竞争过程可以表示为
(1)
步骤3:调整竞争层权值向量。对获胜神经元的近邻神经元的权值向量进行调整,目的是使其靠拢输入向量,调整过程可以表示为
(2)
(3)
其中,α(k)和σ(k)分别表示网络学习率和神经元的影响半径,随着k的增加,这2个参数均逐渐减小。
步骤4:更新数据向量。将新的数据样本数据导入SOM聚类网络,返回步骤2继续调整竞争层权值向量,直至所有数据样本均完成聚类训练。
步骤5:算法收敛判定。如果相邻两次迭代的权值向量误差小于预设门限值或者迭代次数等于K,则聚类过程结束;否则令k=k+1,并返回步骤2。
上述SOM聚类过程表明,网络竞争层中的神经元与其邻近神经元互相促进学习,经过训练后邻近神经元具有相似的权值向量,因此输入特征相似的样本数据将被映射至邻近神经元节点上。通过SOM对企业财务数据进行聚类后,针对不同类型的财务数据会形成各自的基分类器,更好地实现对企业财务数据的拟合,提高后续财务危机的预测精度。
2 宽度学习系统
宽度学习系统是在随机向量函数链接神经网络(RVFLNN)基础上得出的一种新的学习算法[9]。RVFLNN的学习思想将初始数据以及初始数据的简单映射结果共同作为网络模型的输入,然后训练网络模型获取最终输出。宽度学习系统包括3层结构,即输入层、隐藏层和输出层,其中隐藏层由增强特征节点层和映射特征节点层构成,系统结构如图2所示。宽度学习系统的学习过程主要包括映射节点组、增强节点与系统输出。首先,构建映射特征组,构建方法是将初始数据经过线性特征映射函数变换后,利用稀疏自编码器生成;然后,生成增强节点层,即将映射特征组分别进行线性映射与非线性激活,得出增强节点;最后,计算系统输出,将映射节点与增强节点导入到输出权值矩阵,经过回归广义逆计算得出系统输出。
图2 宽度学习系统结构
2.1 映射特征组构建
宽度学习系统的输入数据可以表示为X∈Ra×b,其中a和b分别表示输入数据的数量和特征维度;输出数据可以表示为Y∈Ra×c,其中a和b分别表示模型输出的a个c维数据,则系统的第i组映射特征可以表示为
(4)
其中,φi(·)表示网络的特征映射函数,Wei和βei分别表示由稀疏编码器生成的第i个最佳权值向量和与该权值向量对应的偏置向量。由式(4)可知,映射特征组的节点数取决于权值向量Wei的维数。
2.2 增强节点组生成
将映射特征组导入映射函数变换后即可生成增强节点组,则第j个增强节点组[10]可以表示为
Hj=ξj(Whj·Zn+βhj),j=1,2,…,n
(5)
其中,ξj表示映射模型的激活函数,通常非线性函数,Whj和βhj分别表示特征特点映射至增强节点的权值向量和偏置向量。此时d个增强节点组构成的集合可以表示为
Hd=[H1,H2,…,Hd]
(6)
2.3 系统输出
宽度学习系统的输出为映射特征节点与增强特征节点共同生成的,可以表示为
Y=[Zn|Hd]W=[Z1,Z2,…,Zn|H1,H2,…,Hd]W
(7)
式中,[Zn|Hd]表示宽度学习系统的输入,W表示从特征节点到增强节点再到系统输出的权值矩阵,Y表示系统输出,表示财务危机的预测值。
训练过程中,模型初始化过程中随机生成的权值向量Wei和Whj、偏置向量βei和βhj将保持不变,因此宽度学习系统的训练过程就是搜寻使得线性系统输出的最小二乘解,即
(8)
根据宽度学习系统训练过程可知,系统无须进行权值向量的梯度下降学习,因此具有较快的训练速度,且训练过程降低了系统陷入局部最优值的概率。对于企业财务危机预测问题,历史数据时间长,训练数据集规模很大,因此适合于训练效率较高的宽度学习系统。并且,每个时刻企业财务状态数据均对应着多种财务数据,数据维度非常高,对应需要构建高维度的输入层,因此财务危机预测模型采用单隐藏层结构,能够在确保财务数据拟合精度的前提下提升模型的训练效率。
3 企业财务危机预测模型
3.1 指标选取
对于财务危机预测问题,预测模型性能不仅体现在财务危机预测精确性上,还体现在提前预测能力上。因此,虽然选择t-1或t-2年度数据预测t年度会使得预测精确度有所提升,但预测超前性不足,预测结果不足以为企业预留出充足时间调整决策。为此,综合前3个年度财务数据构建预测模型,以平衡财务危机预测精度和超前性的矛盾。
利用宽度学习系统扁平化特点,构造具备多输出功能的神经网络,预测企业当前年度的财务状态。借鉴已有财务危机预测研究成果,文中从盈利能力、营运能力、偿债能力、每股比例以及成长能力等5个方面选取了30个财务指标作为样本特征,具体如表1所示。
表1 财务危机预测指标
3.2 模型构建
构建集成财务危机预测模型,模型框架如图3所示。
图3 财务危机预测框架
首先,利用SOM聚类对财务数据进行精细化处理,将特征相似度高的样本划分为一类,聚类后的各个类簇分别代表一类公司的财务状态;然后,采用宽度学习系统分别构建各个财务状态的危机预测模型;最后,通过集成分类实现对企业财务数据的精准分析。模型预测过程如下。
假设SOM模糊聚类将数据集划分为P个数据子集,则每个数据子集均代表了一类公司的财务状态。P个数据子集有效描述了从健康财务状态空间到危机财务状态空间的全序列描述。利用分类后的财务数据进行宽度学习系统训练后,就能够得出满足后续分类器集成层需要的基分类器。
最后是分类器集成,目的是寻找最合适的基分类器,采用预测性能优秀的逐步向前集成方法。该方法的分类器选择思路是先对基分类器的预测性能进行排序,然后逐步实现分类器的选择与集成。具体的方法为,如果某一个基分类器加入集成分类器后,集成分类器的分类性能得到提升,则该基分类器被选择值集成分类器中,直至所有的基分类器均不能使集成分类器性能得到提升,则分类器集成结束。通过基分类器集成,能够确保整体财务预测模型的性能最佳。
4 实证分析
主要研究内容是设计了一个基于SOM聚类和宽度学习系统的两层集成分类器的财务危机预测模型。为此实证分析首先需要验证SOM聚类分析引入的不同企业财务状态空间对解决财务危机预测问题的性能,然后验证宽带学习系统对预测财务危机的有效性。选用了2017年至2019年被特殊处理的329个上市公司财务数据,为均衡样本,增加了368个财务健康的企业数据作为正样本。
为验证SOM聚类对财务数据集空间划分的性能,将其与高斯核函数模糊聚类(GFCM)和支持向量聚类(SVM)进行对比测试。3种聚类模型对企业财务数据状态空间的划分结果如表2所示,表中给出了资产收益率、资产总增长率和资产负债率这3个最能代表企业盈利能力、成长能力和偿债能力的指标聚类后各组均值。
表2 3种方法聚类后指标均值
实证结果表明,财务指标能够有效反应企业的财务状态。对于SOM聚类结果,资产收益率和总资产增长率从分组1到分组4均呈现下降趋势,而资产负债率从分组1到分组4均呈现上升趋势。对于GFCM和SVM,不同分组的财务指标趋势相同。经过聚类后,分组1中均为具有很强盈利能力的财务健康企业构成,而分组4中均为财务状态欠佳、盈利能力低的企业构成。测试结果说明,通过对企业财务数据进行聚类预处理,能够有效识别出不同财务状态的企业,为后续有针对性地训练基分类器提供数据支撑。对比3种财务数据聚类方法结果可知,SOM聚类结果中不同分组的组内相似度和组间差异度性能优于GFCM和SVM方法,说明SOM聚类对企业财务数据具有良好的适用性。
宽度学习系统(BLS)是采用的基分类器模型,为验证其对企业财务危机的预测能力,将其与核函数支持向量机(FSVM)、人工神经网络(ANN)和Logistic回归分类器进行对比测试,企业财务数据聚类分析方法分别采用SOM、GFCM和SVM方法。4种基分类器在测试集上的预测准确率如表3所示。
表3 4种基分类器,3种方法聚类后指标均值
表3结果表明,4种基分类器中,宽度学习系统和SOM聚类算法的组合预测模型对健康企业、危机企业以及全部企业的财务状态预测结果最佳,分别为91.24%、96.09%和93.29%,预测结果最差为人工神经网络与支持向量聚类组合的预测模型,分别为59.42%、58.04%和58.98%。对比在SOM聚类条件下的4种基分类器模型预测结果可知,宽度学习系统更适合于对企业财务危机状态进行预测,这是因为宽度学习系统能够准确提取输入财务数据的特征,并高精度拟合高维财务数据与财务状态之间的关系,因此其预测性能优于其他分类器。
5 总结
研究了企业财务危机预测问题,提出了一种基于SOM聚类和宽度学习的集成预测方法。实证分析结果表明,该方法能够对不同财务状态的企业进行分类,高精度地提取并拟合高维财务数据与企业财务状态之间的关系,提升了财务危机预测性能。研究内容为预测企业财务危机提供了一种新方法。