APP下载

基于GMDH神经网络法的中小板上市公司ST分类预测研究

2021-07-02

关键词:财务指标神经元神经网络

石 峰

(湖南工程学院 管理学院,湖南 湘潭411104)

新冠病毒疫情爆发以来,大量企业陷入财务困境。对于投资者和其他利益相关者而言,预测上市公司的上市状态至关重要。“特别处理”(即Special Treatment,ST)是我国证券市场特有的一项旨在保护投资者利益的政策。具体而言,当某上市公司出现财务状况或其他状况异常,导致投资者难以判断该公司前景,且投资者利益可能受到损害时,交易所要对该公司股票交易实行特别处理。特别处理的股票,除了涨跌幅度受到限制以外,其股票名称之前还需注释为“ST”。如果该ST 公司仍然持续亏损,那么它将有被退市的风险。

一 文献综述

针对我国上市公司的ST 分类预测研究,国内已有大量研究成果。陈瑜选取沪深A 股和B 股58 家ST 公司和58 家非ST 公司为研究样本,基于流动比率、资产负债率、总资产周转率、总资产收益率、权益报酬率和净利润率等6 个财务指标数据,运用判别分析法对ST 公司进行分类,准确率达75%左右。[1]姜国华和王汉生选取沪深股市33 家ST 公司和778家非ST 公司的7 个财务指标数据(主营业务利润、资产周转率、债务资产比率、主营业务收入增长率、第一大股东持股比例、资产总额和营业外收支净额),运用逻辑回归方法对ST 公司进行分类预测,预测准确率大约为64%。[2]吴曼琪基于43 家ST 公司的4 个财务指标数据(每股收益、每股净资产、每股现金流量和每股资本公积金),运用K 均值聚类法对ST 股票进行分类,预测分类准确率为66.7%。[3]时建中基于RS-Bag 分类器集成技术对我国ST 公司进行分类预测,预测准确率达到80%左右。[4]张茂军选取2001—2015 年我国制造业157 家ST 公司和200 家非ST 公司的9 个财务指标数据(流动比率、资产负债率、资产报酬率、营业利润率、销售现金比率、固定资产增长率、应收账款周转率、产权比率和总资产规模),运用生存分析法分析发现:总资产规模越大,被ST 可能性越小。[5]

综上,国内针对ST 公司的分类预测研究,主要运用传统的分类预测方法(判别分析法、聚类分析法、逻辑回归法和生存分析法)。这些预测方法的应用通常需要某些假设,比如,逻辑回归中要求logit(p)和自变量之间存在线性关系;判别分析中要求各变量相互独立,且服从多元正态分布。因此,当自变量的数量逐渐增多且高度相关时,这些方法的缺点更加明显。同时,以往的研究在指标选择上,主要选取偿债能力、营运能力、盈利能力、成长能力、现金流量和资产结构等方面的少量财务指标,具有一定主观性。另外,以往的研究在样本选取上,主要根据1∶1配对的原则,即根据ST 公司的数量来选取“非ST”公司的数量。但GMDH 神经网络法应用于分类预测研究不会受到如此严格的限制。然而需要指出的是,GMDH 神经网络法应用于我国中小板上市公司ST 分类的预测研究还很难看到。

分组数据处理方法(Group Method of Data Handing,GMDH)型神经网络法是用于对复杂系统进行建模的自组织算法,被广泛应用于回归、分类、聚类和预测等研究领域。由此,首次将GMDH 神经网络法应用于我国中小板上市公司的ST 分类预测中,构建全面涵盖偿债能力、营运能力、盈利能力、成长能力、现金流量和资产结构等六大方面的86 个财务指标的GMDH 神经网络分类预测模型,并评价其预测效果。

二 GMDH 神经网络法

GMDH 神经网络法是一种研究变量之间关系的启发式自组织方法。GMDH 神经网络法可以自动查找数据中的相互关系、选择模型或网络的最佳结构,并提高现有算法的准确性。Ivakhnenko 为更好地预测河流中的鱼类种群,创造了分组数据处理方法(GMDH),使神经元成为具有多项式传递函数的更复杂的单元,并简化了神经元之间的互联,同时开发了用于结构设计和权重调整的自动算法。[6]43-55Ivakhnenko 构造的多项式为:

上式(1)也称为Ivakhnenko 多项式。其中,m 表示每个神经元进入回归模型的变量数量;a,b,c…是多项式中变量的权重;y是响应变量;xi和xj是探索性变量。在研究中,上述模型仅包含主要影响,由此可表示为:

在模型建立和评估过程中,数据被分为三组:训练集(60%)、验证集(20%)和测试集(20%)。训练集包含在模型构建中,验证集则用于对神经元的选择;测试集是用于考察评估模型在未观察数据上的性能。GMDH 神经网络法是由神经元构成的层次系统。每层中对应神经元的数量取决于输入的数量。假设进入某一层的输入数量等于p,则该层中的神经元数量变为:

图1 GMDH 神经网络法的体系结构

上式(3)考虑了所有成对的输入组合,但这并不意味着所有层都包括h 个神经元。例如,输入层中的输入数量仅定义第一层中的神经元数量。在第一层中选择的神经元数量决定第二层中的神经元数量。该算法自行组织架构,当存在三个层次和四个输入时,GMDH 神经网络法的体系结构如图1 所示。

三 实证分析

(一)数据来源

实证数据来源于巨潮资讯网公布的中小板上市公司的财务指标数据。数据日期为2019 年1 月1 日至3 月31 日,即2019 年第一季度财务报告数据。中小板上市公司总共有940 家,且每家公司的财务指标共计122 个,其中有35 家“*ST”公司和9 家ST 公司。研究目的是运用GMDH 神经网络法对中小板上市公司是否是ST 公司和非ST 公司做出正确预测分类。因此,进一步对数据进行筛选,以满足GMDH 神经网络法对数据的要求。首先,在这122 个财务指标数据中,删除有缺失值的指标和样本;其次,删除财务指标数据为0 的样本。由此得到86 个财务指标的116 家公司样本,其中“*ST”公司34 家,ST公司9 家。最后,将“*ST”公司和ST 公司都归类为ST 公司,共计43 家ST 公司,占116 家公司样本的37.1%;73 家非ST 公司占116 家公司样本的62.9%。运用于分类预测的86 个财务指标全面涵盖了偿债能力、营运能力、盈利能力、成长能力、现金流量和资产结构等六大方面内容(见表一)。

表一 中小板上市公司财务指标体系

续表一

(二)GMDH 神经网络法分类预测

运用GMDH 神经网络法对中小板上市公司的财务指标数据进行特征选择和分类预测,同时参考Osman 和Yozgatligil 开发的R 软件程序包GMDH 进行计算[7],并使用Osman 和Erdem 最新开发的GMDH2 函数进行分类预测[8]。二进制分类是一项任务,其中可以将二进制目标标签分配给每个观察值,从而通过分组数据处理(GMDH)算法对两标签输出进行分类。GMDH 神经网络法适用于复杂的非结构化系统,并且比高阶回归具有优势。通过GMDH神经网络法执行二进制分类存在两种主要算法:GMDH 神经网络法和基于各种分类器集合的GMDH(dce-GMDH)神经网络法。

首先,我们将数据随机分为训练集、验证集和测试集,然后调用GMDH()函数。

运行GMDH()函数得到的结果如表二所示。由表二看到,中小板上市公司ST 分类预测的算法结构包括层、神经元、被选中神经元和最小均方误差。该算法结构共计5 层,每层神经元的数量分别为3655、105、66、105 和105;每层被选中的神经元分别为15、12、15、15 和1。计算神经元的外部标准为最小均方误差。

当层数为5时,最小均方误差达到最小值0.081 52。该算法从86 个变量中选择了8 个变量(X2,X3,X9,X15,X17,X25,X26,X57),即基本每股收益、稀释每股收益、营业税金率、成本费用利润率、应收账款周转率、货币资金比率、固定资产比率和年化期间费用毛利比。

在模型构建完成后对测试集进行预测,测试集共有23 个观测值,预测结果如表三所示。

从表三看出,GMDH 神经网络法预测第1 家公司为“ST”和“非ST”的概率分别为0.29 和0.71,由于第1 家公司为“非ST”的概率大于为“ST”的概率,因此第1 家公司归类为非ST 公司。因此,在23 家测试样本中,归类为ST 公司的有4、6、8、9、11、13、15、19 和23;归类为非ST 公司的有1、2、3、5、7、10、12、14、16、17、18、20、21 和22。

随后,利用R 软件中的confMat()函数为二进制响应生成一个混淆矩阵,并返回一些相关的统计信息。GMDH 神经网络法的分类预测正确率为0.7826。这说明该算法将78.26%的公司分类为正确的类别,即23 家公司中有18 家公司分类正确,其中8家ST 公司分类正确,1 家ST 公司分类错误;10 家非ST 公司分类正确,4 家非ST 公司分类错误。与此同时,可以计算出敏感性值和特异性值分别为0.6667 和0.9091。这表明该算法将66.67%的ST 公司和90.91%的非ST 公司正确分类,即在分类预测结果中,12 家ST 公司有8 家ST 公司分类正确;11家非ST 公司有10 家非ST 公司分类正确。

运用GMDH 神经网络法得到的分类预测结果,与以往研究相比,预测正确率大幅提高。进一步采用1:1 配对原则(43 家ST 公司和43 家“非ST”公司)对中小板上市公司进行ST 分类预测。首先,对两类上市公司的86 家样本进行分组,即分成训练集(60%)、验证集(20%)和测试集(20%)。其中,43 家“非ST”公司样本从73 家“非ST”公司随机选取。1∶1 配对下的ST 分类预测算法结构输出结果见表四所示。

表四 1∶1 配对下的ST 分类预测算法结构输出结果

从表四看到,GMDH 神经网络法在每个相应层的验证集上给出了最小外部标准值(均方误差)。当层数为10 时,最小均方误差达到最小值0.089 05。该算法从86 个变量中选择了8 个变量(X5,X25,X32,X34,X42,X43,X44,X57),即每股未分配利润、货币资金比率、现金比率、流动负债比率、每股经营现金流量、每股经营现金流量经营净现金比率(短期债务)、经营净现金比率(全部债务)和年化期间费用毛利比。

在模型构建完成后对测试集的17 个观测值进行预测。1∶1 配对下GMDH 神经网络法的分类预测正确率为0.8824。这说明该算法将88.24%的公司分类为正确的类别,即17 家公司中,有15 家公司分类正确;其中7 家ST 公司分类正确,1 家ST 公司分类错误;8 家非ST 公司分类正确,1 家非ST 公司分类错误。同样地,计算得到的敏感性值和特异性值分别为0.8750 和0.8889。这表明该算法将87.50%的ST公司和88.89%的非ST 公司正确分类,即在分类预测结果中,8 家ST 公司有7 家ST 公司分类正确;9家非ST 公司有8 家非ST 公司分类正确。

四 结语

运用GMDH 神经网络法对具有86 个财务指标的116 家ST 公司(43 家)和非ST 公司(73 家)进行分类预测,预测正确率为78.26%,敏感性值和特异性值分别为0.6667 和0.9091,即将66.67%的ST 公司和90.91%的非ST 公司正确分类。随后,进一步以1∶1配对原则对43 家ST 公司和43 家非ST 公司进行分类预测,预测正确率达到88.24%,敏感性值和特异性值分别为0.8750 和0.8889,即将87.50%的ST 公司和88.89%的非ST 公司正确分类。

基于GMDH 神经网络法对我国中小板43 家ST公司和73 家非ST 公司的分类预测有助于为中小板上市公司的财务预警和监测发挥作用,与此同时也可进一步在我国主板市场进行推广和应用。

需要指出的是,GMDH 神经网络法是基于对逐渐复杂的模型进行分类,并通过最小化外部准则特征来选择最佳解决方案。GMDH 神经网络法找到了模型结构的最佳复杂性,足以满足样本数据中的噪声水平。其中,隐藏层中的层数和神经元数量以及模型结构和其他最佳神经网络参数自动确定。由于输入变量使用可影响输出变量的非线性函数,它会自动在数据中找到可解释的关系,并选择有效的输入变量。因此,GMDH 神经网络法可以使用两个多层神经网络来提高另一种建模算法的准确性。

猜你喜欢

财务指标神经元神经网络
基于递归模糊神经网络的风电平滑控制策略
AI讲座:神经网络的空间对应
关于财务指标实际应用的思考
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
探讨医院财务分析中财务指标体系的应用
激活皮层生长抑素中间神经元抑制神经病理性疼痛的发展
EVA业绩评价体系应用分析
贝因美股份有限公司偿债能力分析
研究人员精确定位控制饮酒的神经元