APP下载

险境淘金:基于并购重组事件挖掘的财务脱困预测

2022-06-25江俊毅蒋洪迅

系统工程学报 2022年2期
关键词:分类器困境样本

江俊毅,蒋洪迅

(中国人民大学信息学院,北京 100872)

1 引言

收益与风险永远并存.财务受困企业受限于融资成本高,倾向于发行更高回报率的企业债或其它证券.而高收益证券暗藏着高风险,对企业财务困境预测研究一直是学界的热点问题.以往的研究大都专注于预测上市企业陷入财务困境的概率,探求面临的风险与潜在的收益之间的盈亏平衡点.然而,事实上不少上市企业也实现了逆境求生、扭亏为盈,迄今却少有文献研究受困企业的脱困策略以及其可能性预测,特别是并购重组及其后续事件对上市企业的影响.

通过大数据预测上市企业的财务脱困,即险境淘金,在现实生活中既是可能的又是可行的.首先,我国沪深股市很多陷入财务困境的上市企业仍然拥有一个宝贵的“壳”资源,其它非上市企业通过并购重组、吸收合并、出清式资产置换等方式可以盘活这部分市场资源;其次,受到国际贸易态势变化的影响,中国经济出现了明显的产业升级,从劳动力密集型的产业转移到科技密集型产业,跨行业并购重组数量逐年快速增长,这些事件对于分析企业未来经营状况和摆脱财务困境有着越来越重要的理论价值和实践意义;再次,传统的财务数据存在着瞒报、漏报甚至造假的重大缺陷,即便在财会审计严格的美国股市也存在美化报表、隐瞒经营状况、虚构业务等的数字游戏,例如2020 年“瑞幸咖啡”事件;最后,监管规范使得多源异构大数据特征输入变得可能,近年证监会对上市企业的信息披露行为进行了规范,特别是中文年报中的管理层讨论与分析部分,蕴含了企业经营状况、财务状况、治理水平、信用担保和关联关系等的大量信息,使得对其进行深入挖掘变得具有现实可行性,针对文本信息披露的关联挖掘成为财务预测的一个重要的研究方向.

纵观财务困境及其脱困预测的相关研究,涉及到三个基本方向:输入维度的挖掘、预测模型的探索、决策角度的选择.

首先,在输入维度方面,除了传统的财务指标等定量数据,很多学者逐渐认识到了MD&A 文本等定性数据对财务预测的重要性.Cole 等[1]较早提出MD&A 及其披露的信息有助于投资者预测企业未来业绩.薛爽等[2]针对国内上市企业,也发现中文年报具有重要的信息揭示作用.随着大数据的积累,自然语言处理技术(natural language processing,NLP)的发展给我们提供新的强有力工具.Hanley 等[3]利用文本向量化方法度量MD&A 的信息含量.Khrystyna 等[4]利用NLP 技术将MD&A 信息应用于企业收益预测的改进.陈艺云[5]利用中文MD&A 进行财务困境预测的尝试,验证了管理层语调为预测提供了新的信息.然而MD&A并非完美,管理层倾向于采取积极方式强调好消息而用模糊的语言报告坏消息以削弱消极影响[6],无法真实全面反映企业经营情况.对此,Huang 等[7],曾庆生等[8]对MD&A 进行研究发现,其文本会因管理层出于利己主义目的进行有条件的语调操纵,反加剧了企业和投资者之间的信息不对称.因此虽然MD&A 可以提供增量信息,但经过语调管理后的MD&A 使得有限理性投资者更易陷入判断的困境,需要新的信息来源加以修正.另外,并购重组事件作为企业获得和创造增长机会的一项重要投资活动[9],与企业脱困具有极大的相关性,是企业重要的脱困路径之一[10].引入M&A 信息有望能够减轻MD&A 语调粉饰带来的影响,有利于衡量管理层因过度自信而导致的激进的资产置换.然而目前对M&A 事件与财务困境的研究,多见于理论分析[10]以及案例研究[11,12],几乎未见对其中定量定性信息进行挖掘用以财务困境预测的先例.基于以上考量,本文在现有工作的基础上,深入挖掘MD&A,M&A 事件中的定量定性信息,验证其对于财务困境及其脱困预测的有效性;分析其对于预测的具体作用;同时探究M&A 事件与管理层语调的交互作用,比较对仅用MD&A 时可能会出现的文本粉饰现象造成的影响;最后将其加入预测模型得到了更好的预测效果.

其次,在预测模型选择方面,多源数据带来了信息增量的新机遇,也给预测模型带来噪声、冗余和数据不平衡的新挑战.Beaver[13]最早采用单变量分析方法进行了财务困境预测研究;吴世农等[14]选用了6 个财务指标建立了Logistic 预测模型;陈艺云[5]利用管理层语调以及9 个财务比率建立了离散时间风险模型.然而,这些模型所使用的数据量较小,特征选择主要来自经验,存在较大的改善空间.在应用高维数据预测领域,卢永艳等[15]采取了平均影响值SVM 方法实现对多维财务变量的选择,方匡南等[16]提出了稀疏组Lasso支持向量机方法实现对财务比率组间变量和组内变量的筛选,都取得了较好预测效果,但是这些研究在样本数据集的选择上都存在着一定的局限.

在正负样本极度不平衡的应用场景下,数据集采样也是相关研究的重要挑战之一.多数研究都是人为挑选,构成趋近平衡的样本集进行预测[14,15,17,18].然而,挑选出的样本集训练出来的模型只能应用于同时代、同领域企业的预测,对于其它企业效果不明朗,这势必对于预测模型的泛化能力造成影响.目前的发展趋势是一些学者已开始使用过采样与欠采样结合的方法[16]进行改进.因此,本文构造了一种基于集成学习的预测模型,将不平衡的正负样本集切分成多个平衡的样本子集分别进行弱分类器的训练以解决数据不平衡的问题,同时将特征选择嵌入模型中,对于分割后的平衡数据集挑选最佳特征以解决噪声与冗余的问题.最后利用Boosting 方法加权各弱分类器的结果作为集成强分类器的最终结果.该集成学习模型的特点是对所有可用市场信息进行学习,模型学习的信息量更大,对于大多数企业更能普遍适用、推广,有着更好的鲁棒性和泛化能力,并且由于没有人为挑选样本,结果更加准确客观.同时集成学习综合各分类器的结果,比单个分类器能有较显著的效果提升.出于对少数类样本误分为多数类样本的代价较大(识别财务困境企业与脱困企业的意义更大)的考虑,本文在模型中加入惩罚系数,达到了更好的识别财务困境(脱困)企业的效果.通过筛选最优预测变量,得到影响企业财务困境预测的主要因素,从而提出对财务困境企业的相关建议.

最后,在决策角度方面,多数研究聚焦于企业进入财务困境的预测,少有对于困境企业能否脱困进行预测的研究.赵丽琼等[19]曾对ST 企业摘帽脱困预测建立了一个Logit 回归模型,探究影响困境企业恢复的因素,预测效果并不理想.另外还有一些研究分析“摘帽”的影响因素[20,21],及针对某些脱困企业的案例研究[22,23].实际上,相比于上市企业财务困境预测,很多投资人更关注困境企业的转机,特别是上市企业,其股票面临退市的风险而处于价格低位,一旦企业恢复正常成功“摘帽”,其股价必定会出现报复性的反跳而产生巨大的价差收益.研究企业脱困的预测对于实际应用以及股市投资者都有着很大的指导价值,但此领域的文献却有所缺失.本文采用前述的集成学习框架,通过对财务数据、MD&A 以及M&A 的挖掘进行困境企业的脱困预测,得到了较好的预测效果,并讨论了不同时期宏观经济环境和政策因素对预测模型的影响.

本文跳脱了通常的财务困境预测,而更多着眼于财务脱困的研究新角度;在研究方法上也不再局限于传统的上市企业财务数据分析,而是提出了一种多源大数据挖掘的上市企业财务预测的理论框架和实施方法.具体来说,本文不再局限于财务指标,而是集成企业财务数据、信息披露文本和并购重组事件信息等多源数据,探究其对于财务困境预测的影响;在决策角度上,不再局限于陷入困境的单方面预测,而是开展企业解困的可能性和可行性预测;在模型构建上,提出一种改进的多分类器集成学习预测模型,对不平衡数据进行学习,避免人工选择样本集造成的局限性和过拟合,保证预测效果、客观性和泛化能力,同时在模型中嵌入了特征选择流程以解决噪声与冗余的问题;在评价体系上,同时采取了AUC 和TPR 两种指标,前者长于衡量非平衡数据集分类效果,后者可以保证模型对于少数类样本的识别能力;鉴于财务困境样本误分为正常样本(脱困样本误分为困境样本)的代价较大的考虑,在模型中加入惩罚系数,达到更好的识别效果.

2 基于文本分析与事件挖掘的特征提取

2.1 管理层讨论与分析的量化处理

MD&A属于文本内容,目前对于文本信息的量化处理,主流有两种方式:第一种是基于词典的方式,根据特定词典或词表对文本中正面、负面、不确定等各类特征词的划分来对文本进行分类,从而从总体上表征文本的偏向程度[5],该方法可解释性强,可以明确影响文本整体偏向的具体词汇及其数量从而对结果进行解释,但缺点是该方法受制于词典的完备程度;第二种方法是基于文本向量化和机器学习的方式,将每个文本通过向量的形式进行表示,其每个元素为文本中每个词语出现的频率,再利用机器学习算法训练文本分类的模型最后应用于全部文本[24],该方法不要求有既定的词典和先验的知识,但在数据集有限时效果不好并且对于结果的可解释性较差.由于MD&A 的样本量和文本量有限,使用基于词典的方法既有语言学依据又更加透明化,是更加合适的方法[25].因此,出于对量化效果和解释性的考虑,本文借鉴谢德仁[26]、陈艺云[5]等的方法,使用基于词典的方式对MD&A 文本信息进行量化处理.

利用“Jieba”中文文本分词模块进行文本分词,在词典选取方面,正面词汇和负面词汇的判断基础主要是由Loughran 等[27]的英文金融文本词典(LM词典)根据中文年报内容翻译为中文词典,再结合情景进行扩充和完善得到.利用简单比例加权方法设定情感词的权重,统计正、负面词汇词频,借鉴Henry[28]、Brockman[28]等的经典做法,构造量化MD&A 信息的管理层语调变量为

其中POSPEC 表示正面词汇数量占全部词语总数的比例,NEGPEC 表示负面词汇数量占全部词语总数的比例,TONE 表示管理层讨论与分析部分的净语调,取值范围为[−1,1].

2.1.1 并购重组事件信息的量化处理

并购与重组可以进行大致区分:并购主要涉及企业股权结构的调整,目标大多指向企业控制权的变动,核心内容是“股东准入”;重组则主要涉及企业资产、债务及业务结构的调整,目标是优化企业的资产规模和质量、产业或行业属性,核心内容是“资产业务准入”[30].自出现以股权类证券作为交易支付手段后,两类“准入”可通过一项交易同时完成,二者之间的界限逐渐模糊.因此本文将两者的效果合并讨论.为将并购重组事件信息引入预测模型,本文首先从理论上对其有效性进行分析.

2.1.2 并购重组事件信息的有效性分析

并购重组事件反映管理层的素质.梁国勇[31]曾对企业并购的动机进行了研究,认为企业发生并购行为的根本动机是寻求利润最大化,并购行为实际为竞争优势实现了双向转移并建立了新的竞争优势,因此可以认为主动寻求并购行为的管理层在积极地为企业谋求发展优势,而积极作为的管理层对于企业经营有着重要的作用.另一方面,姜付秀等[32]研究认为,企业的过度扩张(并购作为一种主要手段)反映了管理层的过度自信,虽然过度自信的管理层倾向于选择努力工作[33],但过度自信也与企业财务困境有很大的相关关系.

并购重组事件体现企业的发展阶段.姚益龙等[34]的研究发现,初创期的企业规模较小,内部资金流转和外部筹资等都较为困难,不适合并购;成长期、成熟期的企业积累了较多过剩资源,为获得协同效应和降低经营风险,常进行纵向或混合并购;而衰退期企业生产萎缩,财务恶化,现金流枯竭,常处于待并购或被并购的地位.因此可以认为,企业在并购重组事件中的角色在一定程度上反映了企业的经营发展状况.

并购重组事件实现企业资源、债务、管理层的重新整合.买方可通过获得标的的控制权来实现对其竞争优势的获取;而卖方可通过资金的汇入实现债务结构的改善缓解财务压力,通过企业管理层结构的优化、引入先进的管理经验而实现企业经营策略的优化,从而有助于走出困境;对于双方而言,可获得扩大生产规模、实现经验共享与互补、获得稳定的供销渠道、提高市场份额以及多角化经营等的协同效应.

因此,可以说企业历史的并购重组事件从许多方面体现着企业未来的经营以及财务状况,对于企业财务困境的预测有着很大的指导意义.

2.1.3 并购重组事件信息的特征提取

基于以上分析,本文构建了系列指标以对上述作用进行表征,定义样本企业年度内并购重组(只计交易成功的)总次数NUM(即频率)以表征企业进行并购重组的积极程度;定义样本企业年度内并购重组总金额SUM 以表征企业并购重组(资产变更)总规模;同时区分交易地位分别定义作为买方的并购重组次数BUNUM,作为买方的交易总金额BUSUM,作为卖方的并购重组次数SENUM,作为卖方的交易总金额SESUM,作为标的方的并购重组次数BDNUM,作为标的方的交易总金额BDSUM 以衡量企业在交易中所处的不同角色及其规模.

3 集成学习模型设计

集成学习是指通过联合同种算法或多种不同算法,利用不同的特征和数据,训练出稳健的鲁棒的模型.其中每一个算法都是一个弱分类器,联合各个弱分类器的结果得到最终的强分类器,一般来说强分类器的效果将显著优于单个弱分类器.本文在Liu[35]处理不平衡数据问题的基础上建立了一个集成学习预测模型框架,如图1 所示,以兼顾提升预测精度、处理不平衡数据、特征选择和误分类惩罚等多个目的.

3.1 采样生成平衡样本对

财务困境企业数据为典型的不平衡数据集.已有的研究中,对于此类预测问题的样本集的选择,一般是通过人为挑选与困境企业规模、领域相类似的企业作为对应样本加入样本集中,而未考虑到其它类型企业的状况.或是通过对多数类欠采样(舍去其它大量样本)构造单个的预测模型.由于没有学习到其它绝大多数企业的信息,对于未挑选到的企业来说,模型的预测效果无法得到保障,因此存在严重的过拟合问题,缺乏泛化能力和实际应用意义,同时人为选择也无法保证模型预测效果的客观准确性.因此本文对所有可用样本全集进行处理以学习所有样本的数据特征,通过对非平衡数据集进行多次采样得到多个平衡数据集分别建立弱分类模型最后加以集成以规避上述问题.

以困境预测为例,设样本全集中财务困境企业(少数类)集合为P,经营正常企业(多数类)集合为N,即|P| ≪|N|,|·|表示集合的样本量.从N中进行随机采样选取出子集N′,使|N′|=|P| ≪|N|.取T=「|N|/|P|⏋,「·⏋表示向下取整,重复随机采样T次,得到从N中采样所得的正常企业样本子集N1,N2,...,NT.T个样本子集中的总样本数不小于|N|且为保证每次采样中样本企业选取的随机性,使用有放回随机采样.每个正常企业样本子集Ni与财务困境企业样本全集P构成了一个平衡的样本集,至此已构造了T个平衡的样本集{N1,P},{N2,P},...,{NT,P}.

3.2 特征选择

反映企业经营的指标众多,仅可用的财务指标就超过一百余项,但其中很多是噪声或冗余,难以通过经验或理论排除.因此在建模时要求模型具有特征择优的能力,不仅减少过拟合、减少特征数量、提高模型泛化能力,而且还可以使模型获得更好的解释性,加快模型的训练速度获得更好的性能.常见的特征选择方法对非平衡数据的处理效果很差,因此本文将特征选择嵌入模型中,对经过采样生成的平衡数据集进行递归特征消除以减小噪声与冗余.

对于每个平衡的样本集{Ni,P},构造基模型Vi并进行不多于K −1 轮的训练(K为原始特征数,包括管理层语调指标、企业并购重组事件指标以及财务指标),第一轮在原始的K维特征集上训练,每个特征获得一个权重,每轮训练后从特征集中移除权值系数最小的特征,再基于新的特征集进行下一轮训练,如此往复递归直至遍历所有特征.记第j个被移除(可并列)的特征重要性得分为K −j+1,记最后的一维特征得分为1,记所有的K维特征的重要性得分分别为Ri1,Ri2,...,RiK,则取值范围为

取值越小表示特征越重要.对所有的T个样本对分别进行上述特征递归特征消除,可得T ×K维的特征重要性得分矩阵.综合T个样本对进行特征选择,构造表征第n维特征重要性的变量为

对n个RSUM 值进行排序,RSUM 值越小表示特征的重要性程度越高,对于模型的预测作用越大.通过对保留特征数进行优化调整可得到最佳预测效果时的特征数以及目标预测效果时的最小特征数.

3.3 Boosting 提升算法训练弱分类器

Boosting 提升算法是一种可以用来减小监督学习偏差的机器学习算法,在迭代训练弱分类器过程中,样本数据根据是否被正确分类来进行加权以强化对分类错误数据的学习.每个弱分类器根据其分类准确率被分配不同的权重,最后将弱分类器按权重集成,作为强分类器最终的输出结果.

本文将进行特征选择后的T个平衡样本对记为.对每个样本对利用Adaboost 提升算法训练集成学习分类器H1,H2,...,HT.Hi由s个弱分类器hi1,hi2,...,his以及对应的权重αi1,αi2,...,αis构成,i=1,2,...,T,其中弱分类器学习算法的选择与递归特征消除时所建立的基模型保持一致.

设m为每个平衡样本对中的企业样本数,选用的基分类学习算法为ξ,进行共Q轮迭代.以{N′,P}={(x1,y1),(x2,y2),...,(xm,ym)}的训练为例,x为输入特征y为标签.设每个企业样本权值为

初始化样本权值分布为

对每轮迭代(以第q轮为例),基于权值分布Dq从数据集{N′,P}中训练出的基分类器

设P(·)表示分类器预测结果发生的概率,则该基分类器的误差率为

若该基分类器误差率ϵq >0.5,则该基分类器没有效果,反之在该基分类器有效的情况下计算其参与最终决策的权重为

根据对每个企业样本是否陷入财务困境(或是否成功脱困)的预测的正确与否更新样本的权重,预测正确的降低权重,预测错误的增加权重继续加以训练,即

3.4 增设惩罚系数

考虑到将财务困境企业误判为正常企业未能识别出企业的财务风险的后果较严重,而将脱困企业从困境企业中识别的收益较大,因此对于此类误判情况在样本权重调整系数Dq+1(x)的基础上再乘以一个惩罚系数β,即

让财务困境企业样本误判为正常企业、将脱困企业样本误判为困境企业的代价加大,以提高模型对于财务困境风险以及脱困机会的识别能力.

3.5 集成强分类器

经过以上步骤重复训练,可得到H的一系列基分类器h1,h2,...,hs以及对应的权重α1,α2,...,αs.同理,对所有的T个平衡样本对,可得到h11,h12,...,h1s,h21,h22,...,h2s,...,hT1,hT2,...,hT s共T ×s个基分类器以及对应的权重α11,α12,...,α1s,α21,α22,...,α2s,...,αT1,αT2,...,αT s.将所有的基分类器分类结果按权重集成,得到最终强分类器输出为

3.6 预测模型评价指标

对于非平衡数据的预测,不能只简单地以总预测精度作为评价指标,而应综合考虑真阳性、假阳性、真阴性以及假阴性问题.对此,将真阳性率(TPR)定义为纵轴,假阳性率(FPR)定义为横轴,利用模型对测试集中全部样本点计算对应的概率值,从高到低排序依次取每个值作为阈值计算TPR 与FPR,绘制ROC 曲线.AUC 值为ROC 曲线下的面积,AUC 值越大表明模型效果越好,因此本文采用AUC 值作为模型的综合评价指标.另外本文也考察模型的TPR 以侧重检验模型对于财务困境企业(脱困企业)的识别能力.

4 样本选择与数据处理

参照国内在预测上市企业财务困境时的通常做法,本文以因财务状况异常而被特别处理(ST/*ST)作为上市企业出现财务困境的标志.根据中国上市企业的信息披露制度,上市企业(t −1)年年度报告的对外公告与其在t年是否被特别处理几乎同时发生,使用(t −1)年的企业数据进行预测并无很大实际意义,故本文用上市企业(t −2)年的数据来预测企业在t年是否被特别处理.考虑到制造业相对其他行业有着完善的生产流程、均衡的生产周期以及较为稳定的发展趋势,本文以沪深两市A 股上市制造业企业为研究对象.因2007年、2019 年分别颁布新会计准则,对财务指标计算的一致性有所影响,故本文选取2009 年∼2019 年A 股上市制造业企业为样本,对应数据区间为2007 年∼2017 年.另外,本文所使用的MD&A 数据来自中国研究数据服务平台(CNRDS),数据集包括每年各上市企业披露的中文年报,截取其中管理层讨论与分析部分,利用2.1 节所述方式对MD&A 文本内容进行自然语言处理,构造管理层语调变量;本文所使用的并购重组事件数据来自国泰安数据库(CSMAR),数据集包括每年度各上市企业披露的并购重组事件,利用2.2 节所述方式对并购重组事件信息进行特征提取,对于年度内未进行并购重组的样本变量赋值为0;本文所使用的财务比率数据来自锐思数据库(RESSET),数据集包括每年各上市企业披露的所有财务比率,删去缺失超过10%的财务比率以及强相关的比率,共得到87 个可用的财务比率.

数据预处理后,将样本数据集构造为有监督学习数据,共得到598 个财务困境样本,14 613 个正常经营样本(其中190 个脱困样本),为典型的不平衡数据集.本文所使用的所有特征如下表1 所示,输入模型前对所有变量进行Z-score 标准化处理,消除量纲的影响.

表1 特征说明Table 1 Feature descriptions

5 实证分析与讨论

本文分别基于平衡数据集与非平衡数据集(全集)设计了多组实证研究,以检验MD&A 与M&A 对于提高模型预测效果的有效性,同时检验本文提出的集成学习模型的有效性.

5.1 数据源有效性实证分析

过去的研究多是基于平衡数据集进行的,其预测模型(包括统计学模型与机器学习模型)对于非平衡数据集几乎没有预测效果,因此无法通过非平衡数据集来比较不同输入对于预测效果改善的有效性.为了验证加入MD&A 与M&A 是否能够提升模型预测效果,本文首先进行基于平衡数据集的实证分析.采用简单随机下采样方法构造平衡数据集进行财务困境预测的实验.

5.1.1 机器学习预测模型

本文构造了四个主流应用的机器学习预测模型,即逻辑回归(LG)、支持向量机(SVM)、决策树(DT)以及Adaboost 集成学习模型(ADB)并分别利用财务数据(F)、财务数据及MD&A(FM)、财务数据及M&A(FR)、财务数据及MD&A 及M&A(FMR)四种不同类型的信息源作为输入,进行重复实验以排除不同样本的影响,考察不同数据源对于模型预测效果的作用.本文统计了重复实验中各模型在4 种输入下分别取得最优预测效果的次数(有并列)如图2 和图3 所示,各组实验结果统计如表2 所示.

表2 预测结果统计Table 2 Statistics of foresting results

从预测结果AUC,TPR 可以看出,考虑了MD&A,M&A 或两者都加以考虑的模型,具有更好的预测效果.这里,为排除抽样实验产生抽样误差的影响,对于重复实验的结果进行了非参数Friedman 检验.对于AUC 值的Friedman 检验结果均为显著,在统计上可以认为使用四种输入造成了模型不同的预测结果(AUC),由于该结果对于四种不同的模型均成立,是个稳健的结论.而TPR 值的Friedman 检验仅对于SVM 模型存在显著性结果,表明四种输入仅对SVM 的预测结果TPR 值造成明显差异,对于其他模型并未产生明显影响.从而合理推论,MD&A 与M&A 的加入通过使模型更好地识别正常经营的企业从而提高了预测效果AUC 值,但对于SVM 模型则显著地提升了识别财务困境样本的能力.

5.1.2 Logit 回归分析

机器学习模型使得准确的预测成为可能,但模型缺乏可解释性使得难以证明数据内的关系,为进一步解读MD&A 与M&A 对于财务困境预测影响的作用方向,本文先构建了二元Logit 回归模型进行单个变量的统计建模,分析其系数的正负性以对作用效果提供参考,结果如表3 所示.

表3 新构造变量对财务困境的预测能力:基于单变量的比较分析Table 3 The predictive power of newly constructed variables to financial distress:Based on single variable analysis

管理层语调TONE 的系数显著为负,表明年报文本中管理层对企业经营的讨论与分析越正面时,企业陷入财务困境的可能性越小;并购重组事件变量NUM,SUM,BUSUM,SENUM 和SESUM 的系数显著为正,表明企业发生频繁大规模的并购重组是企业财务困境的征兆之一;其余变量的系数统计上不显著,当然不能断言这些变量对于提高机器学习预测模型的准确率是无效的.回归模型会受到内生性问题的干扰,就本文而言可能存在的内生性偏误主要有两个来源:首先是解释变量与被解释变量之间相互作用导致的内生性,另外是遗漏变量造成的内生性问题.针对前者,本文使用的解释变量为(t −2)期报告值而被解释变量为t期报告值,属于“领先–滞后方法”以减少前者的内生性影响.针对后者,现实中与企业财务状况相关的变量层出不穷难以一一追溯,对此本文借鉴过往研究,进一步添加变量加以补救:加入每股净资产(NAPS)以控制企业资产规模特征[36],加入营业收入增长率(opeincm)与资产净利率(ROA)以控制企业运营绩效[36−38],加入资产负债率(dbastrt)以控制杠杆状况[39],加入无形资产比率(intanassrt)以控制企业的成长类型[40].控制变量(仅对表3 中显著的变量)后估计结果如表4 所示.

表4 新构造变量对财务困境的预测能力:基于控制变量Table 4 The predictive power of newly constructed variables to financial distress:Based on control variable analysis

控制企业经营状况后,管理层语调TONE 仍显著为负,表明管理层语调越消极企业陷入财务困境的可能性越大.该结果与Wu[41]的研究相合,其认为MD&A 表明了管理层对企业的期望,并对市场反应产生长期影响,MD&A 语调越乐观的企业倾向于呈现更高的企业价值,反之越悲观时则反映了企业价值的散失.企业年度M&A 总金额SUM 的系数仍显著为正,表明M&A 规模仍显著影响着企业财务困境的预测.买方M&A 总金额BUSUM 仍显著为正,说明控制企业经营状况后,企业M&A 买入规模越大则陷入财务困境的可能性越大,这可以用“管理层过度自信”来解释,过度自信的管理层倾向采用高风险探索式的战略[42],而企业过度激进的扩张在短期内往往无法带来同等的收益[32],将影响企业现金流导致资金链断裂从而陷入财务困境.值得注意的是,一旦控制企业经营状况卖方M&A 事件对财务困境预测便不再有显著影响,表明作为卖方的M&A 频率与规模可能是通过体现企业不同的经营状况或生命阶段从而对企业财务困境预测做出贡献.

为进一步探究加入M&A 事件对管理层语调的预测影响,本文考察M&A 事件(仅分析上表中显著的变量)与管理层语调之间的交互作用,如表5 所示.表5 中第1 列、第2 列和第3 列为基线模型,从第4 列和第5 列的结果可以看出,管理层语调TONE 与M&A 规模SUM 之间存在着显著的交互作用.管理层语调越积极,企业陷入财务困境的可能性越小,但M&A 规模削弱了管理层语调对财务困境预测的作用,M&A 规模越大,这种削弱越大,一个解释是当管理层对年报进行粉饰而夸大对企业的预期时,现实已发生的M&A反映了企业的实际情况,削弱了年报粉饰带来的夸大作用.可以认为,当考虑企业发生的M&A 规模时,对于年报中MD&A 中管理层语调的夸大对预测的影响具有一定的抑制作用.

表5 交互作用检验Table 5 Interaction test

5.2 模型有效性实证分析

随机采样构造出来的平衡样本集,丢弃了大多数的市场样本,损失了大量有用信息;但已有研究的财务困境预测模型对于不平衡样本全集的预测效果较差,如表6 所示,原因是样本集中正常经营的企业-年度样本占绝大多数,模型倾向于将企业预测为正常经营,导致模型的TPR 处于低值,无法有效识别企业的财务困境风险.为充分利用市场信息,同时解决不平衡样本集的问题,本文以第3 节所述方式构造了一个集成学习预测模型(EE)以达到提升预测精度、处理不平衡数据、特征选择、误分类惩罚等多个效果.

初始将模型的基分类器ξ设定为决策树,特征数为98(未特征寻优),惩罚系数β=1(未加惩罚).输入FMR 特征组合,使用样本全集进行模型(EE)的测试,将逻辑回归(LG’)、支持向量机(SVM’)、决策树(DT’)、Adaboost(ADB’)作为对照,进行重复实验(每次实验采用相同的测试集),并与5.1.1 节实验结果对比,结果如表6 所示.

表6 预测结果统计Table 6 Statistics of foresting results

在所有重复实验中,模型EE 的各项指标在所有模型中均表现最佳,表明利用不平衡样本全集训练的EE 模型预测效果显著优于所有对照组,包括SVM 模型(平衡数据集中效果最好)以及逻辑回归模型(实际应用最广泛).分析其原因,EE 模型的基学习模型为决策树(改为其他弱分类器时也有类似的实验结果)并未优于其它模型,EE 模型主要通过对不平衡样本进行采样分割实现了对所有样本信息的训练建模,获得了广泛的市场信息从而实现了较好的预测效果.

进一步地,考虑到如果未能预警财务困境风险从而将财务困境企业误判为正常经营企业的实际应用代价往往较大,如3.4 节所述通过添加并调节误分类惩罚系数β,以提高预测模型的TPR 保证财务困境企业的识别能力.以0.05 为步长从β=0.6 至β=2.0 逐步测试惩罚系数β对模型预测结果的影响,如图4 所示.当惩罚系数β逐步增大时,训练集中被误分类的财务困境样本的学习权重增大,用以强化对分类错误数据的学习,从而使得模型对财务困境样本的识别效果更好,TPR 值逐步提高,最大值达到0.893,相比未加惩罚时有显著提升并明显优于其他模型.而提升TPR 的代价是造成模型对正常经营样本的误判增大,使得AUC值降低,但当TPR 达到峰值时模型AUC 值为0.883,仍显著高于其他模型.

本文利用所构造的模型进行特征寻优,对初始98维特征进行递归消除,每次保留最优的特征组合同时减少一维特征,结果如图5 所示.当输入特征维度过少时,模型无法获取足够的信息,因此AUC 值、TPR 值均处于低位;随着输入特征维度增加,模型的预测效果逐步提升,但并非始终递增,到达拐点后趋平甚至略有降低.原因是反映企业财务状况的指标中很多是噪声变量,如不加选择地把所有特征都纳入模型反而会降低模型的精度.本文构造的模型自动完成最优特征排序与筛选,既避免了基于先验知识的人为输入选择,又降低了噪声的影响,同时也能筛去不重要的变量减少获取数据的成本.

从图5 中可知,模型筛选出的包含45 维特征的最优特征组合(拐点值)即可达到理想的预测效果,特征组合如表7 所示.

表7 特征选择结果Table 7 Results of feature selection

对比表1 的输入变量,可以发现本文构造的MD&A 变量均保留,另外M&A 事件变量中的买方交易总金额、卖方次数、卖方交易总金额、标的方交易总金额经过筛选后也得以保留,说明其对于财务困境预测发挥了重要的作用.结合5.1.2 节的回归分析结果,可以认为企业管理层语调以及其在并购重组市场中所处的不同地位与交易规模在一定程度上确能反映企业的经营状况,从而对企业未来的财务发展起到预示作用.

然而“买方交易总次数”、“标的方交易总次数”被剔除,其原因在于所有企业–年度样本中买方及标的方的企业–年度样本较少,多数为0 值,并且数值变化较小导致该变量的信息熵不大,因信息量不足而被剔除.“年度并购重组总次数”、“年度并购重组总金额”两变量被剔除,主要原因在于与其他并购重组变量间存在线性相关关系,作为冗余被剔除.

所选特征中也剔除了许多财务指标,原因在于许多财务比率变量是从相同的财务报表中提取经过不同计算方式所得的,因此它们之间具有较强的相关性,被作为冗余而被剔除.而从另一方面,也说明了留下的指标更能集中反映企业的财务运行情况,从而预示企业是否陷入财务困境,例如流动比率等表征偿债能力的指标、资产负债率等表征资本结构的指标等,这与之前的文献研究相一致.在日常经营过程中也应对影响上述指标的业务活动着重关注,这对于企业管理者具有启示意义.

5.3 基于脱困样本集的实证分析

为对企业能否恢复正常经营或成功完成重组而“摘帽”进行预测,于险境中挖掘新机遇,本文利用前述构造的模型与数据进行困境企业脱困的预测研究,无论对于企业规避困境、债权人风险控制或对投资者抄底“ST 股”的投资行为均有实际意义.

本文将脱困企业–年度样本定义为当前年度为正常经营而前一年度因财务困境而被风险警示的企业–年度,同第4 节所述方式处理,得到598 个财务困境企业–年度样本以及190 个脱困企业–年度样本.以简单随机下采样构造的平衡数据集和数据全集作为训练样本,输入FMR 特征组合进行重复实验,结果如下表8 所示.本文构造的EE 模型在企业脱困的预测上仍取得了最优的预测效果.对比5.1 节与5.2 节结果也可以看出,对于企业脱困的预测难度要大于陷入困境的预测.分析其原因,首先,用于脱困预测的脱困企业样本的前一年度即为困境企业样本,企业在各维度的表现与困境企业样本的相似性相对较大,模型难以区分;第二,用于脱困预测的训练样本集规模较小,预测模型难以学习到广泛的市场信息;再者,企业脱困的影响因素广泛而复杂,5.1 节的实验未考虑不同时期宏观经济与政策环境的影响,在此情况下MD&A 与M&A的加入仍能显著提升模型的预测效果,已能说明其有效性,但本节研究中用于训练的样本集总量小,在市场信息不足的情况下仅从财务、年报和历史并购重组信息方面进行分析便略显不足,不同时期的宏观环境因素作用凸显,并且ST(*ST)企业摘帽的条件受政策性因素影响较大,需要将其加以考虑.

因此,本文考虑宏观经济环境和不同的政策因素将样本集划分为2007 年∼2010 年、2011 年∼2013 年、2014 年∼2017 年三个时期的子集再次进行实验,分别对应着企业2009 年∼2012 年、2013 年∼2015 年、2016 年∼2019 年的风险警示情况,结果如表9 所示(仅展示多次重复实验的均值).

表9 分时期预测结果Table 9 Forecasting results in different periods

针对不同时期的影响(为排除数据不平衡的干扰,SVM,LG,DT,ADB 仅分析平衡数据集下的结果),发现各模型在各阶段的预测效果有所区别,其中在2014 年∼2017 年最好,2011年∼2013 年次之,2007 年∼2010 年的最差.分析其原因,可能存在以下因素影响:首先,2008 年∼2010 年属于全球金融危机的动荡期及危机后的快速发展时期,股市波动剧烈,我国上市企业也多受影响尤其是外向型制造业上市企业,这个时期上市企业财务状况影响因素复杂,历史财务运行数据无法准确反映困境企业能否脱困,加之这个阶段的并购重组市场并非理性,《上市公司信息披露管理办法》刚推行,信息披露不够规范,更使得该时期的预测难度加大;第二,2011 年∼2013 年期间市场走向稳定发展,信息披露制度逐步成熟,历史财务数据与MD&A 的作用开始凸显,另一方面2011 年《重组管理办法》第一次修订,期间配合着多次对资产重组过程中再融资政策的调整,“借壳上市”作为一类重大资产重组开始受到监管,使得并购重组事件对于困境企业脱困预测也变得更有价值;第三,2014 年∼2017 年期间的信息披露制度与宏观经济环境较前一时期区别不大,而2014 年和2016 年对《重组管理办法》的进一步修订使得并购重组市场更趋向理性,追逐热点、跨界并购的现象明显减少,“炒壳”、“囤壳”等行为得到明显抑制,市场对高风险、短期套利的重组情形也日趋理性,这使得历史并购重组事件对于脱困预测有了更大的意义,因此这个时期内并购重组事件对提高模型预测效果的作用普遍超过了MD&A.综合来看,随着宏观经济环境的稳定运行,信息披露制度的逐步完善,并购重组市场的日趋理性,利用财务数据、MD&A,M&A 进行脱困预测的效果势必也会逐步提升,从本问研究的三个时期的实验结果也可以看出,集成学习EE 模型均取得最好的预测效果,表明其对于不同时期影响的鲁棒性与可靠性。

6 结束语

在上市企业财务数据公报的基础上,本文挖掘其年报管理层讨论与分析中的文本信息以及企业并购重组的市场信息,对其财务困境以及脱困问题进行预测研究.实验结果验证了新特征的有效性,并给出了解释.针对正负样本数据不平衡问题,本文构造了一种集成学习预测模型框架,通过采样构造多个平衡数据集进行训练从而学习全部样本的市场信息,利用特征递归消除减少了噪声与冗余,在训练弱分类器时加大财务困境样本误判的惩罚提高风险预警能力,最后利用Boosting 方法集成各弱分类器.相比传统预测模型,无论在财务困境或脱困预测的AUC 还是TPR 方面,本文构造的模型均实现了更好的预测效果.

本文所涉及的企业脱困预测问题,未来还有不少有价值的潜在研究方向,诸如针对上市企业年度报告MD&A 特征的文本挖掘方法,分析MD&A 中不同语句的影响;挖掘更多企业脱困预测的相关数据源,评估各种特征选择方法对预测效果的影响;继续针对时间序列进行动态分析,研究财务困境中的概念漂移也将是一个有趣的问题.

猜你喜欢

分类器困境样本
用样本估计总体复习点拨
困境
推动医改的“直销样本”
BP-GA光照分类器在车道线识别中的应用
“邻避”困境化解之策
随机微分方程的样本Lyapunov二次型估计
必须正视的理论困境
我国雾霾治理的困境与出路
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器