聚类分析在财务绩效评价中的应用
2022-06-21□文/宋超
□文/ 宋 超
(扬州大学商学院 江苏·扬州)
[提要] 本文探讨数据挖掘技术中聚类分析在财务绩效评价中的应用进展。介绍背景及意义,应用现状,简述利用聚类分析法进行财务绩效评价的一般流程,并提出对财会和数据挖掘技术结合的一些看法和观点。
引言
(一)背景及意义。企业的财务绩效是指企业的运营、战略的执行等是否能提高企业最终的经营业绩。财务绩效能够详细地反映出企业在对成本的控制能力、合理调配各项资金的水平、管理资产用于盈利的程度。然而,现阶段,仅凭借简单的数据分析对企业财务绩效进行分析是不充分、不全面的,所以需要引入其他的研究方法。而且随着信息时代的来临,铺天盖地的信息碎片为我们的财务工作带来了巨大的数据量,财务工作中收集到的数据中往往存在一些内在逻辑关系,因此学会利用数据挖掘技术对深入研究财务数据越发重要。数据挖掘中的聚类分析被广泛应用在各种财务分析中,如财务风险分析、财务绩效分析、财务数据分析等。本文将探讨聚类分析在财务绩效评价中的应用进展。
(二)相关概念
1、财务绩效评价。财务绩效评价表示用科学合理的方法对企业某个时期内的生产经营结果进行定性定量的分析,使得企业业绩具有可比性。便于利益相关者们直观地理解财务绩效,并对企业经营成果做出客观、公正的评判。正是因为财务绩效评价的客观性与公正性,财务绩效评价已经成为了分析企业经营状况不可缺少的部分。
2、聚类分析。聚类分析的基础是数据之间存在相似性,在此基础上将数据分为几类,是一种常见的数据挖掘手段。数据间的相关性是存在价值的,因此聚类分析可以被用于提取数据间存在的特性来产生价值。在进行聚类之前,需要保证数据之间的相关性,这一步则需要通过因子分析来实现。
一、应用现状及评价
在财务绩效评价和聚类分析的结合方面,国内存在大量研究,下面对一些期刊论文进行综述,评价应用的现状及优缺点等。
帅丽媛选取我国煤炭上市公司作为研究对象,剔除ST 公司以保证财务数据稳定,用13 个财务指标反映企业的盈利、偿债、营运和发展能力。通过筛选,去除了3 个指标,并将反向指标做了正向化处理。最终的侧重是盈利能力4 个指标,其余能力均是选取2 个指标。第一个因子的贡献率最高为35.667%,再结合其旋转成分矩阵,能代表盈利能力的资产报酬率X3、净资产收益率X4、营业净利率X5、每股收益X6 均超过0.85,说明通过因子分析,盈利能力最能影响财务绩效评价。下一步对得分进行K-means 法聚类分析,得出以下四类情况。第一类:偿债能力较强而盈利能力弱,之前分析出盈利能力最能影响评价结果,所以这一类整体排名均靠后。剩余三类排名也均是受盈利能力的强弱影响,比如金瑞矿业,三个指标排名都不靠前,却能依靠一个盈利指标使综合排名拉高。指标选取侧重点在于盈利能力,所以排名最受盈利能力影响。对于煤炭上市公司指标选取是否应以盈利能力为主,其中原因作者并未叙述。煤炭公司以国企为主,一直是高耗能、高污染产业,而现今时代主题是去产能、去库存的供给侧改革和“绿水青山就是金山银山”发展理论,其核心指标的选取应该多加分析和探究。
李庆东等人对医药上市公司的财务绩效进行聚类分析,在指标选取过程中,提出了对盈利质量和盈利数量的思考,最终敲定以32 个指标来评价115 家企业的财务绩效。通过因子分析把32 个指标降维,最终得到利用效果因子、主营业务获利因子、现金流量因子、负债水平因子、所有者资本占固定资产价值因子、成长能力因子、经营条件因子、资产保值增值因子和还债压力因子。不仅能反映企业的盈利、负债、发展和营运能力,还体现了企业的资本结构、现金流量等。通过聚类分析,最终所有企业被分成5 类,提炼出每一类的共同点,并对医药行业的总体进行论述,最后对需要提高的点提出相应的对策。由于旋转成分表、得分排名表等均没有列示,只能看出其指标多、公司多。创新之处在于,提出了盈利的质量,不单单以盈利数量进行分析,其结果更加合理。
庞凤娇选取32 家钢铁行业上市公司作为研究对象,剔除其中的ST 公司,剩余10 家上市公司。将钢铁行业的节能减排战略目标考虑到指标选取当中,并结合行业的实际发展情况,在传统的财务绩效评价体系中加入了股票投资获利能力。现今,在股市的投资活动已经成为了众多企业收入的重要来源,尤其是钢铁煤炭等高耗能、高污染传统行业。作者通过专业知识结合行业状况,形成了独特的“绿色技术创新绩效评价”体系,把每股收益、每股净资产、每股未分配利润和每股股利纳入指标体系,较为全面地反映公司的股市投资能力。随后,剔除相关性较高的指标,形成近似值矩阵,如表1 所示。将偿债能力每个指标的相关性进行列示,用以展示指标的筛选过程,让读者更清晰地理解。最终选择了13 个指标,发展能力3 个、股票投资能力3 个、盈利能力2个、营运能力2 个、偿债能力3 个,指标分配比较均匀,没有特别偏重的情况。研究使用的聚类方法是层次聚类法,使用平均距离来计算因子间的距离。平均距离可以反映类内每个点之间的距离,比较客观、合理。此外,由于分析中加入了股票获利能力,不仅给行业内部人员参考建议,还能让股票市场的投资者对公司股票的涨跌有了清楚的认知。(表1)
表1 值的向量相关性一览表
吕振君从盈利、偿债、发展和营运能力四个传统方面来考察50 家物流企业的财务绩效,指标选取很常规、很均匀,每组3 个指标,但没有见到对反向指标的正向化处理。在聚类分析的过程中,作者创造性地对聚类完成后的三个种类建立了得分评判标准,通过数据分析来清晰地展现每一类间的差别。
付静使用因子分析法和聚类分析法分析了28 家上市公司的竞争力状况,选取18 个指标,运用SPSS 软件进行因子分析和聚类分析,但在聚类分析过程中,只对综合得分这一个指标进行聚类。其指标所含信息丢失严重,为避免信息损失,应该对所有因子的得分进行分别的权重计算,即用各自的得分乘以其权重,得出新的权重得分,再对结果进行聚类,才能保证信息尽可能反映在结果中。
综上,在文献阅读的过程中,可以得出一些简单的体会:指标的选取应该结合行业发展背景来看,不能忽略行业的制约因素和重大影响因素,比如庞凤娇建立的“绿色技术创新绩效评价”体系,为高污染、高排放企业绩效评价提供借鉴意义。此外,指标在体系中的分布应该尽量均匀,不能厚此薄彼,如果偏重点过于集中,那么得出的结论是具有一定导向性的,比如说盈利能力指标占所以指标的50%以上,盈利指标的权重得分一定最高。在指标选取过程中,需要对反向指标进行正向化处理,比较常见的有用1 减去原指标、取倒数等处理手段。具体实施过程可以借鉴庞凤娇的相关性矩阵处理,可以直接清晰地反映出如何剔除指标。另外,进行聚类分析时,不能仅用单个指标或综合得分进行聚类,因为在数据折叠、展开过程中丢失的信息太多,而且如果类内只有一个数据,与别的数据计算之间的欧式距离没有意义。此外,如果能像吕振君那样建立一个分类评分标准,那么整个绩效评价过程会更加完善,得出的结果也更有说服力。
二、聚类分析在财务绩效评价中应用过程
(一)行业与财务绩效指标选取。行业选择应该与国民经济运行、人民生活福祉息息相关。财务绩效评价指标体系的建立,一般情况下从盈利能力、偿债能力、发展能力和营运能力出发,这四项是构成体系的基础,在以上所有论文中均有体现,除了这四项指标之外,与行业有关的自然环境、国家政策和社会态度等因素也要考虑进来;不能仅仅把一个指标当作核心去做,即使这样做,也应该加以说明。
根据中央企业综合绩效评价管理暂行办法和财务专业知识,一般需要选取盈利能力、偿债能力、营运能力、发展能力建立指标体系表,在此基础之上,提出特殊财务指标代表与行业结合的相关指标,如反映金融上市公司投资能力的股票发行量、股票发行价以及股价增长率等。
(二)数据预处理与相关性分析。评价指标分为正向指标、反向指标和适度指标,以正向指标为基准,反向指标和适度指标需要做同向化处理才能进行相关性分析。反向指标同向化处理公式为:Y=C/X(Y表示同向化处理后的结果;X 表示处理前的原始数据;C 一般取1,即直接使用倒数来表示)以及Y=1-X(特殊数据的处理)。再通过相关性分析来剔除相关性太强的指标,比如资产负债率和权益乘数,权益乘数=1/(1-资产负债率),两者分析的内容几乎一致,这两个指标同时存在时无法进行下一步的因子分析。在进行相关性分析前,由于各个指标表现形式和所表达的经济意义有所不同,故需要利用Z 得分方法进行标准化处理,去除量纲的影响。相关性分析一般用SPSS 软件的KMO和巴特利特球形度检验即可完成。相关性分析实质上是验证因子分析法的适用性,如果不通过相关性检验,就无法使用因子分析法。
(三)因子分析。因子分析利用降维的思想,步骤为:第一,公共因子的提取,一般提取出的3~5 个公因子,其方差载荷的和大于80%即可覆盖所有指标的信息,如果因子的载荷比重特别悬殊,可以使用旋转的方法来调整;第二,公因子命名,命名一个公因子应该解释其覆盖的指标;第三,计算每一个因子的得分,按权重计算综合得分进行排名,对排名进行简单分析。
(四)聚类分析。先计算每一个因子的权重得分,权重得分=因子得分×其对应载荷。随后按照企业对每个因子的权重得分进行聚类分析。在财务绩效评价中,一般使用K-means 法和层次聚类法。K-means 法的优势在于速度快,处理大量数据时省时高效,但对于K 值的设定把握需要有一定的思考。层次聚类的优势在于可以按照研究需求来控制类数,便于下一步分析,但是由于其算法步骤复杂,计算量大,不适合大数据量的处理。聚类完成后,对其类内共同点、类间差异点进行分析。比如,排名靠前的一类,可以提炼其优点,排名靠后的一类可以总结其劣势。当样本够多且指标合理时,那么从一定程度上能代表行业情况,总结出来的优缺点就具有参考意义,能够上升到行业一般规律。这正好符合数据挖掘的目的:分析数据之间隐含的关系,提取出有应用价值的知识。
三、总结
当前,财务、金融领域对于数据挖掘技术的应用很广泛,比如评价财务绩效、考察财务风险、搜集财务数据等,但是应用的深度还需加强。传统会计行业应该与计算机技术结合,向智能会计转型。现今,财经相关论文运用的数据挖掘技术还是比较浅薄、陈旧,比如综述的部分论文中聚类分析使用的ward linkage,还是于1963 年提出来,后续几年不断完善的一种计算类与类之间距离的方法。企业对于数据挖掘技术应用的深度和广度是远超过高校的,比如说企业运用的智能分析算法有卷积神经网络、递归神经网络和循环神经网络等深度学习算法。此外,企业还不断发展数据分析网络平台,比如网易大数据、Splunk、Tableau、神策数据以及腾讯云、阿里云等。至于会计教育才刚刚与数据挖掘技术交叉,且计算机课程门槛很高,非专业学生很难掌握,所以会计与数据挖掘技术的学科交叉还有很长的路要走。而财务背景的专家研究计算机技术与会计学科交叉促进智能会计发展的并不多,大部分一直在研究传统的会计、财务管理等。这些知识是财务分析的基础,对于我们固然非常重要,但也要结合最新的计算机技术,实现会计、财务管理智能化。所以,智能会计转型应该由高校和企业来共同推进,由计算机技术专家来主导,由财务方面的人才进行具体研究。