基于Logistic模型的财务舞弊识别研究
2021-08-11姚文博刘珊珊
姚文博 刘珊珊
摘 要:本文基于logistic回归分析,结合上市公司财务数据,逐步明晰财务数据与非财务数据对舞弊行为识别的影响机制,并为应用大数据技术构建一个实用、精确的舞弊识别模型,完成实证性检验。以往研究表明,固定资产增长率、经营现金流量对流动负债比率、每股投资活动现金净流量、每股收益、股权集中度五个财务指标的变动对财务舞弊产生重要影响。本文根据公司四大财务指标,通过对公司经营能力、偿债能力、盈利能力以及发展能力的分析,选取具体财务指标与非财务指标对公司经营状况以及舞弊状况进行模型拟合。本文以2014年-2017年中国120家上市公司的财务数据为基础量化指标,以此为样本建立了公司舞弊的预测模型,随机抽取20家上市公司财务数据验证,验证效果良好,模型具有可信性,并对模型进行评价与对大数据环境下的舞弊识别进行展望。
关键词:Logistic回归;财务舞弊;舞弊识别
一、文献综述
大数据时代的来临对各行各业产生了广泛深刻的影响,大数据技术应用也逐渐渗透在财务与审计领域。在此背景下将大数据技术应用于风险的前瞻和内部控制疏漏,特别是财务造假问题的防范尤为重要。在现有相关文献的论述中,众多学者展开了研究与探索,主要涵盖以下方面:
1.舞弊理论与舞弊模型构建
基于“三因素论”、“GONE”理论典型的舞弊理论,学者尝试构建并完善各类财务舞弊识别模型一般过程为指标选取、指标处理、模型构建、模型检验与评价。洪文洲等在基于Logistic回归模型的上市公司财务报告舞弊识别研究构建了向后回归法的回归模型,研究了上市公司财务报告的识别。李清等提出了会计舞弊指数的构建基础与构建方法,比较了Logistic模型与会计舞弊指数的优缺点。张曾莲等基于压力、机会和借口三因素综合了强制性信息与自愿性信息,搭建了更为全面有效的预测指数体系,并选取了证监会發布的公司舞弊样本对模型进行了实证检验。
2.大数据环境下的舞弊识别
内部审计作为一种审计监督机制的重要一环,在舞弊的识别与防范方面发挥重要作用。大数据时代的到来使得各大新型信息技术应运而生,应用此类技术可以辅助审计工作人员快速、精准地实现审计目标,迎来了机遇。与此同时,庞大的数据及其真实性问题的暴露也带来了挑战。马滢等从审计证据、程序、方法等六个角度分析了大数据环境下内部审计的机遇,从制度、人员、应用技术、硬件等六个维度阐释了该环境带来的挑战,最终提出大数据审计是技术发展下审计的必然结果的观点。大数据时代对公司的内部控制提出了更高层次的创新性要求。桑梅研究了大数据时代对审计模式与审计技术的影响,从内控思想、内控水平与共享性及人才资源三方面分析了存在的问题并指出了针对性的措施。在大数据时代,将大数据技术应用至内部审计与报表分析工作中成为一种新的趋势与常态。造假识别方面,高健通过报表分析与大数据结合的思路,提出了从财务报告实施角度逆向发现信息失真的手段,为发现舞弊与提高会计信息质量提供了新思路。汪士果等通过挖掘数据集和会计舞弊红旗标志、算法以及分类器评价方法的归类比较,为审计工作中数据的选择与模型的优化提供了借鉴意义。
二、基于Logistic回归的舞弊识别模型构建
1.样本选择
考虑到近期存在舞弊行为的公司尚且没有被监管机构认定,这两者之间有一定的时滞性,故本文选取舞弊公司样本来源于在2014年1月1日至2017年12月31日期间,受到中国证监会正式行政处罚的中国非金融业的A股上市公司,并选取在行业较为成熟的交易所上市公司作为配对样本,因为其数据便于获取,同时发生舞弊的可能性相对较小。在样本选择时进行了如下处理过程:
(1)样本公司选择原则:为了尽量降低客观因素和无关变量的影响,需按照1:1的比例从中选择行业规模与资产总额以及行业配对的60对舞弊与非舞弊公司,且差额浮动在10%以内,确保样本的规模因素可能对模型构建产生的影响,共计120个样本。在选择样本时,本文剔除了B股公司与金融企业,剔除了所有ST公司,且挑选在各行业内发展较为成熟的公司作为对比样本。
(2)样本数据选择原则:财务数据选取舞弊公司被处罚当年的上一年年报数据,行业类型以及资产的规模则源于公司被处罚当年的信息列示公告,若在选定的时间范围内连续舞弊,则综合考虑舞弊典型性与敏感性,选择最为典型的舞弊年份。本文样本数据均来源自国泰安数据库。
2.指标选取
上市公司舞弊是采用不同类型调节利润的手段,可在财务与非财务各项指标的异常中得到体现。本文在已有文献研究的基础上,基于舞弊理论,从压力、机会、借口与其他四方面入手选取指标。指标涵盖财务指标与非财务指标。
压力角度主要选取评价公司偿债能力、经营能力、盈利能力、现金流情况、风险水平与发展能力的相关指标,对企业的财务状况进行了较为全面的反映。机会角度选取公司治理综合信息中股东数、股权制衡度、Z指数等指标以及三会召开情况。借口角度选取董事、监事、高管的年薪总额与持股比例等体现不同股权所有人利益关系的相关指标来衡量较难量化的高管心理动机所致行为。其他项目中选取审计信息变量,包括审计意见、审计费用、股票简称变更等管理指标。
在指标选取中,我们主要遵循如下原则:(1)非舞弊公司与舞弊公司差异显著。指标务必在舞弊与非舞弊间存在显著差异,有利于凸显舞弊所致的指标差异,进而在后续统计分析中提升模型的准确程度。(2)数据完整性与连续性。一方面应考虑选取指标的覆盖面尽可能完整,能够全面客观反映企业经营状态,能够在企业采用虚增理论,少记成本费用时发生较明显变化。另一方面为了后续统计分析的操作可行性与准确性,本文剔除了样本公司数据披露不完整、大面积缺失或未能查询到舞弊年份前后完整数据的相关指标,最终保留指标50个。
在确定指标体系后,从国泰安经济金融数据库中查询相关数据,并进行如下处理:(1)指标增量计算:为了尽可能避免企业通过利润操纵等手段美化当期数据,本文计算了各项财务指标披露的舞弊发生年份与舞弊发生前一年的增量。(2)部分指标剔除与补缺:剔除全部样本公司在舞弊年份大面积缺失或披露不完全的指标,个别样本的个别缺失数据用该指标的平均值代替。同时为了尽可能减少量纲造成的非必要影响,本文对所选指标的相关数据进行了标准化处理。
3.显著性分析
完成财务指标增量计算后对所选取的财务指标变动指标与非财务指标进行检验,找出舞弊公司与非舞弊公司在一定显著性水平下有显著性差异的特征指标。既往文献中对变量指标进行显著性检验的方法主要有两种:单变量检验与独立样本检验。为了更好突出舞弊公司组与非舞弊公司组同一指标的均值差异,本文采用独立样本的检验,在0.1显著性水平下有如下九个指标通过检验:△X9(存货与收入比)、△X16(资产报酬率B)、△X17(总资产净利润率B)、△X20(净资产收益率B)、△X28(折旧摊销)、△X39(流动资产比率)、△X40(营运资金比率)、△X44(流通股比率)、△X47(股权制衡度),本文选取上述九个指标进行回归方程的拟合。
4.因子分析
经过上述单变量显著性检验我们得到舞弊公司与非舞弊公司的显著差异指标及某项指标与财务舞弊正相关或负相关。模型中如果变量之间存在多重共线性会影响到模型的检验效果,应该挑选出不具有明显相关性的指标,因此需要对上述指标进行相关性分析,即利用因子分析法浓缩指标,找出主要影响因子,从而达到提高模型的预测准确度的目的。通过SPSS检验,KMO取样适切性量数值为0.599,Bartlett球形检验的显著性为0,适合通过主成分分析进行因子浓缩。经主成分提取后9个相关财务与非财务指标被浓缩为4个因子,记作X1、X2、X3、X4,其成分矩阵如下表:
5.舞弊模型拟合
(1)拟合函数选择及结果判断
通过对已有研究的分析,本文选择Logistic回归采用函数
进行拟合,该模型通过最大似然值估计参数,特点是函数的取值范围在0-1之间,可以设定函数表示舞弊行为发生的可能性, 例如函数值大于某一阈值时判定其发生舞弊行为,且根据之前已有研究,该模型识别普遍具有较好的效果。
因上市公司舞弊与否呈严格的两点分布,即是与否,Logistic回归模型适用性强。本文设定舞弊公司该项值为1,非舞弊公司该项值为0,同时设定判定值为0.5。当P值大于0.5时判定其存在舞弊标志,P值小于等于0.5时,不认为其存在舞弊特征。
(2)拟合过程
上述指标处理过程后可得到清晰明确的自变量与因变量,下一步为利用相关处理后的舞弊公司及配对非舞弊公司相关数据建立Logistic回归模型。本文采用二元线性回归模型拟合进行模型构建。将通过检验与因子分析的浓缩因子引入SPSS二元线性回归分析程序中,定义非舞弊公司因变量值为0,舞弊公司值为1。以舞弊发生情况为因变量,浓缩因子为自变量拟合,拟合结果如表2所示:
根据上表结果可得出回归方程表达式:
三、模型检验与评价
1.模型检验
基于随机选取的20家舞弊与非舞弊公司2019年财务数据计算相关指标并代入模型检验,并与2020年舞弊情况进行对比。选取检验样本时挑选的公司均不在样本中,进一步加强检验的随机性。此外,挑选最近年度财务数据,保证模型检验的时效性。按照上述原则,本文选取了10家因报告舞弊被证监会公开处罚的公司与10家运营状况良好的公司作为检验样本。经模型检验,12家公司被判定为舞弊公司,8家公司被判定为非舞弊公司。检验效果总体良好,但模型存在放大公司舞弊风险的不足,有待优化。
2.模型评价与优化角度
(1)模型评价
本模型選取指标体系较为全面,模型结构较为简洁,可理解性强,模型对舞弊公司的识别能力较强。模型应用范围较广,可在以下方面发挥作用:审计人员可借助模型初步识别被审计单位发生财务舞弊的可能性;非财务管理人员也可运用模型分析预测财务舞弊可能性,进而为公司治理与内部控制制度的完善提供参考;证券市场投资者也可使用检验模型洞悉被投资公司的财务状况,进而降低投资风险。
该模型仍然存在不足:其最为突出的问题是模型准确率有待进一步提高。此外,该模型存在放大公司舞弊风险的可能,且阈值的确定存在主观性,这将导致指标异常不明显的舞弊公司未能被识别出以及相关指标轻微波动的非舞弊公司被误判。
(2)模型优化角度
针对模型构建中存在的问题和模型的不足,该舞弊识别模型仍可以从如下角度进行优化:
从样本及指标体系的选取角度,本文样本数量相对较少,可借助大数据工具扩大样本量。如引入所有A股非金融公司,通过扩大样本量优化模型,提升模型概括性。选取指标时本文虽尽可能覆盖各种可能的舞弊指标,但样本中舞弊公司的舞弊原因并不完全相同,导致不同样本的异常指标难以统一化,难以找到一套统一且有效的指标体系。此外,本文选取的非财务指标的量化也具有优化空间。从阈值选择角度看,本文阈值选取基于较少的样本量,且具有一定的主观性,可从扩大样本量及优化阈值选取的角度进行优化。
四、大数据背景下基于财务指标的舞弊识别展望
伴随着大智移云时代的来临,数字化信息呈指数型爆炸增长,大数据的分析处理应用逐渐深入企业日常管理之中。利用大数据,构建舞弊模型是数据技术的重要应用,目前在实际运用过程中仍面临一些挑战。但可以相信,与传统数据分析相比,大数据舞弊模型可以更高效地处理信息,并对企业未来财务信息状况做出合理预测。传统数据分析多针对企业内部结构化资料进行统计分析描述诊断,通过过去数据反映。而新型的大数据分析则科学有效地利用企业内外部全方面资料进行快速分析、行为预测,进行最优化的仿真模拟,预测未来以优化决策。舞弊模型运用专业工具、技术和模型,对大量无序数据进行分析拟合,以获得有价值的隐含信息,并对结果分析解释,增强企业财务信息质量,实现全面审计的预先期望。在如今信息高速发展的时代,财务信息已经不局限于对过去的数据分析整理,合理预测未来并防范未知风险的创新预测分析才是大势所趋。利用新的理论和技术,实现传统人工到大数据分析的逐步转型,无论是从深度还是广度,都可以全方位提升审计效率和准确性。由此可见,基于logistic回归分析构建舞弊识别模型创新技术在应用于会计、审计和财务领域,为企业合理规避风险与获取信息使用者的信任仍具有充足的完善与优化空间与可期的发展前景。
参考文献:
[1]洪文洲,王旭霞,冯海旗.基于Logistic回归模型的上市公司财务报告舞弊识别研究[J].中国管理科学,2014,22(11).
[2]李清,闫世刚.Logistic回归会计舞弊识别模型与会计舞弊指数比较研究[J].东北师大学报(哲学社会科学版),2018(4).
[3]张曾莲,高雅.财务舞弊识别模型构建及实证检验[J].统计与决策,2017(9).
[4]马滢,乔羽.大数据环境下公司内部审计面临的机遇和挑战[J].新经济,2016,(27):73-74.
[5]桑梅.大数据时代公司财务内部控制探讨[J].财会学习,2020(12):246,248.
[6]高健.基于大数据的公司财务造假识别[J].中外企业家,2015(9).
[7]汪士果,张俊民.基于数据挖掘的会计舞弊识别问题研究综述[J].中南财经政法大学学报,2011(1).
[8]高利芳,何磊,李艺玮.企业反贿赂内部审计的主观动因研究——基于世茂集团的案例分析[J].重庆工商大学学报(社会科学版),2020,37(02):75-86.