APP下载

财务报告舞弊识别效率改善研究
——基于分类技术改进和数据信息优化兼容视角

2018-02-07刘志洋韩丽荣吉林大学商学院吉林长春130012

财经问题研究 2018年1期
关键词:财务数据财务指标舞弊

刘志洋,韩丽荣(吉林大学 商学院,吉林 长春 130012)

一、文献回顾及理论分析

(一)文献回顾

会计舞弊手段纷繁复杂,国外学者为从会计信息中窥出财务舞弊的蛛丝马迹,对会计舞弊识别侧重于会计舞弊的征兆即红旗标志[1]。红旗标志的研究起源于20世纪80年代[2],后来Loebbecke和Willingham[3]建立了评估财务报告舞弊风险的概念化模型(LW模型),开创了财务舞弊识别的先河。随着资本市场的发展,非财务指标和增量信息也成为研究的重点。以前文献发现舞弊公司治理结构薄弱,董事长常常兼任总经理,设立审计委员会的比例较低[4],且审计委员会的独立性受到威胁或未尽勤勉义务[5-6],外部董事比例低[7],资产规模相对较小[8]及股权集中度较高[9]等。部分学者同时关注财务信息和非财务信息[10-11],而大部分学者关注财务数据的异常表现,早期关注舞弊当年的静态数据构建模型,洪荭等[16]基于GONE理论对舞弊形成机理及识别进行探讨;后来学者关注动态数据,Beneish[17]发现,应收账款日销售指数、毛利率指数、销售增长指数、总应计与总资产之比指数在舞弊公司与非舞弊公司之间存在显著差异;余玉苗和吕凡[18]、韦琳等[19]以及韩丽荣等[20]也选取部分财务指标的动态变化作为识别舞弊的标志;而Dechow等[21]的模型得到极大改进,同时兼顾了静态和动态数据。

针对识别财务舞弊工具选取方面,部分学者单独考虑分类问题,选取一般的统计模型,如判别分析、Logistic回归和Probit回归等。其中Logistic回归应用最为广泛,Spathis[13]从希腊财务报告数据提取10个静态财务指标构建Logistic回归模型,识别率达到84%,Beneish[17]、 Bell 和Carcello[10]与陈国欣等[14]也运用Logistic回归模型进行研究;部分学者考虑分类兼评分的人工智能模型识别舞弊,如专家系统[22]、神经网络模型[23]和支持向量机[24];还有部分学者通过对比不同模型的识别效率来判定识别工具的优劣。

(二)研究角度依据及舞弊识别效率理论分析

1.选取历史异常数据依据

基于异常会计信息角度识别舞弊可以提高识别的有效性,具有目标导向性强、识别效率高的特质,而以往研究舞弊主要从舞弊成因角度提取红旗标志,只是解释了舞弊的可能性。Beneish[29]指出,美国上市公司财务舞弊从报告公布到被发现平均滞后28个月,而我国滞后时间更长,据估计平均为37个月,因此,由于舞弊的隐蔽性和复杂性,舞弊当年被监管机构和投资者识别出来的概率微乎其微,从侧面表明企业越是进行舞弊操纵越有可能在舞弊当年使公司各项财务数据表现正常,从而规避被发现的可能;而现阶段研究舞弊大多基于静态指标(舞弊当年数据)进行识别,在识别效果上具有一定的局限性,虽然部分学者认识到舞弊是一个逐渐积累的过程,开始关注动态增量信息[18],但是只考虑连续两年环比数据,而从舞弊公司被发现的滞后期来看其进行舞弊时间应该更长。由于舞弊公司通常业绩较差,使财务数据永远表现正常的难度较大,因为一般的盈余管理存在应计项目倒转,而严重的盈余操纵具有不可持续性,因而企业一旦进行舞弊在未来某个时刻终会漏出端倪,表现在财务数据上是历年波动性较大,因而基于历史异常财务信息识别舞弊具有其独特优势。

2.数据信息效率优化

每家企业都是社会经济网络的一个节点,反映企业基本经营状况的财务指标无论在横向上还是在纵向上均应落在合理的区间,如果违背同行业可比性及历史维度的增长趋势,则可以判定该公司存在异常,此外财务报表是建立在复式记账基础上的,报表及账项之间存在相互关联性及内在一致性,如果它们之间的勾稽关系存在矛盾同样可以作为财务异常的依据。财务异常可以分为三个维度,即勾稽关系异常、行业横向异常和历史变动异常。财务舞弊识别可以从上述三个角度进行研究,然而在舞弊识别效率上存在差异,笔者认为企业舞弊手段高明程度存在三个层级,公司进行舞弊的出发点是不被市场感知,因此,首先,必须保证当年数据被市场投资者认为是真实的,起码应该保证本公司报表结构完整,逻辑通顺。其次,保证公司在同行业中表现正常。最后,同时也是最难的是保证公司历史数据平滑,与正常公司发展规律表现出一致性,因为公司进行舞弊通常是由公司绩效较差的压力造成,常常通过提前确认收入等盈余操纵手段来粉饰财务报表,而许多操纵手段具有不可持续性,因而舞弊公司必然导致各年度财务数据波动较大,因而基于历史维度识别财务舞弊比结构矛盾及行业对比效率更高。另外,公司相关的非财务信息由于部分依赖企业财务报告质量,如审计意见、ST等,公司可以通过人为操纵或审计意见购买进行改善;其他的非财务信息,如董事会结构、公司治理状况等,相对于财务数据其更容易操纵以满足市场预期,故而相对于财务数据,非财务数据的识别效率更低。

3.识别工具效率改进

由于财务舞弊具有非线性特征,简单的分类模型识别效果不如数据挖掘兼具分类评分功能的智能模型。为了论证舞弊识别效率改进路径,笔者首先分别对数据和识别技术进行改进,然后对两者进行同时改进以对比舞弊识别效果。

二、经验研究设计

(一)样本选取与数据来源

由于制造业公司在我国上市公司中所占比重较大,同时也是实施舞弊的重灾区,为了便于行业可比性,笔者选取2007—2015年沪深两市主板市场被中国证监会和证券交易所首次处罚的制造业上市公司为研究样本,按照CSMAR数据库披露的违规信息选择“虚构利润、虚列资产、虚假记载、推迟披露、重大遗漏和披露不实”六种违规类型进行研究共得到280家上市公司数据。同时按照三条原则选取配对样本:(1)与舞弊公司处于同一年度。(2)年初资产规模相近。(3)为了保证配对样本没有舞弊嫌疑,要求配对样本从未受到证监会、证券交易所等监管部门处罚。经筛选,得到152家非舞弊公司作为配对样本,最后选取舞弊样本和非舞弊样本各152个进行检验。笔者将样本分为训练集和测试集两个子样本,而财务数据波动性均考察2005—2015年之间的标准差,考虑到舞弊行为被识别一般滞后3年左右,故将2007—2013年共计248个样本作为训练集,其中舞弊公司和非舞弊公司各124家;此外,笔者研究的目的是根据历史信息帮助投资者进行舞弊识别,而2014年和2015年两年财务数据的波动性主要基于历史信息,故作为测试集检验模型识别效率,其中舞弊公司和非舞弊公司各28家。上市公司违规信息、财务数据与非财务数据来自CSMAR数据库和锐思数据库,笔者使用SPSS18、Stata13和MATLAB进行数据处理。

(二)变量选取

根据前人研究成果,综合考虑识别财务舞弊的财务因素和非财务因素,其中,财务指标按照舞弊与非舞弊公司2005—2015年度披露财务数据的标准差衡量财务异常信息,而非财务指标只考虑舞弊年度的情况,变量定义如表1所示。

(三)舞弊样本与配对样本资产规模差异性检验

笔者首先检验配对样本在资产规模上是否与舞弊样本存在差异以考察所选配对样本的合理性,检验结果如表2所示。

表2 舞弊样本与配对样本T检验

由表2检验结果可知,P值为0.415,没有通过显著性检验,表明舞弊样本与配对样本在资产规模上并未存在显著差异,排除舞弊样本与配对样本中资产规模因素产生的影响,说明笔者所选的配对样本较为理想。

(四)描述性统计分析

笔者初步选取38个指标进行舞弊识别,在构建模型时有必要对38个财务指标的差异进行显著性检验。首先进行单样本K-S Z检验样本是否符合正态分布,若符合正态分布则进行独立样本t检验,反之则进行Mann-Whitney U检验。K-S检验结果表明所有指标显著性水平均小于0.050,说明所有指标均不符合正态分布,故而采用独立样本Mann-Whitney U非参检验舞弊样本与非舞弊样本均值差异的显著性,由于篇幅限制,K-S检验结果省略,表3列示所有指标均值差异显著性的非参检验结果。

表3 舞弊样本与配对样本指标差异性统计检验

由表3检验结果可知,除财务杠杆指标外,舞弊公司财务指标波动性的平均值均大于配对样本,并且大部分变量通过显著性检验,说明舞弊公司为满足特定目的进行盈余操纵促使财务指标各年度波动较大,而这种在舞弊公司与非舞弊公司之间波动性存在显著差异的财务指标恰恰可以作为识别财务舞弊的标志。

针对通过Mann-Whitney U检验的变量进行相关分析,剔除共线性变量,根据相关分析结果,将相关系数大于0.500的变量进行剔除,本文依次将变量HROA、HSNIR、HTA、HCUR、HNCL、HART、HTAT、HNAYR、HFL、X3、X4、X11和X12剔除以消除共线性,相关分析结果省略。

三、Logistic模型舞弊识别效果分析

根据Mann-Whitney U检验识别出舞弊样本和配对样本的差异指标,同时剔除共线性指标,构建Logistic回归模型,因变量Fraud是二分类变量,如果公司舞弊,Fraud为1,否则为0,Logistic模型如下:

(1)

表4 Logistic回归结果

注:*、**和***分别表示在10%、5%和1%的水平上显著。

由表4可知,模型评价指标-2对数似然值越小表示拟合越好,而Cox & Snell R2与Nagelkerke R2的值越大代表模型拟合越好,对比模型(Ⅰ)和模型(Ⅱ)发现,加入非财务指标的模型(Ⅱ)拟合效果较好,两模型在训练样本中的识别效果可见表5。

在表5的训练集中,模型(Ⅰ)和模型(Ⅱ)的整体识别率分别为77.8%、78.6%,模型(Ⅱ)的整体识别效果较好,表明财务指标的波动性可以识别大部分财务报告的舞弊行为,然而结合部分非财务信息,识别效果更佳。但是非财务信息对舞弊识别效率提高程度只有约0.8%,另外单独运用非财务数据进行舞弊识别,效果也并不理想,表明非财务数据对舞弊的识别效率不如财务数据。在此需要说明的是,为了便于对比舞弊识别效果,笔者后续分类技术改进模型所选指标原始数据及相关数据优化均是包含部分非财务指标的模型(Ⅱ)中所选数据。

由于企业财务舞弊被识别出来平均滞后3年左右,因此,笔者在运用训练样本构建模型的过程中,考虑到了企业未来数据,而财务舞弊识别模型主要用于投资者和注册会计师等利益相关者对财务真实情况进行预测,所依据的数据均是历史信息,因而为了更好地说明本文的识别效果和应用价值,需要对模型进行测试,2014年和2015年测试样本财务数据的波动性主要基于历史数据,用这两年数据进行检测更贴近实际情况。运用模型(Ⅱ)对测试集的检测结果如表5所示。

表5 模型(Ⅰ)与模型(Ⅱ)训练集及测试集结果

表5测试结果显示,测试样本中28家舞弊样本有7家被误判,识别率为75.0%;28家非舞弊样本中有4家被误判,识别率为85.7%,模型整体识别率为80.4%,识别效果较为理想,进一步表明舞弊公司财务指标通常波动性较大,基于历史异常信息识别舞弊效果较好。

四、舞弊识别效率改进分析

上述线性Logistic回归为避免共线性削减了13个指标,损失许多信息,降低了舞弊识别的效率,因此,如何最大限度地保留原始信息以提高识别效果是学者们探讨的重点。目前常用的方法是主成分分析,其利用各指标间的相互关系,运用降维的思想把原始相关变量转换成几个互不相关的综合指标。提取的主成分是原始变量的线性组合,并且第一主成分(F1)方差最大,包含原始信息量最多,后面的主成分方差依次递减,判定主成分个数主要有两种方法,即取特征值大于1的成分或根据累计贡献率确定。由于分类变量不适合做因子分析,同时为了便于与基准模型识别效果进行对比,故而选择模型(Ⅱ)的指标进行分析,将财务指标进行主成分分析,同时结合非财务指标进行舞弊识别。

由表6可知,如果按照特征根大于1取主成分,累计贡献率只有58.9%,遗漏信息较多,故而按照累计贡献率达到80%取主成分,取前9个主成分可以满足要求,运用线性主成分模型进行舞弊识别效果可见表7。

表6 特征根及方差贡献率

(一)非线性主成分舞弊识别

李清和任朝阳[30]借鉴Taylor展开式的非线性思想,构建非线性—主成分Logistic回归证明其具有较好的舞弊识别效果,但作者基于静态数据,模型整体识别率并不高,故而笔者借鉴该种方法研究动态数据的识别效果,模型构建方法与李清和任朝阳[30]的类似,采用向后逐步回归的Wald法,构建的非线性主成分模型如式(2),经测算取0.400为分类阈值,当P>0.400判定为舞弊,当p<0.400判定为非舞弊,识别效果如表7所示。

(2)

表7 线性主成分与非线性主成分舞弊识别结果

相对于李清和任朝阳[30]静态数据分析,运用历史异常信息构建的舞弊识别模型效果较好,三种方法无论是训练集还是测试集舞弊识别率均有所提高,其中非线性主成分方法测试集相对于李清和任朝阳[30]的识别率提高十几个百分点,进一步说明舞弊公司财务数据要想保持平稳变动的难度较大,基于历史波动信息识别舞弊更具有效性。对比三种方法的识别效果,非线性主成分Logistic回归相对于线性Logistic回归和线性主成分Logistic回归更优,其训练集识别率最高,虽然测试集整体识别效果相同,但非线性主成分识别舞弊样本效率更高,相对来说把舞弊公司判定为非舞弊公司对资本市场投资者的危害更大。此外,线性主成分模型虽然训练集识别效果较差,但预测能力丝毫并未削弱,同时模型变得更为简洁,便于推广应用。总之,动态数据的识别效率优于静态数据,对原始数据进行降维提取主成分并不影响舞弊预测效果。

(二)支持向量机舞弊识别

传统的财务舞弊识别单纯地运用分类技术构建预测模型,较少考虑评分问题,导致识别效率不是很理想,随着数据挖掘技术发展,兼顾分类和评分的智能技术得到广泛应用,最常用的是神经网络和支持向量机,由于神经网络容易产生局部最优、网络结构难以确定及存在过度学习或欠学习等问题,1995年Vapnik提出的SVM方法可以克服上述缺陷,其专门针对小样本问题提出,同时解决了维数灾难问题。支持向量机是建立在VC维理论和结构风险最小理论基础上,其基本思想是将低维空间不可分的样本通过非线性变换映射到高维特征空间中,构造一个分类超平面,其模型优化函数为:

限制条件: yi[wTφ(xi)+b]≥1-εi,εi≥0,i=1,2,…,l

笔者选择径向基核函数(RBF):exp(-gamma*|u-v|^2),其中g是可调节的核参数,另外还需确定惩罚参数C,以实现模型更好的识别效果,笔者采用遗传算法寻优确定惩罚参数C和核参数g。

先运用模型(Ⅱ)中变量的原始数据进行参数寻优,寻找最佳的(C,g),如图1所示。

图1 遗传算法参数寻优结果

图1中,参数(C,g)的最优数值为(1.270,0.112),训练集和测试集的整体识别率分别为74.1%和73.4%,均低于Logistic回归模型的结果,由此可见,单纯地优化挖掘技术并不能提高识别效率,数据特征和挖掘技术兼容性才是提高识别效果的关键。

运用遗传算法对主成分进行参数寻优,参数(C,g)的最优值为(3,0.1),根据最优参数构建训练模型:model=svmtrain(train_label,train_data,′-s 0 -t 2 -c 3 -g 0.1′),进而调用libsvm工具箱中的svmpredict命令对测试集进行预测,预测结果如表8所示。由表8可知,无论是弃真还是取伪均有所改善,模型整体识别率为85.7%,相对单纯优化数据或改进分类技术,只有两者同时改善并相互兼容才能大幅度提高舞弊识别效率。

表8 主成分—支持向量机舞弊识别结果

五、结 论

笔者基于制造业上市公司数据,通过数据优化和模型改进得出如下结论:(1)描述性统计分析表明,由于企业进行舞弊操纵具有不可持续性进而导致舞弊公司历年财务数据的波动性较大,并且大部分财务指标与非舞弊公司存在显著差异。(2)通过历史异常信息的线性Logistic回归、线性主成分Logistic回归和非线性主成分Logistic回归结果,对比李清和任朝阳[30]静态数据的研究结论表明,历史异常波动信息对舞弊识别效率更高。(3)通过原始数据的Logistic回归和支持向量机识别结果对比发现,单纯改进识别技术有时并不能真正提高舞弊识别效率,原始数据需要进行初始加工以匹配先进的识别技术。(4)对原始数据进行降维处理同时借助改进模型可以提高舞弊识别率,并且识别技术越先进舞弊识别效果越好,非线性主成分和主成分支持向量机的财务舞弊整体识别率分别为80.4%和85.7%。根据研究结论和前面理论分析,笔者得出财务舞弊识别优化改进路径:从理论上说,数据信息应按照“非财务数据—财务数据静态指标—财务数据动态指标”的路径依次改善舞弊识别效果,识别技术也应从奔福德定律到分类模型、再到分类评分模型对舞弊识别效率依次进行改进,但是实际上单独改善某一方面并未绝对保证提高舞弊识别效果,研究人员应对两方面同时进行改进,其中财务数据动态指标通过主成分分析消除共线性,同时借助分类评分模型是识别舞弊最佳的研究路径,未来学者应从历史异常数据提取和分类评分模型改进及双方兼容问题上进一步拓展和完善舞弊识别方面的研究。

[1] 秦江萍.上市公司会计舞弊:国外相关研究综述与启示[J].会计研究,2005,(6):69-74.

[2] Romney,M. B., Albrecht, W. S., Cherrington, D. J. Red-Flagging the White Collar Criminal[J]. Management Accounting, 1980, 61(9): 51-57.

[3] Loebbecke,J. K., Willingham, J. Review of SEC Accounting and Auditing Enforcement Releases[R]. Unpublished Working Paper, 1988.

[4] Dechow, P .M., Sloan, R. G., Sweeney, A. P. Causes and Consequences of Earnings Manipulation: An Analysis of Firms Subject to Enforcement Actions by the SEC[J]. Contemporary Accounting Research, 1996, 13(1): 1-36.

[5] Abbott,L. J., Parker, S., Peters, G. F. Audit Committee Characteristics and Restatements[J]. Auditing: A Journal of Practice & Theory, 2004, 23(1): 69-87.

[6] Kusumawati, S. M., Hermawan, A. A. The Influence of Board of Commissions and Audit Committee Effectiveness, Ownership Structure,Bank Monitoring,and Firm Life Cycle on Accounting Fraud [J]. Jurnal Akuntansi dan Keuangan Indonesia, 2013, 10(1): 20-39.

[7] Beasley, M. S. An Empirical Analysis of the Relation Between the Board of Director Composition and Financial Statement Fraud[J].Social Science Electronic Publishing,1996,71(4):443-465.

[8] Beasley,M. S., Carcello, J. V., Hermanson, D. R. Fraudulent Financial Reporting: 1987—1997[R].Companies. Committee of Sponsoring Organizations of the Treadway Commission, 1999.

[9] 陈关亭.我国上市公司财务报告舞弊因素的实证分析[J].审计研究,2007,(5):91-96.

[10] Bell,T. B., Carcello, J. V. A Decision Aid for Assessing the Likelihood of Fraudulent Financial Reporting[J]. Auditing: A Journal of Practice & Theory, 2000, 19(1): 169-184.

[11] Brazel,J. F., Jones ,K. L., Zimbelman, M. F. Using Nonfinancial Measures to Assess Fraud Risk[J]. Journal of Accounting Research, 2009, 47(5): 1135-1166.

[12] Lee,T .A., Ingram, R .W., Howard, T. P. The Difference Between Earnings and Operating Cash Flow as an Indicator of Financial Reporting Fraud[J]. Contemporary Accounting Research, 1999, 16(4): 749-786.

[13] Spathis, C .T. Detecting False Financial Statements Using Published Data: Some Evidence From Greece[J]. Managerial Auditing Journal, 2002, 17(4): 179-191.

[14] 陈国欣,吕占甲,何峰.财务报告舞弊识别的实证研究——基于中国上市公司经验数据[J].审计研究, 2007,(3):88-93.

[15] 吴革,叶陈刚.财务报告舞弊的特征指标研究:来自 A 股上市公司的经验数据[J].审计研究,2008,(6): 34-41.

[16] 洪荭,胡华夏,郭春飞.基于 GONE 理论的上市公司财务报告舞弊识别研究[J].会计研究,2012,(8): 84-90.

[17] Beneish, D.M.The Detection of Earnings Manipulation[J]. Financial Analysts Journal, 1999,55(5).24-36.

[18] 余玉苗,吕凡.财务舞弊风险的识别——基于财务指标增量信息的研究视角[J].经济评论,2010,(4): 124-130.

[19] 韦琳,徐立文,刘佳.上市公司财务报告舞弊的识别——基于三角形理论的实证研究[J].审计研究, 2011,(2):98-106.

[20] 韩丽荣,胡玮佳,高瑜彬.数据安全性:中国 A 股上市公司异常会计信息与财务报告舞弊风险的识别[J].河南社会科学,2015,(7):46-51.

[21] Dechow, P. M., Ge, W., Larson, C. R., et al. Predicting Material Accounting Misstatements[J]. Contemporary Accounting Research, 2011, 28(1): 17-82.

[22] Eining,M. M., Jones, D. R., Loebbecke ,J. K. Reliance on Decision Aids: An Examination of Auditors’ Assessment of Management Fraud[J]. Auditing, 1997, 16(2): 1-19.

[23] Green, B. P., Choi, J. H. Assessing the Risk of Management Fraud Through Neural Network Technology[J]. Auditing: A Journal of Practice & Theory, 1997, 16(1): 14-28.

[24] 邓庆山,梅国平.基于支持向量机的虚假财务报告识别研究[J].当代财经,2009,(7):105-108.

[25] 毛道维,朱敏.企业信用状况的财务判断方法和模型——基于上市公司财务报告舞弊的实证研究[J].四川大学学报 (哲学社会科学版),2006,(3):51-57.

[26] Kirkos, E., Spathis, C., Manolopoulos, Y. Data Mining Techniques for the Detection of Fraudulent Financial Statements[J]. Expert Systems With Applications, 2007, 32(4): 995-1003.

[27] 蒙肖莲,李金林,杨毓.基于概率神经网络的欺诈性财务报告的识别研究[J].数理统计与管理,2009, (1):36-45.

[28] 邓庆山.基于数据挖掘技术的上市公司会计信息失真识别研究[D].南昌:江西财经大学博士学位论文,2009.53-94.

[29] Beneish,M. D. Detecting GAAP Violation: Implications for Assessing Earnings Management Among Firms With Extreme Financial Performance[J]. Journal of Accounting and Public Policy, 1997, 16(3): 271-309.

[30] 李清,任朝阳.基于非线性—主成分 Logistic 回归的会计舞弊识别研究[J].统计与信息论坛,2016, (3):75-80.

猜你喜欢

财务数据财务指标舞弊
浅谈财务舞弊与防范
会计电算化环境下会计舞弊的应对策略
我国金融机构股价和主要财务指标的相关性分析
2018上市公司中报主要财务数据(8)
2017上市公司年报主要财务数据(6)
2017年上市公司年报主要财务数据(1)
2018上市公司中报主要财务数据(3)
全国国有企业主要财务指标
全国国有企业主要财务指标
我国上市公司财务舞弊识别模型初探