基于案例推理的财务报告舞弊识别研究
2015-06-09李清任朝阳
李清++任朝阳
摘要:上市公司财务报告舞弊对资本市场建设和投资者利益保护掣肘已久。以2003~2012年我国沪深A股财务报告舞弊公司及其配对公司为样本,依据“舞弊钻石”理论和现有文献提取舞弊识别指标,基于案例推理思想构建财务报告舞弊识别模型。研究发现,较之于非舞弊公司,舞弊公司通常面临更大的盈利压力和偿债压力,成长能力更弱,事务所变更现象更为普遍,被出具非标准审计意见的概率更高。基于仿兰氏距离的案例推理模型对测试集样本的识别总正确率为66.7%。
关键词: 财务报告舞弊;案例推理;熵值法;K近邻法
中图分类号:F239.1文献标识码:A文章编号:1003-7217(2015)03-0084-06
一、引言
财务报告是上市公司与资本市场沟通的桥梁。因此,确保财务报告信息的真实、准确意义重大。财务报告舞弊是指公司在对外财务报告活动中,由于故意或轻率的行为,无论是虚假或漏列,结果导致重大误导性财务报告,且对投资者的投资决策产生实质性影响的行为。由于信息不对称及有限理性,投资者对上市公司的舞弊操作往往难以分辨,常蒙受巨额财产损失。因此,识别舞弊性财务报告,辨别上市公司信息真伪,有助于保护投资者利益,为建设投融资并重的规范的资本市场提供支持。
舞弊与反舞弊的博弈历时已久,有关财务报告舞弊识别的研究也未曾间断。Ngai等(2011)[1]对美国1997~2008年在金融欺诈领域的49种期刊上已发表文献进行统计发现,普遍应用的方法包括Logistic回归、人工神经网络、贝叶斯网络、决策树等。Beasley(1996)[2]通过构建Logistic回归模型,探讨了董事会结构特征与财务报告舞弊之间的关系,研究发现舞弊公司的外部董事比例显著低于非舞弊公司,而审计委员会设置与否与财务报告舞弊之间不存在显著相关关系。Lee等(1999)[3]以美国证券交易委员会“会计与审计处罚公告”和“华尔街日报索引”所载1978~1991年间舞弊公司为样本,建立Logistic回归模型,着重讨论了指标“盈余与经营现金流量差”的舞弊识别能力,结果发现财务报告舞弊公司的盈余与经营现金流量差异显著高于非舞弊公司。此外,人工神经网络[4,5]和基于多标准决策技术[6]在公司财务报告舞弊识别方面的应用也不乏研究成果。特别地,Curet等(1996)[7]讨论了案例推理在辅助审计师识别管理舞弊中的应用,探索了案例推理模型的开发、完善和评估技术。Hwang等(2004)[8]以137家韩国制造业公司为样本,以涵盖6个控制因素的56个风险指标为基础,采用层次分析法为指标赋权,以欧氏距离法度量案例相似程度,检验了案例推理模型在企业内部控制风险评估方面的应用效果。结果表明,案例推理的风险评估模型效果显著优于人工审计,也好于多元判别分析。
国内关于财务报告舞弊识别的研究则主要采用统计方法和人工神经网络方法。陈国欣等(2007)[9]选取29个指标,以126家舞弊公司和126家非舞弊公司为样本建立了Logistic回归模型,结果显示盈利能力弱、管理者持股比例高、独立董事人数少、被出具非标准审计意见的上市公司舞弊可能性更高。韦琳等(2011)[10]、洪荭等(2012)[11]分别以舞弊三角形理论和GONE理论为指导,构建了Logistic回归模型。梁杰等(2006)[12] 使用5个财务比率和3个会计项目指标建立了基于模糊逻辑和神经网络的财务报告舞弊识别的混合模型。刘君等(2006)[13]以36家舞弊公司和16家非舞弊公司为样本,基于均值差异显著的9个指标,构建了径向基概率神经网络财务报告舞弊识别模型。
财经理论与实践(双月刊)2015年第3期2015年第3期(总第195期)李清,任朝阳:基于案例推理的财务报告舞弊识别研究
财务报告舞弊是一类复杂的经济现象[14],目前仍是会计研究领域的“灰箱”,而案例推理方法适用于规则不完善、不明确、不一致的领域[15],它在财务报告舞弊识别领域是否也有较高的正确率,国内尚未有这方面的研究。本文试图构建财务报告舞弊识别的案例推理模型,以期达到较高识别正确率,辅助投资者鉴别上市公司财务报告信息真伪,提高投资决策的效率和效益。
二、基于案例推理的财务报告舞弊识别原理(一) 案例表示
每个样本公司都视为一个案例,并用其特征属性表示,以便于检索和计算距离。
1. 原始案例筛选。
由于相关指标数据在2003年以后才较为完整,故样本区间选择为2003~2012年。CSMAR数据库中共有16种违规类型,选取“虚构利润、虚列资产、虚假记载(误导性陈述)、披露不实、重大遗漏、推迟披露”6种违规类型作为研究样本。删除金融业和主营业务模糊的综合类上市公司,最终得到沪深A股181家舞弊公司。以年初总资产规模相近、同行业、同年度为标准,选取181家非舞弊公司作为控制组样本。
考虑到先建立模型后使用模型的时间顺序,将全部样本按照年份日期划分为两个样本集:2003~2010年共计260个案例归为训练集,占71.8%,舞弊和非舞弊公司各130家;2011~2012年共计102个案例归为测试集,占28.2%,舞弊和非舞弊公司各51家。
2. 特征属性提取。“舞弊钻石”理论为舞弊识别指标的提取提供了理论指导,该理论最早由Wolfe等[16]于2004年提出。通过对舞弊三角形理论的深入考察,结合对大量舞弊案的主要策划者能力特征的分析,Wolfe等将舞弊动因进一步拓展为压力、机会、合理化、能力四因素。追根溯源,舞弊三角形理论源自1950年美国著名犯罪学家Cressey对250个罪犯的访谈研究。经过为期5个月的访谈,Cressey发现,舞弊的产生是由压力、机会、合理化三因素共同作用的结果 [17]。Wolfe等(2004)观察发现,即使舞弊者感知到压力且存在“较好”的舞弊机会,也有似乎“合理”的借口,但如果舞弊者估计自身能力不足以隐蔽地实施舞弊而不被惩罚,舞弊行为仍然不会发生[15]。舞弊者往往在组织内位居要职,熟悉组织的内部控制缺陷,认为自己能轻易避开惩罚,自负而且心理承压能力较强。具备这些能力特征的策划者被视为催动舞弊发生的第四个因素。
(1) 压力因素。舞弊压力有多种来源,而财务收支失衡、异常开支需求以及由意外损失导致的入不敷出等财务压力是主要来源之一。企业财务压力可以通过营运能力、盈利能力、偿债能力、成长能力等反映出来。衡量营运能力的常用指标有应收账款周转率、存货周转率、总资产周转率等;衡量盈利能力的常用指标有总资产净利率、销售净利率、财务费用率、盈余经营现金流量差等;衡量偿债能力的指标有流动比率、速动比率、现金比率、资本负债率等;衡量成长能力的指标有总资产增长率等[3,10,13]。考虑我国资本市场特殊的制度背景,例如对增发配股公司净资产收益率的要求、对连续多年的亏损公司进行限制交易特殊处理(ST、*ST)乃至退市的规定,加之核准制下公开发行股票的门槛较高,“壳资源”尤为稀缺,上市公司具有强烈的业绩达标舞弊倾向,鉴于此,使用是否具有配股动机、保盈动机衡量来自业绩达标的舞弊压力[11]。
(2) 机会因素。完善的公司治理机制是抵御和防范财务报告舞弊的重要屏障,公司治理不完善则往往给舞弊提供机会[5]。Beasley(1996)[2]研究发现,舞弊公司的董事会通常较少外部独立董事。Dechow等(1996)[18]发现舞弊公司大多缺乏内部审计委员会,董事长与总经理二职合一现象较为普遍。此外,股权结构是公司治理的重要组成部分,被视为公司治理的产权基础。我国上市公司国有股“一股独大”现象突出,国资控股的公司由于所有者监督缺位,其经营者更有机会通过舞弊实现控制企业以获取私人利益[19]。另一方面,注册会计师审计是遏止组织舞弊的最后一道防线, 为了掩盖舞弊行为,舞弊公司在舞弊实施年度倾向于变更审计师事务所[20],变更审计师可能导致不了解情况的新任审计师难以发现和阻止舞弊。综上,本文选择二职合一、独董比例、是否设立审计委员会、国有股比例、事务所变更衡量机会因素。
(3) 合理化因素。合理化是为舞弊行为寻找借口的心理过程,舞弊者的行为与其自身道德可接受程度相关。如果一个人认为舞弊已经超出自身道德底线,则其通常不会实施。然而,由于行为者的心理活动是内在而复杂的,难以直接测量,已有研究大多借用与个人道德相关的代理变量进行间接衡量。Rae等[21]认为,舞弊等非诚信行为的发生常常由于当事人不够正直。韦琳等(2011)[10]分析认为,存在舞弊行为的公司常常由于对审计工作的不配合,被出具非标准审计意见的可能性较大。舞弊公司的非诚信行为还往往给利益相关者带来负面影响,更容易使公司陷入法律纠纷。据此,本文使用审计意见、法律诉讼衡量合理化因素。
(4) 能力因素。财务报告舞弊通常由管理者主导实施,对其个人能力特征的考察有助于识别潜在舞弊风险。Magnan(2013) [22]研究发现,管理者自负是财务报告舞弊的重要隐患,管理者自负的公司更倾向于实施财务报告舞弊。公司业务的增长来自持续的盈利,而自负的管理者倾向于通过资本运作等外部融资实现业务规模的快速扩张,通常体现为活跃的兼并收购计划。换言之,兼并收购与财务报告舞弊的管理者具有共同的自负特征。鉴于此,不妨使用兼并收购衡量能力因素。综上,本文提取的特征属性指标如表1所示。3. 特征属性筛选。
对训练集进行指标均值差异检验,根据差异程度筛选用于舞弊识别的指标。使用SPSS软件对舞弊和非舞弊公司的22个指标是否服从正态分布做KolmogorovSmirnov单样本正态性检验,若两类公司的某个指标均服从正态分布,则使用两独立样本T检验方法检验该指标算术平均值是否相等,并依方差齐次性选择对应的t值及其显著性概率p值,据以判定均值差异是否显著。对两类公司不全服从正态分布的指标,则使用两独立样本MannWhitney U检验方法检验其均值差异显著性。均值存在显著性差异的指标有总资产净利率、销售净利率、财务费用率、资产负债率、总资产增长率、事务所变更、审计意见。
4. 原始案例库构建。
设原始案例(即训练集)为n个,案例特征属性(即舞弊识别指标)为m个,则原始案例库可以表示为如下矩阵:
公司1x11x12…x1m公司2x21x22…x2m……………公司nxn1xn2…xnm
其中,xij(i=1,2,…,n;j=1,2,…,m)表示第i个公司的第j个指标。(二) 案例检索
1. 检索方法确定。
K近邻法作为一类非参数判别方法,常用于分类问题的解决。随着K值取值增大(≥3个),该方法优势更为明显[23,24]。Terrell等(1992)研究表明,K近邻法适用于变量为3个以上维数较多的情况 [25]。本文均值差异显著的变量为7个,适宜采用K近邻法进行案例检索。
该方法的操作首先需要逐一测算新案例与所有原始案例的相似度,然后,对原始案例按与该案例相似程度大小进行降序排列,取其前K个案例,将此K个案例中占多数的类别赋予新案例,实现新案例类别判断。为了追求判断结果的稳健性,K值越大越好;而K值越大,相似度低的案例被检索到的概率也会随之增加,从而对新案例类别判断形成干扰。最佳K值是在考虑稳健性和相似度基础上的综合折中。可以通过试算获得不同K值的判断正确率曲线,从中选择最佳K值。为避免二义性,一般将K取为奇数。
2. 相似性测度公式确定。
研究中对案例相似性的测度往往使用两个对象之间的距离来表达。距离越小表示两案例越相似。常用的距离公式有:明氏距离(包括曼哈顿距离、欧氏距离、切比雪夫距离)和仿兰氏距离[26]。
(1) 明氏距离。把案例看成m维空间的点,令dij表示案例i与案例j间距离,则明氏距离定义为:
dij(q)=q∑mα=1xiα-xjαq(1)
当q=1时,该公式称为曼哈顿距离:dij(1)=∑mα=1xiα-xjα。经过加权的曼哈顿距离公式为: dyi(1)=∑mα=1ωαΩ×xyα-xiα,Ω=∑mα=1ωα。其中,dyi(1)是新案例y到第i个原始案例的距离(i=1,2,…,n);ωα是第α个属性的权重(α=1,2,…,m);ωαΩ保证公式中m个特征属性值的权重之和为1。当q=2时,该公式称为欧氏距离:dij(2)=∑mα=1xiα-xjα2。经过加权的欧氏距离为:dyi(2)=∑mα=1ωαΩ×xyα-xiα2 ,公式中各参数意义同前。
当q=
(2) 仿兰氏距离。兰氏距离是由Lance和Williams最早提出,其计算公式为:dij=1m∑mα=1xiα-xjαxiα+xjα,该公式要求各属性值大于0。由于存在负数故采用了所谓的仿兰氏距离(加权后为): dyi=∑mα=1ωαΩ×xyα-xiαxyα+xiα,定义当xyα=xiα=0时,dyi=0。公式中各参数意义同前。
3. 特征属性权重确定。
根据是否有人为因素参与,可以分为主观赋权法和客观赋权法。主观赋权法包括层次分析法、德尔菲法等。客观赋权法包括熵值法、主成分分析法、中心化系数Logistic回归等,根据数据信息的相关性或差异性等特征构权。本文采用熵值法确定特征属性权重。
三、财务报告舞弊识别案例推理模型的构建
(一) 熵值法确定权重的基本原理和步骤
熵是对系统无序程度的度量,系统越无序,熵值越大,系统越有序,熵值越小。因此,对于指标xj(j=1,2,…,m),其n个指标值差异越大,则该指标在案例综合评价中所起的作用越大,所占的权重也应该越大;如果某个指标的n个值全部相等,则该指标对于不同案例不具有区分能力,其所占的权重应该为零[27]。熵值法赋权的计算步骤为:
1.指标无量纲化处理。对于由n个公司样本,m个评价指标形成的指标矩阵X=(xij)n×m,中心化的公式为:
x′ij=(xij-x-j)/sj(2)
其中x′ij是中心化后的指标值,xj-=1n∑ni=1xij是第j项指标的均值,sj=1n-1∑ni=1(xij-xj-)2是第j项指标的标准差。
2.坐标平移。数据中心化后落入区间[-7.787136,9.681681]中,由于负数不能取对数、不能直接计算比重,所以进行坐标平移,令Zij=8+x'ij。为方便,仍将Zij记为xij。
3.计算指标xj中第i公司指标值xij的比重pij=xij/∑ni=1xij。
4. 计算指标xj的熵值ej=-(1ln n)∑ni=1pij×ln pij,式中乘以系数1/ln n,以便使得0≤ej≤1。
5.计算指标xj的差异性系数gj,定义gj=1-ej。
6.计算指标xj的权重wj=gj/∑mj=1gj,j=1,…,m。
上述数据处理过程示意如表2所示。
(二) 使用熵值法确定权重的案例推理模型
任取一家测试集案例y(y=1,2,…,102)计算其与训练集260家案例的曼哈顿距离,得到距离集合Dy=dy1,dy2,…dy260。260家案例的类别集合定义为C=c1,c2,…,c260,其中ci(i=1,2,…,260)值为1表示舞弊、为0表示非舞弊。取集合Dy中K个最小值,构成案例调用集合Dyk,对应的类别集合为Cyk。若Cyk中等于1的元素的个数超过K/2,则将y判为舞弊公司,否则判为非舞弊公司。然后与y的实际类别对照,类别相同则判别正确,反之,则判别错误。取另一家测试集案例重复上述过程,遍历测试集,最后得到测试集识别正确率。由于K取不同值时集合Cyk中的元素不同,从而识别结果不同,可以绘制不同K值的判别正确率曲线,从中选择最佳K值。为避免二义性,K取1~259的奇数。
使用欧氏、切比雪夫、仿兰氏距离重复上述计算过程,以对比不同距离的识别正确率,结果如表3所示。模型B总体正确率最高为68.6%,然而其舞弊公司识别正确率偏低。由于舞弊公司的错判成本较高,因此考虑错判成本,D模型为最优模型,其舞弊公司、非舞弊公司以及总识别正确率分别为62.7%、70.6%、66.7%。D模型不同K值下的识别正确率曲线如图1所示,最优K值为15。
图1仿兰氏距离、不同K值测试集识别正确率
四、研究结论
本文以“舞弊钻石”理论为指导提取舞弊识别指标,构建了案例推理模型并具有较高的识别正确率。研究发现,较之于非舞弊公司,舞弊公司通常面临更大的盈利压力和偿债压力,成长能力更弱,事务所变更现象更为普遍,被出具非标准审计意见的概率更高。基于仿兰氏距离的案例推理测试集识别正确率达到66.7%,具有一定实用性。该研究丰富了舞弊识别领域的文献,启示审计师在舞弊审计中打破线性思维模式,充分调用已有舞弊审计经验,以相似案例为参照,从整体上系统把握财务报告舞弊特征,提高舞弊识别能力,降低审计风险。
案例推理方法具有较强的开放性。还可以采用其它方法对指标赋权,如使用主成分分析、层次分析等方法赋权,以便与熵值法相互校验权重设置的合理性。另外,不同距离公式下的模型识别正确率各不相同,未来还可以探讨更多距离公式的应用,例如马氏距离、夹角余弦、案例相关系数等。
参考文献:
[1]Ngai E W T, Hu Y, Wong Y H, et al. The application of data mining techniques in financial fraud detection:a classification framework and an academic review of literature[J].Decision Support Systems, 2011, 50(3): 559-569.
[2]Beasley M S. An empirical analysis of the relation between the board of director composition and financial statement fraud[J]. Accounting Review, 1996, 71(4): 443-465.
[3]Lee T A, Ingram R W, Howard T P. The difference between earnings management and operating cash flow as an indicator of financial reporting fraud[J].Contemporary Accounting Research, 1999, 16(4): 749-786.
[4]Green B P, Choi J H. Assessing the risk of management fraud through neural network technology[J].AuditingA Journal of Practice &Theory, 1997, 16(1): 14-28.
[5]Fanning K M, Cogger K O. Neural network detection of management fraud using published financial data[J]. International Journal of Intelligent Systems in Accounting,Finance & Management,1998, 7(1): 21-41.
[6]Spathis C, Doumpos M, Zopounidis C. Detecting falsified financial statements: a comparative study using multicriteria analysis and multivariates statistical techniques[J]. The Euronean Accounting Review, 2002, 11(3): 509-535.
[7]Curet O, Jackson M, Tarar A. Designing and evaluating a casebased learning and reasoning agent in unstructured decision making[A]. In 1996 IEEE International Conference on Systems Man and Cybernetics[C]. IEEE,1996,4(10):2487-2492.
[8]Hwang S S, Shin T, Han I. CRASCBR: internal control risk assessment system using casebased reasoning[J]. Expert Systems, 2004, 21(1): 22-33.
[9]陈国欣, 吕占甲, 何峰. 财务报告舞弊识别的实证研究基于中国上市公司经验数据[J]. 审计研究, 2007,(3): 88-93.
[10]韦琳, 徐立文, 刘佳. 上市公司财务报告舞弊的识别基于三角形理论的实证研究[J]. 审计研究, 2011,(2): 98-106.
[11]洪荭, 胡华夏, 郭春飞. 基于GONE理论的上市公司财务报告舞弊识别研究[J]. 会计研究, 2012,(8): 84-90.
[12]梁杰,位金亮,扎彦春. 基于神经网络的会计舞弊混合识别模型研究[J]. 统计与决策, 2006,(3):152-153.
[13]刘君, 王理平. 基于概率神经网络的财务舞弊识别模型[J]. 哈尔滨商业大学学报(社会科学版), 2006,(3): 102-105.
[14]陈慧璇,朱君.我国上市公司财务报告舞弊特征分析[J].税务与经济,2013,(2):52-27.
[15]Ashley K D, Rissland E L. Compare and contrast: a test of expertise[A].AAAI'87 Proceedings of the Sixth National Conference on Artificial Intelligence, 1987:273-278.
[16]Wolfe D T, Hermanson D R. The fraud diamond:considering the four elements of fraud[J]. The CPA Journal, 2004,(12): 38-42.
[17]Kassem R, Higson A. The new fraud triangle model[J]. Journal of Emerging Trends in Economics & Management Sciences, 2012, 3(3): 191-195.
[18]Dechow P, Sloan R, Sweeney A. Causes and consequences of earnings manipulation:an analysis of firms subject to enforcement actions by the SEC[J]. Contemporary Accounting Research, 1996, 13(1): 1-36.
[19]刘立国, 杜莹. 公司治理与会计信息质量关系的实证研究[J]. 会计研究, 2003,(2): 28-36.
[20]Beasley M S, Carcello J V, Hermanson D R. Fraudulent financial reporting: 1987-1997.an analysis of US public companies[EB/OL]. http://www.Coso.org/Publications/FFR_1987_1997.pdf,2014-10-01.
[21]Rae K, Subramaniam N. Quality of internal control procedures:antecedents and moderating effect on organisational justice and employee fraud[J]. Managerial Auditing Journal, 2008, 23(2): 104-124.
[22]Magnan M, Cormier D. Financial reporting frauds:a manifestation of hubris in the csuite?some exploratory evidence[J]. Cahier De Recherche, 2013,(2):1-51.
[23]Fix E, Hodges Jr J L. Discriminatory analysisnonparametric discrimination:small sample performance[R]. California Univ Berkeley, 1952.
[24]Cover T, Hart P. Nearest neighbor pattern classification[J]. IEEE Transactions on Information Theory,1967, 13(1): 21-27.
[25]Terrell G R, Scott D W. Variable kernel density estimation[J]. The Annals of Statistics, 1992, 20(3): 1236-1265.
[26]李清, 刘金全. 基于案例推理的财务危机预测模型研究[J]. 经济管理, 2009, 31(6): 123-131.
[27]郭显光. 改进的熵值法及其在经济效益评价中的应用[J]. 系统工程理论与实践, 1998,(12): 99-103.
(责任编辑:漆玲琼)