基于数据挖掘的在线审计模型设计
2019-11-30施传新谢志林楚黄维蓝文涛
文/施传新 谢志林 楚黄维 蓝文涛
就当前的情况来看,受到经济全球化的影响,企业经营的业务更为多样,因此,传统的审计模式无法满足现有需求。特别是在大数据技术、信息技术等先进技术不断发展的今天,搭建与应用在线审计系统十分重要。为了保证审计的全面性与科学性,设计基于数据挖掘的在线审计模型具有较高的现实价值。
1 在线审计业务中数据挖掘关键技术的应用
1.1 离群点挖掘法
对于离群点而言,其主要指偏离大部分数据、不符合规范的小部分数据。在该方法的支持下,能够将离群数据从数据整体中分离出来,避免对审计结果产生负面影响,并降低数据分析量。
1.2 支持向量机技术
支持向量机主要借助于最优化方法来解决机器学习问题,也是克服“维度灾难”和过学习等困难的强有力手段。
1.3 遗传算法技术
该技术能够直接对结构对象进行操作,不存在求导和函数连续性的限定。主要使用了概率化的寻优方法,能自动获取、优化搜索空间与搜索方向的调整,不需要引入确定的规则。
1.4 BP神经网络
其具有很强的非线性映射能力,包含着柔性的网络结构,能够用一个待定的输出向量将它与输入向量联系起来,也能够将输入向量所定义的合适方式进行分类,是当前应用最为广泛的神经网络。
2 基于数据挖掘的在线审计模型的功能实现
2.1 审计风险的降低
在数据挖掘技术的支持下,在线审计模型中的审计对象实现由原有纸质账本转向大量的电子数据,其能够在大数据中挖掘出具备现实价值的信息。通过这样的方式,能够降低人工审计模式中发生信息挖掘不深入、审计结果不全面精准的问题发生概率,达到弱化或消除审计风险的效果。同时,在基于数据挖掘的在线审计模型中,审计人员能够得到一个科学的、量化的结果,为审计决策的合理形成提供支持。此时,大幅减少了在线审计模型自身的风险因素,进一步提升审计的效率与效果。
2.2 审计范围的进一步拓展
基于数据挖掘的在线审计模型在拓展审计数据的涵盖范围方面发挥出了较好的效果,实现了审计工作的全面展开。此时,审计人员能够在线完成数据样本的抽取,结合数据挖掘技术完成异常财务项目的发觉,并落实重点审计,实现任意审计业务项目的迅速定位。通过这样的方式,能够明显降低审计时长与工作任务量。与此同时,审计人员还可以在基于数据挖掘的在线审计模型支持下,完成事前、事中审计以及效益审计,最大程度的发挥出模型准确、迅速的优势,以达到降低审计风险、完成全面审计的效果。
2.3 落实科学的抽样与统计
对于基于数据挖掘的在线审计模型而言,其在实际的审计中主要依托计算机运行,使用了数据化、电子化的审计模式。通过这样的方式,审计人员能够利用模型系统完成高科学性的抽样与统计,保证数据处理的精准迅速。同时,由于引入了数据挖掘相关技术,因此审计资料的审计与分析效率得到进一步提升,总体上达到增强审计效率的作用。
2.4 实现自主学习
对于数据挖掘技术而言,由于其具备自主学习的功能,因此将其引入在线审计模型,能够达到对模型展开动态维护的效果,实现历史数据信息的挖掘,发现数据之间潜在的规律规则、相关模式等,形成功能性更强的在线审计模型。同时,在数据挖掘的支持下,能够在相应模型系统中搭建起审计模型知识库,更好的支持在线审计判断与分析的展开。在审计分析中,常会出现新的数据内容,而数据挖掘能够对其展开动态验证,并将其保存至知识库中。通过这样的方式,能够更好的满足审计信息化的发展需求。
3 基于数据挖掘的在线审计模型的具体设计
基于数据挖掘的在线审计模型总体设计理念为:分行业特点,明确审计模型主题;分析数据审计关系,设计模型内部审计程序;制定模型异常风险分析预警条件;分析 模型所需的数据源,明确技术实现路径。设计的具体内容如下所示:
3.1 原始审计数据的收集与处理
3.1.1 原始数据收集
笔者设计的基于数据挖掘的在线审计模型主要包含原始数据收集、审计数据处理(预处理)、数据挖掘分析、审计处理以及新增审计数据处理。其中,原始数据收集作为第一步骤极为关键,直接影响在线审计的效果与相应模型的实用价值,因此,需要重点数据的全面性。
在这一过程中,需要集成企业中各个生产管理信息系统,或是打破不同信息系统数据接口。同时各业务系统数据完整性也会影响审计模型执行效果和实用性。对系统相关的经分体系数据进行调研,从主要的经分系统及辅助其他相关专业业务系统中收集各项相关的数据,对经营数据进行重新整理和分类,明确数据来源和取数方式等内容,形成多源性的数据采取,建设相应的系统接口,并形成统一的数据接口对外数据提供,方便价值数据共享。
3.1.2 审计数据处理
在收集到的原始数据中,不仅包含着有价值的审计数据信息,还包含大量的噪声信息。为了避免其对审计模型建立与应用造成负面影响,必须要对收集到的原始审计数据展开预处理。此时,利用数据清洗、整理的方法就能够达到提升在线审计数据质量的效果。在审计数据的预处理中,可以对不同审计系统产生的数据展开一致性的处理操作,达到降低数据中的稀疏属性的效果,提升数据计算的复杂性,最终实现审计效率增强的目标。
3.2 数据挖掘分析
在完成原始审计数据的处理后,可以进一步展开数据挖掘分析。在这一过程中,需要引入数据挖掘技术,包括K均值算法、BP神经网络、遗传算法、支持向量机等技术,完成数据集中隐藏关系与模式的获取。例如,在支持向量机技术的应用条件下,在审计财务数据或是经济数据的过程中,能够完成同一类或不同类数据潜在关系的模型建立,包括经营报表、营销报表、生产报表等不同类数据的关系。此时,也可以依托相关的非财逻辑思维惯性完成关系挖掘,通过历年经营数据的趋势分析,揭示被审计单位经营管理情况等,通过对比同行业数据,揭示企业存在的管理短板等,使审计思路不再局限于对企业财务来理合规性,实现审计为企业管理服务的转变。例如,通过挖掘现有车辆数目、养路费用、车辆保险费用之间的关系,就能够获取“是否购置新车”、“是否私建小金库”等信息。
在实际的数据挖掘分析中,离群数据挖掘与分析极为关键,能够在大量的审计数据中发掘与不吻合数据模型的内容。对于财务报表而言,其在形成后能够表现出一定的规律,因此,在完成在线审计后,审计人员即可发掘出数据之间隐藏的异常现象与虚假成分。总体而言,离群数据挖掘与分析在揭示财务舞弊、违法违规操作方面发挥着重要作用。通过描述离群数据,能够显示出异常审计结果,为形成科学决策提供参考。
3.3 审计处理及新增审计数据处理
3.3.1 审计处理
在数据挖掘的支持下,在线审计模型能够完成挖掘训练与学习,此后,即可形成相应的审计决策模型。该模型能够在大量源数据中获取审计结构,并对审计内容展开量化分析及表述。此时,若是审计数据存在问题,能够完成及时处理,并在再分析、解释描述等环节的作用下形成审计新知识,丰富决策库内容,为财务审计、运行决策形成提供便利条件。
3.3.2 新增审计数据处理
对于基于数据挖掘的在线审计模型而言,其运行时数据为动态的,因此,相应的模型必须具备自动学习与维护功能,能够对新数据展开操作与关系分析。基于这样的需求,必须结合数据预处理、数据挖掘分析形成新的审计模型,完成新知识的挖掘。
4 总结
综上所述,为了保证审计的全面性与科学性,设计基于数据挖掘的在线审计模型具有较高的现实价值。在引入现代数据挖掘技术的基础上,通过落实原始数据收集、审计数据处理、数据挖掘分析、审计处理以及新增审计数据处理,实现了在审计模型中增添自主学习与维护功能,提升了审计的效率与效果,也进一步保证了审计结果的全面性、有效性。