APP下载

数据挖掘技术在现代审计中的应用研究

2015-06-15胡珊珊

老区建设 2015年8期
关键词:数据挖掘人员系统

胡珊珊

数据挖掘技术在现代审计中的应用研究

胡珊珊

[提要]随着信息技术的发展和网络的广泛普及,审计数据和网络数据以惊人的速度增长。审计过程中利用计算机技术的程度越来越高,审计人员面对大量的财务数据或非财务数据。在审计系统中引入数据挖掘技术,显示出了巨大的优势,本文介绍了审计中引用数据挖掘技术的程序和方法,并指出了这一技术应用于现代审计中的一些局限。

数据挖掘;审计;技术

随着经济的发展,企业活动的日益错综复杂,交易数量的庞大对各项交易进行记录、分析的过程如果仍然依靠手工操作,会导致工作效率严重低下,并且工作成本大大增加。与此同时,随着计算机技术和网络的普及,人工智能系统已经被引入企业管理,如供应链管理系统(SCM)和企业资源计划系统(ERP),这些系统使企业的众多交易活动都可以通过计算机实时在线录入,形成大量的数据,现代审计面临着数据库中的海量数据,如何从中寻找出一定的数据特征,发现可疑数据,以提高审计效率和降低审计风险,是审计人员面临的崭新课题。

一、数据挖掘技术在现代审计中的应用

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的但又是潜在的信息和知识过程。这一概念要求数据源必须是真实的、海量的、有噪声的。数据挖掘是一个完整的过程,该过程从大型数据库中挖掘先前未知的、有效的且可用的信息,并利用这些信息做出决策或者丰富知识。

数据挖掘改变了审计实践的方式。由于信息技术的普及,很多企业引入人工智能系统,这些系统使企业的众多交易活动都可以实时在线录入,各种事件包含大量会计数据和经营管理数据。审计人员通过对数据的分析获得审计线索,获取有用的审计证据,并发表适当的审计意见。数据挖掘可以从大量的数据中发现隐藏于数据中的新的或者不可预见的模式,可以回答审计人员可能根本没有想过的问题。

在审计过程中运用数据挖掘技术的基本思路是这样的:首先接受日志收集信息系统各部件提交的统一格式的审计数据,然后对这些数据进行预处理,比如转换格式、数字提炼等。接下来运用合适的数据挖掘算法对审计数据进行处理,提取数据中隐藏的知识,并对实践进行统计。最后系统地进行审计数据的分析处理及趋势预测。

目前应用于现代审计业务的数据挖掘技术主要有以下几种方法:

(一)离群点挖掘

离群点挖掘是从大量复杂的数据中挖掘出存在于小部分异常数据中新颖的、与常规数据模式显著不同的数据模式。利用离群点挖掘,一方面可以对审计数据进行有效的预处理,减少审计数据量,快速定位数据,从而提高审计效率;另一方面可以自动的从数据中提取难以发现的业务模式和管理模式行为,减少人工参与,减轻审计人员工作负担。

(二)孤立点检测

孤立点是在数据源中与众不同的数据,使人怀疑这些数据并非随机偏差,而是产生于完全不同的机制。由于审计中可疑数据往往表现为孤立点,所以通过检测并去除数据源中的孤立点可以达到数据清理的目的,从而提高数据质量,以达到审计目的。

(三)异常点检测

异常点检测是数据挖掘技术中重要的研究内容。它是从大量审计数据对象中挖掘少量具有异常行为模式的数据对象,很多情况下,这些审计数据对象包含了跟多审计人员感兴趣的信息。

本文将匹配度计算定义为正向匹配度和反向匹配度。反向匹配度是本文提出的一种新的计算匹配度的度量方法。正匹配度和反匹配度主要计算检索时检索的关键词与知识库记录标题的匹配程度。知识检索时,检索关键词与知识库记录的标题在很大程度上能反映整个记录的主题,所以匹配度的计算是非常必要的。

(四)聚类分析

数据聚类是将审计资料数据中较为接近的数据划为一类,根据不同数据的特征,将对象分成几个群体。聚类分析可应用于控制测试阶段,为测试各控制环节的执行情况将具有相似特征的交易分组。继而更有利于审计人员对相似数据进行分析、挖掘。

(五)关联规则

关联规则发现是通过分析资料,找出某一事件或资料中会同时出现的东西。关联规则挖掘用于发现大量数据集合间有意义的关联,它侧重于数据中不同领域之间的联系。审计信息系统运用关联规则提取数据之间的联系,能有效的分析经济业务中数据的相关性,从而使审计人员更准确的发现数据之间的联系。

随着信息技术的迅猛发展和审计实践的变化,这些技术还在实践中不断的完善和发展,将来必定有更多更有用的数据挖掘方法应用于审计实践。

二、数据挖掘技术应用于现代审计工作的意义

随着信息技术的发展和网络的广泛普及,审计数据和网络数据以惊人的速度增长。审计过程中利用计算机技术的程度越来越高,很多大型组织已经建立并运行着特大数量级的应用数据库,并积累了大量的历史数据。审计人员面对的也不再是纸质的会计资料,每一个被审计单位的计算机系统和网络系统中都存在着大量的财务数据或非财务数据。在审计系统中引入数据挖掘技术,显示出了巨大的优势,尤其是在大规模网络环境下进行的数据挖掘,不但可以提高系统的运行效率,还能增强系统的智能性。

数据挖掘作为一种新兴的技术,与以往的单纯的统计方法相比,其优势在于它能从数据中发现人们未知的知识和规律。我们引入数据挖掘技术的目的是建立一种系统化和自动化的创建入侵检测系统的方法,这种方法采用以数据为中心的视点,将入侵检测视为一个数据分析过程。这种方法符合现代审计的需要,其核心是将数据挖掘技术应用于审计数据,从中分别提炼出正常和入侵情况下的用户行为模式,再由生成的模式库匹配入侵检测系统所采集到的数据以捕获网络入侵。它不仅可以处理大规模的数据,而且不需要审计人员提供主观评价信息,这种技术能发现容易被审计人员主观忽视和隐藏的信息,有利于避免有价值的线索被人为的主观因素所忽略的情况。

三、数据挖掘技术应用的局限性

数据挖掘技术在西方审计中还处于初级阶段,它的应用还有一定的局限性。

1.数据质量难以保证

数据挖掘技术的基础在于数据本身的质量,如果数据本身是虚假的、错误的,特别是作为审计对象的那些数据如果被审计单位篡改了,那么再先进、再成熟的数据挖掘技术也无法得出有意义的结论。

2.使用成本高

数据挖掘技术要应用于实际工作中,必须要产生相应的数据编制成本、维护成本、分析成本和人员培训成本,一些数据软件的成本费用更是高的惊人。成本因素也是数据挖掘技术应用于审计工作中的一个局限。

3.对审计人员的素质要求高

由于审计数据特征和测度是根据建模者的经验和知识选择的,因此数据挖掘技术要真正应用到现代审计工作中来,不仅需要审计人员具有丰富的审计理论知识和实践经验,而且还要求他们掌握计算机的专业知识,熟悉数据库和数据挖掘的技能。他们不仅要能识别、运用挖掘技术,而且还要对结果做出有效的分析和评价。

四、结论

尽管数据挖掘技术应用于现代审计技术还处于初级阶段,但它的巨大优势是传统审计方法无可比拟的,相信在不久的将来随着审计人员技术水平的提高和对数据挖掘技术研究的深入,数据挖掘技术必定将在现代审计中有更广阔的应用前景。

[1]李博罗,良辰.中观信息系统审计风险控制体系研究[J].审计研究,2013,(11).

[2]曾德胜澎灿明.基于数据挖掘的审计系统研究[J].长春工程学院学报:自然科学版2011,(1).

[责任编辑:程文燕]

胡珊珊(1982-),女,江西经济管理干部学院讲师、审计师、硕士,研究方向为审计。(江西南昌330000)

猜你喜欢

数据挖掘人员系统
Smartflower POP 一体式光伏系统
改进支持向量机在特征数据挖掘中的智能应用
WJ-700无人机系统
探讨人工智能与数据挖掘发展趋势
品“助读系统”之妙
基于事故数据挖掘的AEB路口测试场景
直扩系统中的窄带干扰抑制
直扩系统中的窄带干扰抑制
软件工程领域中的异常数据挖掘算法
再来一次,这太有趣了!