数据挖掘技术在财务风险预警中的应用
2021-01-02李成锋黄康梅
李成锋 黄康梅 贾 男
(1.中海油能源发展股份有限公司湛江采油服务文昌分公司,广东 湛江 524000;2.广东医科大学附属医院;广东 湛江 524000;3.中海油能源发展股份有限公司采油服务分公司,天津 300452)
企业发展处于复杂的市场环境体系之下,导致企业发展面临很多不确定因素,这些不确定性会引发企业财务风险,如果缺乏科学的财务风险预警系统,不仅很难有效规避财务风险,还会对企业的生产经营造成损失。而数据挖掘技术可以在广泛收集影响财务相关因素指标的基础上,通过数学方法对财务指标进行自动分析,这样既避免了传统财务风险数据计算、收集的弊端,又简化财务指标计算程序,提高数据处理效率,对形成科学的财务风险预警系统具有重要的意义。
一、数据挖掘技术的应用及企业财务风险概述
1.数据挖掘技术的应用现状
数据挖掘技术是一项综合的技术,是多项技术辅助而诞生的,思想理论的诞生源于统计学,数据挖掘技术指的是使用人工智能技术、数据库技术以及统计学原理等来完成的数据收集、收据分析的过程。数据挖掘技术的主要目的是发现和目标群体切合的数据,找到这些数据之间存在的规律,然后将其运用到日常工作、生产等环节,以此减少风险的发生。从数据挖掘技术的工作原理来看,可以将数据挖掘技术看作是一项数据处理技术,这种技术离不开计算机技术的辅助和应用。
数据挖掘技术研究起步较晚,最早产生于1989年,是一项现代化的新型技术,之后在研究的过程中经常将数据挖掘技术和知识发现紧密的联系在一起,在经过相关学者的研究之后,发现数据挖掘技术就是一个发现新规则、新知识的过程,因此又将其命名为知识发现。数据挖掘是指在纷杂数据中提取有效数据,发现数据之间本质联系的过程,这个过程的出现是有前奏铺垫的,它首先是要收集有效的数据;然后针对有效数据的类型特点,对数据库中的数据进行筛选、清理,去除不相关的数据,将收集好的有效数据转变成为所要挖掘的数据类型;接着再找到适合转化后数据类型的挖掘技术;最后通过相应的分析方式找到数据之间存在的关系。随着数据挖掘技术的实践水平不断提高,关联规则数据挖掘技术方法、时间序列数据挖掘技术方法、聚类算法数据挖掘技术方法等常用的数据挖掘技术方法被广泛的应用到具体的工作中,为提高工作效率和工作质量提供了有利条件。
2.企业财务风险的相关概述
处于复杂竞争环境的企业面临的影响可能有积极影响,也可能有消极影响,积极的影响促进企业的发展,但是消极的影响会使企业经营面临各种风险,如果不对其进行风险管控,有效的规避市场中存在的风险状况,就会严重影响企业的发展。企业财务状况作为企业发展经营的风向标,能够反映企业经营发展的综合情况,对企业经营决策和发展战略制定都有重要的引导作用,因此加强企业财务风险管控具有重要的实践意义。
企业在财务风险的管控中通常采用财务指标、财务报表、专家意见等传统方法来完成企业财务风险分析,其中财务报表分析方法是最常用的一种风险分析方法,由于会计的日常工作中会涉及大量的财务报表信息,这些信息的收集和处理是会计的日常工作,贯穿于企业的整个发展过程,内容详细,提供的数据准确,这种分析方法能够通过报表数据提供有价值的信息,进而实现对企业财务风险的管控。指标分析法指的是运用企业中的综合数据形成的一种数据分析方法,主要有企业财务数据、企业业务数据、企业统计数据等,是企业财务分析方法的进一步升级,能够更全面的了解、分析财务中的各项数据,比如营运能力中的流动资金周转天数、流动资产周转率、存款周转率等,还有偿债能力、盈利能力、净资产收益等指标的分析,数据繁多,但是分析具有全面性、综合性。但是这些传统的分析方法,一方面,数据量较大,工作分析任务大;另一方面,对财务风险的预测并不基于客观事实,受管理者认知模式的影响较大,而融入数据挖掘技术进行的财务风险分析方法,改变了传统数据分析方法的弊端,不仅减少了工作压力和人工参与,而且大大提高了数据的准确性,为更好地制定企业发展政策,预防财务风险的发生提供有利条件。
二、财务风险预警指标体系
数据挖掘技术的使用前提是进行数据类型的确定以及有效数据搜集,因此首要问题是建立数据收集的目标体系,即财务风险预警指标体系。财务指标的选择应以企业发展中常用的财务评价指标为主,以此构建能够客观反映常用财务指标的财务比率,财务预警指标体系中也是主要根据财务指标的财务比率实现的数据预测,通过企业平时的业务经营状况体现的财务指标的财务比率来进行分析,这种分析能够找到企业各个数据在发展过程中存在的本质联系,然后能够通过这种规律性的联系,找到相应的规律,为企业制定可行的风险预警策略。但是这种建立在原有数据上的没有考虑到市场动态的运行情况以及企业受市场影响的发展情况,因此这种数据分析方法具有局限性,仅仅适用于受市场发展变化较小的企业的数据分析。为了为企业提供更为客观的参考数据,应科学地选择财务指标,并将市场的动态发展因素考虑在内,为企业制定出客观、有效的运行政策提供有价值的数据参考。
财务风险预警指标体系应和企业的生产经营活动紧密相连,因此指标体系的构成应包括企业的偿债能力预警、运营能力预警、营运能力预警、获利能力预警、资金结构预警、现金流量预警等,其中偿还债务能力预警系统对企业财务风险影响最大,首先,企业要具备偿还债务的能力,才能保障企业安全运行,持续为经营目标运转。因此,预警体系中企业偿还债务数据的分析应是考虑的首要因素,主要包括资金流动比例、存货流动负债比率、债务资本比率等。其次,是企业运行能力的预警。企业的运营能力是企业发展的动力,查看企业资金运营动向、周转速度等,这些能力对企业获利具有重要的影响,主要包括固定资产周转率、资产周转率等,总之这些预警体系的构建为挖掘技术的使用提供了数据分析方向,提供了数据收集类型,为使用数据挖掘技术提供有利条件。
三、数据挖掘技术在财务风险预警中的应用方法
1.基于数据挖掘技术关联规则的财务风险预警应用
关联数据挖掘技术主要是探索事物之间的有效关联性,通过关联性找到事物中存在的本质性的联系,但是这种数据搜集有限定的范围,即对进行同一项目前提下进行的数据关系的探索,主要包括两个方面的数据挖掘内容,一方面,是有效数据的搜集,即频繁项集的产生,通过设置最小阀值来搜集有效的数据;另一方面,是通过上一步提供的数据支持来寻找数据之间存在的本质性联系,即关联规则。关于上述两方面数据挖掘的内容,有效数据的收集是前提,在具体的收集中一般采用格结构来完成,在进行数据收集的过程中,将收集目标设置为d,并作为数据收集标准来完成收集,收集的过程中会产生2d个频繁出现的数据,这些数据之间会产生多种规则体系,多种规则体系用R来代替,进而构建出数据之间存在的关系。
数据挖掘技术中发现数据项集是数据处理的前提,所以在设置好目标数据之后,需要在数据结构中进行和目标数据有关联数据的分析,并确定这些关联的数据的有效性。为了减少庞大数据量的产生,通常会采用减少支持度、数据采集量来简化计算过程,但是尽管如此,也会存在一种数据项集本身具有繁杂属性的数据模型,在这种情况下和其具有关联的数据也是复杂的,会构成对应的复杂的关联体系。比如数据收集的标准被设置为包含有c、d、e三种数据项集,那么不管是包含其中的子元素还是其中构成的复合元素都是有效的数据,而如果是非频繁的数据项集,比如设定e、f为非频繁的数据项集,那么其中包含e、f的项集将会被裁剪。通过上述方式形成候选模式数据挖掘方法以及增长模式数据挖掘方法,以此对财务中存在的关联属性强烈的数据进行分析,排除关联性较低的财务数据分析,被广泛的应用到企业财务风险的预测中,尤其是金融领域、商品零售领域等,用来进行渠道分析,进而建立财务风险预警模型。
2.基于数据挖掘技术时间序列的财务风险预警应用
时间序列的数据挖掘技术指的是利用数据中存在的时间属性来进行数据关系之间的探索,进行数据采集的标准是以时间作为数据收集的切入点进行大量有效数据的收集,进而为提供可行性的决策办法提供数据参考。时间序列数据挖掘技术的应用特点是以时间为轴心,对不同时间点上的数据进行收集、分析,然后按照数据发生的时间顺序来生成数据列表,进而为行业制定政策提供相应的数据参考。数据时间挖掘技术中对时间标准的定性具有差异性,这种差异性主要是由于不同企业的业务经营性质、经营属性不同而产生的不同的时间序列行为,比如股票数据的搜集时间动向标准点主要为连续的时间数据截取;天气预报数据的搜集时间动向标准点为多元时间数据截取;超市进行的数据收集多为某一个具体时间段的销售数据截取,在进行数据挖掘技术的使用中将变化的时间点设置为t,然后进行不同时间点的数据统计,即t1、t2、t3直到tn的时间段截取,接着在对应的具体时间段下进行相应数据的提取,设置为Yt1、Yt2、Yt3直到Ytn,其中Yt为时间序列,序列具有不同的时间属性和所研究事物的属性来选择具体的研究方法,主要包括多变量时间和单变量时间两种预测方法,其中多变量时间预测主要通过建立时间模型来进行数据挖掘,单变量时间预测主要包括随机时间、传统固定时间两种预测方法,模型构建主要包括循环变动、季节变动、长期趋势变动等数据模型。由于时间挖掘技术的运用是动态环境的提取,因此对复杂市场变化情况的数据提取具有重要的参考价值,尤其是对股票市场、企业营销计划等方面能够做出客观的分析,对规避企业财务风险具有重要的意义。
3.基于数据挖掘技术改进型模糊神经网络财务风险预警应用
随着计算机技术的深入发展,数据挖掘技术可以利用计算机技术以及统计学的应用来完成数据挖掘工作,比如改进型模糊神经网络的数据挖掘技术,主要的应用原理是通过建立财务指标的方式来完成数据挖掘技术,由于企业经营状况的不同,所以财务指标的获取具有差异性,因此财务指标的确定主要依靠统计方法、人工方法来制定财务指标,需要注意的是财务指标的选择要和企业的具体经营状况具有高度的匹配性。神经网络数据挖掘技术具有丰富的推广能力,而且神经网络设置非常丰富,具有很高的兼容性,能够实现对不同环境、不同时间段的数据搜集工作,所以能够对企业提出针对性的预警措施。
模糊神经网络的数据挖掘技术使用的数据处理方法为粗糙即属性约简的处理方法,主要包括两个方面,一方面,进行数据筛选工作,通过运用粗糙集理论和统计方法来对输入的数据进行简化处理;另一方面,利用模糊神经网络进行数据处理并完成财务风险预警。其中对于数据的筛选工作至关重要,为了让计算机工作更为便捷,尤其是当前数据获取越来越便利的情况下,将有效的数据进行简约转换,让人们熟知,更方便地理解数据显得尤为重要。粗糙的处理方法主要包括信息系统和决策、属性的核算、约简的选取等数据处理过程,通过这些数据梳理选择n个合理的数据元素,然后构建模糊神经网络,形成财务风险预警系统。该方法目前在保险类型业务具有重大实践意义。
4.基于数据挖掘技术聚类算法的财务风险预警应用
数据挖掘技术聚类算法就是通过将类似的数据搜集在一起进行的数据处理方法,由于是分类别的数据收集,因此在所构成的数据组合下,这些数据具有高度的相似性,折射到具体的应用中,可以对所聚集起来的类似的数据进行统一应用。聚类分析的模式识别不仅仅是进行数据的识别,通过对数据进行归类,还包括对图像、模式、市场研究等识别,总之数据挖掘技术聚类算法就是对数据进行的具体分类,然后对分好类的数据进行处理的一种数据挖掘应用方法,比如将被研究的财务数据样本定义为数据E,将A定义为和它具有相同属性的一个子集,然后A在E数据之下,但是并不在D数据之下,和D数据没有相同的分类属性,但是在之后的模糊理论的影响下,数据的范围逐渐扩大。折射到财务预警系统的构建和应用中,聚类数据挖掘方式能够识别多种类型的数据,比如图形、密度空间、大小等多类型的数据,当前企业所面对的数据类型日益复杂,通过聚类数据挖掘方法的应用能减少数据搜集、处理的难度,对客观的反映企业财务信息,制定客观的财务处理措施具有重要的意义。
5.基于数据技挖掘术双向加权模糊支持向量机财务风险预警应用
财务风险预警本就是针对未知发生的事件进行预测,在这些未知因素中有些因素是无法确定的,是没办法进行实际考量的,而一些因素通过数据分析,发现是既定发生的,但是在进行风险预测过程中也会存在不发生的比例,通过对未知风险和已知风险进行对比,从而为未知样本找到预警类别,主要采用SVM方法来完成财务数据的计算,SVM方法中主要包括块算法、固定样本收集两种方法,其中块算法排除了非支持向量,通过对样本中的非支持项量进行优化,进而实现风险样本的预测,但是随着处理的数据较多,这种计算方法难度较大,因此在数据挖掘技术中会采用固定样本集进行数据的整合优化,大大的提高运算效率,在对财务预警系统的构建中,可以通过对财务数据中的具体财务指标,比如资产营运资产率、利润总额、速动比例、主营业务收入增长率等财务指标采用双向加权模糊支持向量的数据挖掘技术进行数据分析,通过因素集、评判集、权重向量来进行综合评判,进而实现对财务指标的风险预测。
四、结语
由于数据挖掘技术能够全面的收集企业在市场经济环境中的相关数据,对财务指标中的数据以关联、时间、聚类等数据处理技术进行数据分析,所以能够综合的反映企业的经营发展状况,从财务的角度来有效地规避市场经营风险。此外还因为财务指标数据呈现方式不同,企业经营业务类型不同,所以数据挖掘技术的应用方式不同,比如对于金融行业财务风险预测应以时间序列数据挖掘技术处理方式,复杂的数据应选择模糊神经网络数据挖掘技术等。我们在应用数据挖掘技术构建风险预测模型时,应仔细分析数据应用场景,选择合理的数据挖掘技术为构建科学的财务风险预警系统提供有效支撑。