APP下载

数据挖掘技术在经济统计中的应用分析

2021-04-04胡凯歌

信息记录材料 2021年2期
关键词:决策树数据挖掘分类

胡凯歌

(太原学院财经系 山西 太原 030032)

1 引言

我国市场经济处于稳步提升的状况,逐年呈现爆炸性增长态势,经济统计数据库拥有庞大规模的数据,经济市场的繁荣景象必定会增加经济数据信息变得更加繁杂,经济市场对于经济统计工作的高效与准确自然提出了更高的要求。因此,如何提升经济统计的整体水平,创新经济统计的方法与模式,已然成为我国经济统计相关部门不断探索的重点。数据挖掘技术的出现为经济统计工作带来了新的领航方向,可以对经济统计工作中涉及到的海量数据进行资源整合,并且可以在最快时间内准确地挖掘、分析、选择出对经济统计工作有价值的数据信息,从而使数据的质量得到提高,获取信息也更加广泛与准确[1]。由此可以看出数据挖掘技术在经济统计中占比越来越高,值得我们给予充分的关注与重视。

2 数据挖掘技术概述

数据挖掘是数据库与人工智能领域的研究重点,又被称之为数据库中的知识发现,是一门多学科交叉的技术。所谓数据挖掘,即是从模糊、随机的海量实际应用数据中提取、挖掘出对人们具有一定价值数据的过程,主要基于人工智能、模式识别、可视化技术、统计学、神经网络等。数据挖掘技术简单来说就是一种从大量繁冗的数据出提取出有价值信息的一种技术手段,可以对相关数据进行自动化、智能化的分析,并进行整合、归纳与推理,可以为企业的决策者提供科学的数据依据,帮助其及时调整市场经营策略,做出正确决策[2]。

由于经济统计领域的数据复杂性,目前数据挖掘技术在该领域已经有了较为广泛的应用,可以帮助从事经济统计的相关工作人员在获取数据信息方面更加便捷,将大量数据进行不同层次的处理,使之转换为有价值的数据信息,可以打破原始数据随机性、模糊性的制约。

3 数据挖掘技术在经济统计中的应用优势

数据挖掘技可以为经济统计带来诸多的优势,经济统计与其他领域工作不同,涉及大量的金钱数据交易,在经济统计工作中,会涉及到一些企业商业机密,因此在经济统计工作方面进行信息数据安全管理非常重要。数据挖掘包含数据的清理、变化、挖掘实施、模式评估等共计八个步骤,属于一个反复循环的过程,每一个步骤达到预期目标后系统才会执行下一个步骤,在这个过程中可以保证数据信息的保密性[3]。依托于数据挖掘技术的保密性,可以有效地保证经济数据统计所有环节中的安全性,避免数据分析中的潜在隐患带来不必要的麻烦。此外,利用数据挖掘技术作为数据库技术,还可以实现对经济信息存储的持久性与长期性,便于后期经济统计工作所需数据的调动与管理;数据挖掘技术具备较强的搜索与预测功能,其依托于信息技术手段对数据信息进行相关分析,不仅可以避免传统人工检索中容易丢失信息的问题,还具有人工信息检索无法实现的信息采集效率与速度,可以使工作人员快速、准确地获取到一手经济信息,实现对经济信息发展趋势的预测。

4 数据挖掘技术在经济统计中的具体应用

数据挖掘技术可以从规模庞大的原始数据中准确地挖掘出具有价值性和真实性的数据,还可以对这些数据进行分析与处理,使其具有应用价值。随着数据挖掘技术自身的不断创新与完善,在经济统计中的应用也逐渐广泛,以下针对较为典型的应用进行简单分析。

4.1 经济信息数据预处理

数据挖掘技术应用于经济统计中,第一步需要进行的是对数据进行分类、整合和处理。由于经济数据的复杂性,在对有用数据进行分析和研究之前,必须剔除其中的无用数据,因此,需要通过数据挖掘技术对数据信息进行分类和预处理。数据挖掘技术只是经济数据统计处理的初级阶段,而不是经济统计的全部工作,只能用计算机系统对经济数据进行分类和管理,因此,需要采用回归法、分箱法、聚类法等数据清理方法对数据进行清理,并对异常数据进行处理,实现经济信息数据的整合与预处理[4]。

4.2 决策树方法应用

数据挖掘技术可以对原始数据进行分析和输出便于用户使用的数据信息。输出数据的有效形式可以用决策树来表示。决策树方法在数据挖掘中是非常有效的,可以实现数据资料直观快速查找,因此有必要建立决策树,实现决策树方法的有效应用。首先对输出数据的信息进行决策树排序和分类,然后用树形图表示输出数据的信息。决策树可以建立一个清晰的系统,对数据进行分类和排序,准确地提取用户需要的信息。当决策树中的数据进行多次分类时,最终目标是完成标记决策树的数据分布。决策树构建完成后,还需根据具体的统计需求对决策树进行修剪,删除对应急统计没有帮助的数据,确保所有分析数据对当前的经济统计有所帮助。

5 结语

为了更好地利用数据挖掘技术进行经济统计工作,为经济统计工作带来一定的优势,需要正确认识到数据挖掘技术的概念与特征,强化对数据挖掘技术的认知,加强应用力度,这样才能实现经济统计信息数据的有效提供与分析,改善经济统计的工作质量与效率,推动市场经济的稳定发展。

猜你喜欢

决策树数据挖掘分类
分类算一算
探讨人工智能与数据挖掘发展趋势
一种针对不均衡数据集的SVM决策树算法
分类讨论求坐标
决策树和随机森林方法在管理决策中的应用
数据分析中的分类讨论
教你一招:数的分类
基于并行计算的大数据挖掘在电网中的应用
基于决策树的出租车乘客出行目的识别
一种基于Hadoop的大数据挖掘云服务及应用