APP下载

数据挖掘技术在经济统计中的应用探究

2019-07-14杨胜卫赵璐瑶孟慧芸华北理工大学

消费导刊 2019年29期
关键词:统计人员决策树数据挖掘

杨胜卫 赵璐瑶 孟慧芸华北理工大学

引言:在以往经济统计当中,采用传统的数据处理方式,往往会因数据量较为庞大,而出现数据筛选误差即在统计分析中筛选出虚假数据,故而使得最终的经济统计结果缺乏较高的精准性,数据质量无法得到有效保障。因此需要在经济统计当中,灵活使用数据挖掘技术,通过充分发挥其应有效用,以更好地完成经济统计工作。

一、数据挖掘技术的简要概述

数据挖掘技术简单来说指的就是一种可以从海量信息数据中,快速、精准锁定所需有用信息数据的技术。在未进行数据挖掘之前,虽然信息数据量较为庞大,但其中有许多信息数据并不完整,甚至存在诸多错误信息数据,而通过使用数据挖掘技术,则可以将其中新颖的、有价值的信息数据准确提取出来,通过对此类精心筛选出的信息数据进行深度处理,从而为信息统计工作提供真实可靠的数据支持[1]。

在经济统计当中运用数据挖掘技术,可以帮助统计人员快速从众多未加工的经济数据中,筛选出有价值的统计数据,并对其进行深入处理与再加工,为相关工作人员分析经济形势、判断经济走向、制定经济决策决议等提供重要数据参考。此外,由于数据挖掘技术并不只是一种简单的数据分析工具,其可以深入结合信息使用者的实际需求,特别是在我国经济不断发展下,经济数据信息量骤增,其对于经济统计的要求也越来越高。因此将数据挖掘技术运用在经济统计当中,能够有效保障信息评估的可靠性,实现数据处理成效的进一步优化。在运用数据挖掘技术完成对经济数据的深入挖掘与分析处理下,建立起相应的数据库,可以在更好地融合各种数据信息的基础上,为经济管理活动需求提供高质量服务,从根本上避免出现重复性的统计工作,以有效减轻统计人员的工作负荷。

二、经济统计中数据挖掘技术的应用分析

(一)数据预处理。在将数据挖掘技术运用在经济统计当中时,首先需要对现有的经济数据进行预处理,这主要是由于在经济统计中搜集得到的各种经济数据,属于初始数据,其中混杂着部分错误和虚假数据,以及不完整数据。对经济数据进行预处理,其根本目的在于快速筛出存在于经济数据集当中,与经济统计工作无关的信息数据,只精准提取出经济统计分析所需的重要数据。例如在某地区的经济统计当中,在对该地区历年企业上报的基础经济数据进行集中整理后,可以采用均值法进行经济数据的预处理。即企业上报的基础经济数据中如果有数据点属于空值或是噪声数据,则通过对存在的噪声数据、空值进行均值处理,使用数据库当中该属性全部已知属性均值进行空缺添补,可以有效保障后续经济基础数据挖掘以及统计分析工作的顺利进行,并由此获得具有高精准性的经济统计分析数据。

(二)建立决策树。在完成经济数据的预处理之后,需要建立相应的决策树。具体来说,在经济统计中运用数据挖掘技术,建立决策树时,工作人员首先需要利用训练集完成决策树的初步建立,而后借助专门的决策树算法对建立起的决策树进行简化。此时所建立的模型即为数据输出分析模型,随后经济统计工作人员需要对建立起的决策树进行充分利用,对相关经济数据进行准确分类与深入分析。按照从决策树根本开始逐渐延伸至决策树各枝干部分的顺序,直至数据与既定条件相符合后才可终止分割。值得注意的是,如果同时进行两个分割,且分割点上的数据完全相同,此时将会自动终止分割,即顺利完成决策。如果数据本身无分类属性,但可以继续分割输入的经济数据,则此时需要停止分割[2]。在经济统计当中,可以根据该地区历年企业上报的数据,构建起与各企业相对应的序列模式,通过利用数据挖掘技术对企业预测值进行计算,将企业预测值与企业历年上报的实际经济数据进行对比,由此获得差别率。此后统计人员可以对获得的差别率进行一次分类,如按照差别率的占比大小,依次将其分成A、B、C三类,其中A类差别率在20%以上,B类数据中差别率在10%至20%之间,C类数据中的差别率则不足10%。

(三)进一步调查。在使用数据挖掘技术进行某地区经济统计时,经济统计人员在立足本地区企业历年上报数据的基础上,通过充分结合企业规模变化率以及是否有重大经营事件曾经发生于企业内部,判断此时是否需要继续进行先一步调查分析。具体来说,如果根据数据挖掘结果显示,企业规模变化差异率较大,但并未超过合理范围,则无需进行下一步调查从而获取更加可靠的有效经济信息。如果企业规模变化差异率超过规定值,或是企业规模变化差异率极小,且企业确实曾经发生过重大经营事件,此时需要经济统计人员展开下一步调查分析,从而更加深入地了解企业及本地区存在的经济问题,以便可以制定出更加具有针对性和有效性的经济决策决议,在确保经济统计结果的完整性与可靠性的同时,对企业规模变化差异率进行合理调整,达到帮助企业提高自身核心竞争力,扩大经济效益规模,最终实现推动本地区经济长效发展的目的。

结束语:综上所述,在经济统计中运用数据挖掘技术,不仅有助于实现经济数据资源的有效扩展,同时也可以为判断经济局势与经济发展走向等提供真实可靠的数据支持。因此在实际运用数据挖掘技术进行经济统计分析的过程中,相关工作人员需要有意识地对获取的经济数据进行预处理,并建立起相应的决策树,在完成经济数据科学分类并确定具体调查对象的基础上,对挖掘提取出的有价值的经济数据进行深入统计分析,从而更好地为经济管理活动提供所需服务。

猜你喜欢

统计人员决策树数据挖掘
探讨人工智能与数据挖掘发展趋势
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
基于并行计算的大数据挖掘在电网中的应用
试论如何提高财政局统计人员的素质与能力
基于决策树的出租车乘客出行目的识别
一种基于Hadoop的大数据挖掘云服务及应用
试分析街道基层统计工作的存在问题和对策
基于肺癌CT的决策树模型在肺癌诊断中的应用
提高统计分析水平始于提高统计人员素质