数据挖掘技术在经济统计中的应用
2021-01-17农林东营市统计局
农林 东营市统计局
数据挖掘技术是近些年出现的一种新型经济统计分析方法,虽然该技术的某些使用性能仍需改进,但目前其应用已对高效经济统计产生了积极作用。数据挖掘技术的稳定性、高效准确性能让工作人员更轻松地完成相关工作,深入分析数据,总结更多对经济分析有价值的信息,提高其在经济统计中的应用价值。
一、数据挖掘技术的重要性
数据挖掘是指更深层次地评估分析收集的信息数据,总结可以用于指导实际工作的信息资料。在经济统计中,由于经济数据信息量庞大,且各种信息数据之间具有复杂的关联性,数据来源具有一定的不确定性,有时无法提供全面准确的数据资料。面对这些未经处理的数据信息,如果不能对其进行有效分析,将无法发挥这些数据的重要价值。利用数据挖掘技术,对其展开深层次的评估分析,去除不确定的数据信息,能为后期的工作提供可信赖的数据资料,使工作人员更加快捷高效地利用资源。数据挖掘还有另一种含义,即将实际经济数据与结论对比参考,以制定更加符合经济发展规律的决策。
在数据化时代背景下,应用数据挖掘能使经济统计中的具体问题信息化。该过程对各学科的技术要求较高,主要内容有开展相关技术准备工作、建立数据库的基本理论、识别各类数据信息、快捷统计分析及总结数据、预估潜在数据价值、预判某些风险因素、明确呈现重要数据信息,更好地发挥经济统计的重要作用。在很多地区经济管理部门的管理方式与统计模式都比较传统,难以为经济管理活动提供服务。在实际运用过程中,对数据统计工作造成了很大的影响,导致工作效率低下,工作质量不高,甚至影响数据统计工作的整体进步。
二、数据挖掘技术在经济统计中的应用.
只有合理分析有价值的数据信息,才能得出更符合经济规律的结论。在数据信息搜集环节,受各种因素的影响,可能导致数据信息不准确,数据中包含与经济基本规律相违背的内容。在经济统计中,数据的预处理极为关键,也是数据挖掘技术在经济统计中应用的重要表现,具体包含以下内容。
(一)数据清理
数据清理是经济统计分析过程中常用的技术手段,其能完善数据信息欠缺的资料,去除与实际经济情况相差较大及与经济规律相违背的内容,提高收集数据内容的整体质量。目前,广泛使用的技术方式为均值法、平滑分析法、数据预估法以及概率统计分析。这些方法需要结合经济统计的实际情况使用。对于干扰数据或数据信息不完整的情况,一般使用均值法或数据预估方法。平滑分析法是在均值法的基础上平均一定的数据,然后再将其形成一组新的数据。例如,在统计企业产值时,企业未提供年度经营数据信息,此时就可以使用数据预估及均值法,汇总企业近五年的数据,再求均值,进而预估企业本年度的实际经营情况,得出与企业实际经营相符合的经济统计结果。
(二)在数据挖掘技术中集成化处理应用
(1)模式集成。在模式集成过程中,需要将数据信息与实际的经济问题相对应,同时分类汇总各种数据格式,要求系统能自主地分析判断上述内容。例如,一些统计单位提供的数据格式为“stcl_id”,在现有的数据库中并未包含此格式的内容,这就要求系统能分析其所包含的数据信息,总结其数据特点并将其集成于现有的数据格式中,实现对多样化格式数据的有效处理。避免后期分析数据时,出现资料无法打开或缺失现象。
(2)冗余问题。如果一组数据信息的结果会对另一组数据产生明显影响,那么该组数据就具有冗余属性。常见的生产总值就具有明显的冗余属性,其数据特性受国家总人口及经济发展价值的影响。因此,在经济统计中,可以通过对具有该属性的数据进行相关联信息分析,合理预估经济发展中难以统计的数据,达到经济统计的目的。
(三)数据挖掘技术中运用预处理方法
数据挖掘的方式有很多种,其中预处理方法是比较基础的一种方法,是数据发掘前的收集工作。数据挖掘技术需要在基础信息的前提下进行整理和分析,但是基础信息的收集并不在其工作范围内,这就需要一种收集方式来弥补数据挖掘的前瞻内容,而预处理方法恰恰可以做到这一点,所以预处理方法是数据挖掘的前提,从而没有办法代替预处理方式的功能。预处理方法可以将信息中的出入较大、不正确的内容剔除,这种处理方式叫作数据清理。数据清理有很多种形式,比较常见的是均值法。均值法可以将数据有效地填入空缺的数据中去,对数据挖掘起到很重要的作用。预处理方式以及数据清理方式中的均值法都是有效帮助数据挖掘的方法,通过具体的操作来提高数据的准确性。
(四)数据挖掘技术的关联规则
数据挖掘技术的关联规则十分关键。在实际应用环节,其可以整合分析与数据信息相关的属性,合理反映整个数据的特性。例如,在规律查找数据系统信息与各数据之间的因果关系时,往往能发现传统经济统计的常见问题。使用关联规则进行经济统计,可以在更大范围内搜集信息资料,并实现全面的数据处理。根据行业内某一属性的具体信息搜集与该属性相关的其他重要数据资料。在经济统计的实际应用中,数据挖掘可以合理评估数据信息的准确性与质量,在此基础上,关联规则能确定这些数据是否具有一致性,并准确筛选错误信息,提高经济统计数据质量。例如,在统计某些省份的生产总值时,发现各产业的数据信息不足以证明其生产总值有一定的增长,然而该省份提供的生产总值数据明显高于前一年的数据,此时应用关联规则,能发现员工统计疏忽或地方数据信息造假而导致的失误信息。
三、结束语
综上所述,数据挖掘技术不仅可以使得数据变得更加有深度和广度,还可以使得数据更加准确,出现虚假数据内容的概率缩小,改善数据质量,另一方面还可以深层次地挖掘数据之间的联系,可以有效提高数据关联度,从而使得数据信息更加准确。