略谈数据挖掘技术在经济统计中的应用
2020-02-28田长磊
田长磊
(山东省济宁市汶上县统计局,山东 济宁 272500)
对经济统计工作来讲,需要对数据信息进行有效的收集和整合,但由于数据存在一定的不完整性和模糊性,使得经济统计工作的质量受到严重影响。为了对其进行有效的改变,需要将数据挖掘技术引入其中。本文从以下方面对其进行详细的阐述。此次研究对丰富数据挖掘技术方面的知识具有理论性意义。
1 数据挖掘技术的简述
1.1 数据挖掘技术内涵
数据挖掘指的是数据的深加工,即数据信息精细化处理的过程。数据挖掘技术的作用体现在,对大量的数据进行深层次的开发,并在数据库中整理自身需要的数据,同时,将零散数据进行完整化处理。由于数据的随机性和噪声性相对突出,因此,使模糊数据出现概率明显增加。在数据挖掘技术的基础上,能够对数据中的可用信息进行深度挖掘,并进行有效的提取和整理,从而使数据的清晰度和实用性得到显著的提升。为了使数据挖掘技术能够对信息进行有效处理,需在经济数据转换的基础上进行,并利用统计学、神经网络学等技术进行有效的辅助,因此,数据挖掘技术是学科交叉技术的一种。在统计学科中应用数据挖掘技术,可以对数据进行有效的统计分析,这样不仅可以使数据分析效率得到显著的提升,而且能够使数据分析过程得到明显的简化。
1.2 数据挖掘技术的特点
数据挖掘技术的特点主要体现在以下方面:第一,有效信息包含在数据本身之中,但是会被其他数据信息所隐藏。因此,在对数据挖掘技术进行使用时,其需要对海量信息进行处理,一般情况下,利用TB或GB对大数据进行表示;第二,当数据库构建完成之后,利用关联词的方式来对有用数据进行搜索,这样不仅可以使自身所需信息被有效找到,而且可以使搜索范围被有效缩小,从而使数据收集的效率显著提升;第三,随着经济社会信息的不断扩充,信息库中储存的信息量也随之增加。因此,信息库需要对容量进行不断的扩大,这样可以使生产信息的需求得到满足。除此之外,为了让使用者对所需信息进行快速找寻,需要对信息搜索的精准性进行有效的提升。
1.3 数据挖掘技术的优势
数据挖掘技术的优势主要体现在以下方面:第一,其能够对海量信息进行有效处理,从而使工作效率得到明显提升。数据挖掘技术能够对大量数据信息进行快速处理,在经济统计工作中应用数据挖掘技术,可以使其工作效率得到明显的提高。另外,面对复杂程度较高的海量数据信息时,数据挖掘技术能够对其进行有效的整合,工作人员在数据规律的基础之上,对其进行有效的深度分析;第二,对搜索和实时预测进行有效支持,为市场决策提供一定的协助作用。在数据挖掘技术的基础上,使用者可以通过关键词输入的方式来完成联想搜索,这样可以使搜索信息的速度明显提升,以此来使工作效率得到大幅度的提高。与此同时,相关统计人员可以对信息进行有效的分析和整合,并对其存在的关联性进行有效构建,从而来合理预测未来经济的发展趋势;第三,综合性相对较强,能够对多方经济工作进行有效的协调。数据挖掘技术能够对复杂、乱序的信息进行有效整合,使其能够转换成有效信息,这样可以为部门工作提供重要的数据支撑,从而使不同部门数据信息的需求得到有效满足;第四,有效性相对突出,安全性相对较高。在经济统计中应用数据挖掘技术,相关工作人员不仅可以对数据进行系统的了解和掌握,而且能够对数据进行深度分析和整合,这样可以使其工作效率得到大幅度的提升。除此之外,对数据库技术进行合理化的应用,使其能够长期储存海量经济信息,从而为后续工作的开展提供有效保障。
2 数据挖掘技术在经济统计中的应用
2.1 预处理方法运用
对经济统计来讲,由于数据本身存在一定的特殊属性,如复杂多样性、不完整性等,在利用数据之前,需要对其进行必要的预处理策略。对数据预处理来讲,其为处理方式的一种,主要由以下方面构成:第一,数据清理,数据清理指的是对无效信息进行清除,常用的方法为预测法、平滑法等。对原始数据来讲,其通常存在不完整性、模糊以及随机等特点,这使得原始数据存在明显的局限,从而使其无法直接的进行应用,需要对其进行处理,将其中包含的无效信息进行清除,如空值、含有噪声的数据等,这样可以使数据的准确性和有效性得到保障;第二,数据集成,数据集成指的是有效整合原始数据中的不同数据,使其能够以整体的形式存在。在对数据进行整合的过程中,不仅要使数据集合的可操作性得到保障,而且需要使数据集合的准确性得到保障;第三,数据变换,数据变换也称之为数据转化,其主要对不同的方法进行使用,使其能够对数据进行转化,从而为数据规模化和数据泛化的有效实现提供基础保障。
2.2 决策树方法
决策树方法是快速分类法的一种,在经济数据统计中运用决策树方法,能够以直观的方式对数据进行呈现。对收集的经济数据来讲,需要对其有用价值进行深入挖掘,因此,需要对系统分析进行有效应用。利用决策树方式对经济数据进行分析时,需要对决策树结构进行合理化的构建,主要从以下两方面入手:一方面,对分析输出的基本模型进行有效构建,并在训练集的基础上,对决策树进行有效构建;另一方面,对已构建完成的决策树来讲,需要对其进行数据分类,分类工作是由下及上,即由根部向树枝方向发展,当数据输入符合相关设置时,才会停止。该种方式是递归的过程,需要和树枝开展同步进行。在对决策树进行使用的过程中,想要使决策树有效停止,需要满足以下条件:第一,节点上数据全都属于同一类别,使得数据会出现停止现象;第二,并没有分类属性,但对数据依旧进行二次分割。
2.3 在遗传算法中应用
在学术领域中,遗传算法指的是生物自然和遗传机理进行有效结合,在数据处理过程中,对算法进行随机选择。对经济统计工作来讲,相关统计人员需要将社会现状考虑其中,对特定人群数据进行收集,并对数据中含有的信息进行全面分析,以此来对最终分析结果进行有效获得。遗传算法的隐含特征得到突出表现,在该特征的基础上,相关统计人员将遗传算法和数学模型进行结合,对其中隐含的数据进行全面采集,并对数据挖掘技术进行有效应用,使其能够对隐藏的价值信息进行全面挖掘。
3 结语
综上所述,在经济统计中应用数据挖掘技术具有重要的意义,其不仅能够使数据的完整性和真实性得到保障,而且能够使数据潜在价值被有效挖掘,因此,需要对其进行不断深入探讨,从而使其作用得到有效凸显,进而使统计经济数据的价值得到充分发挥。