基于数据挖掘技术的统计工作创新相关研究
2018-04-26刘姣
刘姣
[摘 要]随着经济的快速发展,“互联网+”时代的到来,各行各业的发展产生海量的数据信息,统计工作面临新的机遇与挑战。如何提高统计数据质量、如何充分发挥数据挖掘技术在统计工作中的优势,是统计工作者们共同思考的话题。本文重点阐述数据挖掘技术在统计工作中的创新应用。
[关键词]数据挖掘技术;统计工作;创新;研究
doi:10.3969/j.issn.1673 - 0194.2018.06.066
[中图分类号]TP311.13 [文献标识码]A [文章编号]1673-0194(2018)06-0-02
随着信息技术的快速发展,大数据、云计算、物联网等先进的科技在人们日常生产生活中得到了更为广泛的应用,先进的信息科技大大加快了数据的传播速度,提高了传播质量。在统计工作过程,利用信息技术能有效提高数据信息的及时性、完整性与有效性,大大提高了一国的综合国力与国际竞争力。
在政府日常运营中,统计部门发挥至关重要的作用,统计工作质量的高低直接影响政府决策的有效性与科学性。在新形势下,信息技术体系的不断完善,有效提高了统计工作的质量,例如:数据挖掘技术,在统计工作的信息化进程中发挥不可替代的作用,为政府的科学决策提供强有力的支撑。笔者根据自身多年的工作经验,谈谈自己对数据挖掘技术下统计工作创新研究的几点思考。
1 数据挖掘技术与统计学
数据挖掘技术虽然起步比较晚,但是对于统计工作来说具有深远的意义。从技术层面来看,数据挖掘技术高度统一了人工智能、统计学、数据库管理、数据仓库、可视化、并行计算与决策支持等,通过数据库、数据仓库技术存储及管理数据,再结合统计学方法和人工智能分析数据等,深度研究数据挖掘技术在日常统计工作中应用,能有效快速统计瞬息万变的数据信息,从而挖掘出更有效、更有意义的数据信息。
1.1 數据挖掘技术具有高智能化
随着计算机网络技术的高速发展,数据存储技术、大数据推广技术也得到快速发展与广泛普及,随后,统计学方法体系也得到完善。新形势下,随着“互联网+”时代的到来,各行各业的发展都迎来“数据大爆炸”“知识匮乏”的现状,而工作人员将数据挖掘技术与计算机网络技术高度统一,以从海量数据信息中挖掘出更多有用的信息。数据挖掘技术与统计学由于都属于数据处理专业,具有较高的连通性。统计学利用建模手段去挖掘海量数据信息中有用的数据;数据挖掘技术也有明显的数据挖掘特征,旨在发现更多、更有益、可利用、可发掘的数据。由此可见,统计工作中充分利用数据挖掘技术非常重要
1.2 数据挖掘技术加快统计学的发展步伐
现阶段,统计工作者的主要任务就是以数据信息为基础,建立模型,并深度分析研究模型。建模之后,再分析数据,这一步非常重要,然而,从目前来看,统计工作者对模型的阐述与分析研究并不深入。利用数据挖掘技术,可以针对数据集,根据不同的需求利用不同的数据挖掘技术,例如:决策树,神经网络、聚类分析等,能大大提高数据处理的有效性。值得一提的是,数据挖掘技术处理数据具有很多优势,例如:能有效处理量大、维数高、结构复杂及类型多样的数据信息。由此可见,数据挖掘技术的种种优势,能有效加快统计学发展步伐,提高统计工作信息化程度,进一步提升统计工作的质量与效率。
2 现阶段统计工作存在的问题与缺点
2.1 易造成数据的冗余
我国现阶段的统计部门所应用的数据格式并没有完全统一的规定与要求,数据格式较多,比如VF、SQL、TEXT等。这样一来会使统计数据产生冗余,格式不够统一,使得数据在处理起来较为麻烦且复杂,给统计工作也带来了很大的难度。
2.2 数据缺少统一的管理标准
由于数据的来源和获取渠道极为广泛,所以管理起来也会遇到很多的问题,存放较为分散,没有一个统一且标准的管理模式,由此导致无法实现对数据进行进一步的深加工,继而无也法更好地利用和开发所获得的数据资源,造成数据资源的严重浪费。
2.3 缺少对数据资源的剖析和利用
统计工作在社会的各个层面皆有应用,统计指标多,拥有大量的数据资源。虽然统计部门获取的数据资源较为丰富,但对于这些数据资源无法实现层次更深的分析和提炼,缺少深度挖掘数据资源的工具,从而不能有效地利用好数据资源,使得统计工作与信息化严重脱节。除此之外,对于已经挖掘出的数据信息也没有进行仔细的甄别,无法判断现有资源是否完全,对于决策的利弊也不得而知。
2.4 缺少有效的后续开发
对于统计工作来说,统计数据是为政府和企业提供重大决策的主要依据,需要对统计技术和统计工作有一定的创新和开发,但就目前的统计工作来看,只是单纯地为制作表格而进行数据总结,并没有实现后续的开发工作。这样一来就使得数据资源不具备再次利用的价值,从而也降低了统计工作的质量与效率,无法实现对统计工作的进一步创新与开发。
3 数据挖掘技术在统计工作中的适应性
3.1 超强的综合应用性
新形势下,数据挖掘技术能利用具有超强综合应用性的手段,来有效挖掘出统计工作者所需求的某种特性的数据,从而有效拓展统计工作的深度与广度,加快统计工作的创新发展。
3.2 较强的实际有效性
数据挖掘技术是一种具有明确目的的数据深加工技术,工作性能非常稳定。首先,其能有效提高统计者分析整理相关数据的质量,其次,对聚类分析、神经网络等技术手段的有效利用,能挖掘出更深层次、更高质量的数据信息,充分提高其实际有效性。
3.3 较高的技术适用性
现阶段,统计工作需要庞大的数据库作支撑,并为数据挖掘技术的应用提供广阔的平台。数据挖掘技术在这个平台上进行数据整合,从而提高统计数据的真实性、完整性与有效性,从而获取更深层次、更有用的信息资源。