大数据环境下的统计数据研究
2021-01-27王那那山东省青岛市黄岛区黄岛街道办事处
王那那 山东省青岛市黄岛区黄岛街道办事处
一、大数据环境下统计数据应用的主要问题
(一)统计数据的规范性较差。首先,统计本身具有极强的数据依赖性,统计数据的使用对规范性要求颇高,但是大数据环境下统计数据应用的基本数据大多为元数据。元数据是指没有进行数据处理的数据,缺少规范性,而且元数据比较粗糙,可读性差、解读难度也比较高;其次,统计数据与大数据系统的适配性也是导致统计数据规范性差的原因之一。大数据技术在数据挖掘、开发以及操作方面的应用要求大数据与其系统之间具有高度的适配性。如果数据与数据处理系统之间的适配程度不高,需要找寻适配的数据系统进行数据迁移。因此,如果数据系统处理存在费用不足、系统崩溃等方面的问题,将对整个数据统计处理工作带来巨大的影响。
(二)数据的访问性较弱。大数据是互联网信息技术不断发展的产物,是信息技术在网络信息时代的突出表现。随着大数据技术的不断发展,大数据技术逐渐被应用与社会生活的各个方面。一般统计数据的处理流程主要有数据审核、汇总、分析、形成报告等等。但是受到专业性、制度分化等方面的限制,一些统计数据所需要的数据资源很难找寻,基层数据的访问性较差,这也是影响数据报告的一个重要因素[1]。数据访问性受限使得许多基层数据无法充分挖掘其数据价值。当前统计数据对数据的应用更多的停留在数据资源的归整之中,而且还有很多数据因为保存不当等原因遗失,使得数据的挖掘与使用价值大大降低。
(三)数据价值的挖掘较低。大数据已从近年来的众生呼唤迅速成为实践现实,大数据充斥于各行各业,各个领域[2]。但是现在基层数据依旧存有大量的数据未曾充分挖掘其数据价值,很多基层数据能够充分地反应全国经济的发展情况,各种统计数据能够反应出社会的各个方面信息。统计工作涉及的范围比较广,但是因为数据挖掘方法的限制、数据制度上的不连贯以及专业壁垒限制等等因素的影响,统计工作很难得到一个全面深度挖掘。除此之外,缺少多维度的数据价值平台也是限制统计数据价值挖掘的主要因素之一。
二、大数据环境下统计数据的应用分析
(一)数据资源的整合与管理。数据资源的整合与管理是统计数据的基本工作之一,大数据技术在统计数据中的应用主要表现在各类元数据的整合与管理。统计数据中的元数据不仅仅是一些网络数据,还有一些是来自政府部门统计中的数据,比如质监、工商以及民政等多个部门的行政数据等等。统计部门利用大数据整合技术,将各种资源数据整合起来进行分析,最后形成清晰、准确的高质量、规范化统计数据报告。除此之外,统计数据还利用大数据处理平台实现数据图片的清晰化表达,准确清晰数据转换,并根据不同的元数据审核与评估,来监控与编码数据管理,提供元数据的支撑,解决当前许多统计报告中数据资源不全的问题。
(二)数据资源的分析应用。分析是大数据资源利用的重要环节,除了基本的数据整合之外,统计数据也为用户提供了数据可视化分析与查询工作。比如从用户的视角对数据进行分析挖掘,多维度查询数据,对统计数据进行分析、挖掘,以此来形成统计报告,准确描述并直接反映社会生活。目前统计数据应用中最常用的数据资源分析手段,就是使用R语言,建立多元线性回归、描述性统计以及随机等数据分析方法,为数据报告的形成提供分析接口,弥补统计数据的一些不足之处。模型式的数据表达更为直观、清晰,且具有可读性。除此之外,大数据环境下的统计工作还能够根据统计用户的不同需求制定数据图表,并导出符合用户需求的格式文件。
(三)数据资源的共享应用。作为一种无形财富,统计数据不会因为一方持有而导致另一方利益受损,全球经济一体化在统计数据上得到了很好的体现,统计数据已成为了一种可以共享交换的资源[3]。大数据时代,数据不再是一个个孤立的存在,互联网为数据提供了一个整合平台,互联网平台上的数据以及各种数据报告之间存在共享、互联性。大数据时代,各种不同类型的数据都能够在网络平台上进行发布,除了被应用于一些数据研究之中,还能够通过网络来获取一些高质量的精准数据,促使统计数据的共享利用。
统计数据共享的优势主要表现在以下四个方面:第一,统计数据共享有助于增进公众与国家各部门之间的信任度,提高政府部门的执行力度;第二,统计数据共享有助于提高数据搜集的工作效率,降低数据搜集的时间成本,全面地了解数据资料,同时还能够帮助统计数据做出更为精准的决策,最大程度地发挥统计报告的价值,提高社会公众的满意度;第三,统计数据共享有助于提高各个部门的元数据处理与使用,通过对比整理各类数据,增强数据的可信度,提高数据质量。第四,统计数据共享分为基本数据分享和特定数据分享两个方面,这种分类方式有助于提高特定数据的梳理,强化专业领域数据的处理能力,还有助于解决统计报告不够专业的问题,为统计工作人员提供更为专业的数据资源,帮助统计工作人员提供更为精准、专业数据报告。
综上所述,大数据时代,数据成为社会生活的重要元素。本文从大数据环境下统计数据遇到的一些问题入手,并从数据资源整理整合、数据分析以及数据共享三个方面分析大数据环境下统计数据的应用管理。经过分析了解到大数据技术在统计数据中的应用范围极广,虽然存在各种问题,但从整体上来看,仍有很大的发展前景,值得关注。