关于大数据与统计新思维的思考
2017-07-08王鲲鹏
【摘 要】在当今社会中,多媒体技术已经深入人们的日常生活,网络上充斥着大量的信息,这些信息种类繁多,规模庞大,如何有效的利用这些信息成为一个新的难题。大数据给统计工作到来了极大的挑战。本文将探究大数据环境下的统计新思维。
【关键词】大数据;统计;统计新思维
一、引言
随着信息技术的发展越来越快,普及程度越来越高,大数据对生活各领域的影响也越来越大。许多领域的发展不得不进行改革,以适应大数据时代。统计学也受到了一定的影响。大数据具有规模大、种类多、更新速度快的特点,这要求统计的方式必须随之改进,这样才能有效的工作。
二、大数据的内涵
“大数据”是近几年来比较流行的一个词汇,在生活中出现的频率非常高,尤其是在研究领域。对于这个词,不同领域的人有不同的理解。从统计学的角度来解读,大数据就是建立在现代信息技术和手段基础上,连续的、扩充的数据形式。这种数据的存储能力和记录能力比传统数据要高出许多,其突出特点是数据量的规模十分庞大;记录的信息涵盖的范围很广,几乎无所不及;信息的内容质量参差不齐,鱼龙混杂。同时,信息的更新速度非常快,有利用价值的信息可能很快就被淹没,需要及时的捕捉。简单的说,大数据就是所有可记录信息的集合体。
三、大数据给统计思维带来的变化
1.认识思维的转变
大数据的来源与传统数据有很大的不同。传统数据在收集的过程中有很强的目的性,能够在一定程度上了解数据提供者的相关情况,并且可以对数据信息进行核实。但大数据来自于网络,其产生过程本身不具有明确的目的性,因此,信息内容杂乱,有利用价值的信息不多。在类型上,传统数据有一定的格式和结构,通常显示为图表等形式。大数据信息则没有结构上的标准,形式很随意,彼此之间的联系性也很弱。从量化角度看,传统数据的量化过程和方式已经比较完善,基本可以直接投入分析或计算工作的使用。大数据信息的非结构性给量化工作带来了极大的困难,这种数据的统计工作难度很大,难以得出科学的统计结论。面对大数据信息,量化的意义和形式也发生一定的变化,失去了规范性。由此可以看出,传统的统计方式已经不再适用于大数据的统计。
2.收集思维的转变
统计工作是建立在数据收集的基础上的,没有数据就无法进行统计分析。在传统的分析方法中,首先要明确分析的目的,然后根据目的收集信息,对收集信息的方式也有精心的设计。大数据的出现为收集者提供了类型更丰富的数据,而且数据获取的耗时更短,这使数据统计工作的中心从收集转变为筛选。但是,统计工作在收集数据资源的过程中,除了考虑资源的丰富性,还要考虑数据存储的问题。大量的数据信息会占用很大的内存空间,这要求统计人员必须对数据信息进行适当的取舍,否则将造成存储方面的困难。
3.分析思维的转变
传统的数据分析过程是从定性到定量,然后再回到定性的过程。定性分析是为了确定分析工作的要点和方向。定性分析的质量决定了统计分析的质量。在大数据的背景下,定量工作也开始
变得简单化,统计工作只需要从定量的数据中选择符合目的需求的数据,为决策工作提供有参考价值的数据信息。基于大数据基础上的统计分析过程更简单,结论更科学准确。
传统的统计工作要先提出假设,通过对数据的分析,验证假设的正确性。在这个过程中,要保证假设的科学性,如果假设不合理可能会对结果造成一定的不良影响。在大数据环境下,实证基本摆脱了假设的限制,通过一定的技术手段可以轻松的找到数据之间的规律,然后通过分析得出最终结论。证实的过程简化为发现——总结,给统计工作带来了更大的便利。
传统的统计方法是通过样本推断整体,运用分布理论估计结论准确的概率。样本的质量直接影响统计结果的质量。大数据的统计对象不是个体样本,而是总体数据,不会受到分布理论的限制,而是基于具体数据得出的真实结论,有更高的科学性和可行性。
四、应对大数据的策略
在大数据的环境下,数据统计应该改变对总体、个体以及样本内涵的认识。传统的数据分析要先确定总体,然后再确定数据和样本,但是,大数据改变了这种情况。大数据环境下的统计是先获得数据,然后再确定总体。大数据不会预先对总体目标进行定义,这是因为大数据中的信息数据是处在不断变化之中的,事先的预测难以起到归纳总结的作用。统计分析后的识别工作也很难有效进行,这是大数据中个体名称多样性造成的。因此,统计工作要改变对个体和整体的定义方法,以及对样本的定义方式。
在大数据时代中,统计工作还要应用新的数据分析方法。由于数据具有多样性和复杂性,传统的分析方法难以发挥作用。大数据中的信息内容和形式丰富多样,很难划分其类别和性质。因此,面对大量的信息数据,研究者只能采取有针对性的分析方法,否则无法得出科学的结论。
五、结语
综上所述,在大数据的影响下,统计学的相关工作也要改变传统的方式,转变单一的思维,用全新的思维方式,分析信息数据的利用价值,改进统计方法,挖掘大数据的优点,有效的分析数据,为决策者提供准确有效的分析结果,提高决策的可行性。
参考文献:
[1]陈宇秋.小议大数据与统计新思维[J].财经界(学术版),2016,02:288-289.
[2]潘桂梅.大数据环境下的统计新思维分析[J].现代经济信息,2015,10:158.
[3]陈巩,谭雪霏,赵春波.大数据背景下统计新思维的探索研究[J].信息通信,2016,12:163-164.
作者简介:
王鲲鹏(1995—),男,籍贯:山東省博兴人,学历:本科,就读于青岛理工大学,研究方向:经济统计学。