大数据视角下的统计学理论创新研究
2020-12-15蔡道波
蔡道波
摘 要:大数据时代下,数据量正在不断的增加,同时信息资源的价值也得到了凸显,对大量的信息数据进行专业的筛选处理分析,能够最大程度的发挥出信息资源的价值,借助信息化的数据收集手段以及信息化的信息分析手段能够高效精准的对大量的数据进行处理,而这就是大数据时代下对信息洪流的主要处理手段。在大数据时代背景下,传统统计学也获得了较大的发展机遇,结合大数据特征以及现代信息化处理手段,对传统统计学理论进行创新重构,能够让传统统计学,在现代社会的发展中发挥出更大的作用,同时也能充分挖掘出信息数据资源的价值。因此本文主要从大数据背景下对统计学理论创新进行研究,希望能够抛砖引玉,促进大数据时代背景下对传统统计学的研究。
关键词:大数据技术;统计学理论;创新
信息技术的发展以及互联网的普及在很大程度上强化了大数据技术信息获取以及信息分析的能力,在当前的发展阶段下,借助现代科学技术信息获取的成本在不断降低,同时数据信息的价值也在不断被放大,目前大数据技术已经在各个领域行业中发挥了重要的作用,并推动了现代社会的发展。在数据洪流中对信息数据获取分析的能力有更高的要求,而传统统计学方法理论在建立之初,并没有考虑到需要处理如此庞大的数据,因此在传统统计学方法理论的支持下,已经很难保证充分发挥信息资源的价值。对于现代的统计学领域来说,需要充分认识到大数据时代下信息数据的特点,从大数据视角出发,对统计学理论进行创新,保证统计学理论能够充分的挖掘出信息资源的价值。
一、传统意义下的统计学理论
在传统的统计学理论中,主要包含三种主要的统计方法,分别是:描述统计法,该统计学方法主要应用于一些非随机,非概率性的数据,比如社会调查,指数编制等都可以利用描述统计法进行统计;随机现象统计法,比如常见的数理统计方法,概率论等都属于随机现象统计法;特殊方法,特殊统计方法具有很强的针对性,主要针对特定学科的数据处理,比如在环境统计中以及经济学统计中普遍采取特殊统计方法。
传统统计学理论受数据采集技术,以及数据处理分析技术的限制,很多统计数据信息都无法实现完全的采集。因此在传统统计学中,相关的理论都是建立在样本数据的基础上,在传统统计理论下,即使能够实现对数据的全部采集,也会因为数据分析以及数据收集的成本较大,而采取抽样统计的方法。统计分析方法以及抽样方法,是统计学中比较重要的统计实施方法,而以上两种方法也仅能实现对特定统计对象尽最大可能的还原总体特征,而且仅能对统计对象的极小一部分特征进行统计,导致统计分析的全面性不足。
可以说传统统计学在很大程度上是建立在抽样理论基础上的,通过以点带面的统计分析方法,强调对因果关系的利用,从统计样本特征推断出统计对象的整体特征,进而形成数据采集、整理、分析、研究的统计学体系。
二、大数据视角下统计学理论创新
(一)抽样和总体理论存在价值
传统统计学从统计对象的整体进行样本的提取,并对提取的样本进行观测,从样本数据的特征来对统计对象整体的特征进行认识。在大数据背景下,海量的数据被集中到高纬度的样本集合中。依据传统的统计学理论,进行有限的样本提取,同时还需要实现较高的统计精度,是比较难以实现的。同时在传统统计学理论中为了降低统计对象的复杂性,通常需要对统计中的变量进行压缩、降维、选择、分解,又会进一步降低统计的精度。大数据中存在着大量的模糊数据,以及多领域学科数据,数据之间相互重叠,因此传统统计方法难以实现对统计对象的精准描述。因此在大数据时代背景下,需要对传统统计学中,抽样理论以及样本,总体等概念进行进一步的解释和创新,是对总体和样本等概念不再使用或是进行重新定义,以及如何对总体,抽样样本的定义进行修正等问题,都是统计学理论需要改进和创新的至关重要的问题。
(二)统计方法重构
在传统统计学中存在群体行为、结构描述和高纬度表达等的分析方法,而以上分析方法无法使用适应大数据背景下,数据的时效性,異构性,突发性以及交互性的特点。因此传统的统计方法体系也需要从大数据的特点出发,建立新的理论指导体系。通过建立起符合大数据特征的分析模型,并保证能够有效的祛除大量的数据噪音,对有价值的数据进行科学高效的筛选,实现对不同类型的数据进行有机的整合,确保数据分析的结果能够符合统计对象的实际特征,这些都是目前传统统计方法需要突破的方向。对大数据的统计分析,通常需要涉及到时间纬度,空间纬度以及数据本身的纬度,如何对大量复杂的数据进行高效的统计分析,并建立精准的统计模型,是目前大数据背景下统计学发展的重要突破口,也是目前统计学发展完善的关键方向。
(三)统计结果评价框架的构建
在大数据背景下,统计分析的评价标准也需要进行有针对性的调整。传统的统计学结果评价框架是建立在样本分析基础上的。而大数据时代下,需要针对海量的数据进行统计,传统的统计结果评价框架很难做出精准的判断。因此在数据视角下,需要对现在的统计学理论加强分析,确定针对大数据分析,统计学理论哪些还有价值和意義,不适用的有哪些,同时对需要加以改进和创新的理论进行研究,进而建立新的,符合实际需求的统计结果评价框架。
总 结
在当前的发展阶段下,信息数据正在呈现指数级别的增长,现代社会的信息量比以往任何时候都要巨大。可以说现代是一个信息化的社会,数据化的社会,信息数字资源正在成为一种能够创造价值的社会资源,现代社会科学技术的发展为充分挖掘信息数据资源的价值提供了有利的条件,处在这样的社会中,所有人都需要意识到大数据时代已经到来。在大数据时代下,信息获取的效率以及信息分析的效率都有了很大的提升,同时传统统计学理论的弊端也逐渐凸显,已经难以适应现代海量的数据统计分析需求。因此对于传统统计学来说,需要从大数据时代的特点出发结合现代数据统计分析的需求,对统计学理论进行创新,保证统计学理论能够充分的发挥出信息数据的价值,进一步提升学科的实用性,在促进学科发展的同时,也推进社会的发展进步。
参考文献
[1] 曹彦林.应用统计学在大数据背景下的应用与创新探讨[J].纳税,2018(04):232.
[2] 彭先萌.大数据时代统计学发展研究[J].哈尔滨职业技术学院学报,2015(06):124-125.
[3] 田茂再.大数据时代统计学重构研究中的几个热点问题[J].统计研究,2015,32(05):3-12.