APP下载

大数据时代下统计学发展的若干问题及解决对策

2019-03-08尹春月

西部论丛 2019年8期
关键词:解决对策统计学大数据

摘 要:在大数据的发展背景下,统计学的发展面临着巨大的挑战,但同时大数据的发展也为统计学发展带来了很大的机遇,因此在统计学发展过程中,应当及时改变传统的统计学的统计方式,结合现如今的大数据进行适当的改革,确保统计学工作能够与时俱进,使统计学在最大程度上实现自身的价值。本文就针对大数据背景下统计学发展过程中存在的问题和解决措施进行简要的分析探讨。

关键词:大数据 统计学 发展 问题 解决对策

在现如今这个信息高速发展的时代中,大数据互联网以及云计算都已经成为了社会发展的基本特点。也正是由于计算机和互联网的不断发展,使得人们获得的信息量达到了前所未有的程度,各种各样的信息被保存下来并广泛传播,这也就迎来了现如今的大数据时代。由于大数据具有规模性、多样性以及高速性的特点,这也就使得统计学的发展出现了一定的问题。笔者根据统计学而的特点总结出了统计学的发展在大数据环境中存在的几点问题。

一、大数据时代下统计学发展存在的若干问题

大数据时代下,为统计学的发展带来了新的机遇,但同时也有一定的挑战,而最直接的挑战就是有部分的传统的统计学方法在大数据的环境下失效了。因此,统计学的发展也成为了统计学的学者最关心的问题。但是由于这个问题较为广泛,因此很难得出准确的答案,但根据统计学与大数据时代的特点,总结出了以下几点在大数据背景下统计学发展过程中存在的问题。

(一)在大数据背景下如何发展经典统计方法

统计在发展过程中,经过长时间的应用与探讨,有许多经典的传统统计方法,不论是理论还是实践,都有良好的反应,然而在大数据背景下,如果直接使用传统统计方法进行工作,可能会产生一些问题。但是如果直接抛弃传统的统计学方法,更是不可取的,传统的统计方法是经过统计学者长时间的时间推理最终得到的结果,如果直接抛弃,这将是统计学发展过程中的一种损失。因此,对于如何将传统统计方式与高速运算方法以及相应的软硬件进行创新改进,并将统计学合理的运用在大数据当中,这就成为了一个值得深思的问题[1]。

(二)对多种来源的大数据信息进行整合分析

在大数据时代,获取信息的渠道多种多样。通常情况下,同一对象或者同一问题经常会有多种不同来源的数据存在,比如说,分析城市居民的出行模式,就针对这一现象,系那个管人员就可以通过GPS定位、社交网络、公交刷卡等多种不同来源的数据,获得居民的位置信息,从而对居民的出行模式进行准确的分析。由于大数据所具有的特性,使得搜集数据更为便利,并且通过对获得的信息进行有效的整合能夠获得更丰富的信息,同时不同来源的数据信息之间也可以相互进行印证,在一定程度上保证了信息的真实性以及准确性。但是由于不同来源的信息数据通常也都具有不同的数据特征和结构,而在统计学的发展过程中,对于这种多种来源且结构不同的数据进行整合分析以及建模也是一个重要的发展方向。

(三)从统计学的角度分析大数据的边际效应

在大数据时代背景下,由于信息系统的开放,人们可以随时随地的利用信息系统搜集各种需要的信息数据,再是在实际的搜集数据过程中,并不是数据的数量越多就越好。并且大数据的信息价值存在着边际递减效应,简单来说,就是当数据量增加到一定程度,信息系统提供的信息几乎不再增加,但是处理信息以及收集信息的成本依然在不断增加,并且搜集过程中含有的数据噪音也会对信息的提取产生一定的影响。因此,在大数据时代背景下,不能仅仅考虑数据量的增多,同时也应该考虑到信息数据的手机成本以及信息数据的效用之间相互平衡,选择最合适的数据信息数量,因此,对于大数据在建模过程中的边际效应,也应当从统计学的角度进行考虑。

二、大数据时代下统计学发展下存在问题的解决对策

在大数据的时代背景下,各类信息技术不断发展,使得以往很难手机的数据信息能够进行大规模的收集,而云计算则能够使大规模数据处理的目标得以实现。由于传统的统计方式已经无法适应当下的时代背景,因此,就需要结合大数据的特征对统计学进行创新改进,从而更好的促进统计学发展。

(一)对总体、个体以及样本制定明确的定义

在传统的统计分析中,通常情况下,想要完成统计工作,首先就需要从统计对象的整体中进行抽样,在对抽样的样本性质进行分析,从而确定总体的特点,由于需要从总体中抽取样本获得数据,就需要对整体的范围进行明确,然后再利用样本分析进行整体的分析。然而在大数据的环境下,则是恰恰相反的,首先需要有数据,然后再有总体,在这其中,并不需要有定义目标,只需要某一个时间点中的所有数据的对应概念,也正是由于个体数据具有不确定性,而数据本身又是一个动态的进程,当前时间段一下一个时间段的数据之间存在一定的差异性,因而也无法对数据在事后进行个体识别。在互联网中,相同的个体可以有很多歌称谓以及符号,而且相同的符号和称谓又能够代表多个不同的个体,所以在大数据中,通常情况下,对整体数据进行研究很容易,但对于数据的个体进行研究相对来说比较有难度。但是对于大数据分析来说,针对个体进行研究依然是重要的分析环节,在传统的统计学中,样本定义的方式无法在大数据中提取样本的数据,而这就需要我们针对传统意义上的总体以及个体的定义进行改变[2]。

(二)积极构建基于大数据框架的统计学体系

在大数据的时代背景下,我们要正确看待统计学的发展,统计学想要在大数据背景下取得有效的发展,就需要积极构建起基于大数据框架上的统计学体系,而统计学也必须将大数据的整体统计方法以及思想引进到统计学体系当中,与统计学相关的内容也应当从传统的样本统计过渡到样本统计与总体统计相结合的模式中。传统的统计模式中的样本统计法主要是利用样本的数据来对整体进行推断,然而由于样本的生成具有随机性,因此利用样本的数据对整体进行推断容易产生较大的误差;而基于大数据下的整体统计方法就能够很好地避免这种问题,通过不断的引入大数据,统计学大致能够划分为总体统计与样本统计,将样本统计与总体统计有效的进行结合,能够使统计学的发展更好的适应大数据的时代需求[3]。

(三)研究新的分类与梳理方法

在传统的统计学中,主要是依靠预先设计好的方案对数据进行分类与梳理工作,并且通常情况下,参考的相关指标以及最终获得的分类都属于结构化的,由于在数据预处理的过程中,对数据进行分类和梳理是必不可少的工作环节,是统计分析过程中的重要部分。然而在大数据中,由于数据的来源以及数据的表现方式都是多种多样的,因此,如果依然采用传统的统计学的方式进行研究,针对信息的类型以及分类依据标识和标识之间的关系以及类与类之间的区别度等进行分析研究,这显然会为统计工作增添更多的麻烦,针对大数据进行数据分析时只能在对数据进行预处理之后,依照数据的特征进行补充完善。总的来说,传统的数据分类和梳理已经不能适应大数据的要求,因此,应当积极研发新型的数据分类和梳理方法,并基于此方法,研究新的数据分析方法。

(四)将多种统计学方法进行合理的整合

在传统的统计分析过程中,最主要的分析研究方法就是歸纳推断法,主要是通过对样本数据的主要特征进行分析,然后依据样本数据的分析对整体进行分析推断。然而由于归纳推断法依然需要利用样本的特征对整体的特征进行分析推断,依然需要从个体信息中发现新的信息,然而针对大数据信息,如果仅仅是注重对个体的分析归纳,对于大数据信息而言,是一种严重的浪费。数据信息中的部分类别甚至是个体,又或者是部分异常值,都能够由此推断出一些全新的结论。因此,还要对个体的信息实施进行更深入的探讨研究,并且要分局现有的经验以及相关的知识对其他更为具体的规律进行推理分析,也就是演绎推理法。在数据分析推理过程中,采用演绎推理法能够更好的帮助我们基于现有的知识以及姜堰对数据进行更为深入的挖掘,避免对一些细小但是却又很关键的点的忽略现象的发生。将演绎推理法与归纳推断法进行有效结合,能够在大数据中获得更多的数据信息[4]。

因此,在大数据时代背景下,统计学想要进行良好的发展,就需要不断地改进自身现存的问题,从大数据中吸取更多的对自身发展有益的方面,将自身的统计方式加以合理的改进,创新传统的统计方式,适应大数据背景下的时代发展需求,从而促进自身更好的在大数据背景下获得更好的发展。

三、结语

总的来说,在大数据的时代背景下,统计学的发展面临着严峻的挑战,同时大数据也为统计学的发展提供了良好的机遇,并且,要正确的认识大数据对统计学的意义,大数据的出现对统计学是一种补充而并非是替代,并且传统的统计学虽然在现代社会发展过程中存在着一些不足,但在经济分析以及社会统计方面依然有着至关重要的作用。因此,要正确认识到在大数据发展背景下,统计学发展过程中存在的问题,并且要及时的制定出相对应的措施加以改进,去报统计学能够获得良好的发展。

参考文献

[1] 大数据中的统计方法"课题组, 马双鸽. 大数据时代统计学发展的若干问题[J]. 统计研究, 2017, 34(1):5-11.

[2] 陈建宝, 鞠芳煜, 禚铸瑶. 大数据时代下的统计学——第五届中国统计学年会综述[J]. 统计研究, 2015, 32(5):106-112.

[3] 吴爱峰. 大数据时代统计学面临的机遇与挑战[J]. 农村经济与科技, 2016, 27(22):223-223.

[4] 符一平. 浅谈统计学在大数据时代面临的机遇、挑战及其发展趋势[J]. 中国管理信息化, 2016, 19(14):245-246.

作者简介:尹春月(1993.05--),女 ,  汉族,山东省沂水县人,本科,研究方向: 风险管理与精算。

猜你喜欢

解决对策统计学大数据
大数据的统计学基础分析
统计学教学与实验实践的一体化整合初探
对影响我国注册会计师审计独立性的原因及对策的研究
省属地方高校应用统计学专业人才培养模式研究
基于大数据背景下的智慧城市建设研究
难以一致的统计结果