大数据时代统计学的挑战与机遇
2023-04-24田晓玲
田晓玲
随着大数据时代的全面到来,人们获取信息的方式也发生了巨大改变,同时在获取信息资源过程中,拥有了更多的途径与渠道。这对于数据统计工作人员以及从事数据统计的学者来讲就如同打开了一扇新的大门,同时面临诸多的机遇和挑战。
在信息技术高速发展背景下,当今社会已经快步走入大数据时代,并基于大数据技术支持下,能够更加全面整合分析相关信息,逐步形成了全新而又便利的数据分析方法,这在大数据和统计学之间架设起一条彼此互通的桥梁。大数据技术的普及应用给统计学带来了巨大变革,并对统计学的发展与提升起到了很大的促进作用,使得统计学未来发展前景越加广阔。但是与此同时也给统计学带来了诸多挑战。
一、大数据时代下统计学概念概述
教科书上对统计学给出了这样的定义:有效搜集整理分析随机性数据,对考察问题给出推断与预测,最终为行动提供数据支持。从根本上看,统计学是一门与数据有关的学科。如美国总统拜登在竞选总统过程当中便是基于数据团队支持下而取得成功的,而马云在很早的时候就将大数据当作企业发展的重要战略。步入大数据时代之后,在网络技术支持下数据收集变得更加便利,传统设备已经无法容纳海量增长的数据信息,必须及时进行设备更新,而运用大数据对相关数据展开全面分析,才能确保信息的有效传递,并为推动社会不断发展提供有效支撑。在当前社会发展进程当中,统计的都是极为重要的内容,如进行商品交换时,统计学发挥的作用更大,利用统计学还能及时掌握市场经济信息。进入大数据时代,统计工作开展过程中,不能仅仅停留在随机抽样调查层面,而应当打破这种传统统计方式,运用大数据技术手段获取更为丰富的信息,进而为推动社会发展提供全面详实的数据参考。
二、大数据时代对于统计学产生的影响
(一) 样本概念变得更为深化
我们知道统计学离不开样本,样本是统计学的重要組成部分,只有保证样本的有效性,才能将相关情况准确体现出来,在大数据快速发展时代,样本概念和传统数据相比出现了很大不同,通常我们得到的诸多网络数据:一种为静态网络数据,即直接在客户端创建的数据,不用进行提取便可应用,不用投入较多成本。另一种为动态数据,伴随时间的改变数据也出现相应的变化,样本也不再仅仅停留于随机抽取,选定之后便可直接进行分析。
(二)从类型方面看,呈扩大之势
传统数据主要为结构化数据,其标准比较固定,而随着大数据技术的快速发展,数据结构也出现了巨大改变,同时出现大量的异构数据。与此同时,大数据技术也改变了过去的储存方式,大数据可以直接将探测的信号容纳进去,并运用网络实现不同结构数据的有效识别,并迅速储存下来。
(三)收集概念得到扩展
过去统计工作开展过程当中,数据收集都是有目的的进行,效率不高,还需要投入较多的成本。而伴随大数据技术的快速发展,在数据收集过程当中更加的步骤化,做好数据识别及处理工作,在此基础上进行分析,从中探寻所需的数据,并合理储存。但是在海量信息面前,必须要对数据的分析与识别给予充分重视,最大程度提高数据精准性与安全性,有效降低成本投入。
(四)数据来源较传统不同
统计数据收集过程当中,过去都是依照研究目的进行收集,知道数据源,这些数据核对比较简单。进入大数据时代信息获取更加便利,而且很多数据无数据源,难以对记录身份进行识别,所以在数据收集过程中应当充分重视数据源登记。
(五)量化方式发生变化
对于传统的结构化数据来讲,有着比较成熟的量化方式,通过对数据的收集与分析便能获得结果,然而进入大数据时代,出现大量的异化结构数据难以通过直接分析的形式获得结果。目前很多专家学者都在对非机构化数据的处理进行研究,进而推动统计学在大数据时代获得更好发展。
(六)分析思维发生改变
从分析过程看,过去分析数据过程当中都是依照定性、定量以及最终定性的方式进行分析。但是大数据在进行统计分析时,只通过定量、定性便能获取相应的结果。同时,传统数据证实分析时都是按照假设证的方式进行分析,然而实践发现,这种分析方式时常会出现较大误差。而在大数据技术快速发展背景下,我们的思维为发现—总结,这是整合—发现最终定论的过程,在此过程中会有很多发现。
(七)统计软件越来越多
过去在统计学开展过程当中主要应用SPSS、SAS、STATA等统计软件,但随着大数据的快速发展,主要是基于数据中心为前提,将大数据和软件有效整合,极大地简化了分析过程。通过以上分析不难发现,在大数据技术的快速发展背景下,可以更加主动统计,使得统计学在原有基础上获得了巨大进步与发展。
三、大数据时代下统计学面临的挑战
统计学有着非常久远的发展历程,形成了较为成熟的理论基础,在生产实践当中发挥的作用也越来越大,统计学的快速发展也深刻地影响到经济社会的快速发展。但步入大数据时代之后,数据分布状态呈现海量增长,并以分散式分布,这给统计学带来了极为深刻的影响。首先大数据的“大”,数据信息现已突破了人们的想象。而大数据当中的“全”,可以使人们更加全面的认识大体量、多样化的数据,数据样本和总体彼此间的关系也出现巨大改变。而且多样化的数据,也使得传统数据统计主观诉求出现巨大改变,之前人们进行统计分析过程当中,更多的关注“为什么?”但是大数据时代下的统计更加关注“是什么?”这种改变深刻影响到传统统计学,推动大数据时代统计学的快速发展已经成为重要发展方向,然而传统和更新之间彼此仍存在某些不相容的问题,所以在变革过程当中,需要全面综合考虑各个方面。
第一,通过分析样本标准不能看出,大数据时代样本获取变得更加便利,伴随网络技术的快速推进,大样本标准也有了很大的发展和提升。传统统计学将界限定在30,大于30为大样本,小于30为小样本。进入大数据时代,这个界限就太低了,没办法清除干扰信息,这就会给分析结果造成影响。所以,在掌握数据来源的基础上,还应当对样本标准做出及时更新,旧的数量可以通过大样本数量进行替代,进而满足大数据时代的发展要求。
第二,在选取样本及其形式方面,传统的统计学数据结构比较固定,传统统计学固定结构化数据内藏着一定的统计规律,虽然可以从中了解到研究对象具有的数量关系,然而不是任何事物都存在相应的量化指标,有的指标虽然被量化,但是却无法将研究对象清晰地解读出来。在数据采集过程中,过去的统计数据库难以处理这些数据,但是基于大数据支持下构建非结构数据库,转化这些数据,便可将多样化的分析作用体现出来,这样就在很大程度上降低了选取样本的标准,进一步扩大统计范围。
最后,在开发统计软件过程当中也面临着诸多挑战,随着大数据技术的快速提升,在分析数据过程中,都是基于数据进行非关系分析,面对海量的数据处理,需要更为合理的快速分析技术。
四、大数据时代下统计学面临的发展机遇
(一)提升了统计质量
就统计质量而言,主要体现在适用、准确以及时效和平衡等几个方面,适用主要是确保统计信息与相关要求相符合,统计信息必须要能够充分满足客户需求,而大数据技术手段合理应用可以更加有效地提升适用功能。同时,过去所说的时效性,主要体现在统计所用的时间长短上,运用更短的时间进行统计,确保客户能够短时间内获取统计信息,而基于大数据支持下其时效性更强。准确主要体现在估值和真值是否存在差别,在相应范围当中数据有一定的误差存在可视作正常。大数据技术下数据获取更加全面,同时也有效包容了误差,使误差有效减少,提供了数据的真实性。平衡及协调,基于大数据支持下检验与核对数据信息,都需要满足客户不断检查,全面增强数据平衡性。
(二)降低了统计成本
基于数据收集层面进行分析,在大数据技术支持下,打破了过去通过问卷调查以及电话调查等形式进行统计的局面,可以快速利用互联网完成数据统计,及时、迅速,提高了数据精准性,大大减少了成本投入。而且在利用数据方面,过去的统计数据过期之后,还需要进行行再次抽样分析,并且信息公布存在很大局限性。大数据技术可以更加便捷地对于数据进行收集,并能反复利用这些数据,大大降低了统计成本。
(三)统计学作用范围的增大
过去在统计学开展过程当中,时常受观念、成本等诸多因素影响,经济学的应用范围也比较有限。而伴随大数据时代的快速发展,数据也出现很大变化,可以快速地进行数据传递,为社会各行各业做出巨大贡献,并在推动自身发展的基础上,更好地服务社会大众,推动国家建设。
(四)统计学科体系的延伸
将大数据应用于统计学当中,虽然也给统计工作带来很大挑战,但其发展机遇也更加广阔。目前,统计学当中引入的大数据技术,海量的数据深刻影响到统计样本选取及确定标准。过去简单的抽样调查,很难适应当前时代发展要求,所以统计样本也必须要向着总体统计方向迈进,实现样本统计和总体统计齐头并进,有效应对传统统计工作存在的不足,增强统计工作整体成效。
五、大数据时代下统计学的应对策略
(一)培养复合型人才
传统的数据统计方法较为简单,对数据人员的综合素质要求不高,随着大数据时代的到来,我国的统计工作变得日益复杂起来,各种类型的数据需要统计人员进行分析和整理,这在无形中增加了数据统计人员的工作量,为了适应新形势下统计工作发展需求,我国的统计学领域必须重视人才的培养工作,建立一批复合型的人才队伍,从而满足大数据时代下统计学对统计人员的要求。当代的统计学人员不仅要具备良好的统计专业知识,还要拥有良好的统计能力以及软件操作能力,所以相关单位必须要将提高统计学人员的综合素质放在首位,运用各种形式培养统计人员的操作能力,真正的培养一批复合型的统计学人才队伍,促进数据统计行业的发展。
(二) 推动统计学和大数据的协同发展
伴隨大数据技术的日益推进,也深刻影响到人们传统的生产生活方式以及工作方式,受大数据技术影响,统计学必须要做出相应的调整,在开展数据统计工作时,相关的技术人员在掌握数据统计知识的基础上,应该有效地结合统计学和大数据,通过大数据技术手段来对各种信息进行统计分析,并与统计方法有效结合,充分发挥大数据对统计学的促进作用,为统计学的健康发展提供助力。大数据技术在带来巨大发展机遇的同时,也带来了巨大的挑战,统计学领域的相关人员必须紧跟时代潮流发展趋势,融入到大数据时代中,促进统计学的发展。
(三)注重统计学的多学科合作
在大数据技术高速发展背景下,无论哪个行业,每天都会有海量的数据产生,单一的传统学已经不能满足信息处理的要求,但是在数据统计中,统计人员过分依赖计算机等一些软件制约了统计学的发展。所以,数据统计学人员不仅要掌握必备的统计学知识,还要积极学习数学知识以及计算机知识,发挥不同学科的优势,真正实现优势互补,促进统计学与数学、计算机学科的合作,使统计学工作能够满足当下社会和人们生活对统计数据的需求。统计学与数学、计算机学科的合作和融合已经成为促进统计学发展的必由之路,相信在不久的将来,统计学在数学与计算机学科的推动下,将会朝着更加科学化和规范化的方向发展。
结语:
统计学当中数据是核心,也是统计学价值的重要体现,传统的数据意义在大数据时代出现了巨大改变,数据所蕴含的信息、传播以及分布速度已经打破了人们的想象,同时也转变了数据具有的核心意义,因此更需要以大数据技术为支撑,推动统计学的快速发展。虽然统计学在大数据时代面临诸多机遇和挑战,但为适应新时期的发展要求,应当紧跟时代发展形势,及时做出转变,对大数据时代特征进行充分研究,并将大数据技术引入传统统计学,这样才能为统计学的快速发展奠定坚实的基础。