大数据时代对经管专业统计学课程教学的影响
2022-03-18李红
文/李红
1.概述
目前,互联网、5G、人工智能、物联网、多媒体、大数据等技术正在不断发展。其中,大数据技术已经在零售、制造、金融、政府政务、医疗、物流及移动通信等多个领域得到了广泛应用,并且创造了巨大的经济效益和社会效益。随着大数据时代的到来,统计学研究对象的基础发生了变化,人们认识、收集和分析数据的思维也发生了变化。[1]大数据提高了统计质量,降低了统计成本,使统计学的应用领域不断扩大。大数据给统计学带来了发展机遇,但分布式大数据和数据流环境也给统计学带来了挑战。统计学最直接的挑战是,在大数据环境下,部分传统经典的统计方法已经失效。[2]有学者提出从改变对样本的认识、改变对不确定性的认识等八个方面出发,应对大数据带来的机遇与挑战。[3]
2.大数据对经管专业统计学课程教学的影响
2.1 大数据扩充了统计数据的来源
统计学是关于数据收集、整理、分析和解释的一门学科。数据是统计学的研究对象。在大数据时代之前,统计数据往往来自普查、抽样调查和统计报表;人们在研究目的的驱动下,收集数据;数据类型为结构化数据。然而,在大数据时代,数据类型不仅包括结构化数据,还包括非结构化数据(如文字、图片、声音、视频、网页、日志等)、半结构化数据。数据来源渠道多样,不需要事前设计和组织调查,并且数据获取速度快,从而极大地扩充了统计数据的来源。
2.2 大数据给传统统计分析方法带来了挑战
2.2.1 数据收集方式发生变化
在大数据时代,统计数据大多来自网络上自动记录、储存的数据,不具有目的性,数据采集不再局限于传统的问卷调查、座谈会、电话调查等方式,而是使用传感设备自动采集。这种新的数据采集方式,使统计样本的概念发生了变化。传统统计学样本是来自总体的部分个体,样本应该具有代表性,并且能够反映总体的特征。在大数据时代,样本就等于总体。人们需要利用网络爬虫技术,采集网页信息或数据。
2.2.2 数据整理方式发生变化
在大数据时代之前,统计数据整理是指根据统计研究的任务和要求,按照整理方案,对调查收集到的原始数据进行加工,使之条理化、系统化,从而得出反映总体特征的综合资料的工作过程。统计数据整理的程序包括统计数据的审核、分组与汇总、统计图表编制。数据审核主要审核数据的完整性、准确性和及时性。在大数据时代,数据量非常大,其中可能存在虚假的、错误的数据,这些数据不能直接使用。因此,在使用大数据之前,人们需要开展数据筛选、数据清洗、数据提炼、数据降维、数据降噪等工作。大数据不再强调数据的精确性,“允许不精确”已经成为大数据的一个显著特点[4,5]。与样本容量小、数据类型为结构化数据的统计数据相比,大数据的数据量更大,数据类型更加复杂多样,数据价值密度更低。
2.2.3 统计分析方法发生变化
大数据时代的到来,给传统统计分析方法带来了挑战,一些传统的统计分析方法已经不再适用,人们需要发展新的数据分析方法。分布式并行计算技术的快速发展,催生了适用于大数据抽样、分类、聚类、关联分析的K-means算法、Apriori算法等新的分析方法。传统统计学教材侧重变量之间的因果关系,统计推断分析是以抽样分布理论为基础的。在一定的概率下,人们可以利用样本特征,推断总体特征。然而,在大数据时代,统计分析侧重相关关系分析,样本就是总体。因此,人们不再用样本特征推断总体特征。
2.3 大数据对经管专业统计学实践教学的影响
统计学是一门方法论科学,它主要培养学生利用统计学理论和方法分析解决实际问题的能力。因此,学校需要加强学生实践能力培养。目前,经管专业统计学课程教学包括理论教学和实践教学。由于教学内容复杂和课时较短,学校往往重视理论教学,却忽视了实践教学。同时,传统实践教学大多使用Excel、Eviews、SPSS等统计软件。这些统计软件无法对高维、复杂、多样的海量数据进行降维、清洗。在大数据时代,这些软件已经不再适用。此外,实践教学中的数据通常是经过加工整理后的二手数据,而不是原始数据。其中许多基于小样本数据建立的传统统计方法,并不适用于大数据分析。[6]实践教学与大数据分析人才需求脱节,导致许多学生无法利用所学知识去解决企业的实际问题。
2.4 对经管专业统计学教师的挑战
大数据要求人们在数据处理与分析等方面使用新技术。因此,教师不仅需要掌握相应的统计理论知识,还需要掌握计算机互联网技术、信息技术等相关知识,例如数据库、结构化编程、算法、数据结构等知识。另外,教师还需要熟练应用统计软件,对大数据中的数据进行获取、清洗、降维、降噪、数据可视化展示、分布式计算、并行计算。这对经管专业统计学教师提出了更高要求。因此,为了适应时代发展,满足人才培养的需求,教师需要及时调整和更新知识结构,提高大数据分析技能。
3.经管专业统计学课程教学改革探索
3.1 树立大数据思维
大数据时代的到来,使大数据在体量、类型、结构等方面与传统数据有所不同,这对数据的搜集、筛选、整理与分析提出了新的要求。在经管专业统计学教学中,教师应树立大数据思维,结合与专业相关的大数据案例,选用合适的统计分析方法,对数据信息进行搜集、存储、清洗、整理与分析,增强学生的大数据意识,提高学生的大数据分析能力。
3.2 优化统计学课程教学内容
在大数据时代,数据类型不仅包括结构化数据,还包括非结构化数据。教师可以从以下两个方面出发,优化统计学课程教学内容:增加真实的大数据案例和大数据处理技术等相关内容;增加大数据的统计分析方法。教师应将大数据环境下产生的经济问题、商务问题作为案例,采用基于大数据分析技术的教学模式,培养学生的实践能力。在大数据时代,人们不再区分总体与样本的概念(总体即样本),并且开始重视相关分析与因果分析。因此,教师应结合实际情况,增加推断统计等内容。另外,在教学过程中,教师不仅需要介绍抽样调查的基本原理和主要方法,还需要介绍参数估计、假设检验、时间序列分析、回归分析、主成分分析等统计方法。
3.3 以数据驱动实践教学
为满足大数据时代对数据分析人才的需求,教师应加强实践教学。教师需要增加实践学时,利用Python等统计软件,提高学生数据分析能力;需要引入真实案例数据,并且保证每一章都至少有一个真实案例;应以问题为中心开展教学,以任务驱动改变教学方式,引导学生从被动接受知识转变为带着问题主动探索知识。除此之外,教师应将社会热点问题作为案例,比如新冠肺炎疫情下的国家宏观经济和居民消费、税收优惠与企业研发投入、社会保险费率与企业用工成本等。教师还需要组织学生开展调查和研究,指导学生收集、整理、分析相关数据。实践教学应重在引导学生利用统计方法解决实际问题,培养学生的独立思考能力和动手能力。
3.4 完善教师知识体系
教师应充分认识大数据时代带来的变化和挑战。教师需要不断更新知识结构和提高教学能力。在大数据时代,人们需要应用分布式计算、云存储、关系数据库等信息技术,快速搜索、抓取、存储、计算和分析各种类型的数据。因此,教师应当与时俱进,不断学习大数据知识,更新和完善自身的知识体系,以适应大数据背景下的统计学课程教学需求。
4.结语
在大数据背景下,社会对经管专业人才提出了新的要求。因此,在经管专业统计学课程教学中,教师应树立大数据思维,不断更新教学内容,增加实践教学,完善知识体系,以适应大数据时代对数据分析人才的需求。