APP下载

大数据背景下统计学专业教学改革的思考

2016-05-30郭海兵

现代职业教育·高职高专 2016年11期
关键词:样本专业分析

郭海兵

[摘 要] 大数据的时代背景下,统计学专业迎来了机遇,同时也面临着巨大的挑战。结合大数据分析的特点,分别从培养目标的定位、信息技术教育的提升以及实践教育的增强这三个角度,探讨统计学专业教学改革的方向。

[关 键 词] 大数据;统计学;全数据模式;样本数据

[中图分类号] G642 [文献标志码] A [文章编号] 2096-0603(2016)31-0184-02

目前,“大数据”已经逐渐成为了妇孺皆知的热词。虽然大数据的精确概念是在2009年前后提出来,并于2012年开始流行,然而对于大数据技术的应用早已开展。例如,沃尔玛公司通过销售数据分析,对关联商品组合促销,提升销售量;谷歌公司通过用户的搜索关键词,能够快速地定位流行疾病的病源地。并且随着互联网技术的进步,各种大数据技术的成功案例层出不穷。美国政府在2012年3月发布的《大数据研究和发展倡议》,把大数据称作“未来社会发展的新石油”,把发展大数据研究提到国家战略的高度上来。2015年,《中国大数据发展调查报告》表明近几年来我国大数据市场价值接近40%的速度在增长,2015年达到了115.4亿元。全球化的背景下,大数据已经走进了每一个角落,正在给我们的政府管理、企业运行和信息获取创造价值和机遇;与此同时,也对我们的生活、学习和工作提出了变革要求。

作为一门收集整理数据,并结合数学模型进行量化分析,进而作出推断预测的学科,统计学是一门综合性和应用性比较强的学科。这一属性十分契合大数据分析的要求,因此大数据时代的到来,推动了统计专业的快速发展。近年来,很多的新兴院校都相继开设了统计专业,统计学专业正在面临一个繁荣期。然而,就像一把双刃剑,大数据给统计学专业腾飞和发展荣幸了机遇,与此同时,也对传统的统计学的教育和教学提出了迫切的变革需求。

一、大数据在统计分析中的新特点

(一)数据收集方式的改变

在传统的统计中,数据的收集是通过人为对样本的属性进行逐一采集、整理,形成一系列横平竖直的结构化数据,然后利用这些样本信息,进行描述分析、统计推断。然而,现代的信息技术使得样本数据的收集实现了信息化和自动化。例如,通过爬虫程序直接抓取互联网数据,工业生产中的传感器获取的数据等等。另外,数据的形式呈现出多样化,除了传统的表格数据,还有诸如文本数据、音频数据和视频数据等。这就需要在统计专业学生培养过程中,一方面重视信息收集方式的教学;另一方面做好多维数据处理技术的传授工作。

(二)样本数据模式和全数据模式

传统统计中,由于数据收集能力的限制,很多时候我们无法获取全数据,只能通过随机样本,利用少数的特征对总体的属性进行统计推断。在大数据时代,数据获取的方式和技术发生了巨大的变化,人们可以通过互联网、即时通讯工具以及数据库,获取各种海量数据。面对这样的海量数据,随机抽样不再有太大的意义了。因此,大数据背景下,全数据就是样本数据,即样本就是总体。传统的统计分析重点是,通过样本信息预测总体的特征属性,大数据分析更加侧重于发现海量数据下的各种关联细节。

(三)模型分析的弱化

传统的统计中,侧重在变量之间建立模型,刻画出变量之间的因果关系,而相关分析只是作为进行模型分析之前,进行数据探索的一个小小的手段而已。然而,在大数据中,数据的结构复杂,变量众多,体量较大,有时候很难用一个“普世”函数描述出变量之间的准确关系。無法综合评价出变量之间关系的情况下,我们可以部分揭示出变量之间的关系。事实上,由于相关分析无需太多的模型假设,运算成本较低等众多原因,使得相关关系的分析成为大数据分析的基础。

(四)模型的复杂性和精确性难以量化平衡

传统的统计学处理的数据,都是在时间和空間设定的情况下结构化的数据。在数据的处理上遵循数据清洗整理,利用经典统计模型,在设定的精度范围里对总体的特征进行推断和分析。这样的过程中,模型的复杂度和精确度,都可以在我们事先设定的情况下进行。然而,在大数据背景下,一方面,数据的收集过分依赖技术手段,很难进行人为的精度控制。另一方面,数据的来源无论是空间上还是时间上都更加复杂,格式多样,这就使得数据前期的清洗处理变得非常困难,由于存在系统性的偏差,很难将全部的杂质项从数据中萃取掉。在秉持“数据多比少好”的情况下,就得接受数据混乱和不确定性的代价。在大数据中忽略一部分模型的精确性,并不是说不要模型的精确性,而是指我们对于模型的精确性的可控性在减弱。

二、统计专业教学改革的方向

时代的发展、技术的进步对于统计学专业提出更高的期望和要求,结合统计学专业现有教学体系中存在的问题,给出了统计学专业教学改革的方向。

(一)培养目标的定位

过去国内对于统计专业定位是分割成诸如经济统计、数理统和其他的统计几个类别。学校的招生过程也是按照这样的几个类别进行招生。这就使得学生的培养被固定在几个人为设定的格子里,湮灭了各个知识之间的交叉结构。自从统计学专业被升格为一级学科之后,这种状况有所改善。随着大数据的出现,统计分析技术的服务范围已经不再局限于诸如学术庙堂、政府部门以及高端公司等这样的精英圈子;普通的社会机构、企业和工厂等各行各业对统计专业产生了迫切需求。

因此,在统计学专业的定位上,应该摒弃传统的简单分割成经济统计和数理统计的理念。大数据背景下,统计学作为一项分析工具,需要与其他专业做好衔接和服务工作,培养多元化的分析人才。在统计学专业培养目标的定位上,应该充分考虑统计分析的工具性,促进统计专业与各自优势学科的交叉和融合,形成“多元化”的培养目标。既能培养出理论分析的精英人才,也能培养出简单数据管理者。

(二)统计理论和信息技术的平衡

传统的统计学专业的课程体系中,专业主干课程围绕数理基础、统计分析以及信息技术这样的几块。通常偏重的统计理论侧重于数理逻辑课程的教学;而侧重与统计应用相关的内容(如经济统计)侧重于统计分析的课程教学。这样的安排都忽略了对统计专业学生进行信息技术的培养。纵观整个数据分析的流程,从最初的数据收集,数据的分析和结论,都是离不开信息技术的支持。特别是大数据分析,无论是硬件上面还是软件上面,都对数据分析的参与者提出了很高的要求。

因此无论是传统的经济统计,还是数理统计,掌握一定的信息技术是一个必要的条件。这需要在课程设置上,既要引入适当的硬件方面,也要加强软件的教育。以往统计学专业的软件教学主要以SPSS、Eview等这类封装好了,以体验式为主的统计软件。对于这类软件无论是在处理数据的体量上,还是处理数据方式的灵活度上,都无法适应大数据分析的需求。在软件教学方面,培养学生一定的编程能力是非常必要的,相比于机械的拖拽软件分析数据,编程分析更加灵活,能够激活数据分析者的主动性和创造性。

(三)实践教学模式的创新

近年来,随着对统计专业应用性认识的不断加深,很多学校对实践教学环节也是越来越重视,在课程的设计上增加了实践环节的比重。但是相比于数量上的提升,实践环节的质量依然还有很大的提升空间。尤其是在大数据的背景下,很多实践环节过分侧重人工数据采集和局部样本信息的分析。主要表现在这些方面:(1)数据的收集手段上,没有充分使用现代信息技术方法。例如,有些学校的教学实践中,还是停留在让学生上街发放问卷的阶段;稍好一点的学校运用了诸如问卷星这样网上问卷的形式。而大数据背景下,这种获取的数据有方式,无论是在数量还是质量方面都是相对不足。我们需要让学生在数据获取能力方面适当进行提升,例如,加以适当的培训,让学生掌握一些网络上爬取数据的技术。(2)传统的模型驱动的实践内容,在一定程度上不适应大数据分析原则。传统的实践课程中,侧重运用模型去揭示数据之间的关系,并且相应的表现在我们的评价体系上,过分强调了模型的合理性和正确性。大数据分析应该基于数据出发,通过一些技术手段来揭示数据之间的关系;有的时候很难在大数据之间建立模型,或者很难建立一个现有的模型。实践教学过程中,让学生形成数据至上的理念,也就是在分析过程中尽量让模型去适应数据,而不是基于一些改造手段,让数据去适应模型。(3)除了學校的项目实习,积极鼓励学生走出学校,获取实习机会。校外实习接触的问题更实际,既能检验学生的学习效果,也能激发学生的学习兴趣,从而实现教学相长。

大数据时代的到来,成就了统计学专业的繁华,统计专业的发展也必将会推动大数据辉煌。“繁华落尽处,互为渡舟人。”各种现象的随机性、不确定性,掩盖了万物之间错综复杂的关系,统计方法能够帮我们拨云见日。科学在发展,技术在进步,一成不变的东西终将会走出历史的舞台,统计学专业也不例外,培养方式的改革迫在眉睫。

参考文献:

[1]王忠.美国推动大数据技术发展的战略价值及启示[J].中国发展观察,2012(6).

[2]中国大数据发展调查报告[R].北京:中国信息通信研究院,2015.

[3]耿直.大数据时代统计学面临的机遇与挑战[J].统计研究,2014(11).

[4]劉春杰.大数据时代对当代统计学教育的挑战[J].统计与决策,2015(8).

[5]邱东,李子奈,肖红叶.经济学类专业统计学、计量经济学课程教学现状调研报告[J].中国大学教学,2007(11).

猜你喜欢

样本专业分析
一句话惹毛一个专业
用样本估计总体复习点拨
隐蔽失效适航要求符合性验证分析
专业降噪很简单!
专业化解医疗纠纷
电力系统不平衡分析
推动医改的“直销样本”
更聚焦、更深入、更专业的数据分析
随机微分方程的样本Lyapunov二次型估计
电力系统及其自动化发展趋势分析