大数据时代统计课程的教学改革研究
2021-04-22崔玉杰刘喜波
崔玉杰 刘喜波
[摘 要] 随着大数据时代的到来,大数据已经渗透到社会生活中的多个方面。2015年我国首次提出国家大数据战略。研究国内外统计大纲及人才培养的基础之上,结合国内的实际情况,以数理统计课程为例,具体研究了教学内容变革的原因、传统知识拓展与新知识的融合并重,结合教学目标分析了基于python的编程软件等在教学中的具体设计、考核评价以及新的培养模式对教师的要求,这对于建设一流统计学科有一定的借鉴意义。
[关键词]大数据; 数理统计; 教学改革; 编程软件
[基金项目] 2020年度北方工业大学教育教学改革重点项目“统计学一流专业建设研究”(207051360020XN135)
[作者简介] 崔玉杰(1966—),男,山东聊城人,经济学硕士,北方工业大学理学院副教授,主要从事金融、统计等研究;刘喜波(1962—),男,河北张家口人,理学博士,北方工业大学理学院教授,北京市教学名师,北京市中青年骨干教师,主要从事金融数学、统计等研究。
[中图分类号] G642.0 [文献标识码] A [文章编号] 1674-9324(2021)08-0064-04 [收稿日期] 2020-10-17
一、大数据时代国内外统计学教学改革研究
(一)大数据国家战略的提出
2015年11月3日,《中共中央关于制定国民经济和社会发展第十三个五年规划的建议》首次提出推行国家大数据战略[1]。大数据时代对统计专业的学生提出了更高的要求,他们不仅需要掌握统计理论、统计方法和专业统计软件的应用,还要懂得如何提出问题、如何进行数据操作、如何判断数据质量、如何评价模型和方法的有效性,以及如何準确清晰地呈现分析结论。国内诸多学者对此进行了探索[2-5]。
(二)美国的做法
从美国的大学教学要求看,美国统计协会早在2014年在其“统计学本科专业课程设置指导纲要”对统计课程设置及其配套提出了指导意见,充分强调了在大数据时代必须具有编程能力、访问并利用数据库的能力。要求学生能使用一种或多种统计专业软件如R、Python、SAS等编程语言进行数据分析。
要求教师具备丰富的数据处理经验;会利用真实案例以激发学生的积极性,并注重实际数据分析;培养学生将所学的统计理论与方法、统计计算技术用于解决实际问题,使学生通过团队训练及职业道德培训进一步掌握统计处理实际问题的能力,让学生学会沟通技巧、通过好的反馈机制检验教学效果,全面培养学生的数据处理能力[6]。
(三)其他国家的做法
英国倡导大学要更加重视数学和统计学的教学。皇家统计协会的“数据宣言”报告建议提升国民的数学和统计学知识技能,以应对数据经济时代。政府倡导“更多16岁以上青年人学习数学和统计学”。英国教育部制定了“未来数学支持计划”,此外,日本、印度等国家也提出了相应的促进措施[7,8]。
二、站在大数据时代理解统计学深刻含义
计算机和互联网技术尤其是人工智能的快速发展,使得大数据时代成为必然。日常社会经济活动或客观现象的记录、监测是大数据的来源,这样的超级数据只有通过快速发展的信息技术才能量化、存储,进而从中获取很多有价值的数据信息,恰当地运用这些数据才能使各种管理及经营活动更加有效。
统计学从产生开始就是从数量规律上去认识客观世界、理解客观世界、把握客观世界。大数据分析借助统计学的基本思想与方法更能快速把握客观世界的变化规律。同时,大数据时代也对统计学提出了更高的要求,统计学要通过各种教学改革适应新的要求,作为第一基础课程的数理统计改革[9]首当其冲,本文以数理统计为例进行研究分析。
三、教学改革的内容分析
(一)大数据时代要求教学内容跟上时代的节奏,呼唤教学内容的改革
数理统计是统计学的理论基础,是推断统计的重要内容,在进行小样本推断时表现出了强大的功能,被广泛应用于各行各业。随着大数据时代的来临,数据的采集方法及采集数据的量已经达到非常大的级别,如果仅仅用传统方法进行估计、检验、方差分析、回归分析可能远远不够。
首先,采集数据的方式由手工变为自动化,观测采集数据更加细致、更加密集,这种变化要在教学中有所体现。也就是说在学好基本统计理论的同时,要加大编程软件及相应的实验教学以快速适应时代的需求。
其次,数据的分析方法也要变革,通过统计理论进行建模,再借助计算机编程实现批量数据统计检验和分析,当然教学中计算思维的引入不可忽视。
再次,统计数据可视化也成为时代发展的需求,学习者如果能“看得见”“摸得着”“用得上”才能理解得更加深刻,这样的要求对统计一流学科的建设提出了要求。
(二)传统统计理论与新知识的拓展并重
传统统计理论与新知识的拓展并重在教学内容中要有具体体现,重视传统统计理论同时还要善于融入新知识,使二者有机地结合起来。比如,传统知识引入推断统计的三大分布后,我们巧妙地运用软件R或Python实现三大分布密度曲线和分布曲线的可视化,这样既可以帮助同学们理解三大分布,同时引导同学们对编程软件产生兴趣,从而避免了枯燥的简单说教式的教学方法。由于编程手段在课堂教学或实验教学中的运用,从根本上改变了教学手段的落后,提升了同学们的应用和创新能力。对统计学教师提出了较高的要求,不仅要有丰富的教学经验,还要对专业知识的理解把握。通过可视化增强学生学习数理统计知识的兴趣,加深学生对数理统计知识的理解与运用,进而改变用一面黑板或一张PPT讲到底的落后局面,激发学生学习数理统计理论知识,运用现代编程技术实现更复杂的统计数据分析的兴趣。
(三)基于大数据时代背景,紧密结合人才培养目标确定教学内容
人才培养是最终目标。从国际上看,美国统计师协会(ASA)早在2014年就在统计课程设置及其配套的指导意见中强调了大数据时代必须具有编程能力、访问并利用数据库的能力。要求学生会使用一种或多种统计专业软件如R、Python、SAS等,并会使用“脚本”等辅助文本编程工具,学会统计理论知识,学会计算和分析数据,并具有解决实际问题的能力。同时英国、日本、印度等国家都提出了类似的要求。我国在建设一流学科时也提出了同样的要求,从2015年我国首次提出推行国家大数据战略起,对人才的培养便写入了教学目标中。
为了实现人才培养目标,数理统计课程在教学中除了夯实基本理论知识,还要在数理统计基础、估计理论、检验理论、方差分析、回归分析的基础之上引入三次或四次试验,具体实验可以包括如下内容(当然也可以结合教学实际情况做出更加灵活的符合学生需求的其他形式内容安排)。
第一次实验课,可以安排在理解数理统计中三大基本分布的基础上,使用Python、R、SAS等编程软件实现三大分布密度曲线及分布曲线的可视化、分位点的查询、分布函数的可视化等。①编写或调用命令画出三大分布密度曲线及分布曲线,使理论形象化,帮助学生理解三大曲线;②用实验辅助设计高尔顿实验板,帮助学生形象化的理解正态密度曲线及正态分布等内容;③通过改变t分布的自由度让学生动态地看到,随着自由度增加t分布逐渐近似为正态分布的过程;④通过统计软件的语句查询正态分布、卡方分布、t分布、F分布的下分位数及上分位数的具体值,进一步理解显著性水平的含义,这对全面理解把握数理统计基础知识会起到事半功倍的作用。
第二次实验课,在有了统计推断知识基础后,利用Python、R等编程实现具体案例的点估计、区间估计,这部分内容是推断统计的重要内容。①使学生通过编程语言理解如何利用学过分位点、拒绝域得出点估计及区间估计的上限、下限。②用编程作图,让学生看到随着置信水平的变化,区间估计的上限、下限是如何变化的,这就避免了让学生死记硬背公式,进而使学生在理解基础知识的基础上用编程语言解决具体问题。③结合区间估计让学生知道假设检验的基本内容,让学生知道通过样本对总体做出判断时并不保证百分百正确;通过显著性水平的变化让学生通过软件结合可视化理解在较大α水平下拒绝,同样的样本在较小α水平下就不能拒绝,从而使学生理解区间估计和假设检验是同样抽样问题的两个方面,它们解决实际问题的目标是一致的。学生通过结合估计原理和假设检验原理运用编程解決实际问题,这就加深了对知识的理解和运用,不再是简单的机械的去记忆。
第三次实验课,在学习完方差分析原理后,用Python、R等编程实现具体案例的方差分析解决实际问题。①结合实际问题,让学生理解方差分析的适用条件,理解实际问题中理论适用条件的含义,比如实际中怎样结合软件设定在方差相等的条件下,对总体均值是否相等进行检验。②学生在实验设计过程中必须思考为什么提出方差分析;当出现多个总体时,对总体均值的检验用原来的单正态总体方差总体均值的检验方法及双总体均值是否相等的检验是否合适。③通过思考学生认识到对多总体均值是否相等的方差分析方法是解决这类问题必须掌握的有力工具。④学生会理解和使用方差分析表解决实际问题,最后理解方差分析表在解决实际问题中的重要意义,最后全面掌握方差分析内容。
第四次实验课,在学习完回归分析的原理后,用Python、R等编程完成具体案例的线性回归分析,让学生归纳线性模型中的原理及解决实际问题时应该注意的问题,进而全面理解和掌握线性回归分析的主要内容。这部分内容以简单线性回归分析为起点,使用软件画散点图,通过坐标平移后各个象限散点的多少理解皮尔逊相关系数的实际意义,进而引导学生在许许多多的直线中找到最能“代表”这些散点的最优的直线,这就理解了当初高斯提出最小二乘法的原理。结合软件让学生从原理上去学,学生才能学会用线性回归的基本理论解决实际问题,既做到了夯实理论基础同时又和现代技术相融合,为进一步学习其他统计学内容打下良好的基础,在具体的教学中实现了培养人才的目标。
由此可见,一流学科的建设离不开基础课程金课课程建设。数理统计作为统计学专业的最重要的专业课程之一,要善于激发学生的学习积极性与创造性,借助于现代信息技术培养学生由“要听课”向“爱听课”到“想听课”的转变。要做到这一点,统计编程软件起到关键作用,结合具体的三次到四次统计实验课使学生独立编程认识正态分布、卡方分布、t分布、F分布,从编程实现的可视化上帮助学生去理解复杂的统计基本理论,使学生“看得见”“摸得着”“用得上”,从而激发学生从“爱思考”“想思考”到“深思考”的转变,让学生理解基本定理,利用基本定理解决疑难问题,进而让学生在解决实际问题中激发学生“敢质疑”“敢批判”到“超越创新”的转变,这些转变作为新的学习动力激发学生积极性,为实现全面培养学生各方面的能力奠定坚实的基础。
(四)教学考核评价的改革
教学效果的检查除了对基本理论知识的考核外,要着重增加过程考核的内容和方式,充分利用现有的大数据手段快速,比如课堂上让学生利用手机等基本通信工具在线完成重点概念、知识点、公式的复习、理解和掌握,并及时给出评价,最后纳入总成绩的评定之中,不再仅仅依赖最后期末考试试卷确定课程成绩;同时,要把平时的实验课成绩也纳入课程总成绩中,线上交流、随机提问、及时复习多种方法实现数理统计理论知识的全面掌握与评价。
(五)高校统计教师在建设一流学科中应该如何做才能符合要求
一流学科建设同样对教师提出了更高的要求。首先,在熟悉基本理论知识基础上,需要掌握编程语言处理理论及应用,并使二者恰当融合在一起,以有利于学生消化吸收。设计好师生互动的每一个环节,利用线上平台及时检查学生效果,激发学生学习的积极性和创造力,进行统计实验课时更要引导和激发学生的编程能力,通过编程使学生对基本知识、基本概念理解得更加深刻,充分利用编程软件的强大计算功能实现统计数据的可视化,让理论、方法、图形全方位在学生头脑中扎根,对培养时代急需的统计人才打下坚实的基础。
四、结语
总之,大数据时代吹响了统计学教学改革的号角,作为统计学专业的重要基础课,数理统计责无旁贷地站在了教学改革的前沿。在教学实践中把信息技术的编程语言引入到课堂中,在金课建设中实现学生为主体,教师为主导,师生全面互动,面向能力培养,实现学生从“要听课”向“爱听课”到“想听课”的转变,激发学生从“爱思考”“想思考”到“深思考”的转变,激发学生向“敢质疑”“敢批判”到“超越创新”的转变。要以编程新技术为新动力激发学生积极性,全面培养学生各方面的能力,这是作为一流统计学科建设及其重要金课建设都必须认真思考的教学改革问题。
参考文献
[1]高亢,赵晓辉.我国首次提出推行国家大数据战略[EB/OL].http://www.xinhuanet.com/politics/2015-11/03/c_1117030186.htm
[2]曾五一.统计学类专业教学质量国家标准解读[J].中国大学教学,2019(11):6-9.
[3]祝丹,陈立双.大数据驱动下统计学人才培养模式研究[J].统计与信息论坛,2016,31(12):102-107.
[4]朱建平,张悦涵.大数据时代对传统统计学变革的思考[J].统计研究,2016,33(2):3-9.
[5]邱东.大数据时代对统计学的挑战[J].统计研究,2014,31(1):16-22
[6]龚凤乾.关于美国三份统计学评估和教育指导纲要的简介与思考[J].统计研究,2017,34(6):124-128.
[7]黄孔雀,许明.英国高校数据能力培养策略研究[J].中国大学教学,2018(8):91-96.
[8]刘大北,贾一苇.日本《大数据时代的人才培养》倡议:制定背景、研究方向、计划及举措[J].电子政务,2015(10):85-95.
[9]唐琳.大数据背景下“数理统计”课程的教学改革研究[J].云南大学学报(自然科学版),2020,42(S1):61-64.