中美本科概率统计基础课教学的比较与思考
2016-02-03杭晓渝
杭晓渝
摘要:概率统计教学的重要性,中美本科概率统计基础课的比较,在课堂教学里培养学生统计思维的例子与方法。
关键词:概率统计;概率论;统计学;统计思维
中图分类号:G642.0 文獻标志码:A 文章编号:1674-9324(2016)05-0084-02
一、概率统计
概率统计是本科非数学专业学生学习的三门数学基础课里应用味道最浓的一个(微积分和线性代数是其他两科),但由于内容较多,课时有限,往往给学生留下一个走马观花、教学目的不明确的印象。为了避免这样的不良效果,开课之际就需要让同学们明确了解几个基本的问题:什么是概率论?什么是统计学?为什么把这两个数学的分支包括在同一门课里?为什么要学习概率统计?
二、概率论
拉普拉斯曾说“Probability is common sense reduced to calculation”,即概率是把常识浓缩成计算。因此,概率论可以被看做人类认识世界的一条思路,是我们解释和分析自然现象与社会现象的工具。它能帮助我们衡量并计算日常生活里每一个行动和决定所面对的未知因素,所承担的风险。它可以进一步帮助我们控制风险,比较、选择决策。更重要的,概率论是理解、学习统计科学的基础。统计学(Statistics)是收集、组织和解释数据的科学。我们生活在一个信息爆炸的时代,统计数字、统计分析、统计决策是现代信息社会里交流、沟通的基本语言,它对现代科学所起到的作用就像英语对全球化的世界所起到的作用一样,在不同的学科之间搭建起了一个标准化的桥梁。生产和科学技术的飞速进步,各门学科向计量方向的发展对统计学提出了更高更迫切的需求,成为统计学前进的强大推动力,使得统计理论不断完善,方法不断发展更新,成为社会经济领域和科学技术领域中不可缺少的工具。国民经济中的GDP,工业统计、农业统计、教育统计、物价统计、人口统计,股市行情、物价指数、市场信息、趋势预测,考试中信度、效度、难度、区分度……,可以说,有数据,有模型的地方就要用到统计理论。从数据分析的角度来看,概率论是通过模型和系统来研究它们所产生的信号和数据应服从的规律、形式和变化趋势;而统计学是通过观察到的数据和信号来分析并学习未知的模型。因此,这两个息息相关、相辅相成的部分组成了概率统计课,这门课所培养的是从大数据里找规律,讲道理,做预测的一种思维方式。
三、统计学
近两年来,笔者在天津商业大学宝德学院承担了三个学期的概率统计课教学工作;从1997到1998年,笔者在美国哥伦比亚大学也担任了四个学期的统计课(Introductory Statistics)的教学工作,这两个课堂之间的对比是十分鲜明的。首先,学生的情况类似,哥大选修统计课的多为本科一二年级经济、心理、医学预科专业的学生,宝德的学生均为二年级会计、金融专业的学生。但课前的要求就不同了,国内的概率统计课要求学习过一年的微积分,而美国的统计课大多数都不要求微积分。国内的概率统计课从教材到教学,都不同程度地存在着重概率轻统计的倾向,加上教学时间的限制,往往是前面的概率论部分讲完了,剩下的时间已经不多,统计部分就草草结束了。很多时候,都只能简单地介绍参数估计和假设检验,根本讲不到实验设计,最小二乘回归和方差分析。由于教学上对概率论的偏重,学生可能在随机变量的概念、计算上花的功夫最多,对统计思想和数据分析的理解就不够了。相比之下,哥大的统计课是一个螺旋前进的过程。直接从数据开始,不讲概率,一维数据的均值、中值、异常值,数据的图形描述(直方图、箱线图等),导出钟形曲线,直观地理解正态分布;对二维数据介绍频率表,回归直线,模型里变量之间的因果分析;实验设计,随机抽样的概念和优点。到学期中间第四章,才开始学习概率的定义,随机变量,从此学习几种重要的抽样分布。然后再回到前面学生已经接触过的模型里,继续学习统计推断的思想和方法。这样一个教学过程可以培养学生对数据的十分具体的理解,有利于学生进一步学习统计软件,会用模型,会解释软件的计算结果。尽管美国学生的数学基础普遍较弱,不一定能掌握好基本概率、随机变量的计算,但对抽象模型和实例的联系以及对模型的描述、统计逻辑的表达都要好过我们的学生。可以说,美国大学的统计课可以作为非数学、非工程专业学生本科期间唯一的统计课程,而我们的概率统计课更像是为后续的统计课打基础。
四、统计思维
在教学实践的过程中,在遵守教学大纲的前提下,笔者尽可能地引进、吸收美国统计课的优点,强调数据分析,模型拟合,课堂上的互动。希望为学生不仅能继续打好概率分布、随机变量的基础,也能促进学生统计理念、统计思维的形成。例如,在介绍无偏概念的时候,引入美国总统大选的爆冷门例子,1936年罗斯福击败兰登,1948年杜鲁门击败杜伊,解释大选前民意调查的结果与最终的选举结果相反的原因是调查抽样的偏差。又例如,在学习假设检验的时候,和反证法作比较;帮助学生理解拒绝原假设相当于找到一个反例,接受原假设相当于没有找到反例;因此前者是一个更值得信赖的结论。又例如,在介绍古典概型的时候,让学生猜测班上(45人左右的班级)至少有两个同学生日相同的概率,往往学生会大幅度低估这个概率(当班级里有40名同学的时候,此概率已达到89.1%)。再在黑板上一一记录全班同学的生日,显示确实至少有两个同学生日相同,既吸引学生的兴趣,也加深学生在计算概率的时候对“至少”的理解。又例如,讲独立性的时候,课前让一个学生投硬币100次,记录下“正”“反”的结果;再让另一个学生“编”出一个长为100的序列,模拟投币100次的结果。请这两位同学把他们的结果写到黑板上,老师大多数时候都可以猜出哪一个序列是真的,哪一个序列是“编”的。因为编的序列会在“正”与“反”之间变化过于频繁,由此向学生介绍投币一百次“正”与“反”之间的变化次数的抽样分布,同时加深对随机性的理解。又例如,向学生介绍著名的Monty Hall问题;电视娱乐节目有三扇门,其中一扇背后有奖品(汽车),另两扇门后是空的。参赛观众选定了一扇门后,主持人打开了其余两扇门里的一扇空门,问参赛观众是否要换一个选择。一部分同学认为换另一扇门能提高中奖的机会,另一部分认为换与不换不影响中奖的机会。在引导学生利用条件概率公式计算概率之后,指出问题的答案要依赖于主持人是否事先知道汽车在哪一扇门后。如果主持人不知道车在哪扇门后,换与不换的中奖率都是50%;如果知道,则不换的中奖率只有1/3,换的中奖率达到了2/3,通过这个简单有趣的例子强化学生对条件概率的理解。再例如,在介绍独立性和伯努利概型的时候,让学生先计算NBA球队之间季后系列赛(七场先胜四为胜方,设每场比赛双方的胜率均为50%,且各场比赛结果独立)要打四场、五场、六场和七场的概率。然后把理论上的概率与历史记录的频率相比较,发现四、五场的概率与频率非常吻合,但六场的概率要小于实际的频率,七场的概率要高于实际的频率。引导学生来解释这个误差的原因,同学们会充满热情地提出各种各样的理论。也许各场比赛结果独立的假设不符合现实;也许决赛双方实力有明显差距,胜率50%的假设不合实际;也许五场比赛之后,落后的一方信心丧失,领先的一方信心高涨,增加了领先一方第六场比赛的胜率。这个例子表面上是锻炼学生利用独立性计算概率的能力,但更有价值的是给学生提供了一个简单的数据拟合、模型解释的练习。
我们在日常生活里越来越被数据围绕着,新闻、天气预报、广告、民意调查等等都包含着各种各样的统计数字。如何用数据来提高说服力,如何通过统计分析来表达具体的理论和观点,如何准确理解他人引用的统计数字都是现代社会成员必须的能力。统计思维可以帮助我们把宝贵的信息从无处不在的噪音里分离出来,也是进一步学习经济、金融、医药、生物、工程、社会科学的钥匙。教好概率统计课,学好概率统计课将是大学教育进一步改革的核心之一。
参考文献:
[1]吴赣昌.概率论与数理统计(经管类第四版)[M].北京:中国人民大学出版社,2011(08)第4版.
[2]Moore,McCabe,Craig:Introduction to the Practice of Statistics 2009 by W. H. Freeman and Company.
[3]彭铁鹏,张晓洁,江珂珂.教师职前教育课程设置的比较与思考——以中美两所大学的课程计划为例[J].黑龙江教育学院学报.2009(04)
[4]朱永新,杨树兵.部分发达国家师范教育课程设置述析——兼谈我国师范教育课程设置存在的问题[J].苏州大学学报.2001(03)
[5]王伦.树立科学的教师教育质量观 推进教师教育课程改革[J].中国高教研究.2006(12).