大学公共概率统计课程学习中学生常犯错误的分析与思考
2019-09-10章志华
章志华
摘 要:《概率统计》是大学各专业的通识教育基础课程,在产品抽样检验、实验数据分析等领域具有重要的应用,因此是大学生最感兴趣的公共数学课程之一。但是由于概率统计课程以高等数学为基础,对学生积分学知识的掌握程度有一定要求,再加上高中数学课堂接触积分概念很少,很少介绍统计推断原理,因此大二学生在学习该课程过程中会出现很多困难和问题。文章将对学生学习过程中容易混淆的概念进行了总结与分析,并提出教学改进措施。文章的观点有望给本科概率统计课程学习和教学提供借鉴。
关键词:概率统计;概念混淆;教学改进
中图分类号:G642 文献标志码:A 文章编号:2096-000X(2019)26-0081-04
Abstract: Probability and Statistics is a foundation course for undergraduates. It can be applied in fields like product sampling inspection, experimental data analysis and so on. Therefore, it is one of the most interesting mathematics courses for students in universities. But there are a lot of difficulties and problems in the process of learning, because the base of probability and statistic is calculus, which requires that the students must have a deep comprehension of calculus. However, the concept of integral is seldom taught in high school math classes, and the principle of statistical inference is never introduced. In this article, the concepts that are easy to be confused in students' learning process are summarized and analyzed. Improvement measures of teaching are proposed, in the hope that the opinions in this article could supply a reference for undergraduates and college teachers.
Keywords: probability and statistics; confusion of concepts; improvement of teaching
大学公共《概率论与数理统计》课程一般开设在二年级,主要包含两个部分:概率论和数理统计。《概率论》作为该课程的第一部分内容进行介绍,也是后继课程《数理统计》的基础。对于数学专业的学生,部分院校将《概率论与数理统计》作为两个课程,并分别开设在两个学期来教授,由此可见《概率论与数理统计》的重要性和难度。概率论以微积分为基础工具,研究具有不确定性的隨机现象的统计规律性;数理统计以概率论知识为基础,借助统计推断原理,利用随机试验对抽样的总体进行估计和推断,包含参数估计、假设检验、回归分析等内容,由于课时有限,一般高校开设的公共概率统计课程中统计部分知识只介绍参数估计和假设检验两块内容。概率论和数理统计已经发展成两个成熟的学科,在当今的大数据背景下具有更广泛的应用,特别是数理统计可应用于地震预测、产品抽样检验、数据分析、决策分析和评价等领域,因此,不仅很多高校的数学学院开设统计学专业,甚至部分高校的经济学院、管理学院也开设统计学专业。同时该课程也是考研数学的重要组成部分,因此概率统计是最受大学生青睐的通识教育课程之一。但是由于该课程以《高等数学》为基础,对学生积分部分知识的掌握程度有一定要求,特别是对重积分的知识有一定要求,再加上高中数学课堂接触积分概念很少,很少介绍统计推断原理,因此大二学生在学习概率统计课程过程中会出现很多困难和问题,这主要体现在平时课堂回答问题和课后作业常犯的错误中。接下来,本文将通过具体的例子对学生在学习过程中容易混淆的概念和常见的记忆性错误进行总结与分析,并提出相应的改进措施,希望可以给学习概率统计的大学生提供有利的帮助,同时给教授该课程的教师提供借鉴。
一、易混淆概念
本节我们以例题的形式列举出学生在学习过程中容易混淆的概念,对发生混淆的原因进行追溯和分析,并提出预防措施。
(一)随机事件和集合概念混为一谈
例1设随机试验E的样本空间为?赘={x|0x2},事件A={x|1/2<x1},B={x|1/4x3/2},求事件。
解:根据题意,由于随机事件是样本空间的子集,利用集合在数轴上的表示可得AB=A={x|1/2<x1},由于样本空间为?赘={x|0x2},因此我们得到={x|1/0x1/2}∪{x|1<x2}。
在本例中学生经常犯如下错误:学生记住了随机事件是集合的本质,但没有考虑到随机事件是样本空间的子集,依据中学的固定思维和方法,先求出A和B的交集,然后想当然的认为全集是整个实数集R,再根据集合补运算,利用数集在实数轴上的表示进行计算,得出了错误结果={x|x≤1/2}∪{x|1<x},犯此类错误的原因有两个:一是对样本空间概念没有完全接受,没有意识到它是一个全集;二是对随机事件的概念没有完全接受,总是和汉语词汇“事件”联系,不能将其和子集进行对应。针对这一错误,教师在引入样本空间和随机事件的概念时首先应强调这两个概念是伴随随机试验而产生的两个名字,样本空间中的“空间”是指一次随机试验的“所有”可能结果组成的集合,这一结果可以是一些具体的事物,如抛掷一枚硬币可能产生“正面,反面”两种结果,也可能是一些离散的数字,如投一枚骰子可能产生“1,2,3,4,5,6”六种结果,还有可能这些结果的取值处于某个范围内,如北京夏季某天的最低温度是25摄氏度,最高温度是37摄氏度,那么要考察每年该天在上午9时20分30秒这一时刻的温度,这一时刻温度的取值就是区间[25,37]内的某一个值,因此这时的样本空间是一个连续的区间,该区间就是一个全“空间”。其次教师要反复向学生强调随机事件是样本空间的子集。最后教师要着重强调样本空间和随机事件两者之间是全集与子集的关系,并且该处的全集是和随机试验对应的,随机试验不同对应的全集也不同,因此不能将全集和实数集混淆。
(二)样本空间和样本空间的概率混淆
例2 设?赘是样本空间,试用事件A,B,C及其运算表示事件“A,B,C不同时发生”。
解:设D表示事件“A,B,C不同时发生”,则D=ABC或D=-ABC。
本例中学生常犯的错误是将D表示为1-ABC,其中学生将样本空间这一事件的概率为1与样本空间?赘混淆。产生该错误的原因是因为学生混淆了逆事件与逆事件概率的计算公式P(A)=P(-A)=1-P(A)在数学家柯尔莫哥洛夫引入概率的公理化定义时,样本空间作为必然事件,即在一定条件下必然发生的事件,规定其概率为1,此处的1即百分百,对应于包含所有可能结果的必然事件,这是概率公理化定义的一个必要条件,该条件既符合人们的认知,也为后继概率论的发展带来了很多便利,大大简化了计算。概率的公理化定义给随机事件发生的可能性建立了数学模型,将随机事件的统计规律性数量化。教师在介绍概率定义时可根据上述概率公理化的意义来说明必然事件对应的概率为1的意义,目的是让学生更容易接受,同时也可以让学生更好的理解逆事件概率计算公式中1的意义,并强调概率是区间[0,1]的实数,因此概率也可以看成是满足特定条件的集合函数,该函数的自变量是集合,取值在区间[0,1]。通过这些辅助说明和解释,学生更能体会概率的本质是用来刻画随机事件的统计规律性的,因而能更好的区分样本空间以及样本空间的概率。
(三)概率密度函数和分布函数混淆
在一维连续型随机变量教学过程中,概率密度函数是重点,可通过对概率密度函数取定积分来求概率。并且一维连续型随机变量的分布函数和概率密度之间的关系如下
对F求导,利用变上限函数求导知识,可以得到在f的连续点x处,有F'(x)=f(x),即分布函数的导数是概率密度,概率密度的变上限积分是分布函数,或者说(1)式表示的是随机变量X取值小于等于x时的概率,等式(1)所反映的分布函数和概率密度之间的关系在几何上表示为图1。针对连续型随机变量,虽然分布函数和概率密度之间的关系可以用(1)式简单的概括,但仍有学生将这两个概念混淆,以致得到在计算中得到错误的结果,或者计算不够简洁。
例3 设随机变量ξ的分布函数为F(x)=(π+4arctanx)/4π,(-∞<x<+∞)。试求:(1)ξ落在区间(-1,1)内的概率;(2)ξ的概率密度。
解:(1)根据分布函数的定义F(x)=P(Xx),以及连续型随机变量在单点处的概率为0,我们可得到P(-1<X<1)=P(-1X1)=F(1)-F(-1)=(arctan1-arctan(-1))/π=1/2。
(2)设ξ的概率密度为f(x),则有F'(x)=f(x), 因此得f(x)=[(π+4arctanx)/4π]'=1/π(1+x2),-∞<x<+∞。
本例中学生犯的第一种错误解法如下:
解:(1)ξ落在区间(-1,1)内的概率为P(-1<X<1)=P(-1X1)=(π+4arctanx)dx/4π=1。
犯該错误的原因是将分布函数的概念和概率密度函数的概念混淆,不理解它们的意义。教师在上课时应强调分布函数指的是概率的分布,要从几何上认识分布函数和概率密度之间的关系,该关系表示如图1,在图1中横轴表示自变量,纵轴表示概率密度f,阴影部分是分布函数F。同时教师还可以借助物理中线密度与线段质量之间的关系来解释概率密度与分布函数之间的关系,让学生能够更加形象的接受和理解这两个概念。犯该错误的另外一个原因从学生无法接受离散型随机变量的分布函数向连续型随机变量的分布函数的过渡,离散型随机变量分布函数F(x)在计算时就是把所有取值小于x的概率做累加,从累加过渡到积分学生好理解,但是为什么要对概率密度f取积分,学生却不能接受,因为离散型随机变量不取积分。教师在解释这一问题时可以借助定积分的几何意义是曲边梯形的面积做类比,此处被积函数就是概率密度,对应曲边梯形面积就是分布函数。或者教师还可以将概率密度类比为加速度函数,分布函数类比为速度函数来做解释。
本例中学生的第二种解法如下:
解:(1)先求概率密度f(x),f(x)=F'(x)=[(π+4arctanx)/4π]'=1/π(1+x2),-∞<x<+∞。再利用概率密度和分布函数之间的关系得到ξ落在区间(-1,1)内的概率为P(-1<X<1)=P(-1X1)==1/2。
此种解法并没有错,但是在学习了连续型随机变量之后,学生往往会非常喜欢用概率密度的积分来计算概率,而淡忘了分布函数是用概率来定义的这一事实,导致在解此题时多了一个求积分的过程,计算过程繁琐,有画蛇添足之感。
(四)两个事件互斥与相互独立混淆
事件的互斥与相互独立是概率论中非常重要的两个不同概念,分别定义如下[1]:
定义1[1] 若A∩B=?覬,则称事件A与B是互斥的,或称为互不相容的。
定义2[1] 如果两个事件A与B满足
P(AB)=P(A)P(B) (2)
则称事件A与B是相互独立的。
例4 设A, B是两个相互独立的事件,已知P(A)=0.3, P(A∪B)=0.65,求P(B)。
解:因为A与B相互独立,即P(AB)=P(A)P(B)。(3)
再根据概率的加法公式
P(A∪B)=P(A)+P(B)-P(AB) (4)
将P(A)=0.3,P(A∪B)=0.65代入(3)和(4)式得P(B)=0.5。
本例中学生常犯的错误解法如下:
解:因为A与B相互独立,所以A∩B=?覬,因此P(AB)=0。由概率的加法公式P(A∪B)= P(A)+P(B)-P(AB),将P(A)=0.3,P(A∪B)=0.65代入,得P(B)=0.35。
显然,上述解法中学生将事件的相互独立与互斥混淆。犯此错误的原因是学生没有注意到相互独立的概念是借助于事件的概率来定义的,而互斥的定义是针对事件本身来定义的,两者有本质区别。教师可通过举例说明两个事件互斥和相互独立之间没有必然的联系,图2可以是一个很好的例子。在图2中,左图中事件A,B分别对应到集合A,B,表现为正方形的左下角和左上角部分,且A,B的概率都是1/2,且AB的概率为1/4,说明A,B相互独立,显然AB不等于空集,即A与B不互斥。在图2的右图中,事件A,B分别对应到正方形的左下角和右上角,它们的概率都是1/2,因此根据定义2中的公式(2)可得A与B是相互独立的,但AB等于空集,说明A与B不是互斥的。图2的两个例子说明:两个事件互斥与相互独立之间没有必然的联系,互斥的事件未必相互独立,相互独立的事件也未必互斥。
(五)样本方差和样本2阶中心矩混淆
样本方差和样本2阶中心矩是数理统计部分的重要概念,在参数估计中经常用到,它们的具体定义为:设X1,X2,…,Xn是来自总体X的一个样本,=(X1+X2+…+Xn)/n是样本均值,则称S2=∑(Xi-)2/(n-1)为样本方差,B2=∑(Xi-)2/n为样本2阶中心矩。这两个概念学生很容易混淆,因为只是分母是n-1和n的差别。教师在介绍这两个概念时一定要联系参数估计的内容,样本方差是总体X方差的无偏估计,因为样本方差的期望正好等于总体X的方差,即E(S2)=D(X),这也是为什么S2取名为样本“方差”的原因,但是E(B2)<D(X),并不是总体方差的无偏估计。通过这样讲解,大部分学生就能记住为什么S2的分母必须是n-1,并能理解它的意义,从而牢牢的记住该定义。
(六)常见记忆性错误
1. 方差性质记忆错误
方差是概率论中最重要的概念之一,它是随机变量的一个重要数字概念,反应了随机变量取值和均值之间的分散程度。在参数估计中,当由两个样本得到的参数估计都是总体参数的无偏估计时,需要研究这两个样本估计的有效性,此时就需要计算这两个样本和均值之间的分散程度,也即比较两个样本的方差。因此,方差计算也是参数估计的一个重要方面。
但方差的计算公式为DX=EX2-[EX]2,不具有线性性,学生经常犯的错误是将D(CX)=C2DX记为D(CX)=CDX。为防范这一错误的发生,教师可以在介绍该性质时对它加以证明,同时要反复强调方差不具有线性性,这是因为方差的计算公式中含有平方项。
针对两个独立的随机变量,两个随机变量差的方差是D(X-Y)=D(X)+D(Y),学生经常记成D(X-Y)=D(X)-D(Y)。犯该错误的原因有两个:一是学生想当然的认为方差和期望一样具有线性性,二是学生没有明白产生上述相互独立随机变量方差计算公式的原因。针对一般的随机变量:D(X±Y)=D(X)+D(Y)±2E{[X-EX][Y-EY]},当X与Y相互独立时,上式右边第三项为0,因此D(X±Y)=D(X)+D(Y)。如果学生能自如的推导上述公式,那么两个相互独立随机变量差的方差公式一般都不会弄错。
和方差相关的第三个常见错误是认为D(C)=C,即认为常数的方差是常数。犯此错误是由于在期望的性质中有一条是E(C)=C,学生将该性质照搬到方差上来。教师在教学中应向学生强调方差反应的是随机变量取值和均值之间的偏离程度,如果一个随机变量取值恒等于常数,那么该随机变量的均值也为该常数,因此没有偏离,故方差为0。
2. 正态分布转化为标准正态分布
正态分布是一类非常重要的分布,根据大数定律和中心极限定理,正态分布是n个随机变量算术均值的极限分布:棣莫弗-拉普拉斯定理说明正态分布是二项分布的极限分布;独立同分布中心极限定理说明具有相同分布的随机变量的极限分布是正态分布[1-3],因此正态分布在概率统计中起著举足轻重的作用。从而,和正态分布相关的概率计算问题是概率统计中经常面临的问题。但是,我们知道正态分布的概率密度函数的积分不是初等函数,因此如果想利用概率密度的积分求概率是不可能完成的。现在课堂常用的做法是将正态分布转化为标准正态分布,并通过查表来计算。例如,X是服从N(μ,σ2)的正态分布,可通过(X-μ)/σ服从标准正态分布来计算概率。但学生常犯的错误是认为(X-μ)/σ2服从标准正态分布,从而得到了错误的结果,这是因为在正态分布的数学符号中参数为σ2,学生直接将其代入。
二、结束语
结合自己的教学经验,本文总结和分析了学生在学习公共概率论与数理统计课程过程中经常犯的错误,主要包括容易混淆的概念和常见记忆错误。我们通过例子对概念理解中容易犯的错误进行陈述,指出常见的记忆错误,并针对每个错误分析了其中的原因,提出教师在教学中需要注意的细节,以及为防范学生再犯此类错误教师在教学上需要做出的改进措施。本文的观点有望给概率和数理统计初学者和高校概率论与数理统计课程教学者提供借鉴和参考。
参考文献:
[1]盛骤,谢式千,潘承毅.概率论与数理统计第四版[M].北京:高等教育出版社,2008.
[2]上海交通大学数学系.概率论与数理统计第二版[M].北京:科学出版社,2007.
[3]朱翼隽.概率论与数理统计第二版[M].江苏大学出版社,2015.
[4]胡娇铃.工学结合背景下《概率论与数理统计》教材改革与数学模型思想的应用[J].高教学刊.2019(10):119-121.
[5]温上伟.五年制师范生对概率统计知识理解现状的调查研究[D].赣南师范学院,2015.
[6]马健.大学概率统计教学的新问题及课程内容改革[J].长沙大学学报,2016(5):114-117.