“极大似然估计”教学的诊断和策略研究
2024-09-15曾诚迟楠景湘李
摘 要:贵州理工学院作为地方省属高校以培养高素质应用型人才为办学目标,对《概率论与数理统计》课程提出了新的要求。针对“极大似然估计”这一数理统计部分最重要的知识点之一,结合在实际教学过程中的经验,对“极大似然估计”在教学中存在的问题和现状进行了诊断和分析,然后详细研究了其存在的原因,最后给出了相关的教学策略和研究措施。
关键词:极大似然估计;诊断措施;策略研究;课程思政
1 概述
贵州理工学院是应省委、省政府实施工业强省战略和城镇化带动战略对理工类应用型人才之需,经教育部批准设立的一所省属本科理工院校,于2013年正式开始招生,是贵州省唯一一所理工类院校。我校通过不断的探索与实践研究,明确了“培养适应地方经济社会发展需要的高素质应用型人才”的培养目标定位,立足贵州,服务地方,辐射西部。应用型本科院校,以应用型和地方性为办学定位,以培养具有创新精神和实践能力的高级应用型人才为目标。这一目标的确立,对我校的大学数学教学工作提出了新要求,《概率论与数理统计》为理工科各专业重要的学科平台基础理论课,同时也是非常重要的应用类型课程[1-2],一直深受学校重视。同时,作为教学活动不可或缺的部分,以学生发展为中心的教学内容的合理设计对于培养学生的创造性思维能力、抽象概括能力、逻辑推理能力,分析问题和解决问题的能力起到至关重要的作用,这也是金课的要求[3-4]。
另一方面,大学数学相比中学数学的一个最重要的特点就是其抽象性和复杂性。对于《概率论与数理统计》该门课程,本质上是由概率论和数理统计两个分支构成;而从关系上来说,需要先讲授概率论,再讲授数理统计。目前大学阶段的一个共有现象则是课时被压缩的极度厉害,因此在《概率论与数理统计》这门课程中,留给数理统计这部分的时间就极其少了,往往只有十个课时不到。但是对于数理统计而言,参数估计和假设检验是两大主体框架内容,通常只能根据具体的剩余时间来介绍点估计、区间估计、统计量标准、假设检验等。因此,学生普遍反应在数理统计这部分掌握不清晰,而对于“极大似然估计”这一个重要的知识点[1,2],就需要教师在教学过程中有所思考,使得同学们能够在有限的时间里掌握“极大似然估计”的原理思路和步骤方法等等。
2 “极大似然估计”的教学现状和存在问题
“极大似然估计”(Maximum Likelihood Estimate, MLE)是求估计的一种方法,最早是由德国数学家(Gauss)在1821年针对正态分布提出的,但一般将之归功于英国统计学家费希尔(Fisher),因为费希尔在1922年再次提出了这种想法并证明了它的一些性质而使得最大似然法得到了广泛的应用[5]。
“极大似然估计”方法的目的就是利用已知的样本结果,反推最大概率导致这样结果的参数值,它就是建立在极大似然原理的基础上的一个统计方法[6],是概率论在统计学中的应用。极大似然估计提供了一种给定观察数据来评估模型参数的方法,而且通常说来,“极大似然”就是“最像”的意思。该方法的主要特点如下[1,2]:一是它比其他估计方法更加简单;二是它为无偏或者渐近无偏,当样本数目增加时,收敛性质会更好;三是如果假设总体的条件概率模型正确,则通常能获得较好的结果,但如果假设模型出现偏差,将导致非常差的估计结果。此外,极大似然估计在后续很多专业的学习过程中,也有非常多的应用[7-9]。
但遗憾的是,在目前关于“极大似然估计”的教学过程中,由于教学时间所限或者其他原因,教师在课堂上很少介绍“极大似然估计”这一重要知识点的发展历史、来源、原理、特点等等,这也使得学生在学习的过程中对于“极大似然估计”的认识非常肤浅,首先感觉它就像“天马行空”般的出现,其次不知道其具体的原理和使用方法,再次是不知道它在后续的课程中有什么作用,加上临到课程后期的时候,教师和学生的心态都是普遍比较慌张的,最后大部分的同学们也就只能把“极大似然估计”拿来直接使用。这样的结果使得同学们在“极大似然估计”这一知识点的得分率极低,经统计,在贵州理工学院(2013-2022年)近十年的《概率论与数理统计》课程的试卷中,考查“极大似然估计”这一知识点的题目的平均分只有3.2分,连一半分数都不到(总分通常为7分)。其实在实际中,关于“极大似然估计”的内容并不复杂,其知识点相对简单,而相应的方法也比较初等化:主要涉及中学学习过的连乘和对数性质,加上微分导数或偏导数,不用牵涉学生们普遍都比较害怕的定积分计算,理论上应该是不困难的。
3 “极大似然估计”教学中存在问题的原因分析
对于“极大似然估计”方法,一方面由于高度的抽象性和严密的逻辑性让学生感觉枯燥乏味;另一方面由于课时骤减,使得教师无法对该方法的发展历史、来源、原理、特点等进行详细介绍,同时师生也普遍缺少必要的交流与互动,与专业需求契合度不高。
另外,如果我们使用“极大似然估计”方法,首先需要构造关于参数的似然函数,其中是来自总体的样本;其次在似然函数的基础上变形得到对数似然函数;然后通过求导(偏导)来导出似然方程(组),并求解可得极大似然估计值和极大似然估计量。
对于离散总体,设有样本观测值,可写出该观测值出现的概率,它一般依赖于某个或某些参数(用表示),即可将该概率看成的函数,也就是似然函数:
对于连续总体,样本观测值出现的概率总是为0的,但可考虑使用联合概率密度函数来表示随机变量在观测值附近出现的可能性大小,即似然函数:
进一步,在离散总体情形(1)和连续总体情形(2)中,都可以继续扩展得到:或。因此,学生们在学习“极大似然估计”的过程中遇到的第一个大问题就是对于连乘符号的错误使用,包括连乘符号与连和符号的混用,学生对于省略号的恐惧等等,下面给出例子进一步说明。
例:已知总体的概率密度为,是的简单随机样本,是未知参数,求的极大似然估计量.
错解1:当,则;
错解2:当,则;
错解3:当,则;
错解4:当,则;
错解5:当,则;
错解6:当,则;
错解7:当,则;
错解8:当,则;
错解9:当,则.
上面给出了贵州理工学院在2013-2022年的《概率论与数理统计》试卷中发现的一些共有现象,有些错误还是上述几类错误的综合。实际上正解应为:
当时,则。
第二个大问题则是学生对在中学就已经学习过的对数的运算性质掌握不牢靠,经过统计调查,发现共有错误可总结为如下六类:
错解1:当,则;
错解2:当,则;
错解3:当,则;
错解4:当,则;
错解5:当,则;
错解6:当,则.
实际上正解应为:当时,则有。
第三个大问题就是来自同学们对于求导数的计算方法掌握不熟悉,经过统计调查,发现共有错误可总结为如下三类:
错解1:当,则;
错解2:当,则;
错解3:当,则;
而实际的正解应为:当时,则有。
第四个大问题就是同学对于极大似然估计值和极大似然估计量的区别掌握不清楚,往往通过似然方程求出来的解就认为是极大似然估计量。
4 解决“极大似然估计”教学存在问题的对策方法
对于“极大似然估计”教学点的发展历史、来源、原理、特点等等,教师在备课中引结合相关资料和文献给予糅合,然后在授课中贯穿教学过程,这样学生就不会感觉到迷茫。同时对于“极大似然估计”的计算,要坚持四个步骤:①写出似然函数;②对似然函数取对数,并整理;③求导数或偏导;④求解似然方程。在教学过程中,需要坚持从知识上升到能力,从工具上升到运用,从技能上升到文化。同时合理设计教学情境,提高学生的学习兴趣;也要侧重数学知识与专业需求相结合,拓展内涵提升素质。
在具体的计算过程中,对于有限个样本观测值,教师在讲授过程中,可以让学生在草稿纸写上一头一尾,这样可更好的克服同学们对于省略号带来的恐惧。还是以前述例题为例,如果能先在草稿纸上写出来,则可比较清晰的看出共有个和个样本,还有相乘,这样就比较清楚,也不容易出错。
同时对于离散分布的分布律或连续分布的概率密度函数,要引导学生能区分对待。比如对于前述例题的有效概率密度部分(即:),可分为三大类,第一类为,这类通常都可以有个;第二类为,这类含有样本的要特别注意,因为有限个样本的不同,需要写成,也就是不能简单合并;第三类为,这类虽然也含有,但是它的底数为,因此与第二类是有区别的,同时指数含有样本,也要有所注意。
此外,在教学知识的讲授过程中,要注意课程思政[10-15]的引入。通过融入思政元素,把对基本概念和基本理论的知识传授与价值引领相结合。深入挖掘“极大似然估计”教学点所蕴含的思政元素:“化繁为简”“量变引起质变”“永攀高峰”等可始终贯穿“极大似然估计”教学的全过程。
参考文献:
[1] 茆诗松, 程依明, 濮晓龙. 概率论与数理统计(第三版)[M]. 北京: 高等教育出版社, 2019.
[2] 盛骤, 谢式千. 概率论与数理统计及其应用(第二版)[M]. 北京: 高等教育出版社, 2010.
[3] 陈学慧, 李娜, 赵鲁涛. 将思政元素融入概率论与数理统计“金课”建设与实践[J].大学数学, 2021(3): 30-35.
[4] 吴岩. 建设中国“金课”[J]. 中国大学教学, 2018(12): 4-9.
[5] Fisher R. A. On the mathematical foundation of theoretical statistics [J]. Philos Trans, 1922, 222. Reprinted in Contributions to Mathematical Statistics, 1950, J Wiley & Sons, New York.
[6] 陈永娟. 极大似然估计概念的微课程教学设计[J]. 安阳师范学院学报, 2019(2): 3.
[7] 田玥. 基于统计回归模型的极大似然估计[J]. 通讯世界, 2019, 26(3): 243-244.
[8] 左卫兵, 李英莉. 逻辑回归模型中的混合最大似然估计[J]. 河南教育学院学报(自然科学版)2017, 26(3): 1-6.
[9] 李亚旭. 近似因子模型的惩罚极大似然估计[D]. 浙江工商大学, 2017.
[10] 李纯, 净张淼, 王纯杰,等. 概率论与数理统计课程思政与科教融合的创新探索[J]. 高教学刊, 2022(16): 43-46.
[11] 周琴, 刘志清. 课程思政理念下概率论与数理统计混合式金课建设与实践[J]. 信息系统工程, 2021(3): 170-174.
[12] 张慧, 朱庆峰, 杨广芬,等. 《概率论与数理统计》课程思政案例设计及应用[J]. 高等数学研究, 2021(4): 117-120.
[13] 马昕. 《概率论与数理统计》课程思政教学改革的实践与探索[J]. 高教学刊, 2021(3): 135-138.
[14] 李晨, 陈丽萍. 概率论与数理统计课程教学中思政元素的挖掘与实践[J]. 大学教育, 2021(3): 104-106.
[15] 张俊珍. 基于追踪视角的学生发展性评价的实践逻辑[J]. 教育理论与实践, 2022(10): 29-33.
项目资助:本文受到高等学校大学数学教学研究与发展中心教学改革项目(CMC20160303);贵州省教育厅省级教学内容和课程体系改革研究项目(2020128,2021210);贵州省教育厅省级金课;贵州省教育厅省级本科高校优秀教学团队(YLDX201615);贵州理工学院教育教学改革研究项目(2022JXGL02,JGYB201804);贵州理工学院混合教学模式改革项目(2018HHKC04)等资助
作者简介:曾诚,男,博士,教授,研究方向为随机控制与博弈,特殊矩阵及应用、复杂系统和网络,高等教育管理等;迟楠,女,硕士,讲师,研究方向为凸优化、经济数学、高等教育研究等;景湘李,男,硕士,讲师,研究方向为数理统计及其应用、高等教育研究等。