基于几何直观的最小二乘法教学实践与探索
2024-09-23丁博
[摘 要]最小二乘法是理工科高年级本科专业中常用的一个算法,在经管类专业中也有重要应用。但由于该算法涉及的数学理论比较多,导致学生理解较为困难。因此,如何设计教学内容,在不降低理论深度的情况下,引导学生从不同的角度看待问题,进而开拓其思维,是教学中应该深思的问题。文章结合教学实践,通过化繁为简、数形结合以及问题导向等方式,对该算法的课程教学进行了总结和探索,以期更好地培养学生的思维能力和创新能力。
[关键词]最小二乘法;问题导向;数形结合;教学教法
[中图分类号]G642.0 [文献标识码]A [文章编号]2095-3437(2024)15-0040-04
最小二乘算法在18世纪由数学家高斯发现,并应用于大地测量和天文观测的研究中。自此以后,最小二乘算法被广泛应用于多个学科、多个领域[1-2]。随着现代电子计算机的普及与发展,尤其是人工智能时代的来临,该方法更显示出强大的生命力,在回归分析、机器学习[3]等方面均有应用。
由于最小二乘法的理论涉及的数学理论较多,尤其是用到不少高等数学和线性代数的知识,因此容易出现教师无法简单讲清楚、学生难以听明白的情况。为降低教学难度,不少教学设计中仍然采用初等数学的方法来讲述最小二乘法,避免了复杂的矩阵运算,但也降低了理论深度。这种教学方式相对简单,也足以应付一些简单的应用场景,但容易导致学生的思维水平仍然停留在初等数学的阶段,不利于学生创新性思维的培养。
为培养学生的创新能力[4],教师通过改进教学实践,尝试进行学科交叉教学[5]。针对理工科高年级本科学生,在不降低理论深度的同时,着力采用几何直观的方法讲述最小二乘法的原理,使学生在掌握该方法的同时,学会用不同的视角看待同一问题[6],进一步体会其所蕴含的深刻思想,进而提升学生的综合素养。
在优化教学实践的基础上,进一步总结探索一些面向抽象问题的教学方法,如化繁为简、数形结合、实际应用等,以此提高学生的思维能力、创新能力,最终提高学生的综合素养,践行新时代培养创新型人才的理念。
一、最小二乘法教学实践
最小二乘法教学的实践上,教师通过代数和几何的角度,不拘泥于教程和资料,推导和分析最小二乘法。通过分析公式推导的每一步,使学生知其然,更知其所以然。
(一)最小二乘法的代数方法求解
1.内积与范数概念的复习
对于列向量x=(x1 x2…xn)T,y=(y1 y2 …yn)T,其内积定义为xTy= x1y1+ x2y2+…+ xnyn。当xTy = 0时,称x与y正交。在内积的基础上,教师介绍向量的二范数定义,指出向量的二范数就等于其自身内积的平方根,即[x]=[x21+…+x2n],在几何上,向量的范数即为向量的长度。
2.最小二乘代数方法求解
当线性方程组 y = Hx 无解时, 称其为不相容方程组。对于不相容的方程组,教师可以引导学生,希望求其近似解,最好的办法是寻找向量 [x],使得 [y-Hx2]达到最小。用数学公式表达即为[y-Hx2]=[miny-Hx2]。此时称[x]为不相容方程组 y = Hx 的最小二乘解。令v=y-Hx,则最小二乘问题也可写为[minv2]=[miny-Hx2]。
为了找到最优的最小二乘解, 教师可以引导学生设计代价函数J(x)= [v2]=[y-Hx2]=(y-Hx)T(y-Hx),再令代价函数J(x)对向量x求导(注意不同的书中对向量求导的定义不尽相同,有的书中用行向量来表示,因此最后表示形式会稍有不同),并令导数为零,即得2HTHx-2HTy=0,这样就可以得到正规方程组 HTHx = HTy。
显然,当H列满秩时,根据矩阵的相关知识,可以知道矩阵(HTH)的逆存在,也即矩阵(HTH)–1存在,进而将正规方程组HTHx = HTy两边同时左乘以矩阵(HTH)–1,可得最小二乘解为[x]=(HTH)–1HTy。此时代价函数J(x)也达到最小。
3.教学实践中需注意的事项
在上述教学过程中,直接利用矩阵求导可以避免初等数学推导中的烦琐的计算,但这种表示对于一些基础不太好的学生来说有些难度。教师可以介绍一些简单的例子,以加深学生对其的理解;也可以引入一些简单的例子,再给出其矩阵表达。实际的教学过程中,教师可以根据学生的基础和接受程度选择适当的方式。
(二)普通线性方程组解的几何解释
为了给出最小二乘的几何表达,下面介绍普通线性方程组的解的几何解释。
1.线性方程组的向量形式
教师可以从一个简单线性方程组y = Hx的例子开始。假设该方程只有两个未知数,即x=(x1 x2)T,此时矩阵H只有两个列向量,不妨设两个列向量分别为α1和α2。则线性方程组的矩阵形式 y = Hx可以写成向量形式 y = α1x1 + α2x2。
2.线性方程组的解与线性组合
当线性方程组y = Hx有解时,则意味着向量y可以由向量α1和α2线性表出;反之当向量y可以由向量α1和α2线性表出,必然存在两个数x1 和x2, 使得y = α1x1 + α2x2成立,于是线性方程组y = Hx有解,其解即为x=(x1 x2)T。
当向量α1和α2线性无关时,这两个向量的所有线性组合组成的集合就构成了一个线性空间,称为矩阵H的列空间,记为R(H)。在几何上,R(H)表示一个平面,如图1所示。
3.线性方程组有解的几何解释
线性方程组y = Hx有解,在代数上表示向量y可以由向量α1和α2线性表出,而在几何上,就意味着向量y处在R(H)所表示的平面上,即y∈R(H)。反之,当向量y处在R(H)所表示的平面上时,向量y一定可以由向量α1和α2线性表出,此时y = Hx一定有解。这样就可以通过数形结合的方式,把线性方程组有解同几何直观联系起来,从而加深学生对所学知识的理解,在潜移默化中培养学生多角度思考同一知识的习惯,也为接下来最小二乘的几何解释打下基础。
(三)不相容方程组最小二乘解的几何解释
1.不相容方程的几何解释
当线性方程组 y = Hx 无解时,一般称其为不相容方程组或超定方程组。由上节的讨论可知 y = Hx 无解,就意味着向量y不属于R(H)所表示的平面,即y ∉ R(H),如图2所示。
2.最小二乘解的几何解释
最小二乘解的目标就是寻找向量[x]=([x1 x2])T ,使得[y-Hx2] 达到最小。仍然假设矩阵H只有两个列向量,并且两个列向量分别为α1和α2,则 [y] =H[x] 可改为向量形式 [y] = α1[x1]+ α2[x2],此时向量 [y] 为向量α1和α2的线性组合,即[y]∈R(H),如图2所示。在几何上,最小二乘的目标即是在R(H)平面上找到向量[y], 使得向量([y-y])的长度最短。
由几何直观可知,当向量([y-y])与平面R(H)垂直时,其长度最短。而向量 ([y-y])与平面R(H)垂直,就意味着([y-y])与平面R(H)上的所有向量都正交。因为向量α1和α2属于空间R(H),所以([y-y])当然也与向量α1和α2正交。根据向量正交的定义,此时有α1T([y-y])=0,α2T([y-y])=0,由于向量α1和α2是矩阵H的列向量,因此HT([y-y])=0,从而得到正规方程组HTHx = HTy,当矩阵(HTH)–1存在时,进一步可以得到其最先二乘的解的形式为[x]=(HTH)–1HTy。
3.教学实践的总结与讨论
通过这样的教学设计,可以让学生学会用几何直观的视角看待最小二乘的解,既可以增强学生的理解能力,帮助其洞察知识的本质,又可以让学生更好地感受理论的魅力,激发其发散性思维和创造性思维。在教学中,教师还可以根据实际情况,增加一些更加深刻的内容,如投影矩阵、空间分解等概念,为后续学习更深层次的理论奠定基础。
二、抽象问题的教学方法探索
如前所述,最小二乘法作为一个重要的算法,其应用非常广泛。然而该算法的理论较为抽象,导致学生理解较为困难,也容易影响后续的学习。因此,如何将抽象的理论通过浅显的语言表达出来,是教师在教学中必须考虑的因素。下面借助最小二乘法的教学实践,对该类课程的教法进行总结。
(一)化繁为简,减弱抽象问题
在讲解最小二乘法的矩阵表达时,如果学生基础较弱、理解较为困难,教师可以先从简单的情形出发,尽量不要一开始就直接从多元超定方程组进行推导。首先,教师可以把维数降低,从最简单的二元形式开始介绍。此时其矩阵只有两个列向量,问题就变得简单多了。其次,教师对简化后的超定方程组进行推导,从而得出最小二乘的矩阵表达式。这种化繁为简的方式便于学生接受。最后,教师由简入繁,将二元的结论顺势推广到多元的形式。这样的教学过程较为顺畅,学生的理解程度也可以随之加深。
如果在讲解过程中,仍有部分学生难以理解,教师则可以化抽象为具体,列举一些实际的例子,让学生从初等数学的角度进行推导。之后再把具体例子抽象为符号表达,进一步将其结论归结到矩阵形式。教师通过这样化繁为简的方式,从简单和具体的例子出发,再层层递进,由简入繁,不但教授了知识,而且在潜移默化中向学生传授了科学的思维方式。
(二)数形结合,多角度认识抽象问题
数形结合不单是一种多角度认识抽象问题的方式,也是一种知识转换和迁移的方式。利用知识的迁移,把不熟悉的内容转换为熟知的内容,符合一般的认知规律,既能巩固旧知,又能大大减轻新知的抽象性。
在讲解了最小二乘的矩阵表达之后,教师应通过带领学生复习线性方程组与线性空间的知识,引导学生将线性方程组与向量的线性表出等概念联系起来,再将向量的线性表出与几何直观联系起来。在此基础上,教师进一步延伸出超定方程组的最小二乘问题,即寻找最小二乘解,其等价于寻找垂直于矩阵列空间的向量。这样就从几何中垂直的概念引出最小二乘正规方程的表达式,实现了方程语言、矩阵语言、几何语言三者之间的转换。
从不同的视角出发对知识点进行讲授,目的是使学生能够根据多种思想方法对问题进行细致观察、综合分析,概括提炼其中所蕴含的内在规律,进而提升其逻辑思维能力,激发其发散性思维,培养其创新潜质。
(三)建模应用,理解抽象问题的本质
最小二乘问题与实际生活或工作联系紧密,用最小二乘问题解决实际问题,有助于进一步理解抽象概念的本质。教师可以在教学环节中适当加入一些应用最小二乘法解决实际问题的例子,比如用最小二乘解决曲线拟合问题等。
曲线拟合问题与最小二乘法的关系最为密切,可以说曲线拟合问题的解决就是发现最小二乘原理的历史起源。在课堂上,教师可以向学生介绍相关历史背景,如数学家高斯是如何发现和利用最小二乘原理,得出了谷神星的运动轨道,并准确预测了谷神星的位置。
在介绍上述历史的基础上,为符合学生学习认知规律,对谷神星轨道预测问题进行抽象和简化,提出问题“给定平面上的10个观测点,假设这些点就是谷神星观测记录,每一个点对应的横坐标表示观测时间,对应的纵坐标表示谷神星的位置。那么如何预测接下来时刻谷神星的位置?”接着设计问题引导学生思考“如果有一条曲线经过了平面上的10个观测点,只要找到这条曲线的方程f(x),那么就可以预测接下来第11个、第12个观测点的位置了”。
这一过程,就把实际的问题变成了一个曲线拟合问题,而曲线拟合问题就是要找一条曲线的方程,使其在对应时刻的函数值与观测值的差最小,进而把曲线拟合问题转化为一个最小二乘问题。通过这种教学设计,让学生理解最小二乘法的强大之处,在提高学生学习兴趣的基础上,加深其对知识点的印象。
总而言之,在教学过程中,教师要综合运用化繁为简、数形结合、特殊到一般、案例教学、建模及应用等方法,培养学生的抽象思维能力。
三、结语
培养创新人才是当前重要的教育理念,而知识的讲解必须达到一定的深度,才能激发学生的创新思维。本文针对理工科专业中广泛应用的最小二乘法,在不降低理论深度的同时,用代数的严谨和几何的直观阐述其基本原理,从而使学生在掌握该方法的同时,体会看待同一问题的不同视角。通过对理论的深入探讨,对学生的主动思考能力、逻辑分析能力进行全方位训练和提升,进而实现“知识传授、能力培养”相融合的教学目标,最终提高学生的综合素养,使其成为创新引领的高素质人才。
[ 参 考 文 献 ]
[1] 《运筹学》教材编写组.运筹学[M].4 版.北京:清华大学出版社,2012.
[2] 李子奈,潘文卿.计量经济学[M].5 版.北京:高等教育出版社,2020.
[3] 彭德巍. 人工智能课程实验案例研究与实践[J].大学教育,2021(2):71−74.
[4] 张智杰,张艺馨,张静.在大学数学教学中培养学生创新能力[J]. 智库时代, 2019 (12): 162.
[5] 林健.第四次工业革命浪潮下的传统工科专业转型升级[J]. 高等工程教育研究,2018 (4): 1−10.
[6] 朱婧,陈学慧,张志刚.基于卓越工程师计划数学能力培养的探索[J].高教学刊, 2018(6): 80-82.
[责任编辑:黄紧德]