人工智能时代下研究生应用数理统计优质课程建设
2024-05-13肖枝洪黄守成
肖枝洪, 黄守成
(重庆理工大学 理学院,重庆 400054 )
0 引 言
理工科研究生是国家在人工智能时代所要培养的创新型人才,所以高等院校不仅要注重对理工科研究生理论分析能力的培养,更要注重对解决具体实际问题的综合能力的培养.三部委曾经分别在2013年和2020年共同颁布的《关于深化研究生教育改革的意见》(教研[2013]1)[1]和《关于加快新时代研究生教育改革发展的意见》(教研[2020]9)[2]中提出“培养具有创新能力的卓越人才的主要途径是进行研究生教育,要对其培养方式方法高度重视;要深化科学与教学的融合,加强学术学位研究生创新精神和科研能力培养;要突出产业与教育的融合,注重专业学位研究生实践动手能力的培养.” 2014年《教育部关于改进和加强研究生课程建设的意见》(教研[2014]5)[3]又提出“课程的教育与教学在研究生培养质量保障中具有奠基性和大局观的战略作用.”这些文件为进行研究生应用数理统计优质课程建设指明了方向.而优质课程建设能够使整个教学活动的质量和水平得到大力提升,使先进教育教学技术得到更加广泛的推广和应用.另外,优质课程建构的共享教学平台,可以更好地满足非全日制研究生自主学习的需要.因而,优质课程尤其对提高“人工智能时代”专业学位硕士研究生创新能力和培养质量具有重要意义.
1 研究生应用数理统计课程在教育教学中目前存在的问题
理工科研究生应用数理统计课程是全国高等院校理工科专业学位研究生和部分学术学位研究生的专业学位课,对研究生的专业方向课程的学习具有很大的支撑作用,对形成研究生分析问题与解决问题的思维观有很大的启迪作用[4-5].虽然,已有校级研究生应用数理统计优质课程建设的基础,但随着时代的发展,特别是人工智能时代,一方面,数据统计分析软件要么缺少介绍,要么没有与时俱进,存在更新不及时的情形,现今各类研究生《应用数理统计》教科书中尚没有配套的数据分析软件.针对上述问题,部分学者提出在应用数理统计课程教学中使用SAS,MATLAB或Mathematica软件[6-7],但笔者认为在人工智能时代使用Python软件更合适,这是因为Python软件普适性强,可视化功能强,上手难度小,而且是机器学习、深度学习和强化学习等人工智能内容常用的编程语言.第二方面,在教学内容的设置上有滞后问题,缺乏较为新颖的内容;甚至与本科生教学内容有很多雷同的地方,而这些内容又不是对以前的内容进行概括总结为新内容做铺垫.对此,有学者在本课程教学改革中针对人工智能构建了部分案例以论述应用数理统计在人工智能中的作用[8-9],但没有从课程内容的整体性进行建构.统计学家Larry Wasserman也指出“人工智能时代,统计学概念被计算机科学赋予了“新外套”,应用数理统计更应融合计算思维特点,交叉结合计算机机器学习部分教学内容,使学生明白其背后的本质就是统计学的常用概念”[10].第三方面,在数字资源建设上,许多省部级及以上优质课程或精品课程不仅难以得到充分使用,而且对课程知识也没有进行及时更新,其开放性也不够,阻碍了研究生广博地、便捷灵活地、自主地使用现代数字技术提高自主学习的效率[11].第四方面,虽然研究生应用数理统计课程侧重于对试验数据的分析方法和应用的介绍,但是现今研究生在学习该课程时,实际动手进行试验设计和数据预处理的课时很少,数据分析的原理介绍课时过多[12].第五方面,对于研究生课程学习效果的考核方面,现今的做法是单一的期末考试:采取闭卷或开卷形式的知识性考核,缺少对实际动手能力的考核[13].第六方面,研究生应用数理统计课程通常要求承担课程教学的教师具备较高的把控教学的水平和探求人工智能时代科学新知识并发现新问题的能力,然而还是有部分承担该课程教学的老师在上述方面存在有所不足的问题:任课教师的教学理念缺乏新的活力、所采取的教学方法缺乏因材施教难以与时俱进[13].
针对以上六个方面的问题,重庆理工大学研究生应用数理统计课程组对本课程进行了切实可行地改革和建设,以期望将本课程建设成为人工智能时代重庆市研究生优质课程.
2 研究生应用数理统计优质课程的建设措施
研究生应用数理统计课程以概率论为理论基础,其目的是根据实际问题设计实验,得到试验数据,并依据试验数据对实际问题进行建模,或进行统计推断进而发现问题的内在规律.此课程所拥有的独特的思维方式和分析问题的手段已经融入到人工智能时代的各个应用场景,是相关科学领域进行数据分析以探求科学内涵的重要数据挖掘工具,也是大量高端科技前沿进行研究的根本性分析方法.具体而言,应用数理统计的基本原理和方法已经作为人工智能时代分析与处理多变量、结构化的大数据所必备的一种通用工具和技术[13].基于现今研究生应用数理统计课程教育教学中的若干不足,课程团队从下述若干方面进行了完善与建设.
2.1 课程教师队伍建设
高质量的教师队伍是应用数理统计教育教学的第一资源和保障.研究生应用数理统计课程的教育教学不只是要求任课教师具备对国际上有关科学动态的最新进展有高度的洞察力,而且还要求任课教师能将取得的最新科研成果有机地融入该课程的教学内容中,形成以科学研究引领教学、以教学反哺科学研究的相互促进的教学理念.所以,在研究生应用数理统计课程团队建设上,根据人工智能时代的要求,应对任课教师的科学研究能力与教育教学水平从如下几点进行改进与完善.
(i) 师资队伍专业结构调整.本课程师资人数已从原来的不到5人增加到10人,其中45岁以上教师占3人,35至45岁之间的骨干教师 5人,35岁以下占 2人,具有博士学位8人;数理统计方向8人,人工智能方向1人,管理工程方向1人.本课程教学团队还应在此基础上不断吸纳优秀青年才俊,增加人工智能和管理工程方向人员,更加有效改善教师的专业结构,使得课程团队具有跨学科、交叉合作的特点.
(ii) 拓宽师资队伍的人工智能视野.首先,任课教师需从传统的单一思维,向多元思维转变,要经常性浏览具有人工智能特色的交叉学科的专业期刊的文献摘要,了解应用数理统计所介绍的数据处理方法在各个领域的应用情况,使自己在授课时能够有的放矢,引导研究生具有明确的学习目标和科研方向.再者,承担课程教学的老师,需要经常性参加校内外相关学科的学术会议,尤其是每年举办的国际机器学习、人工智能相关会议.了解应用数理统计课程与人工智能前沿理论的相结合的情况,学习先进的数据分析原理和方法,拓宽视野,从而做到在讲授该课程时厚积而薄发.最后,任课教师要熟练掌握Python数据分析语言,能够熟练地运用Python软件处理实验数据,进而能够指导研究生运用应用数理统计的理论和方法对实验数据建立正确的模型,并以此为依据进行合理分析,取得优质的科研成果.
(iii) 打造具有持续发展的教学团队.课程组成员不定期进行统计学与人工智能前沿文献的研读,不定期进行说课或课程研讨,研究与探讨该课程渗透人工智能特点的教学方法.尤其要积极引导和培养具有博士学位的年轻教师作为该课程的后备力量,积极调动承担该课程教学而且教学经验丰富的教师发扬“领、传、导”的作用,帮助承担课程教学的年轻教师不断提升教学技能,塑造成具有责任心的严谨的教学品格,从而孕育出一支教学水平高、科研能力强、敢于负责的老中青相结合的课程教学团队.
2.2 教学内容建设
人工智能的主流技术(如深度学习)以对大数据的加工处理为基础,其模型、分析、计算基础都根置于数理统计[14].数理统计的方差分析可以为人工智能更好的拟合模型,提供良好的泛化性能;数理统计的随机化、归一化数据处理可以加快人工智能的训练速度,避免过拟合;数理统计中概率分布、条件概率、贝叶斯公式、以及 Markov链等概念也大量应用于人工智能的决策任务中.但现有理工科类研究生的应用数理统计课程却缺乏相应知识点,与人工智能时代背景的需求相脱离,所以更新该课程教学内容,势在必行.
(i) 结合理工科类专业特色,制定适应人工智能时代特色的研究生应用数理统计教学大纲.在制定研究生应用数理统计课程教学大纲时,采取调研教学用书,查阅相关资料及访谈毕业生等,制定出具有人工智能时代气息的理工学科专业特色的研究生课程教学大纲.由于传统的研究生《应用数理统计》教材对贝叶斯统计、统计模型算法、试验设计篇幅内容讲解较少,所以应适当增加其内容,任课老师可针对不同的学科情况,进行合适的学时分配,例如对计算机和人工智能专业,可重点讲解对数据可视化、EM算法、MCMC算法、聚类算法等内容,建议对该部分多安排2~3学时; 对化工和材料等实验为主的学科,可重点讲解在试验设计和统计控制方面的内容,建议对此部分内容多安排2~3学时.此外,研究生应用数理统计课程教学大纲要体现教学内容 “少、精、宽、新”的特点.例如,大纲中将以前“线性回归”作为重点内容调整为将“非线性回归”作为重点内容,对较为经典的试验设计内容进行缩减,增加多因素试验设计、多级系统和统计控制等方面的内容.又考虑到许多学科增开了“人工智能+”的课程,而这些课程在算法中要用到转移概率等概念,所以研究生应用数理统计课程教学大纲增加了Markov链等内容.
(ii) 以人工智能案例为导向,优化与完善研究生应用数理统计课程教学内容的层次结构.为了激发研究生的学习兴趣,培养其推存出新的能力,该课程遵循“实际例子导入→基本理论和公式讲解→具体案例印证→实际数据分析与处理”的教学程式,从具体到抽象,再从抽象到具体,对课程教学内容逐步展现,丝丝入扣,循循诱导.
因为高等院校教师通常承担着省部级及以上各类科研课题以及各类实用型横向课题,研究生们也会积极加入到这些科研课题中,而这些课题对培养研究生创新思维与科研水平具有积极的启迪作用和引领作用,故此,研究生应用数理统计课程教学内容中应以相关学科的科研成果为案例来介绍试验设计和实验数据的统计建模方法.另外,将较新的科学研究文献引入到课程教学中,使课程教学内容与时俱进,具有人工智能时代的气息,体现出创新性和实用性,从而使空泛的教学内容变得生动具体,烙上时代特征.
(iii) 课程理论教学与实践教学紧密融合.实际动手能力和工匠精神的的培养如今为高等院校研究生各学科所大力倡导.因而,本课程也在实践课程教学方面加大力度,采取“依据具体情境产生疑情→依据疑情形成问题→根据问题提出备选模型→根据模型选取方法和软件→根据数据拟合模型→根据模型得出结果→将结果升华为结论→总结改进”的程式,切实地训练研究生根据实际情形提出问题并加以解决的能力,从而使研究性在实操过程中产生创新意识,自觉形成科学的思维闭环.比如为药物生物学院研究生讲预测模型时,引进糖尿病遗传风险预测案例,采用讯飞人工智能(Artificial Intelligence,简称AI)比赛的数据集,通过向学生讲解糖尿病患者患病的原因和危害,引申出准确诊断出糖尿病患者的临床意义,引发学生兴趣与参与度.随后,引导学生将问题符号化为二分类问题,提出使用决策树或支持向量机(Support Vector Machine,简称SVM)模型进行建模.然后对数据进行预处理(如清洗数据、填补缺失数据等),运用Python软件进行统计分析,得到相应结果和结论,最后讨论是否有进一步改进的空间.
2.3 教学条件建设
(i) 适应人工智能时代的教材建设.针对重庆理工大学以及一般高等院校理工科学科特点,撰写了适合研究生应用数理统计课程教学的研究生教材《应用数理统计与Python应用》.该教材突出介绍统计方法的应用场景,比较细致地讲解用统计方法解决具体问题的策略和操作过程;介绍了数据分析Python软件的使用方法.教材中对于应用Python软件所得到的数据分析结果,与理论方法分析步骤相呼应,不仅能够使学习者知其然,还能使之知其所以然.同时,该教材不仅兼顾到各工科专业的课时设置有所差异,而且做到内容简明扼要、重点突出,便于授课教师根据不同的需要对内容进行增补;而且例题与习题的叙述均在常识的范围之内,通俗易懂,也便于研究生自主学习.
(ii) 具有鲜明特色的课件建设.根据研究生应用数理统计课程教学大纲制作出课堂教学课件,课件内容突出重点,基本原理和方法简略介绍,对案例的分析步骤进行较详细介绍.收集相关科研文献和专业老师的科研成果,编写出有代表性的科学研究案例.而且,链接到有关的网址或网站,下载Python软件或R软件等数据分析软件,编写软件使用指导书,使研究生能够较熟练地运用所学软件处理实验数据,得出合理结论,产出优质成果.
(iii) 内容充实生动的课程数字资源建设.灵活利用数字技术平台,对丰富教学内容,延展学生的学习时间和空间,培养学生的学习兴趣和实践动手能力有着较大的辅助作用.本课程团队成员开发了研究生应用数理统计优质课程数字平台,其栏目设置涵盖课程教学目的与内容简介、教学与学习指南、课程团队介绍、多媒体学习课件与视频、试验设计指南与数据处理软件介绍、课程案例库与习题库以及逸闻趣事等栏目.通过该课程数字资源,引导研究生方便快捷地利用研究生应用数理统计课程平台,自主学习该课程在课堂上没有弄懂的教学内容和扩展内容,明了应用数理统计的最新理论和方法以及应用成果,拓宽其学术眼界;还可以通过逸闻趣事栏目,进行课程思政教学,启迪研究生形成正确的人生观、通达的世界观和科学的价值观.
2.4 教学方法与手段的改进
(i) 课程教学方式灵活多样.根据不同的教学内容,采取不一样的课程教育教学方式.研究生课程教育教学应该突出体现教学内容的学术性与新颖性.在课堂教学实施过程中,运用启发与诱导、讨论与归纳、实际案例剖析、创新与经典对比等形式丰富的教学模式,以期启迪研究生的好奇心,消除学习的疲倦感,形成创新性思维,锻炼提出新问题和解决实际问题的技能.譬如,对于研究生应用数理统计的基础部分采用老师讲授、研究生听讲并做练习的启发式教学方式;对于重点部分和难点部分,采取问题导向教学方法:任课老师给研究生预先布置任务,让他们提前预习,上课时回答问题,并对问题的回答作为平时成绩记载.例如,在讲解马尔可夫链蒙特卡罗(Markov Chain Monte Carlo,简称MCMC)算法内容时,由于MCMC算法包含众多知识点:Markov链、蒙特卡洛模拟、后验分布以及Gibbs抽样等知识点,要求研究生课前通过CSDN或GitHub等网站搜索相关知识点的介绍,提前预习,课堂上可以更好理解教学内容.对于较新或者比较前沿的内容,也是预先布置任务,分派研究生课前查阅相关文献资料,上课时分成小组进行报告,这种研讨式的教学方式,可以激发研究生的好奇心和创新性.比如讲解随机森林时,会涉及到信息熵、基尼系数概念,以及XGboost,Catboost,LightGBM等前沿算法,让研究生以4~6人一组为单位查阅相关中英文文献资料,写总结报告、制作PPT并上台汇报,与大家探讨交流,共同学习.
另外,在教学中,任课老师更应注重答案的开放性,以期望激发研究生的研究兴趣,引导其自主思考,提升其对复杂问题的解决能力,目的是把研究生培养成发现新问题的“智慧高手”,而不仅仅是解决问题的“理论和方法的使用者”.比如上述所说的课前预习后上课回答问题,以及前沿内容小组收集文献资料进行上台汇报,均没有固定标准,对于同一个知识点,学生获取的渠道不一样,所用的案例也不尽相同,表达方式也会有所差异,但都能提升了研究生自主学习、自主思考和自主解决问题的能力.
(ii) 在课堂教学手段上采取传统板书与现代教育技术相融合的技巧.在应用数理统计课程理论与公式演算上,仍然采用在黑板上演示的形式;在实际例子讲解、实验数据分析与计算上,通常采取灵活多变的教学方式:譬如,在PPT上凸显重要文字内容,将纷繁复杂的数据可视化为直观性强的图表;在实施试验设计步骤的演示时,播放录制好的操作过程视频,增强直观效果,增强研究生的感官印象;在讲解二维正态分布时,将编写好的Python代码进行运行,现场输出二元正态分布的密度函数的3D图形,增加研究生的直观理解;讲解非线性回归分析时,根据所收集的数据模拟出多种函数曲线,让研究生直观比较哪种曲线对所给定的数据拟合得更好,并指出每个曲线的优劣之处,从而激发研究生的探索精神.
(iii) 根据人工智能和大数据时代的特点,不仅在研究生应用数理统计课程的实践教学中贯穿数据分析软件的使用,而且在研究生应用数理统计课程的理论教学中也贯穿数据分析软件的使用,从多方面强化训练研究生的数据分析软件应用能力.这是因为如果不具备强有力的数据分析软件的应用能力,再好的实验数据也难以得到合理的结果,从而所做实验就会被认为失败.同时,软件的使用,也可以证实应用数理统计的理论和方法的正确性,消除研究生的疑虑,增加其学习的信心,从而使研究生在建立模型时主动运用应用数理统计的原理和方法建立合理的数学模型,用以解释所研究的问题而抽象出具有普遍性的结论.
2.5 课程教学效果评价体系的改进
(i) 研究生应用数理统计课程考核方式改革.基于成果导向教育(Outcome-Based Education,简称OBE)教育教学理念,将由过去单一的闭卷或开卷考核研究生掌握基本理论与方法、基本计算能力的考核方式改进为多形式的以学习成果产出为评价标准的考核方式.例如将研究生在最新科研文献的收集与评论、撰写数理统计原理与方法在所学习的领域中的应用的专题报告、试验设计与数据分析报告以及上机编程解决实际问题等方面作为考核内容,在期末考试试卷中也加入具有实际背景的题目,采取开放式的考试方式.这样,在研究生课程考核上能使他们有更加灵活的更有效的发挥场所,避免出现为考试而考试的不良动机,而是主动自觉地检验自己对该课程掌握的程度.
(ii) 科学合理的课程教学评价机制的改进.根据教学目标和相关要求,制定条理清晰的教学评分表,确定切实可行的教学评价栏目,建立全面而系统的课程教学评价体系,全面评价本课程教育教学对研究生的成才成人的作用和效果.合理评价一般由以下几个方面来实现:①课程学习期间评教:将此课程学期末研究生对任课教师的一次性教学评价转变为平时分阶段的评教与期末综结性评教相结合的过程性评价,并以期末评教占60%的权重给任课教师综合打分.②本校督导专家评教:本校督导老师和研究生院或各学院负责研究生工作的领导随堂听课进行评教.③课程教学产出成果的调研:一方面,随机抽取在校生进行座谈,听取在校生对教学效果的评价,反馈课程教学的优缺点.另一方面,通过QQ 群或微信等方式,向毕业生发出调查问卷,请他们对本课程的教学效果和应用情况进行评价,例如,对任课教师的讲课方式、课程的内容、重难点以及应用领域等方面进行评价.为此,课程团队从教学模式、课程内容、重难点掌握程度、以及分析能力四个方面设计了一份课程建设与学生学习效果满意度的调查问卷,并在化学工程与技术、计算机科学与技术、车辆工程、材料科学与工程、药物生物技术专业等QQ群和微信群分发了1000份,实际收回864份有效问卷,进行统计分析见表1.
表1 应用数理统计课程教学效果问卷调查结果及分析
对数据进行列联表检验,得到自由度为6的卡方统计量值为19.417,p值为0.0035,表明表1中调查数据是有效的.从表1中也能看出研究生对课程建设的四个维度是相当满意的,也就是说应用数理统计的课程改革效果得到了研究生的认可.通过上述全方位的评价,可以促使本课程的教学效果日益提升,形成优质的教育教学品牌.
3 结 论
本文主要探讨了重庆市应用数理统计优质课程的建设情况,从符合人工智能时代要求的教学大纲修订、具有特色的教学内容完善、具有高水平师资队伍的培育、教学模式的创新、密切联系实际的教学案例库的构建和科学合理的考核评价方式的改进等六个方面加以建设和实施.从表1 的调查数据可以看出,93%的学生对教学模式感到满意,新增教学内容让90%的学生感受到对主修专业有用,91.2%的学生对教学重难点的设置感到满意,97%的学生对习得的数据分析能力比较满意.表明新颖的教学模式,新增的教学内容以及重难点在学生群体中大受欢迎,不过仍然有少数学生对此课程的教育教学不太满意.如何使研究生应用数理统计优质课程更上一层楼,更好地培养研究生的学习和科研能力,对我们队伍来说仍然是一个长期而艰巨的任务,我们将持续精进,建设更加优质的课程!
致谢由于受到相关文献的启发,以及审稿专家提出的许多建设性意见,使本文有了质的改进,在此表示由衷的谢意!