环境科学专业“数据分析与实验设计”课程教学改革探讨
2020-09-29王鸣,薛艳
王 鸣,薛 艳
(南京信息工程大学 环境科学与工程学院 江苏省大气环境与装备技术协同创新中心 江苏省大气环境监测与污染控制高技术研究重点实验室,江苏 南京 210044)
环境科学是一门新兴的研究和解决环境问题的综合应用型学科,涉及内容广泛[1]。对环境问题的分析离不开实验研究和定量分析,因此系统学习数据分析与实验设计相关的理论知识和方法体系能够培养环境科学专业学生的量化思维和实践能力。我校为环境科学专业本科生开设了“数据分析与实验设计”课程,但以往的教学效果显示,学生对课程内容掌握情况不理想,未达到课程教学目标。未能全面考虑环境科学专业的特点及学生的实际需求,未能将理论与实践紧密联系是导致这一问题的重要原因[2]。为此,结合环境科学专业特点,在“数据分析与实验设计”课程教学内容、教学方法和考核方式等方面进行改革探讨,旨在加大案例式教学和实践性教学力度,激发学生学习热情和兴趣,提升学生理论联系实践、解决实际问题的能力。
1 课程特点及教学过程中存在的问题
“数据分析与实验设计”课程设计的初衷是,培养学生应用数理统计相关知识开展环境科学实验研究和进行数据分析的能力。以往授课教师为数学专业教师,教学内容与传统数理统计课程接近,侧重理论知识和数理方法。学生普遍反映课程内容抽象难懂、理论性强、掌握难度大,而且理论与实践没能有机结合,学生不知如何联系环境科学实际,从而失去学习兴趣,具体体现在如下方面:
(1)数学理论所占比例过高。概念抽象,数学公式及推导过程复杂,非数学专业学生理解和掌握难度大。
(2)方法应用和软件技能培训薄弱。文字性理论阐述过多,统计方法适用条件、优缺点比较等侧重应用的介绍较少,缺少对统计软件的讲授。
(3)教学与实践结合不紧密。教学过程中未能将理论知识和方法与环境科学专业的实际需求有机融合,导致课程结束后,学生不知如何用所学知识解决实际问题。
上述问题说明,以往的教学未达到“实验设计与数据分析”课程预期教学效果,与开设该课程的初衷“强调应用,弱化数学理论”不符。为了提高环境科学专业学生学习数理统计的积极性,培养学生利用相关理论知识分析、解决环境问题的能力,对课程教学进行改革势在必行。
2 课程改革探讨:“应用+实践”的教学模式
针对数理统计教学中普遍存在的“重理论,轻方法”“重阐述,轻软件”和“重传授,轻实践”等问题[3-4],结合环境科学专业特点,提出了以“应用+实践”为导向,理论教学与实践教学并重的教学模式[5]。总体思路是,由环境专业教师替代数学专业教师进行授课,在讲授数理统计相关理论和方法的过程中,用具体环境问题作为案例,并结合环境科研项目进行实践教学。
在教学内容上,弱化数学理论和公式推导,课时占比由约70%降至30%~40%;强调应用,注重方法应用条件和优缺点比较讲授,并在教学过程引入大量案例和练习,课时占比为30%~40%;增加利用Excel、SPSS、Igor Pro 等软件进行数据分析和实验设计的技能性培训和练习,课时占比约为10%~20%;另外,增加基于环境领域科研项目的实践教学,课时占比为10%~20%。
在教学方法上,一方面在课堂教学过程中加强课内互动,以环境科学领域具体案例为切入点,引导学生选用正确方法解决实际问题,引入软件操作练习,指导学生用软件实现参数估计、大小比较、相关性等数理统计分析;另一方面,结合科研项目,开展任务驱动的实践教学,以小组为单位完成具体的实验设计和数据分析任务,并以PPT 汇报和论文形式进行呈现。
在考核方式上,改变以往以书面考试为主方式,将书面考试分数在总成绩中的占比由100%降为60%,增加对课堂案例讨论和科研项目实践练习的考核,在总成绩中的占比分别为10%和30%。
3 实践教学案例设计
3.1 实践教学目标
通过实践教学,使学生加深对课程重要知识点的理解和掌握,培养数理统计思维,正确应用数理统计方法分析环境数据,开发专业潜能,提升创新意识和解决实际问题的能力。通过具体的案例分析,使学生将数理统计理论和方法融会贯通,强化对采样方法、数据预处理、概率分布、假设检验、相关分析等核心内容的理解和应用,并掌握利用软件实现统计分析的具体方法和操作步骤。
3.2 实践教学内容
在“数据分析与实验设计”理论课程基础上,以国家自然科学基金项目“长三角地区大气羰基化合物化学转化和来源量化研究”为案例,设计了如下实践教学内容。
3.2.1 采样方案设计
大气羰基化合物采样方案的设计,主要考查学生对于如何获取代表性样本和抽样方案等知识的理解和掌握。获得有代表性的数据,是基于有限样本资料推断总体特征统计分析的基础。在样本量确定的情况下,抽样方法是影响样本代表性的重要因素。常用的抽样方法包括系统抽样、随机抽样、系统-随机抽样和多层次抽样[6]。在本案例中,大气羰基化合物采用2,4-二硝基苯肼(DNPH)衍生化法进行采集,采用高压液相色谱(HPLC)技术进行实验室分析[7-8],由于采样和分析成本较高,综合考虑将总样本量控制在400 以内。由于A 城市的功能区划中包含城区(住宅和商业为主)、工业区和清洁背景区,为了确保样本的空间代表性,采用多层次抽样方法,设置城区、工业区和清洁背景区3 个采样站点,每个站点的观测结果构成一个子系统。考虑到大气羰基化合物浓度的时间变化特征,为保证样本的时间代表性,在每个站点采用系统-随机抽样方法进行样本采集。首先按照系统抽样的思路,划分春、夏、秋、冬4 个季节,然后在每个季节中随机选取5 天(随机抽样)进行样本采集。在采样当天,按照系统抽样思路,每间隔4 h 采一个样。
通过采样方案设计这一实践训练,一方面能够使学生对抽样方法有更加直观的认识,加深对多层次抽样、系统抽样和随机抽样的原理、步骤、适用范围和方法及其差异的理解和掌握;另一方面通过抽样方法的灵活运用,培养学生的创新性思维,为学生独立开展环境科学实验打下基础。
3.2.2 概率分布拟合分析
引入具有绘图功能的统计软件,并设计可视化的直观教学案例,能够提升教学的趣味性和实用性[9]。数据分布能够反映总体的综合特征,而数据分布特征是影响统计方法选择的重要因素。在本案例中,利用Igor Pro 软件中的Histogram 函数进行频数分布特征分析[10]。以工业区站点甲醛浓度为例,其频数分布如图1 中灰色阴影所示。进一步利用正态分布和对数正态分布这两种理论分布模型,对其进行概率分布拟合分析。从拟合结果来看,对数正态分布能够更好地反映大气羰基化合物的浓度分布特征。
图1 工业区站点甲醛浓度频数分布图
这项实践内容可以使学生加深对总体分布特征、正态分布、对数正态分布等知识点的理解和掌握,并且能够自主利用软件实现概率分布拟合分析,有利于调动学生的积极性,使学生直观感受到数据分析的现实性和实用性。
3.2.3 异常值检验
通过概率分布拟合分析,发现工业区站点甲醛浓度频数分布接近对数正态分布,因此将数据先进行正态变换,变换公式为X’=ln(X)。式中,X 为大气羰基化合物原始观测浓度,X’为取自然对数之后的浓度。然后进行假设检验,显著性水平α 确定为0.05。统计假设的原假设H0为可疑值但不是异常值,对立假设H1为可疑值且为异常值。首先将最极端的数值(即最大值和最小值)作为可疑值开始检验。利用Excel 软件中NORM.DIST 函数计算出最大值、最小值的相伴概率p[11],分别为0.011 和0.046,小于0.05,因此拒绝原假设,即在0.05 显著性水平下,最大值和最小值为异常值;进一步检验次大值和次小值,其相伴概率分别为0.032 和0.107,次大值相伴概率仍小于0.05,认为其为异常值,而次小值相伴概率大于0.05,接受原假设,认为其不是异常值;继续检验第三大值,其相伴概率为0.068,大于0.05,认为其不是异常值。
异常值检验不仅能让学生练习数据预处理、异常值检验和相伴概率计算的具体步骤,而且能加深对假设检验的一般步骤、统计假设、显著性水平等知识点的掌握、理解和应用。
3.2.4 总体大小比较
为了使学生理解并掌握总体大小比较方法及其选择依据,设计了如下练习题目:判断城区和工业区站点羰基化合物浓度是否存在明显差异。
考虑到羰基化合物浓度符合对数正态分布,能够进行正态变换,因此在进行总体大小比较方法选择时,优先选择检验功效更高的参数检验方法,即t 检验。另外,使在两个站点的相同时刻采集的样本构成一一对应的个体,采用成对数据t 检验进行大小比较。统计假设的原假设H0为城区站点和工业区站点甲醛浓度不存在明显差异,对立假设H1为两站点甲醛浓度存在明显差异。显著性水平确定为0.05。利用Igor Pro 软件中Analysis—Statistics—Two Sample Test 来实现对成对数据的t 检验[10]。检验结果显示,检验统计量t所对应的相伴概率为0.008,小于0.05,因此拒绝原假设,即认为在0.05 的显著性水平下,两站点甲醛浓度存在显著差异。
3.2.5 相关分析
分析以往教学中相关分析的统计假设和方法选择考试出错率较高的问题,设计了如下练习内容:为初步判断大气羰基化合物的来源,探讨工业区站点甲醛和乙醛浓度是否具有共变关系[7-8]。
羰基化合物浓度数据可以进行对数正态变换,故选用参数检验方法(Pearson 相关系数法)进行相关分析,以充分利用数据信息,提高检验功效。统计假设中H0为甲醛和乙醛浓度不相关,H1为二者显著相关。利用SPSS 软件实现Pearson 相关分析,具体步骤为“分析—相关—双变量—Pearson 相关系数”[12]。检验结果显示,Pearson 相关系数r 为0.941,在0.01 水平上显著相关,因此作出甲醛和乙醛浓度具有显著共变关系这一判断。
3.3 实践教学效果
在这一实践教学案例中,设计了针对课程6 大类理论知识,共20 个重要知识点的练习,覆盖课程教学大纲中约70%的内容,详见表1。另外,在实践教学中,指导学生使用了3 个常用的数据分析软件,掌握了9 项重要的软件使用技能。
表1 实践教学案例中涉及的主要知识点及技能练习
学生在这一实践过程中,通过对实际环境数据进行统计分析,加深了对数理统计理论、方法的掌握,提高了应用能力,并对环境数据分析有了更加直观的认识,大大提升了学习兴趣。
4 结语
针对环境科学专业特点和学生需求,探讨了“数据分析与实验设计”课程的教学模式改革,提出以实用性为核心,理论与实践并重的教学模式。在新的教学模式中,弱化理论推导,加强案例讨论,增加软件使用等技能练习,并结合环境科研项目设计了实践教学方案。这不仅使学生提高了分析解决问题的能力,而且挖掘了专业潜能,增强了创新意识和综合素质。