正交试验中的极差分析与方差分析
2017-05-12华中师范大学数学与统计学学院唐佳丽
☉华中师范大学数学与统计学学院 唐佳丽
☉华中师范大学数学与统计学学院徐章韬
正交试验中的极差分析与方差分析
☉华中师范大学数学与统计学学院 唐佳丽
☉华中师范大学数学与统计学学院徐章韬
一、引言
在社会生产和实际工作中,我们常常会遇到多因素的问题,需要找出主要因素.为了节约时间、成本,提高效率,我们通常会抓影响试验的主要因素进行研究[1].正交试验设计就是要求在较短的时间里,用较少的试验次数分清影响试验的主次因素.在“各个因素均衡分布”的指导思想下,运用标准化的正交表来安排试验,能减少试验次数,缩短试验时间,并可用极差分析和方差分析对试验数据进行整理和合理的分析,快速找到优化方案,取得较好的试验效果,具有很强的实用性.
对中学的概率统计课程而言,我们可以在更大一点的范围内深度挖掘教材内涵[2].在人教版高中数学选修教材中,详细介绍了试验设计和如何实施正交试验设计,然而在数据的分析处理上只用了极差分析法,事实上还可以运用方差分析法处理数据.在教学实践中,我们可以将方差分析的思想渗透给学生,从深度和广度上拓宽学生的视野和思维,从而让学生明白,数学的分支虽然千差万别,但不同的数学知识之间是相关联的.本文正是做这方面的补充,为“正交试验设计”的教学添砖加瓦.
二、正交试验设计
1.正交试验中的相关术语
为了便于阅读,首先需要明白正交试验设计中的一些常见名词.指标是指在试验中需要考查的效果的特性值.例如,后面提到的弹簧的弹性,也就是因变量.因素也称因子,是试验中考查对试验指标可能有影响的原因或要素,也就是自变量,一般用大写字母A、B、C来表示.水平是指试验中选定的因素所处的状态和条件称为水平或位级[3].全试验指各因素各水平全部的搭配都做试验[1].在多因素的情况下,最好能抓住主要因素,化多因素试验为少因素试验,以达到用较少的试验次数取得较好效果的目的.
正交试验之所以在一定程度上能用部分试验去代表全试验,主要是因为它有以下两个特点:其一,用于试验安排的正交表具有正交性,这就保证了不同因素的不同水平参与试验的次数相等,不同因素的不同水平搭配出现的次数也相等,即各种因素的各种水平的搭配是均衡的;其二,正交试验设计具有整齐可比性,也称综合可比性.因其具有正交性,所以任意两种因素之间进行的是全试验,在不考虑各因素交互作用的前提下,任一因素的各水平的试验条件近似相同,各因素间具有可比性.
2.正交试验实施步骤
以教材中“如何实施正交试验设计”这一章节的例1(某五金厂在弹簧生产中,有时发生产品断裂现象,为提高弹簧的弹性指标,要做回火工艺试验)为例,介绍正交试验设计的实施步骤,并在此基础上对教材进行深一步剖析,引进方差分析,沟通极差分析与方差分析.
步骤1:制定因素水平表.
在制作因素水平表安排试验之前,首先,我们应当考虑试验指标与试验目的,在此例中,试验指标即弹簧的弹性,而目的就是提高弹簧的弹性,在实际需要中,弹性越大越好.其次,根据试验的目的、理论及平时生产的经验综合分析,选择需要考查的因素:回火温度(A);保温时间(B);工件质量(C),并确定好各因素的各个水平.其中,A:A1=440℃,A2=460℃,A3=500℃;B:B1=3min,B2= 4min,B3=5min;C:C1=7.5kg,C2=9.0kg,C3=10.5kg.最后,根据因素和水平制作因素水平表,见表1.
表1 因素水平表
步骤2:设计试验方案.
根据已经制作完成的因素水平表,考虑试验条件和实际的可操作性,选择一张适合的三水平正交表:L9(34),因这张表最多可以考查4个因素对试验结果的影响,而此次试验我们只考查3个因素对试验的影响,所以我们可任意选择表中的3列进行表头设计并制作试验方案表安排试验,见表2.
表2 回火试验方案表
步骤3:试验并列出试验结果分析计算表.
列出方案表之后,就可以根据方案表进行试验.试验过程中,我们应特别注意:试验的次序尽可能随机化以减少因素间相互影响造成较大的误差;除了我们需要考查的因素,其他的试验条件在整个实验过程中尽量保持相同,增大结论的可靠性;准确记录好每一次试验的数据.
试验结束后,对试验数据进行简单的分析计算,列出实验结果分析表,详见表3.
表3 实验结果分析计算表
注:表中的T表示所有试验次数的数据之和,Ti表示各因素的第i水平所做试验的数据之和,Ti是Ti的平均数,即各因素的第i水平所做试验的数据的平均数,R表示各因素Ti的最大值和最小值之差,即Ti的极差.
三、数据处理
1.数据的直观分析——极差分析
由于正交试验具有正交性和综合可比性,以A因素为例,虽然在试验中与B、C因素的搭配不同,但A因素的同一水平下的B、C因素处于相同的地位,其不同水平的效应也可以近似抵消.如此,我们就可以把TAi(A因素的i水平数据的平均数)的数据变化大体看成是由A因素的不同水平引起的,则RA就能近似看成A因素的水平变化能引起整个试验产生变化的程度,RA的值越大,说明A因素对整个试验的影响越大,此因素对于试验越重要[1].反之,就说明A因素对整个试验的影响越小,属次要因素.B、C因素的比较与A因素同理,这就是极差分析法的原理.
用极差分析进行分析,我们可以较为直观地比较出来此次试验的主次因素,并通过简单的对比找出最优水平的搭配.此例中,RA>RC>RB,所以A是影响试验的主要因素,B为次要因素.另外,我们可以根据TAi的数据大小选择使弹性指标最大的A因素的水平:A1,用相同的方法选出B1、C2,得到的搭配A1B1C2为最优水平的搭配,即回火温度为400℃,保温时间为3min,工件质量为9.0kg为最佳搭配.
当然,在简单的数据之间进行比较,使用图示会更清晰明了,将极差的数据利用极差的效果对比图表示出来,可以更直观地得到结论,如图1.
图1各因素极差对比图
从图中可以看出,对试验影响最大的因素为A,在各因素确定的各个水平上,使得y轴上数值(试验数据:弹性指标)最大的水平分别为:A1、B1、C2,故最优搭配为A1B1C2.
极差分析原理简便,通俗易懂,在分析数据中起到了一定的作用,但这种分析方法的局限性很强:虽然我们可以将所有考查的因素进行主次的排序,得到了主要因素,但这种因素对试验的影响是否显著,在何种水平上显著,我们仍然一无所知.而且,引起试验数据变化的来源也十分模糊,我们并不知道数据的波动究竟是由于因素的改变(可以解释的误差),还是由于试验的随机误差(未被解释的误差),在多大的程度上依赖于这两种误差?因此,这种分析从数学意义上就显得过于粗糙,引进方差分析正是为了解决这一问题.
2.数据的方差分析
教材中并没有对方差分析进行介绍,但在“试验为什么要设计”这一章节中提到:“英国学者R.A.Fisher提出了方差分析方法,创立了‘试验设计’”[1].既然教材中有所提及,并说明了方差分析在试验设计中的地位,教师就有必要挖掘教材的内涵进行拓展,架起沟通极差分析和方差分析之桥,完善学生的数学认知结构,使教学内容既能符合教学需要,又能促进学生的发展.
方差分析是分类变量与定距变量之间的相关性分析[2],通过分析各因素引起的数据波动较误差引起的数据波动的差异程度,来推断相应因素不同水平总体均值差异的显著性.所以我们有必要对试验数据进一步计算其相应的离差平方和与误差平方和,见表4,其中,ST为总离差平方和,SE为误差平方和.
表4 方差分析计算表
表中相应的数据计算公式和计算过程如下(r是各因素的水平数,ni表示各因素i水平参与试验的次数):
当正交表中出现空白列,则误差平方和就等于总平方和减去各因素平方和;而当正交表的列数充分使用时,即每列都使用,误差平方和就选择各因素平方和中最小的一个.
由以上的计算结果我们可以列出一个方差分析表,见表5.
表5 方差分析表
注:均方和等于平方和除以相应的自由度,F比等于因素均方和除以误差均方和.
显然,F的比值越大,其相应的因素对试验的影响程度越高,故能根据F比的大小排列出因素的主次程度.但仅仅有因素主次的排列是不够的,极差分析也正好止步于此,而方差分析能进行进一步的分析.在方差分析中,看各因素对试验的影响是否显著,在何种显著性水平上显著只需比较相应的F比值与各显著性水平的临界值的大小.若因素F比超过了某一显著性水平的临界值,则此因素在此显著性水平上显著,反之,我们就认为此因素在此水平上无显著特征.这样,我们就能深入地分析各因素对试验的影响程度.
从上面的分析表中可以看出FA=67.6>F(2,2)0.10=9.0,FA=67.6>F(2,2)0.05=19.0,A因素对试验的影响无论是在0.1的显著性水平上,还是在0.05的显著性水平上都表现为显著,所以我们有理由相信A因素是显著性因素.而C因素不仅在0.05的水平上不显著,在0.10的水平上也不显著,所以C因素在试验中对试验的影响很小.B较C更是对试验的影响不显著,因此在选择最优搭配的时候,我们可以从环保、节约时间、降低成本,方便操作等角度综合考虑,如B2因素节约材料,操作简单,故在试验中选择B2水平是较合理的,这时得到的最优水平的搭配A1B2C2较用极差分析法得到的最优搭配A1B1C2更符合实际的需要,也更具有现实意义.当然,如果在操作或技术层面的区别十分微小,就选择使弹性指标值最大的因素水平,此时最优搭配亦为A1B1C2.
四、试验验证
通过分析确定的最优搭配A1B1C2并不在之前所做的9次试验当中,而9次回火试验中,试验结果最好的是第2次试验,弹性指标为391,因而我们要对选择的最优搭配进行试验验证.通过试验,其试验结果指标为400,高于第2次试验的试验指标值391,则认为A1B1C2是满意的,也证实了A1B1C2是最优的水平搭配.
五、教学上的意义
通过对“正交试验设计”的阐述,我们可以看出,极差分析法思想朴素,原理单纯,能根据各因素的极差大小排列出因素的主次顺序,学生学习起来困难并不大.然而这种比较方法的精度并不高,教师若能在此基础上进一步引导学生思考误差的来源,自然而然地将方差分析的思想和方法融入课堂,弥补极差分析之不足.这也要求在平时的实际的教学中,教师要纵观数学和课堂的全局,有意识地挖掘教材,使教学内容丰富多彩,使学生的数学认知结构日益精进.另外,教科书的编写者花了大量心血编写了通俗易懂、致力于提高学生核心素养的选修教材,若不加强教学研究,任之束于高阁,绝非课程改革的本意,故我们以沟通极差分析与方差分析为主题,撰写了小文.
1.课程教材研究所.普通高中课程标准试验教科书(B版)数学选修4-7[M].北京:人民教育出版社,2007.
2.徐章韬,赵宏.作为数学教育研究数据处理的方差[J].中学数学(上),2016(2).
3.徐仲安,王天保,李常英.正交试验设计法简介[J].科技情报开发与经济,2002(7).F