六西格玛管理DOE某案例的改进
2019-03-23俞钟行
◆俞钟行 / 文
DOE是六西格玛管理的重要方法,难度较大。本文拟对《六西格玛管理统计指南(第三版)》中做19次试验、用Minitab分析数据的全析因设计,只做8次试验、用excel分析数据,而可以得到相同的结果。
一、原例原解
改进热处理工艺提高钢板断裂强度(望大)问题。因素及水平如表1:
为考虑各因素的交互作用,决定做全析因试验,并在中心处进行3次试验,一共19次试验(即24+3)。用Minitab分析,得结果如下:
即因素A、B、D和交互作用BD是显著的。标准差S=6.30446。
二、对原例用L9(34)解
原例在中心处做试验,实际相当于4个因素、3个水平的情况。在日本和中国的实践中,对于4因素3水平的DOE,常用正交表L9(34)来完成。而且已有研究表明,在此情况下也能分析交互作用等复杂情况。本例虽然作了19次试验,由于结构不同,不能抽出相当于L9(34)的9次试验。但下面用excel来分析数据的方法,与L9(34)情况下分析时的思路和步骤是一样的,并能得到有益的启示。
表1 因素水平表
图1 Minitab分析结果
在excel电子表格上,用“数据分析”里的“回归”模块对原例19次试验数据(图2)进行分析,得出图3的结果。
虽然图3中“回归统计”的Multiple R=0.926964、“方差分析”的Significance F(其实就是p值)=7.67E-06都不错,并且4个因素中的3个P-value值也都远小于0.05,但残差的SS(平方和)/总计的SS(平方和)=540.3136/3839.161=0.140737>10%,说明所得回归方程存在“失拟”的问题。
用excel画出本例4因素3水平的“因素趋势图”如图4。这种图的画法要一字排开,因为这样最容易辩识各因素的强弱、走势和相互之间有无交互关系。因素的走势若为“V”,很可能是2次方;若为斜向上的钝角,可能是3次方。从图4看,较强的3个因素基本是直线,应是一次方。此外,两个因素的因素趋势图若呈交叉状态,则表明它们之间可能有交互作用。“遗传原则”认为:两个因素中至少有一个是显著因素,才可能有交互作用。图4中,A和B基本平行,C又是特别弱,故需要考察的交互作用基本就是AD和BD。经回归检验,AD无交互作用,BD有交互作用。具体操作步骤是在excel里插入BD项(图5),然后用excel的“回归”分析,得出结果:Multiple R=0.954971、标准误差=5.09874、Significance F=1.99 E-06、残差/总计=0.08803<10%,与图3比较已全部明显改进且已不“失拟”;考察的各因素及交互作用的显著性情况也不错。最后以所得回归方程,用excel里“规划求解”选优,无悬念地得到Y=571.1128、A=860、B=3、C=1.6、D=60(即全析因试验中最好的1次)。这里用excel分析已取得与Minitab分析类似结果。即使是真的L9(34)的9次试验数据,按上述思路和步骤作分析也是可行且能成功的。
图2 excel上原例19次试验结果
图3 excel回归分析结果
图4 用excel画原例因素趋势图
三、对原例用L8(27)求解
从原例L16(215)中可以挑出L8(27)的数据,L8(27)的数据在excel中如图6:
用excel里“数据分析”的“回归“模块分析,结果如图7:
因为这里残差/总计=130.1538/2097.079=0.062064<10%,所以不“失拟”,回归的其余指标也都挺好。如果这时以Coefficients里显示系数形成的方程为目标函数,用excel里的“规划求解”选优,得到的最优值= 569.7125,相应因素组合为:A=860、B=3、C=1.4和D=60。为何没有挑出实际已经存在的最优组合——图6的最后一行?把“因素趋势图“画出来(图8)可得到启发:
图5 excel上原例已插上BD项的试验结果(省略显示)
图8 的L8(27)因素趋势图与图4的L9(34)是相似的。按L9(34)时的做法,插入BD项后再回归,得Multiple R= 0.989846、标准误差= 4.602852、Significance F=0.049751、残差/总计=42.3725/2097.079= 0.020205,比插项前有明显改进。因此承认BD交互作用是合理的。而且此时用excel里的“规划求解”选优,得到的最优值=571.55,相应因素组合为:A=860、B=3、C=1.6和D=60,等同于图6的最优组合,也等同于图2的最优组合。另外从图8看,因素A最强,因素C虽最弱,但C与A的交叉关系颇显著,因此尝试对图6插入AC项,并作回归分析。有意思的是:回归结果的第1、第2张表完全等同于插入BD项。这可以L8(27)表头设计的“混杂”现象来说明:
图6 excel上原例挑出的L8(27)数据
图7 L8(27)excel回归分析结果
图8 L8(27)的因素趋势图
本例的L8(27)的A、B、C、D四个因素,就是如表2所示放在1、2、4、7列上的。在此情况下,交互作用AC和BD都出现在第5列,因此是混杂的。若说此例的因素趋势图不容易看出B和D有交互作用,但A和C有交互作用是容易看出的。这说明:因素趋势图确实能透露出一些交互作用的信息的。
表2 L8(27)表头设计
也尝试在插入AC后删去因素A,使总的项数保持4项不变,并作回归分析,其结果没有纯粹加AC好。
四、用Ru来评估回归方程的优劣
表3 五种情况下Ru等回归方程拟合优度指标的统计
注意到在回归分析时,如增加项,一般相关系数都会变得更好一些,有时这并不代表拟合得更好。为了明白回归方程的拟合是否真的变好,可以参考上田一太郎等著《用Excel学数据挖掘》,根据下面公式作判断:
Ru=1-(1-R)(n+k+1)/(n-k-1)
式中,R:多重相关系数;n:数据个数;k:EXCEL回归分析的“回归自由度”。
最优者是当Ru是正数且数值最大时的回归方程。
如回归方程情况为L8(27)加插1项时,Ru=1-(1-0.989846)(8+5+1)/(8-5-1)= 0.928922。
表3是上述5种情况下Ru的计算结果,及表征回归方程拟合优度的其它重要指标的统计。显然,只作8次试验、回归时根据因素趋势图加插交互作用BD(或AC)的拟合最好,在全部5个指标中有4个是最优的。
小结:六西格玛管理DOE可以改进得更精益。如本例①4因素2水平加测中心点的全析因试验,用excel结合因素趋势图能像Minitab一样很好地分析数据;②4因素2水平必须加测中心点时可用L9(34),以excel结合因素趋势图作回归分析,以规划求解选优;③4因素2水平非必须加测中心点时可用L8(27),以excel结合因素趋势图作回归分析,以规划求解选优。
参考文献(略)