根原因分析:问题原因数据分析的工具(1)
2016-02-05比约恩安德森汤姆费格豪
◆比约恩·安德森 汤姆·费格豪 著
贾宣东 李文成 译
根原因分析:问题原因数据分析的工具(1)
◆比约恩·安德森 汤姆·费格豪 著
贾宣东 李文成 译
可能的原因是如何与问题联系起来的?哪个原因的危害性最大?问题原因数据分析阶段的目的,即试图解决问题之前的最后准备阶段的目的,就是使可能的原因明晰化。
在问题原因数据分析阶段可以使用的工具有:(1)柱状图;(2)帕累托图;(3)散点图;(4)问题集中图;(5)关系图;(6)亲和图。
柱状图
柱状图,也叫直方图,可以用来表示数据的分布和变化。这些数据可以用长度、直径、期限、成本、态度等来衡量。使用柱状图的目的是使数据能更清楚地显示出来。
在根原因分析中,对柱状图的典型应用有:(1)呈现数据,以便发现最主要的原因;(2)理解不同的问题、原因和结果等出现的分布。
使用步骤:(1)确定所有数据点的数量N。要产生一个有效的柱状图,至少需要30个数据点。(2)计算最大值和最小值的差,即极差R。(3)根据N的大小,将R分为几个组C之间的关系为:数据点的个数和适宜的组C。数据点<50,组C数量为5~7;数据点50~100,组C数量为6~10;数据点100~250,组C数量为7~12;数据点>250,组C数量为10~20。(4)确定每一组的组距H。H=R/C。组距H后保留的小数点位数应该与数据点所保留的小数点位数相同。(5)将最小的数据作为第一组的最小值,然后依次确定每一组的最大值和最小值。每一组的最大值就是这一组的最小值加上组距H。这一组的最大值就是下一组的最小值。记住,每一组的最小值通常包括在它所在的组中(即大于等于最小值),而每一组的最大值则属于下一组(即小于最大值)。(6)为了使柱状图的结构更加简单,可以将数据插入到检查表中。(7)依据检查表构建柱状图。在横轴上标注组,在纵轴上标注频数。使用垂直的柱子来表示每一组的分布。
使用柱状图时应该注意以下几点:(1)一个高峰表明了过程的均值。如果这一高峰不集中,一般是因为存在特殊的原因,这也是需要注意和进一步调查的地方。(2)两个很明显的高峰可能是由两个不同的数据源引起的。这些数据源包括:两个不同的操作人员,两个运输者,两个供应商等。这时需要进行检查。(3)分离模式,指没有逐渐减少的现象,表明数据点在数据收集或者收集之后受到了某些选择性过程的影响。(4)如果分布的形状像梳子,则可能是组太多引起的,一些类别里没有任何数据点,最终导致图表无效。
检查清单:(1)收集并记录生成柱状图所需的数据。(2)数据列中至少应该包含30个数据点,因为30个以下的数据点组成的柱状图是无效的。(3)计算数据列的极差,即最大值和最小值的差。(4)确定应将柱状图里的数据划分为几个组。(5)利用公式,计算每一组的组距。(6)确定每一组的最大值和最小值,定义它们的边界。(7)依据定义好的组合和收集到的数据绘制柱状图。(8)检查最终的柱状图,确定它的形状。分析形状,得出原因。
帕累托图
帕累托原理强调,大多数的结果(大约80%的结果),都只是由一部分少数原因(大约20%的原因)引起的。因此,根原因分析的最有效做法就是对这20%的原因,也称为“关键的少数”,进行诊断。
帕累托图的最主要目的就是生动地描绘这些不对称的分配。帕累托图可以依据问题的严重程度,如发生频率、成本、性能水平等,来展示问题的原因。
在根原因分析中,帕累托图常被用作:(1)根据原因的重要性清晰地展示问题的所有原因;(2)理解需要做进一步调查的原因是哪个。
使用步骤:(1)定义需要分析的问题以及已经识别出的潜在原因。(2)选定在比较各种可能的原因时使用的标准。标准一般为这些不同原因发生的频率或者成本。(3)确定收集数据的时间间隔,按照收集标准进行数据收集。一般情况下,这项工作可能早已完成了。(4)在横轴上按照原因的相对重要性高低顺序将原因从左到右进行排列。根据原因重要性的不同画出相对应的不同高度的矩形。(5)在左边的纵轴上标出数值,在右边的纵轴上标出百分比值,然后沿着矩形的顶部画出一条累计重要度曲线。
检查清单:(1)由于绘制帕累托图需要一系列固定的原因,因此需要事先定义问题和可能的原因。(2)确定标准,以便排列可能的原因。(3)为收集关于原因和定义的标准的数据设定时间间隔。(4)如果还没有收集好数据,请为构造帕累托图收集必要的数据。(5)画图。将原因排列在横轴上,用左边的纵轴标识排列的标准,用右边的纵轴表示累计的标准百分比。(6)根据定义好的标准,将重要性由低到高的顺序,从左至右排列各种原因。(7)在帕累托图上画竖柱。柱子的高度和每个原因的重要程度相对应。在每根柱子的上方插入各个原因的数值。从左至右画出原因的累计重要性曲线。
散点图
不同层面之间的原因总是相互影响。散点图可以反映各种原因之间的这种关系。前提条件是这些原因都可以用数值来表示。
散点图最主要的目的是表示两个原因或者其它变量之间的关系。
在根原因分析中,散点图的应用表现在:(1)在弄清楚一个层面的原因对另一个层面的原因的影响后,探求原因链;(2)剔除那些与根原因不相关的原因。
使用步骤:(1)选取要验证的两个变量(一个因变量和一个自变量)。(2)对每一个自变量的值,测量其相对应的每一个因变量的值。(3)将这两个变量的值组成数据对,将其标在散点图上。一般来说,至少需要30对数据,最好超过100对,才能产生一个有意义的散点图。(4)画图。将自变量或者期望的原因用横轴来表示,将因变量或者期望的结果用纵轴来表示。(5)分析图中表示出来的收集到的数据对。(6)如果这个图没有显示出任何相关性,可以将这些数据对用对数图来表示。对数图有时候能够揭示出那些用普通的坐标轴表示的图所不能揭示出来的关系。
检查清单:(1)如果要进行一项涉及大量相关性测试的大型实验,必须定义好所有的变量。(2)选择并定义要用散点图来分析的两个变量。(3)如果数据还没有收集好,则测量两个变量。(4)必须收集30对以上的数据对,最好是100对以上。(5)设计散点图,将自变量用横轴来表示。自变量就是被认为控制着两个变量的关系的那个因素。(6)将因变量用纵轴来表示。因变量就是被认为与自变量保持一定关系变动的那个因素。(7)在散点图上描绘出数据点。(8)检查整个散点图,找出散点图中两个变量之间的关系模式。(9)如果不能看出一定的模式,就在对数图的一个或两个轴上重新绘制。一般来说,对数图能够使很难看出的模式可视化。(10)如果能够看出相关关系,在得出确切的结论前调查可能涉及的第三个变量。
(未完待续)
摘选自《根原因分析:简化的工具和技术》(第二版)