用统计学方法对企业检测工序的简化分析
2019-11-16张雯婕陈晓军黄立生徐杰
文/张雯婕 陈晓军 黄立生 徐杰
质量是产品存在的根本,工厂只有提供优质的产品才能在现代的商业竞争中做大做强。在产品生产过程中的品控管理显得尤为重要[1]。随着现代生产技术的提高,机械化、数字化的生产工艺在很大程度上提高了产品品质的稳定性,但是在一些大型企业中,随着品质意识的日渐深入,决策层没有或是说不敢随着产品生产性能的提升及时调整品控管理,工厂的品控管理存在着过度检验的现象,虽然已经有人意识到了这个问题,但是该不该减少内部检测的工序以及如何减少还没有一个科学有效的依据。
数据分析是企业品控管理实现持续改进的一大重要手段,数据分析可为质量改进提供理论证明[2]。本文以某一大型企业检测项目数据作为分析对象,尝试采用统计学方法分析在保证现有的检测结果不变的条件下能否简化检测工艺。
1 材料与方法
1.1 材料
以某企业2016—2017年,一个整年度的某一产品的某一检测项目数据为研究对象。该产品在一整个年度中连续生产,且没有改变过工艺。该检测项目为定时抽样检测,整年度共获得有效数据2186个。
1.2 方法
t检验:亦称student t检验(Student's t test),主要用于样本含量较小,总体标准差σ未知的正态分布[3]。 T检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。
本试验采用随机抽样从原数据中抽取50%、33%、25%、20%、10%的数据组成处理数据组,通过t检验检测抽样后的平均数与原始平均数的差异。其计算公式如下:
2 结果与讨论
工厂想要简化检测工序,最有效的方法就是降低样本数量,在这过程中要能保证减少后的样本数据其特征参数(在该检测项目中为平均数)与原数据一致,简化工艺才算成功。理论上检测数据会在真实值上下浮动,越接近真实值其出现的次数越多,符合正态分布规律。原样本的统计分析见图1,证明原样本的数据分布符合正态分布。
图1 原样本的频率分布直方图
本试验随机抽取原样本的50%、33%、25%、20%以及10%的数据,与原样本(100%数据)进行比较,频率分布线图见图2。由图2可知,数据的减少导致曲线的平滑程度下降,但其特征形状没有改变:没有左右偏斜,其顶峰与100%的数据基本一致。直观表明处理数据组与原数据组的相似性。
图2 不同样本量的频率分布线图
在本文中做出统计推断:
(1)已知试验数据服从正态分布,由原抽样数据算出平均数为276.7。
(3)显著性水平:根据试验要求(差异是否显著)规定α=0.05。
(4)统计量的值:由于总体标准差(σ)未知,需使用t检验。
(5)建立H0的拒绝域,因 HA≠276.7,所以是双侧检验,当|t|> t0.05(双侧)时拒绝H0证实HA,反之则证实H0。由t分布的临界值表得知t0.05(双侧)=1.98。
在统计学理论中,单纯的数值上的差异不能说明任何问题。本文做的统计推断的目的是由处理组平均数推断其总体平均数是否等于某个值(本文中等于原样本的平均数276.7),而由样本平均数推断总体平均数是和样本量有关的,样本量越大平均数越真实。若H0假设成立,说明处理组与原样本无差异,证明减少样本量可行;若HA成立,说明处理组与原样本有差异,证明减少样本量不可行,样本量要放大。凡是统计都会存在误差,显著性水平表明误差的范围,在本试验中α=0.05表明存在5%的误差,为了保证本试验的成功,在随机抽取样本时,其样本量保证在120以上,因此,t值的临界值本试验取为1.98。
具体的几组数据的推测结果显示在表1中。
表1 几组处理组的数据比较
表1结果表明对于5组处理数据组的t检验都证明了H0,证明在统计学上几组处理数据的平均数与原数据组是一样的,也就是说可以用1095个(50%的数据)、729个(33%的数据)、547个(25%的数据)、437个(20%的数据)、219个(10%的数据)数据来代表总体数据,其结果不变。采用本文中提到的抽样方法在检测过程中抽样量大大减少,企业在保证了检测质量的前提下可以节约较大成本。
3 结论
通过统计推断,可知该工厂在现有检验抽样基础上可将抽样频次降低到原来的10%,且检测质量得到保证。本文针对现代生产企业可能存在的过度检验现象提供了一种解决思路,从理论上证实了降低抽样频次的真实可靠性,为企业在保证产品质量的前提下降低企业成本提供了一种可能。