论质量技术检测中抽查样品的代表性
2022-08-12叶永和
叶永和
(温州市质量技术检测科学研究院/国家鞋类质量监督检验中心(温州),浙江 温州 325007)
引言
在监督抽查过程中,要对核查总体(即监督总体、监督批产品或产品总体)进行监督时,往往是采用随机抽样的方法,并通过样品的检验来做出判定。因此,一些人很自然地把监督抽查判定核查总体正确与否等同于样品的代表性强弱,认为其代表性越强,抽查判定结果的正确性越高、越准确,反之相反。所以,很多质量监管部门或人员想方设法在抽查过程中提高样品的代表性工作,这种看似合理的做法实际上是一种变相的刻舟求剑。
1 对代表性的认识
根据我国词典[1]解释:代表是指显示同一类的共同特征的人或事物;性是指物质所具有的性能或物质因含有某种成分而产生的性质。因此,代表性可以解释为该物质能显示某种同类物质所具备的性质情况。换言之,某物体能反映该物种的性能,我们视它为该物种的代表,而它的性能或特点越接近该物种的性能与特点,其代表性强,反之其代表性弱。比如,某批男式皮鞋的帮底剥离强度均值为160 N/cm、割口裂口长度为8.0 mm、鞋跟结合力为1800 N 等,而某双男式皮鞋的帮底剥离强度、割口裂口长度以及鞋跟结合力的特性参数值越接近160 N/cm、8.0 mm、1800 N,其代表性越强,越能代表该批男式皮鞋的质量值。又比如,某抽查的样品合格品率越接近该产品总体的合格品率,我们就称该样品的代表性好,否则称该样品的代表性差。
2 抽查样品的代表性
在抽查工作中,样品的代表性主要不是由抽样工作的正确与否来决定的,也不是看随机抽样方法是否到位去判定的,而是由抽查方案与抽查性质以及条件要求所体现出来,这一点大家必须有一个清晰的认识。
2.1 随机抽样获得样品的特点
抽样是从产品总体中抽取部分产品的过程,它分为随机抽样与非随机抽样。根据国家抽样标准[2]对随机抽样的定义:随机抽样是“从总体中抽取n 个抽样单元构成样本,使n 个抽样单元每一可能组合都有一个特定被抽到概率的抽样”,而非随机抽样是除随机抽样外的其他抽样总称。换言之,随机抽样只是一种获取样品的方法,它主要是保证样品抽到有一个特定的获取概率,排除人为的主观因素,为推演计算提供客观的概率依据,不存在随机抽样的样品具备代表性之说。因为,在落实随机抽样中,产生随机数的方法有4 种:随机数表法、随机数骰子法、伪随机数发生器法以及扑克牌法等。但是,无论哪一种方法人们都是无法控制,所以获得的样品不可能有代表性,反而非随机抽样可以保证样品的代表性。比如,判定抽样、筛选抽样等等。
同时,在产品总体中不可能每件产品的特性参数值都一样,哪怕是同一厂家、同一型号、同一批次、同一材料、按照同一标准生产的产品也不可能完全一样,它是呈正态分布,以标准差σ的大小来表示产品特性参数值的分散程度。标准差σ 越小,表示产品特性参数值越集中,即相对的具有代表性产品数越多,反之就少,靠随机抽样是不可能获得样品能代表产品总体的质量情况[3]。也就是说,抽样获取的样品是否具有代表性不是看它是不是随机抽样,实际上与该产品总体的标准差σ 有关,标准差σ 越小,随机抽样获得代表性的样品可能就越多。比如,某批男式皮鞋的外底耐磨性能均值为6 mm,用随机抽样是很难抽到外底耐磨性能为6 mm 值的皮鞋,尤其是标准差σ 比较大的产品总体,而采用非随机抽样方法——判定抽样,就比较容易挑选出外底耐磨性能为6 mm 值的皮鞋。
2.2 统计抽查的样品具有代表性
在统计抽查中人们希望从随机抽样的样品中能得到产品总体的特性参数值,而样品的特性参数值越接近产品总体值越好,最好是相同,以此来代表产品总体特性参数值,许多科学家对此进行探讨。瑞士科学家伯努利在研究事件概率的过程中发现,大量随机现象的平均结果会趋向一个恒定值,因此创立了伯努利大数定理。
从伯努利大数定理[4]公式(1)得知,当某件发生的概率p,与该事件发生次数γ有密切关系,随着次数n增大,其趋向于该发生的概率p。
式中:p——发生概率;
γ——事件发生次数;
n——发生次数;
ε——大于零的任意数。
比如,把以事件次数n看作是样品数量,把样品出现特性参数值的次数视为γ,而抽查产品总体的特性参数值为概率p,根据伯努利大数定理,随着抽取的样品数量的增加,样品的特性参数值(或占比)就接近产品总体的特性参数值(或比例),甚至与产品总体相同。
然而,在一般情况下把样品的数量大于50 时,所获得的样品统计特性参数值就比较接近该产品总体所拥有的特性参数值,或者说这两者相差很小,即这些样品的特性参数值能代表该产品总体的特性参数值,其代表性是随着样品数量的增多而加强。因此,在统计抽查中,可以从该产品总体中随机抽样100 件产品进行检验,样品的特性参数值或合格品率基本上等同于该产品总体的特性参数值或合格品率,样品数量越多与产品总体值越接近,其代表性越好。换言之,在统计抽查中随机抽样得到的样品能代表被抽查产品总体。
2.3 监督抽查的样品不具有代表性
监督抽查是通过样品不合格的概率来判定核查总体为不合格总体。也就是说,监督抽查是以随机抽样获得的不合格样品概率来推算核查总体达不到监督抽查(n;L)对应的声称质量水平(即事先规定的质量水平)值,判定为不合格,而不是以相同于样品特性参数值不符合产品标准规定来证明核查总体该特性参数值也不符合,来判定核查总体不合格的。因为,监督抽查的判定方案是根据概率论的小概率事件原理设置的,不是以样品的代表性强弱来判别的。
根据小概率事件原理[5],在监督抽查中把实际不合格品率(即质量水平)不高于规定不合格品率(即声称质量水平),发生的抽查样本(即样品的集合)不合格设置的概率很小,一般为5%。如果在一次监督抽查中发生样本不合格(样品不合格数d 大于不合格品限定数L,即d>L),说明该核查总体不合格品率大于规定的不合格品率,判为该核查总体不合格。所以,监督抽查判定核查总体不合格不是根据样品的代表性强弱做出的,而是以样本出现不合格的概率来判定的。比如,监督抽查2 个样品,样本只有三种可能:100%合格;50%合格与100%不合格,这样的结果能代表核查总体也只有三种质量水平吗?或者说这2 个样品的特性参数值能代表核查总体的特性参数值吗?这显然是不可能的,也是不正确的。
目前,国家监督抽查标准[6-9]把错判概率设定为5%(即随机小概率事件为5%),来设置监督抽查方案(n;L),根据概率论的二项分布公式(2)计算[10]出当核查总体的不合格品率为Pa(p)。
式中:L——不合格品限定数;
d——样本中的不合格品数;
p——核查总体的实际质量水平;
n——样本量。
根据公式2,不同监督抽查方案(n;L)与核查总体不合格品率之间的关系,如表1 为L=0 时、表2 为L=1 时所示。
表1 L=0 时样本数n 与规定不合格品率的关系
表2 L=1 时样本数n 与规定不合格品率的关系
从表1 得知,当采用监督抽查方案(n;0)时,样本中只要出现有不合格,按照小概率事件原理可以判定核查总体的合格品率达不到(n;0)对应的声称质量水平值,判为不合格,其置信概率为95%。
比如,监督抽查方案(2;0),检验发现1 个样品不合格不是代表核查总体合格品率为50%,而是指合格品率达不到97.5%;2 个都不合格也不能说核查总体合格品率为100%不合格,只是肯定核查总体的不合格品率超过了2.5%。同样,当采用监督抽查方案(13;1)时,样本中有2 个或3 个或4 个及以上样品不合格,同样可以肯定核查总体的合格品率达不到97.5%,判为不合格,但不代表对应着核查总体的不合格品率为15.4%或23.1%或30.8%及以上,等等。(2;0)抽查方案没有发现不合格品是不能证明该核查总体已达到97.5%合格品率或100%合格;同理,(13;1)监督抽查没有出现不合格品,或只发现1 个不合格品也不能说该核查总体的合格品率已达到97.5%或92.3%,只能说本次监督抽查未发现该核查总体为不合格总体,或不否定其声称质量水平值。其他监督抽查方案(n;L)也以此类推:样本不合格就可判定核查总体不合格,这是监督抽查的特点;而样本合格是不能肯定核查总体合格,这也是监督抽查的特点。
2.4 样品代表性的变化情况
统计抽查的样品具有代表性,而监督抽查的样品不具有代表性也并非绝对的。也就是说,随着样本数量增加或减少,以及设置条件的改变,样品的代表性强弱也会随之发生变化。
比如,在产品总体中随机抽取500 个样品,检验后发现有1个或2 个或3 个样品不合格,样本的不合格品率分别为0.2%或0.4%或0.6%,从统计抽查角度来说检验样品具有代表性,它代表着产品总体的不合格品率分别为0.2%或0.4%或0.6%,它与实际产品总体的不合格品率值非常接近,这种之差是可以接受的。但是,如果在产品总体中随机抽样5 个样品,检验后发现有1个或2 个或3 个样品不合格,样本的不合格品率分别为20%或40%或60%,从统计抽查的角度来说检验样品还具有代表性吗,肯定与实际产品总体的不合格品率相差很大,很显然样品是不具有代表性。也就是说随着样本量的下降,在统计抽查中其代表性是在逐渐减弱,直至消失。
然而,从监督抽查角度来说,在核查总体中随机抽样5 个样品,检验后发现有1 个或2 个或3 个样品不合格,它可以肯定核查总体的合格品率达不到99%,判其为不合格,可不能以样品具有代表性来说明核查总体的不合格品率分别为20%或40%或60%。但是,如果监督抽查500 个样品,检验后发现有3 个不合格品,样本的不合格品率0.6%,这时既可以样品具有代表性来判定核查总体的不合格品率为0.6%,也可以从监督抽查角度肯定核查总体的合格品率达不到99.85%,判其为不合格。所以,样品的代表性问题看似与样本数量大小有关,实际上还与由事先设置的条件要求有关。
3 结束语
在随机抽样的样品是不是具备代表性,不是看抽样工作的开展是否科学、合乎程序以及工作人员抽查是否认真,而是由抽查方案与抽查性质以及条件要求来决定的。在统计抽查中样品表现出代表性,它是根据概率论的伯努利大数定理来决定样品代表性的强弱;在监督抽查中样品是不具备代表性,它是根据概率论的小概率事件原理所设置判定的结果,是以样品出现的不合格概率大小来推算得到。换言之,统计抽查与监督抽查不是一回事,虽然都是采用随机抽样的方式获取样品,但是由于其设计理论基础与条件要求的不同,所赋予样品的性质是不一样的,不能把统计抽查的概念简单地套用到监督抽查之中,否则会造成监督抽查判定方法与工作方向的混乱。这一点各级监管部门要引起高度重视,应认真学习与掌握抽查控制理论,弄清抽查的性质与目的,充分认识在抽查中样品的特性与作用。