APP下载

按批抽样时成包皮棉抽样数量研究

2021-03-09丁时永邵佳蕊

中国纤检 2021年12期
关键词:皮棉批量标准差

文/丁时永 邵佳蕊 罗 俐

抽样,又称取样,从欲研究的全部样品中抽取一部分样品单位,其基本要求是要保证所抽取的样品单位对全部样品具有充分的代表性。新中国成立至今,我国先后共发布了4版细绒棉标准,分别是GB 1103的72版、1999版、2007版和2012版,上述棉花标准根据我国棉花检验的实践经验,结合工作需要和实施条件所规定的取样比例和数量,便于记忆和操作,一定程度上适应了我国棉花检验工作的实际,但随着我国棉花质检体制改革的不断深入,棉花包型转换引起的皮棉组批包数趋少,因抽样数量原因导致的检验结果重复性不高等问题逐步显现,成为影响棉花检验结果准确性的重要因素。

1 我国棉花标准抽样数量问题分析

1.1 棉花包型成为影响抽样数量的决定性因素

对于成批皮棉按批抽样时品质样品抽样的设定,我国棉花标准总体可以概括分为两种,第一种是72版,其按不同的批量分段采用不同的比例方式确定抽取样品数量,具体规定为“成包皮棉在10~15厘米深处取样,每10包取样1筒(约500克),不足10包按10包计算;100包以上,每增加20包取样1筒,不足20包按20包计算;500包以上,每增加50包取样1筒,不足50包按50包计算”;第二种为其余3版,它们所作规定大体一致,即对不同的批量采用同一比例方式确定抽取样品数量,其间除了表述稍有差别,基本上都如2012版规定“成包皮棉每10包抽1包,不足10包按10包计”。回潮率(原含水率)和含杂率等重量指标抽样包数和同版本的品质样品按批检验时抽样包数量基本一致。

上述两种方法样品抽取比例有明显差别,如果结合我国在不同棉花标准版本实施期间主体棉花包型不同,不同版本所规定的取样数量更是发生了很大变化,72版和1999版标准实施时,我国棉花包型基本一致,多采用所谓的Ⅲ型包,该包型单包重约85公斤,如一批重约42.5吨的皮棉成包500包,依据72版标准需要抽样30只,按照1999版标准则需要抽样50只,后者抽样数量显著增多。2007版标准实施期间,我国棉花质检体制改革渐入正轨,Ⅰ型包得以推行,和Ⅲ型包一样成为当时我国棉花加工的主要包型,2013棉花年度伊始,2012版标准开始实施,借助于国家实施的大规模棉花临时收储活动,我国基本实现了棉花仪器化公证检验,Ⅰ型包全面取代Ⅲ型包,此时,同样42.5吨的一批棉花,仅有186包左右,按照2012版标准只需抽样19只,抽样数量较72版标准大幅下降三分之一多,较同规定的1999版标准更是下降了62%(详见表1)。4版标准所作之抽样规定,同样重量的棉花,抽取样品数量起伏不定,相互之间差距极大,并且随着包型增大,抽样数量急剧减少,在这期间,棉农“四分”习惯的丧失、棉花收购渠道的多元化以及机采棉的快速推广,等等,诸多因素造成我国棉花无论质量还是重量指标的一致性较以往不仅并无显著改善,甚至“混等混级、一致性差、短纤维率上升的矛盾日益突出”[1],2015年8月28日,中国纤维检验局在《期货交割棉公证检验工作规程(试行)》第二十六条规定:“直接进入交割库的交割棉,品质检验样品按批抽样的比例不得低于30%。”抽样比例在同期2012版标准规定的基础上至少大幅增加2倍,显然是出于增强样品代表性以提高检验结果准确性的考虑。

表1 包型对于抽样数量的影响表

1.2 极限抽样误差受棉花批量大小影响明显

误差界限e,也称为极限抽样误差,指一定概率下样本统计量和总体参数之间抽样误差的可能范围,用式(1)进行计算:

其中:z为对应于某一置信水平的标准正态分布的分位点值,σy为标准误。

标准误σy,亦即抽样平均误差,用式(2)表示:

其中:n为样本容量,N为批量,S为总体标准差。

批量棉花包间考核指标的离散情况和棉花批量多少并无必然的关系,基于上述认识,同时为便于比较现行抽样规定下不同批量之间由于抽样数量原因造成的极限抽样误差差异,这里将不同批量棉花各考核指标的标准差设定为固定的值1来处理,由式(1)不难得到2012版标准规定的取样数量在不同批量情况下所形成的极限抽样误差(置信度取95%)(见图1)。

图1 2012版标准不同批量抽样形成的极限抽样误差图

由图1可以看出,2012版标准不同批量下的抽样数量规定所形成的抽样极限误差差异明显,趋势上,批量越小,样本量越少,极限抽样误差越大,反之,批量越大,样本量越大,极限抽样误差越小,72版标准抽样规定形成的情形也与此大体相当。如果取中间的某一极限误差值0.47作为我们检验可以接受的最大值,此时该值对应的批量为160包(抽样16只),显然,依据2012版标准规定数量抽样,在批量小于160包情况下,意味着极限抽样误差会大于0.47,由此将会有相当概率检验结果超出总体均值的允许范围,而在批量大于160包的情况下,则出现抽取样品量随批量增大而大幅增加的同时,极限抽样误差的减小却相对并不明显,换言之,这种情况下,抽样和检测成本近于线性增加,抽样质量的改善速度却表现得缓慢、不同步。

1.3 综上,可以得出以下两个结论:一是从1999版标准到2012版标准,抽样规定一脉相承,而和棉花本身质量无关的包型却成为影响抽样数量的决定因素,包型增大导致的抽样数量大幅减少,无疑大大降低了样品的代表性。二是我国长期以来规定成包皮棉检验使用百分比抽样方法,样本数量和批量保持近乎固定的比例,看似平衡了样本量和批量之间的关系,但无论在理论上还是在实际使用中都可以发现其存在着不同批量产品据此比例抽样产生的样品代表性差异,表现出“小批宽,大批严”的不合理性:批量大,检验经济性不足;批量小,样品偶然性有余。因此,有必要加强按批抽样检验时成包皮棉抽样数量研究,在遵循抽样随机性原则的基础上,充分考虑批量皮棉的特点,科学合理确定抽样数量,以提高样品的代表性,从而提升检验结果的准确性。

2 试验与抽样方案设计

72版标准始,我国即确立了对成包皮棉采用按批抽样按批检验的模式,后为了适应棉花质量检验体制改革的需求,2007版标准开始出现增加逐包抽样的规定,目前,逐包抽样和按批抽样已经成为齐头并进的两种抽样检验模式,其中逐包检验广泛运用于品质检验,而按批检验则普遍用于重量检验以及一些特定场合(如进口棉入储、部分国储棉出库等)的品质检验,所以,按批抽样下的样品代表性对品质指标和重量指标的检验准确性都有着直接的影响。

确定合理的取样数量,尽可能消除和控制试样数量原因产生的误差,应遵循统计规律。简单随机抽样下,通常依据极限抽样误差和估计量的标准误来确定所需的样本容量。由式(1)、式(2)可得样本容量n的计算式,见式(3):

确定合理的样品数量,重要的是把握其各项影响因素,由式3可以看出,决定样本容量n的因素有批量、标准差、极限抽样误差和置信水平,其中批量据实而定,置信水平常取95%,很明显,合理确定样本容量需要着重调查的就是批量棉花的包间各项考核指标的离散情况以及确定检验能够接受的极限抽样误差。

2.1 成包皮棉各项指标的离散情况

2.1.1 品质指标

品质指标主要选取马克隆值、反射率Rd、黄度+b、长度、长度整齐度和断裂比强度(以下合称时简称品质指标)等物理指标,这些指标是我国当前棉花国家标准设定的关键质量指标,也是各类棉花质量检验需要着重控制的指标,对其离散性的调查主要采取对批量棉花总体标准差进行统计分析的方式,数据来源主要为监管棉、期货棉、轮出国储棉、入储新疆棉和进口棉的包包检验数据,棉花产地涉及新疆、内地和国外(美国和巴西),共计随机选取了100批数据进行分析。各指标的调查数据按大小排序,分布见图2,分布范围见表2。

图2 品质指标包间标准差分布图

表2 棉花质量指标总体标准差分布情况表

2.1.2 重量指标

涉及按批检验的重量指标主要有两个,分别是回潮率和含杂率(以下合称时简称重量指标)。

2.1.2.1 回潮率

回潮率大小受籽棉状态、加工条件和存储环境条件影响较大,兼顾到调查的经济性和数据的代表性,对其离散性的调查主要采取对批量棉花样本标准差进行统计分析的方式,数据来源主要为监管棉、期货棉、轮出国储棉、入储新疆棉和进口棉的公证检验数据,同样共计随机选取了100批数据进行分析,回潮率调查标准差的范围从0.095%至1.226%,按大小排序,分布见图3。

图3 回潮率样本标准差分布图

2.1.2.2 含杂率

与棉花品质指标、回潮率指标相比,含杂率的获取相对不同,其检验数据并非抽取的所有样品单个测量结果的平均值,而是抽取样品经过规定程序和方法混合生成新的样品的检验结果,考虑到其数据来源特点,加之全面调查的工作量过于庞大,所以对其的离散性采用了不同于品质指标和回潮率指标的调查方式,具体为选取包间杂质差异明显的棉花批次,结合经验,可以判断其离散性足以覆盖95%以上的棉花批次,通过对其按标准和相应规范重复抽样后进行试验,统计试验结果之间的标准差来获取含杂率的离散情况。

《基于检验因素的棉花公定重量变化原因分析报告》[2]中,重复性条件下,对包间差异明显的3批棉花(批量均为186包,国产棉指Ⅰ型包,下同)分别按10%的比例随机抽取含杂率测试样品10次,每批形成10个实验室样品,依据原中国纤维检验局制订的《棉花含杂率作业规范》,测试每个实验室样品的含杂率,获取结果之间最大的标准差为0.24%,本文也借用这个数据作为批量棉花抽样环节按10%抽样含杂率调查的最高标准误。

2.2 抽样数量方案设计

当前抽样规定下形成的极限抽样误差和棉花批量紧密相关。受诸多因素的影响,棉花的批量存在多寡不一的现象,如2011年至2013年棉花临时收储期间,内地棉花的批量多为60包或120包,新疆棉以93包和186包为主,而进口棉批量则更多地依赖于包型和与集装箱的匹配度,常常从80包至120余包不等。近年来,随着我国棉花质检体制改革的逐步深入,加上国储棉、期货交割棉、新疆监管棉以及全国棉花交易市场交易棉等相关交易、管理规则的引领,我国棉花的批量逐步趋向于以186包为主,同时考虑便于运输和交易等因素,186包几乎可以视为我国目前棉花批量的上限(本文以下未说明的均以其为上限),这里,将2012版标准下上述水平的标准误作为完善抽样数量遵循的底线,以其为基准设计的方案作为本研究的设计方案1,此外对186包分别抽样30只和50只[分别对应72版和1999版标准规定的相应包数的抽样数量(Ⅲ型包包装,包数按500包,重量约42.5吨计)]为基准设计的抽样数量方案作为本研究的设计方案2和方案3(表3)。

表3 抽样数量设计方案和其对应基础

为了保证抽样推断的把握程度,充分认识和把控抽样风险,各指标标准差采用调查结果的最大值,由此各方案采用各指标的标准差和标准误见表4(含杂率调查因区别于其他指标,其标准误2、3为依据比例所作的推算结果),样本容量用式(3)计算,各方案不同批量下的抽样数量计算结果见表5(批量上限200包),其中计算结果数值向上取整处理,图4和图5则用于体现各方案之间的抽样数量差别(为便于表示方案之间的抽样数量差别趋势,批量上限增加至500包),表中和图中的“方案2-1”、“方案3-2”分别表示对于同样批量棉花,方案2与方案1之间、方案3与方案2之间抽样数量差值。

图4 各方案不同批量下的抽样数量图

图5 方案之间不同批量下抽样数量差值图

表4 各指标采用标准差和不同设计抽样方案下的标准误

表5 各设计抽样方案不同批量下抽样数量和相互间的差别表

续表5 各设计抽样方案不同批量下抽样数量和相互间的差别表

依据式(1),各指标不同设计抽样方案下极限抽样误差计算结果见表6,其中z取2,极限抽样误差的置信水平95.4%(下同)。

表6 各指标不同设计抽样方案下的极限抽样误差

2.3 抽样方案极限抽样误差的分析

方案1至方案3,随着抽样数量的增多,对于包间考核指标离散性一致的棉批,极限抽样误差依次降低,确定多大极限抽样误差能够接受,主要依据应该是国家主管部门规定的检验允差,从目前掌握的情况来看,中国纤维检验局对于棉花检验允差较为系统的规定主要见于两个文件,分别是《全国棉花交易市场交易棉公证检验实施办法(试行)》(中纤局检一发〔2015〕67号)和《关于印发2015/2016年度国家储备棉轮出公证检验实施办法及操作规程的通知》(中纤局检一发〔2015〕19号),上述文件除了对颜色级(Rd、+b)和马克隆值允差规定稍有不同外,其余基本一致(表7)。除了公定重量指标外,其余项目允差针对的复检样品或是原样,或是重新包包抽取的样品,此种情况下的允差本质上是重复性或再现性检验之间的允许差值,其差值来源也因此主要限定在同一样品(或同包样品)的一致程度大小以及测量系统偏差,而没涵盖到按批检验时包间差异引起的抽样误差,当然,文件中规定上述允差也适用于少数情况下的按批抽样检验。此时,则面临无明确的依据对抽样环节和检验环节产生的允差进行分割的问题,因此,上述检验允差很难作为确定极限抽样误差大小的依据。

表7 棉花复检相符情况判断标准

在缺乏官方依据的情况下,确定可接受的极限抽样误差,其基本要求应不低于2012版标准最高水平,在其基础上,在考虑检验经济性情况下,能够适度降低极限抽样误差显然是更为理想的抽样方案。基于上述认识,结合前文分析,3个方案中,方案1可以达到2012版棉花标准规定下最为可靠的抽样水平。方案2和方案3则全面优于2012版标准抽样规定下的极限抽样误差。图6以断裂比强度指标为例显示了各方案和2012版标准抽样规定下形成的极限抽样误差关系。

图6 各方案与2012版标准不同批量下断裂比强度极限抽样误差比较图

方案1、方案2和方案3的极限抽样误差不受棉花批量影响(批量1时除外),保持稳定,方案之间抽样水平依次提高,极限抽样误差大小依次近乎保持9:7:5的比例关系,方案1和方案2之间与方案2和方案3之间,极限抽样误差差距基本一致(表6、图6),不同的是随着棉花批量的增大,抽样数量差值逐渐扩大(图5),以致批量为186包时后者接近前者的两倍(20:11)。

为了增强抽样的可操作性,便于抽样人员记忆,同时不降低抽样水平,表5和续表5中方案1可以简化为:成包皮棉10包及以下,抽样7包;11包至50包,抽样15包;以上不足规定抽样包数时,全部抽取;51包至100包,抽样18包;101包至200包,抽样20包;200包以上,每增加50包加抽1包,不足50包按50包计。方案2和方案3也可以作以上类似的简化,详见表8。

表8 方案1、2、3的简化抽样方案

3 讨论与结论

3.1 具有充分的代表性是对抽样的基本要求,而足够的抽样数量是保证样品代表性的必要条件,抽样数量的确定则应遵循统计规律,同时满足检验目的。此外,抽样的随机性也是保证抽样质量的必要条件,如果不注重随机性,对于一批质量指标或重量指标五五分布的泾渭分明的棉花,即使按总包数50%比例进行抽样,样品正常检验结果较实际状况依然可能谬以千里。

3.2 方案1、方案2、方案3的设计基准分别对标细绒棉2012版、1999版和72版国家标准在棉批重量42.5吨左右时的抽样包数,方案1可视为2012版标准抽样方法升级版,方案2、方案3的设计对应棉批重量,基本消除了棉包包型增大后引起的抽样包数减少问题。就3个方案比较而言,方案1最为经济,抽样水平也可以达到2012版标准的最高水平,但从试验结果来看,Rd、+b和长度等项目的极限抽样误差分别高达2.386%、0.584和0.606mm(表6),依据经验和检验所需的准确度要求,基本可以判断其处于难以接受的水平,可能不利于检验结果的复现和准确性;方案3的抽样水平最高,但由于抽样量较大,绝大多数情况下会造成人力、财力、时间和资源等检验成本无谓的大幅增加;方案2的优势在于“性价比”较高,原因在于其确定的抽样数量较方案3大幅下降、较方案1增加有限的情况下,产生的极限抽样误差却可以居于3个方案极限抽样误差近乎等差数列的中间。另外,其较方案1抽样极限误差较大幅度地降低,也为抽样水平优于2012版标准最好水平在棉花批量和包间离散性等方面留了相当的例外空间。所以,在方案的选用上,本研究倾向于首选方案2,其次方案1,第三方案3。

3.3 我国棉花标准按比例抽样规定一直都相对存在着“小批宽,大批严”的不合理性,由批量大小确定的抽样数量差异造成了不同批量棉花极限抽样误差的不同,而其不同,不仅会影响较小批量棉花检验结果的准确性,而且也必然难以针对不同批量棉花的检验行为设定一个涵盖抽样和测试环节的统一的合理的检验允差,来考核检验结果的准确性,从而更有效地规范检验行为、提高检验质量、解决交易纠纷。设计方案1、 方案2和 方案3规定下,离散性一致的棉批相关检验指标的极限抽样误差不受批量大小影响,则可以有效解决上述问题。

猜你喜欢

皮棉批量标准差
批量提交在配置分发中的应用
用Pro-Kin Line平衡反馈训练仪对早期帕金森病患者进行治疗对其动态平衡功能的影响
气流喷气式皮棉清理机
美国2018/2019年度皮棉总产达400万t
调运皮棉
浅议高校网银批量代发
对于平均差与标准差的数学关系和应用价值比较研究
影响皮清机皮棉气流输送加工质量的问题分析
基于AUTOIT3和VBA的POWERPOINT操作题自动批量批改
考虑价差和再制造率的制造/再制造混合系统生产批量研究