新制绢丝黑板样照与旧样照的吻合度评价
2017-10-15许建梅周颖
许建梅 周颖
摘要: 当前黑板检验仍是桑蚕绢丝检验中的主要检验手段之一,但是各检验机构所使用的黑板样照却存在不同程度的老化、褪色,因此浙江丝绸科技有限公司新研制了一批绢丝黑板样照。为了有效评价新样照与老样照间的吻合程度,文章设置了感官评价准则和评价员培训方法,采用了差别成对比较检验方法,对新旧样照的差异性进行检验与评价;并对新样照进行了试套检验,利用成对T检验来获得新旧样照在评等定级上的差异性。结果表明,感官评价方法与对试套检验数据进行的成对T检验方法结果相一致,可以从两个不同的方面对新制绢丝黑板样照进行有效评价。
关键词: 绢丝黑板样照;吻合度;感官检验;成对比较检验;成对T检验
中图分类号: TS147
文献标志码: A
文章编号: 1001-7003(2017)12-0001-06
Abstract: Seriplane test is currently still one of the main test methods in spun silk inspection. However, the seriplane photographs that different inspection centers are using have become aging and color fading to different degrees. Thus Zhejiang Silk Science and Technology Company developed a new set of seriplane photographs for spun silk. To evaluate the goodness of fit between the new and the old photographs effectively, the sensory evaluation rules and an assessor training method were applied, and paired comparison test was used to test and evaluate the differences between the new and the old photographs. Meanwhile, actual inspection was done for the new photographs. The paired T test was used to gain the differences of new and the old photographs in grade rating. The results showed that the sensory evaluation was in accord with the paired T test for actual inspection, and the new seriplane photographs could be effectively assessed from the two different aspects.
Key words: seriplane photograph for spun silk; goodness of fit; sensory evaluation; paired comparison test; paired T test
目前,桑蠶绢丝品质技术指标主要包括条干均匀度、洁净度、千米疵点、支数变异系数等,而前三个指标的检验主要还是依靠检验员对照标准黑板样照进行检验。经过长期使用,各检验机构所使用的黑板样照均存在不同程度的老化、褪色;有的企业及检测机构的样照甚至已损毁或丢失,而这些黑板样照都没有原样。因此,急需研制一批新的黑板样照替代旧样照。而新样照的研制必然要先准备标准黑板实物,通过拍照制作底版,再进行冲印[1-2]。在这个过程中若黑板实物制备与旧标准样照有偏差,那么新样照与旧样照间就会存在较大差异;在拍照制作底版、相纸选择、冲印过程中又存在诸多因素,会导致最后的样照与黑板实物存在细微的差异。为此,需要采取合适的方法来评价新制黑板样照与旧样照间的差异。以往黑板样照的研制中大多集中在研究样照制作[3-4]、样照反映疵点的基本原理[5],对于新样照与旧样照间的差异研究少有涉及。当前正在使用的样照已有数十年,且有国家标准作依托,在产品的评等定级上已广为接受,因此新样照对旧样照的吻合度就成为关键。如果新样照不能做到与旧样照无显著差异,则一旦采用新样照,在绢丝产品评等定级中便会出现较大的波动与误差,给绢丝生产企业造成较大的损失,同时也会对检验机构的公信力造成一定的损害,扰乱绢丝贸易秩序。
为此,本研究拟采用感官评价方法与新旧样照的试套试验,对新旧样照间的吻合度即差异性进行评价。感官评价一般是通过评价员的视觉、嗅觉、触觉、味觉和听觉,对受测量物进行定性评价的一种科学方法[6-7],最早是1975年由美国食品协会提出,并在后来广泛应用于食品、纺织等行业[8]。本研究中主要是指利用评价员的视觉来评定新旧黑板样照间的差异。对于感官评价结果的分析,如果是用来评价两受检验物间有无明显差异,通常都是采用“成对比较法”进行差别检验,这种方法在食物的感官评价中使用相当普遍[9]。本研究中借鉴食物差异性评价的方法[10]来进行新旧样照的吻合度分析。除此以外,本研究还进行了新旧样照的试套检验,对检验结果采用“成对T检验”进行差异显著性分析[11],从另一个方面来分析新旧样照的吻合度、新样照对旧样照的可替代性问题,联合采用这两种手段即可对新旧样照的吻合度和差异性进行准确有效的评价。
1 新旧样照差异的感官评价方法
1.1 感官评价准则的建立
感官评价方法是请具有多年绢丝黑板检验经历的资深检验员按一定的方法经过培训之后,对新制绢丝黑板样照与旧样照的差别进行感官描述性评价。为了更深层次地了解新旧黑板的差异程度,本研究将评价员的感观量化,以100为固定模数,建立了以下的量化评价系统,评价范围为0~100分。
100分:新旧样照完全一致,凭肉眼看不出差别。
95分:新旧样照无显著差异,仅限于光影、明暗上的差别,新样照可以替旧样照检验,不会造成检验成绩的差异。
90分:新旧样照存在细微差别,如果分别按照新样照和旧样照对同一黑板进行多次重复检验,条干均匀度成绩差异平均2.5分左右;洁净度成绩平均达2.5分左右;千米疵点成绩低支的为0.2只左右,中支的0.3只左右,高支的0.4只左右。
80分:新旧样照存在一定差别,个别疵点翻拍后走样,如果分别按照新样照和旧样照对同一黑板进行多次重复检验,条干均匀度成绩差异平均在5分左右;洁净度成绩平均在5分左右;千米疵点成绩低支的为0.4只左右,中支的0.7只左右,高支的0.8只左右。
70分:新旧样照存在显著差别,如果分别按照新样照和旧样照对同一黑板进行多次重复检验,条干均匀度成绩差异平均10分左右;洁净度成绩平均在10分左右;千米疵点成绩低支的0.8只左右,中支的1.4只左右,高支的1.6只左右。
60分:新旧样照存在极显著差别,如果分别按照新样照和旧样照对同一黑板进行多次重复检验,条干均匀度成绩差异平均20分左右;洁净度成绩平均在20分左右;千米疵点成绩低支的1.5只左右,中支的为2只左右,高支的2.5只左右。
0分:完全不相关。
1.2 检验人员的选择与培训
根据ISO 11056:1999 Sensory analysis-Methodology-Magnitude estimation method中的规定,当选用的评价员为有经验的经过高度专业培训的检验员时,评价员个数最少可以只有5人,推荐人数是10人。本试验中选取6人,这6人在利用黑板样照检验绢丝纱线疵点方面不仅经过高度专业培训,而且都是具有多年检验经验的资深检验员。
首先对评价员介绍上述的评分规则。然后准备几组示例,让评价员打分,如果6个评价员的打分结果差别较大,则需重新培训,直至对同一示例,6个评价员的目光一致,评分结果一致。这时才可以使6位评价员进行正式评分环节。
1.3 样本准备与试验方法
试验准备了两套旧样照,一套新样照。每套样照分别包括高支绢丝、中支绢丝、低支绢丝的条干均匀度、千米疵点、洁净度指标检验的共9块样照。
试验中采取成对比较的感官检验方法。这种方法是以随机先后评价顺序出示两个样品给评价员[8],请评价员对新样照与旧样照(两块旧样照可随机任选一块)之间的差异,以及两块旧样照之间的差异分别进行打分。打分时评价员并不知道哪些为新样照,哪些为旧样照,以免产生心理暗示。前面一组打分主要是用来衡量新旧样照间的差异,而最后一组为对照组,用来衡量前面两组打分的有效性。因为最后一组两个旧样照应是无显著差别的,如果最后一组打分低于90分,则需要根据实际情况确认该评价员打分是否有效。
1.4 试验数据与分析
根据上述试验方法与规则,由6位评价员最后打出的评分结果见表1,其中“新∶旧”表示新旧黑板样照间的对比,“旧∶旧”表示两块旧黑板样照间的对比。
对试验结果进行差别检验时采用成对比较法。表1中分数大于等于90的可認为新旧样照间无差异,小于90分的认为有差异,小于70分的为极显著差异。根据ISO 5495—2005 Sensory analysis-Methodology-Paired comparison test的规定,在进行成对比较差别检验时,原假设为新旧黑板样照间无显著差异。最低响应数可采用下式进行计算:
nR=n+12+z0.25n(1)
式中:n为评价员个数;z的取值与显著性水平α的选择相关,若α=0.05,则z=1.64,若α=0.1,则z=1.28。
因此,当评价员个数为6时,显著性水平α=0.05时,最低响应数为6;α=0.1时,最低响应数为5。也就是说在置信水平为0.05时,要6个检验员结果一致,才能得到统一的结论;如果显著性水平为0.1,则仅需5人结果一致。比如说,表1中低支绢丝的条干均匀度新旧黑板打分均超过95分,则接受原假设,认为这两块新旧样照间无显著差异;而对于低支千米疵点新旧黑板间差异5人打分在95分以上,有一人打分为80分,则在10%的显著性水平上接受原假设,即只有90%的把握认为比较的两块新旧样照间无显著差异。按此准则,可以得出低中高支绢丝三个指标共9块新黑板与对应的旧黑板的差异情况,结果见表2。表2中检验结果均是基于显著性水平为0.05的基础上得出的,表中打“*”的两处如果显著性水平调整为0.1,则为接受原假设。这说明对于低支千米疵点和高支条干均匀度,新旧样照间可能无明显差异,只是这个结论的显著性程度不高。因此,单靠感官评价结果,部分新制样照能否替代旧样照还无法得到最终结论,并且该差异检验也无法对新样照的偏紧偏松作出判断。为了更准确地评价新样照,还需要进行实际的黑板检验,即试套试验。
需要注意的是两套旧样照均是根据绢丝检验中对标准样照的标准要求而制作,理论上应是完全一样的。在检验过程中,如果评价员6人当中只有个别人(人数不超过1人)对两块旧样照间差异打分低于90分,则说明在这组黑板样照差异的评价中,该评价员目光可能不准确,这组评价结果则应全部舍弃。这时有效评价员数就为5人。根据式(1)计算可得,此时置信水平α=0.05时,最低响应数为5;α=0.1时,最低响应数为4.43,仍约等于5人。表1中打“*”的数据即为异常数据,则对应的新旧样照间打分数据也应剔除,在表1中用实线方框标出的,即为要剔除的数据。
两套旧样照虽然理论上应完全一致,但是因为不是来自同一生产商,且出厂时间不一致,在不同的检验中心使用,所以使用时间与频率不同,保养维护不同,可能会出现不同程度的老化、褪色。因此在感官判断时,可能评价员会出现一定的目光差异,对于这种情况则不应作数据剔除。为此,本研究认为如果6人中有超过2人(含2人)对两块旧黑板样照的判断打分低于90分时,则不作异常数据剔除。比如表1中阴影部分数据,表示的是有2人对中支条干均匀度的两块旧样照提出存在差异,这时则不应剔除他们对相应新旧的打分数据。
2 新旧样照试套比对试验
2.1 样本准备与试验方法
准备高支绢丝22批、中支绢丝36批、低支绢丝5批,共63批绢丝的试样筒子,每批10个筒子,再由这10个筒子摇取2块黑板,共20片丝。对每批2块黑板分别对照新旧样照逐一打分,给出条干均匀度、千米疵点、洁净度成绩结果。具体打分细则根据FZ/T40003—2010《桑蚕绢丝试验方法》标准中规定进行。为了使结果更具代表性,高中支绢丝样本分成了两组,分别在两个检验中心检验。
2.2 数据与分析
2.2.1 首次试套比对试验
根据上述试验方法,制备黑板试样并评分。表3列出的是高支黑板样照试套检验数据,其中中支的因为有36批数据太多,就不一一列出。为了分析同一黑板按新旧样照检验的结果之间有无差异,本研究采取成对T检验法,即从两个方面来分析:一是分析按新旧样照,检验评分上有无差异;二是分析按新旧样照,检验等级上有无差异。一般来说,只要按新样照检验时在最后的等级评定上跟旧样照没有差别即可。为了便于检验运算,对每处疵点的评价等级进行量化,以0表示优等品,1表示一等品,2表示二等品。在进行成对T检验时,首先需要对每对数据求差。如果按旧样照评为优等品,按新样照评为一等品,求差时结果为1,也就是表示两种定级结果级差为1。
在成对T检验时,若两组数据变量分别用x,y表示,则首先求成对数据的差d=x-y,该差值反映的就是两个检测结果间的差异。为此,两个检验结果的有无差异问题就转化为判断成对数据的差是否服从均值为0的正态分布[11]。提出原假设H0∶E(d)=0。在H0为真的条件下,检验统计量:
式中:T表示检验统计量服从自由度为n-1的t分布。
利用表3计算统计量,再查t检验表即可得知是否接受原假设。本研究采取直接根据统计量计算p值的方法,省去了查表的麻烦,结果更加一目了然。p值的计算公式如下:
式中:p≤0.01,则说明统计量T落在了拒绝域内,表示在显著性1%的水平上拒绝原假设;若p≤0.05,则表示在显著性5%的水平上拒绝原假设。
表4即为成对T检验的结果,其中打“*”的p值均大于0.05,表示在显著性5%的水平上接受原假设,新旧黑板样照间无显著差异。其中低支千米疵点样照p值为0.036,表示虽然在显著性5%的水平上不能接受原假设,但是可以在显著性1%的水平上接受原假设。从表4可以看出,与旧样照存在显著差异的主要是中支和高支的洁净度新样照,高支的条干均匀度和千米疵点样照也存在差异。
这样的结果与表2中的感官检验在中支和高支样照的判断上是一致的,但是在低支样照的判断上出现一些偏差,主要是低支洁净度样照的判断上。分析认为是因为在试套试验中低支试样仅有5批,这使得数据失真,误差增加。因此,在低支样照的判断上仍应采信表2的感官判断结果。
此外,值得注意的是表4中高支条干均匀度样照虽然假设检验结果为存在显著差异,但是结合表3中原始数据可以发现:对于高支绢丝,选取的这些批次的样丝条干均匀度成绩大多在72.5~75分,而按照FZ/T42002—2010中规定条干成绩大于等于75即为优等品,70~75分则为一等品。很多批次按旧样照批分为75分,按新样照则批分为72.5分,这时虽然分值仅发生一点变化,等级却要低一个等级。而中支绢丝选取的试样条干均匀度成绩则分散在75~82.5,因此中支条干均匀度样照在检验等级上测不存在显著差异。因此,在这种情况下,就不能仅以p值结果确认新旧样照在检验定等上有无显著差异,而应注意在试套试验中扩大受检样丝的质量变化范围,以提高统计检验结果的可靠性。
2.2.2 样照修正后试套比对试验
从上述的感官检验与试套试验中可以发现,洁净度新样照普遍与旧样照存在显著差异,且新样照标准明显过紧。为此,样照研制小组又重新取样,重新制备了一套洁净度样照。对于新制备的样照有必要再进行试套试验来检验修正后的样照效果。为此,重新准备了高支绢丝试样20批,中支40批进行新旧样照的试套检验。检验时同样对三个指标均进行了检测,对检测结果进行成对T检验,结果见表5。表5中打“*”的数值与表4中一样,仍表示p值大于0.05,接受原假设,即新旧样照间无显著差异。
由表5可以看到,洁净度样照经过修正后与旧样照在显著性5%的水平上无显著差异,而高支条干均匀度样照仍有差异,具体原因与前面一樣,是因为高支条干的批分恰好都集中在75分左右。
3 结 论
针对绢丝黑板样照研制过程中,新制样照与旧样照的吻合度与可替代性问题,本研究建立了感官评价差异的方法,包括感官评价准则的建立、评价员的选择与培训、成对比较检验法对感官量化结果的统计分析;采用成对T检验法,对新样照与旧样照的比对试套数据进行了分析;结合感官评价差异的方法与成对T检验法的结果,对绢丝黑板样照提出了准确的修正方法;并利用成对T检验对修正的结果进行了再检验,证明了修正后样照与旧样照的高度吻合,无显著差异。同时,说明了采用感官检验与试套试验可以从两个不同方面对新旧样照的吻合度进行有效准确的评价。
参考文献:
[1]陈庆官,李广荣.生丝黑板检验标准样照的制作[J].丝绸,1994,39(5):46-48.
CHEN Qingguan, LI Guangrong. Development of the standard seriplane photograph for raw silk[J].Journal of Silk,1994,39(5):46-48.
[2]陈庆官,袁美珍,李广荣.桑蚕双宫丝特征标准样品(样照)的制作[J].丝绸,2000(12):44-45.
CHEN Qingguan, YUAN Meizhen, LI Guangrong. Preparation of standard sample photograph for features of mulberry doupion silk[J]. Journal of Silk,2000(12):44-45.
[3]孙萍.样照的研制及在检验中的作用[J].中国检验检疫,2001,16(5):18-19.
SUN Ping. Study and development of the photograph and its application in inspection[J]. China Inspection and Quarantine,2001,16(5):18-19.
[4]張陆莲.纱线条干,结杂目光检验样照及评定方法探讨[J].广西纺织科技,1996,25(1):44-46.
ZHANG Luliang. Discussion on the visual inspection photographs of yarn evenness and defects and the rating method[J]. Guangxi Textile Science & Technology,1996,25(1):44-46.
[5]平慰庭,徐应和.黑板样照[J].现代商检科技,1993,3(2):53-55.
PING Weiting, XU Yinghe. Seriplane photograph[J]. Modern Commodity Inspection Science and Technique,1993,3(2):53-55.
[6]刘方菁,刘辉,宁娜,等.感官评价原理在肉质评价中的应用[J].肉类工业,2011,22(2):12-15.
LIU Fangjing, LIU Hui, NING Na, et al. Application of sensory evaluation principles in meat quality[J]. Meat Industry,2011,22(2):12-15.
[7]KOEHL Ludovic, ZHOU Bin, ZENG Xianyi, et al. Sensory evaluation in characterization of fabric hand[J]. Journal of Donghua University,2004,21(3):76-81.
[8]LIU Xiaohong, ZENG Xianyi. A model of selecting expert in sensory evaluation[J]. Advances in Intelligent System and Computing,2014,214:151-161.
[9]SANZ T, TARREGA A, SALVADOR A. Effect of thermally inhibited starches on the freezing and thermal stability of white sauces: rheological and sensory properties[J]. LWT-Food Science and Technology,2015,67:82-88.
[10]魏永义,王艳芳.火腿肠的差别成对比较检验研究[J].肉类工业,2015(6):16-17.
WEI Yongyi, WANG Yanfang. Study on difference paired comparison test of ham sausage[J]. Meat Industry,2015(6):16-17.
[11]MENDENHALL William, BEAVER J Robert, BEAVER M Barbara. Introduction to Probability and Statistics[M]. 11th Edi, Boston: Thomason Learning,2004:386-390.