利用分布参数评价批量棉纤维成熟度
2018-04-28章玉铭徐步高
章玉铭,徐步高
(1.浙江大唐纺织科技开发有限公司,浙江 诸暨 312000;2.西安工程大学 纺织科学与工程学院,陕西 西安 710048)
0 引 言
一直以来,不少学者致力于建立一套用于标定棉纤成熟度与细度测量方法的所谓标准棉纤.1956年,Lord收集了100种标定棉马克隆值[1]的棉花.在80年代,国际纺织生产商联合会(ITMF)与其他组织合作开发了一套含9种标量的棉花,用于大规模纤维成熟度的测量[2].在1999年,Thibodeaux和Rajasekaran利用一种商用图像测量系统来测量50多种种植在美国的棉纤维的截面图像[3].在2000年,Hequet和Thibodeaux带领的研究组完成了对来自世界各地的104种不同棉花大量纤维的截面图像分析[4],建立了可用于标定其他测量方法的棉纤维成熟度数据库[5].在棉花研究领域,普遍认为棉纤横截面图像可提供直接、可靠的成熟度信息.该课题组所用的“纤维图像分析系统”(FIAS)[6]软件帮助他们在较短时间完成了对大量纤维截面图像的分析.但是,近来另一研究发现该软件(FIAS)可能漏检10%至40%的不成熟纤维,从而高估棉花样品的总体成熟度[7].
不成熟纤维,尤其是死棉,具有较薄的纤维壁,在切片时,易被刀片划伤,也容易横向卷曲或折叠.这样的纤维边沿在图像中很难被正确地检测.在研究和使用FIAS的基础上,发现FIAS不能自动修补断开的纤维截面,且在“灌水”算法中易丢失不封闭纤维截面.另外,截面测量的均值长期以来被用作样品的成熟度指标[4-6],测量值的其他分布参数没有被考虑其中.这种单一参数的方法也是不能反映复杂的棉纤成熟度的分布情况.因此,文中首先对FIAS的纤维检测算法进行改进,以提高其对不清晰、不完整纤维边沿检测的适应性和准确度,增加有效的纤维测量根数,避免丢失不成熟纤维带来的系统偏差.再用优代后的算法完成104种棉花的截面图处理,分析棉纤成熟度分布的几种型态,并提出了由分布曲线计算不同成熟度纤维含量的方法.将该方法与旧版本的FIAS数据进行对比分析,并将优化后的FIAS与手工标记进行验证,对2 201幅图像,近10万根纤维进行对比测试,得出优化后的FIAS对纤维的漏检率和误检率均降低至1%以下.
1 棉纤成熟度评定方法
棉纤维的截面图像成熟度评定主要包括以下几个步骤:棉纤维备样[2-5],切片[3-4],横截面图像获取及截面图像处理和分析.本文改进的FIAS软件主要涉及图像处理和分析部分,具体步骤为动态阈值的图像分割,背景“灌水”,中轴线提取,中腔识别和参数测量,各步骤具体算法见文献[6].在截面分析中,单纤维成熟度通常是由圆度或θ值的形状参数来表征[3-4,6,8].θ由截面的周长(P)和净面积(A)按公式θ=4πA/P2计算[9].所以,增加纤维外沿和其中腔边沿检测准确是提高棉纤成熟度测量可靠性的关键.
选择7种不同品种的棉花,获得了1.5万多幅横截面图像,同时使用未改进和改进后的FIAS软件对图像进行分析.将横截面测量的成熟度数据与Advanced Fiber Information System (AFIS)和 High Volume Instrument (HVI)的测量数据进行相关分析.
1.1 纤维检测算法的改进
为把纤维截面从图像中分离出来,旧版本FIAS采用了4个主要的图像处理步骤:(1)动态阈值;(2)背景灌水;(3)纤维骨架;(4)中腔识别[7].当图像的光照均匀,对比度强时,这些处理步骤是有效的.但当纤维自我卷曲、折叠、粘连造成奇异的截面形状时,该算法经常出现错误.相比之中,步骤(2)和(3)的可调参数较少.因此文中算法重点改进决定纤维外沿与中腔的步骤(1)和(4).
1.1.1 动态阈值 在一幅8位的灰度值图像中,光照强度的变化十分明显.用固定阈值对整幅图片进行分割的方法并不有效.因此,采用动态阈值法将图片转换为二值化图像最为合理.旧版本FIAS[6]通过一个特定大小的子窗口计算阈值信息Ti,从而将窗口内的目标像素与背景分离.Ti是由窗口内像素的均值Mi和标准方差SDi通过式(1)所得,即
Ti=Mi—c×SDi.
(1)
其中,系数c的值在程序中设定为0.2[6],窗口固定为7×7像素.无论光照强度如何变化,系数c和窗口的尺寸都是不可调节的,因此所得Ti值可能并不是转换二值化图像所需的理想参数.图1(a)为一幅光照不均的图片,用上述阈值方法所得的二值化结果如图1(b)所示,其中的高强度噪声增加了追踪棉纤外沿的难度.图1(a)中的深色区域相比浅色区域,对背景噪声更为敏感,所以系数c的值应该与窗口均值Mi相匹配,从而控制阈值的敏感度.通过观察大量图片发现,明亮区域的噪声值普遍低于深色区域,因此在明亮的窗口中,系数c的值应该提升,从而降低阈值Ti.将基于区域信息的动态系数c标定为ci,经大量实验分析,ci的经验计算公式为
ci=0.014Mi-2.694(R2=0.985 7).
(2)
通过动态系数ci计算所得图1(a)的二值化图像如图1(c)所示.与图1(b)相比较,不但大量噪声数据被滤除,棉纤的外沿信息也被追踪得更为完整.
(a) 原始图像 (b) 优化前的二值化图像 (c) 优化的二值化图像图 1 动态阈值处理图像Fig.1 Dynamic threshold processing image
1.1.2 破损边界修补 为了只保留闭合的棉纤外沿,需将二值化图像图1(c)中的一些背景噪声以及破损的棉纤边界从图像中滤除.“背景灌水”是一种十分有效的方法.通过对白色的背景填补黑色像素,破损棉纤边界的白色中腔被黑色像素填满,从而“淹没”在黑色的背景中.为了防止那些只有细小缺口的棉纤被灌水滤除,需将破损的边界在灌水之前修补完整.
目前,没有一种通用的算法可以全局检测所有破损边界的端点,端点的修补只能基于逐个追踪棉纤外沿链的方法.其步骤为:(1)通过计算每个外沿点邻域中的外沿链数量,检测是否当前棉纤的外沿含有“断开点”(dead-end).如果一个外沿点的八邻域中只含有一个外沿链信息,此点被判断为断开点.(2)在当前棉纤外沿链中搜索另一个断开点.(3)两个断开点之间的破损距离是否在允许范围之内;同时,连接它们的外沿链长度是否超过之前所设定的棉纤周长.步骤(3)的意图为防止两个断开点之间的断开距离过于遥远,同时避免两个粘连棉纤断开点之间的连接.在优化的程序中,破损距离的连接长度设定为5个像素,边界修补过程为直线连接两个断开点.
图2(a)列举了一些具有代表性的破损边界,图2(b)为修补后的棉纤外沿.外沿修补在没有改变棉纤原有形状的前提下有效地防止它们被背景灌水去除.
(a) 破损边界 (b) 修复边界图 2 破损边界与修复边界Fig.2 Damage boundary and fixed boundary
1.1.3 中腔识别 在横截面图像中,不是所有棉纤都拥有明显的中腔.在图3(a)中,1#,2#以及3#棉纤不成熟,无中腔;4#,5#和6#棉纤由于对比度较低,中腔不是很清晰;7#,8#和9#棉纤只拥有部分中腔.因此上述棉纤的中腔很容易被高估或者低估.
一旦一个棉纤的外沿被锁定,通过计算其边界内部像素(像素强度的均值和方差)可以获取一个新的局域阈值,从而精确提取该棉纤的中腔信息.由于中腔应该位于整个棉纤的中间部分,如果边界内部的像素中存在不止一段黑色区域,那么棉纤的骨架(例如:中轴)可以用来定位中腔.在得到局域阈值以后,如果该棉纤内部还是没有发现中腔,则将该棉纤的骨架(一个像素宽度的线段)设定为中腔.因此,局域阈值的计算以及骨架计算的方法大大提升了中腔的尺寸以及位置的准确性(图3(b)所示).
(a) 原始图像 (b) 检测后的横截面图 3 原始图像与检测后的横截面Fig.3 original image and extracted cross section
表1为部分优化前和优化后FIAS所得的棉纤检测样本.显然,优化前的FIAS会遗漏一些粘连棉纤,并且常常高估或低估中腔的信息.随着算法的改善,优化后的FIAS可以更为有效地分离粘连棉纤,同时更加准确地定位棉纤中腔.
表1两种FIAS对棉纤检测的比较
Table 1 The comparison of two kinds of FLAS for cotton fiber detection
1.2 成熟度分布特点
一幅标准的640×480像素的图像往往包含10到100个数量的棉纤横截面.不同图像中横截面的θ值也是独立测量的,分布于[0,1]之间.通过对大量图像中棉纤横截面的测量,棉纤成熟度θ的描述统计,包括:均值Mθ,标准方差SDθ,偏态Sθ,以及峰态Kθ,都可以成为检测成熟度分布的特征值.在同一分布模型下,均值和标准方差描述的是中心趋势和分布差异,而偏态和峰态则表示分布的对称性和峰值点.由于频率分布不均衡,偏态的值可以是负的,正的或者零.负偏态意味着整个分布向均值的左侧拉伸,又称为左偏移(left-skewed or left-tailed),数据更多地集中在均值的右边;正偏态则完全相反;在零偏态的情况下,均值两侧分布曲线相称.峰态数据越大,峰值部分越突出,分布尾线也越长;峰态数据越小,峰值部分越圆滑,分布尾线也越短.因此,偏态和峰态的值决定了分布的正态性.许多例如t-tests,F-tests之类的经典统计方法对非正态分布的数据并不适用.
图 4 样本包3044与3055的成熟度分布比较Fig.4 The maturity distribution of sample 3044 and 3055
图4为相同均值、标准方差及峰态,不同偏态下棉纤样本包3044和样本包3055的成熟度(θ)分布.X轴代表棉纤的成熟度,Y轴代表数量在整个样本包中的百分比.经计算,2个样本包具有几乎相同的均值(0.475和0.479),标准方差(0.180和0.172),和峰态(-0.535和-0.532),但是它们的偏态值不同(0.376和0.232).而且2个样本包的成熟度分布差异很大.即使它们的均值几乎相同,但样本3044中不成熟的棉纤个数也更多.因此,不能只通过计算均值的方法进行区分,成熟度的分布状态在棉纤成熟度比较和排序中起到了关键的作用.
1.3 成熟度分布的型态
由图4可见,不同的样品包,棉纤成熟度分布型态完全不同.成熟度分布的型态反映出样品包中各成熟阶段纤维含量的百分比. 在描述分布形状的几个参数中,偏态是最主要的区分值. 偏态为负数时,说明不成熟纤维含量更高;当偏态为正数时,说明纤维较集中分布在高成熟度的区域内. 因此,偏态反映出纤维成熟度的分布情况. 根据偏态值(Sθ)的不同,成熟度分布曲线可以被分为五大型态,如表2所示.
表 2 成熟度分布型态Table 2 The distribution pattern of maturity
图 5 成熟度分布型态Fig.5 The distribution patterns of maturity
不同型态代表不同成熟度聚积的情况:型态Ⅰ中的主要成分为极度不成熟的死棉;而型态Ⅴ中有大量过于成熟的棉纤.图5列举了5种成熟度分布的型态,它们不但均值不同,其他分布参数也有很大的差异,因此,每一种分布型态都代表了一种级别的棉纤成熟度.未成熟的棉纤维强力较弱,若样品包纤维主要成分为不成熟的纤维,如型态Ⅰ和型态Ⅱ,则在加工过程中由于不成熟纤维容易断裂,降低了纤维的平均长度,且不成熟纤维染色牢度较差,影响织物最终的外观和质量,同时不成熟纤维含量较多也会造成纺纱断头增多,从而影响生产效率. 因此,通过5种分布型态,可大致判定样品包内纤维的成熟度情况,从而确定后续加工的各项工序参数的设置及配棉的设计.
1.4 棉纤种类和含量
基于对棉纤截面特征的分析,棉纤一般可以划分为死棉、不成熟棉和成熟棉.表3给出了每一类别棉纤的4个实例图片及其θ范围.极度不成熟的棉纤称为死棉,这些棉花在成长初期就停止了生长,因此内壁非常薄,断开后呈现很细的带状.死棉的θ值一般低于0.3.生长到一定程度,并出现了明显的棉纤壁和中腔的棉纤称为不成熟棉,其θ值一般介于0.3到0.6之间.成熟棉指的是那些生长充分,呈圆形或者椭圆形状,中腔较小的棉纤,其θ值应该高于0.6.因此,死棉、不成熟棉和成熟棉可以通过θ值进行简单分类.
相比成熟棉,死棉更容易缠绕形成棉结[10],不但破坏纱线的结构,且会大大降低纺纱效率.同时,由于缺少纤维质含量,棉结具有较快的解吸附率,在印染过程中无法上色[11].所以,死棉也是染布中产生白色污点的主要因素[12-13],从而严重影响了布料的市场价值.另一方面,成熟棉拥有较强的力度以及上色性,它是棉花成熟度判断的关键.在成熟度分布图中,3种棉纤的含量可以根据图6标识的θ值范围进行百分比的累加.
表3基于成熟度θ值的棉纤分类
Table 3 The classification of cotton fiber based on the value ofθ
2 实验结果
2.1 优化后FIAS测试结果的准确性分析
将优化前和优化后版本的FIAS测试结果用PA和CA表示.由于优化前的FIAS对不清晰或不完整的棉纤边界无法准确识别,因此在处理过程中添加了手动编辑的功能.对错误识别的棉纤双击鼠标,标记为删除,其数据会从结果中去除.手动编辑所得的PA结果用PAM表示.优化后的FIAS改进了棉纤识别功能,错误识别的棉纤会自动从结果中去除,同时增加了手动编辑工具.操作者可以修补不清晰的棉纤边界,分离粘连棉纤,以及通过鼠标或者绘画笔删除异样对象.手动编辑工具可以重复使用,直到操作者对识别结果满意为止.手动编辑所得CA结果用CAM表示,由于手动编辑能够通过修补和删除异常对象得到正确清晰的棉纤边界,因此认为CAM数据为正确值,该结果可以作为验证对象,用来鉴别CA数据的准确性.
棉纤样品包2996中的2 201幅图片作为CA和CAM测试对象,首先利用优化后的FIAS对所有图像进行批量处理,随后对图片逐一进行手动编辑.图7展示了CA和CAM结果的成熟度分布的直方图及各种分布参数.尽管在θ区域附近两个分布曲线存在细小差别,但其相似度很高(R2=0.999),两组分布参数的值也很相似.由此可见,除去一些不可修复的不成熟棉纤部分,CA测试可以提供非常准确、可靠的数据结果.鉴于CA和CAM结果的高度一致性,也无需再对CA的结果进行手动编辑.
图 6 成熟度分布图 图 7 样品包2996的成熟度直方图以及分布参数Fig.6 The maturity distribution diagram Fig.7 The maturity histogram and distributed parameters of sample 2996
2.2 优化后 FIAS的未成熟棉识别效果分析
使用CA、PA和PAM方法对7种样品包中的所有图片进行处理,所识别的棉纤数量如表4所示.表Δ代表CA与PA或PAM所识别数量的差值除以CA所识别的数量.通过与CA的7个数据结果进行比较,PA的遗漏识别率为0.57%到5.31%,再对PA中错误的识别结果进行删除后,PAM的遗漏识别率升至59%以上.这也意味着优化后的FIAS可识别更多的棉纤,通过对不成熟棉数量检测的提升,不成熟棉在成熟度分布中的偏差得到很好的纠正.
表 4 棉纤识别数量比较Table 4 The comparison of identification number
2.3 FIAS系统棉纤维成熟度参数的测试结果与分析
2.3.1 成熟度均值Mθ与成熟率Mr表5将3种测试方法在7个样品包中所得的成熟度均值Mθ与FIAS成熟率Mr和HVI的马克隆值进行比较.由于PA方法中很多不成熟棉被识别为成熟棉,因此PA所得7个Mθ普遍高于PAM和CA方法.通过手动移除这些不准确的棉纤,PAM中Mθ的值有所降低,但仍高于CA的结果.尽管如此,3种方法的Mθ之间相互关联,并且与FIAS成熟率Mr之间的线性相关性几乎相同.CA与PAM测试结果大幅提升了与马克隆值之间的二次相关性.3种方法的Mθ可以通过公式(Mr=Mθ/0.577[4])得到各自的成熟率,并与FIAS的成熟率进行比较.从表5可以发现,除去样品包3075,PA的成熟率普遍高于FIAS;而除去3074, CA的成熟率却普遍低于FIAS.
表 5 成熟度均值(Mθ)的比较Table 5 The comparison of maturity average (Mθ)
注:* 线性回归计算所得,** 二次回归计算所得
2.3.2 标准方差SDθ、偏态Sθ和峰态Kθ表6列举了另3种成熟度分布的描述参数:标准方差(SDθ),偏态(Sθ),和峰态(Kθ).PA与CA的各SDθ值几乎相同,并且由于PAM中的异样对象被手动删除,PAM的各SDθ值呈现最低.值得一提的是,7种样品包使用CA方法得到的SDθ竟然完全相同.CA所获的Sθ值均高于另两种方法,并且除去3074,它们的值都是正的,基本为PA结果的2倍,从而导致3种方法所得的成熟度分布型态几乎相差了一个等级.基于“超峰态”的概念,表格中的Kθ得到了调整(减去3),从而使正态分布的峰态值为零.当Kθ为负时,较为平滑的峰值会呈现在均值周围,称之为偏峰形.根据表中的Kθ数值,7种样品包的3种测试方法所得成熟度分布均为偏峰形.
2.3.3 成熟度分布直方图 使用CA、PA和PAM 3种方法对样品包2999中所有图片进行处理,所得成熟度分布直方图如图8所示.尽管3种方法所得Mθ值相似(分别为0.48,0.45和0.45),但直方图差异明显.CA的直方图呈现严重的右偏移,并在死棉区域(θ< 0.3)出现尖锐的峰值.然而,PA和PAM直方图却只有细微的右偏移,由于手动去除了错误识别的棉纤,PAM中统计棉纤数量的直方图高度偏低.
表 6 成熟度分布参数Table 6 The distributed parameters of maturity
基于CA方法的7种样品包的成熟度分布如图9所示.从中可以发现这些样品包成熟度区别很大,有正态分布的3074,也存在严重右偏移的3075.它们之间的区别通过偏度参数Sθ就可反应:3074的Sθ为-0.03,而3075的Sθ为0.61.在这7个样品包中,有2组分布曲线相似的样品包:2996与3009,和2999与3008,并且它们的分布参数Mθ,SDθ,Sθ和Kθ都相当接近.3016的峰度为绝对值最大的负数(-0.60),它的分布曲线峰值最平坦.因此,对不同样本之间进行的成熟度比较应该综合地基于这4种描述参数.
图 8 样品包2999的成熟度直方图熟度分布 图 9 7种样品包CA测试的成熟度分布Fig.8 The maturity histogram of sample 2999 Fig.9 The maturity distribution of seven samples with the method of CA
2.3.4 死棉、不成熟棉和成熟棉含量 根据θ值的大小,可以将棉纤简单地分为死棉、不成熟棉和成熟棉.同时,一个棉纤样本中每种棉纤的含量(比例)也可通过成熟度的分布图进行统计.对7种样品包通过PA,PAM和CA测试后的各种棉纤含量进行计算,结果见表7.3种测试均发现7种样品包的不成熟棉所占比例最大(除去3074,其余均超过了50%).3种测试的结果中,不成熟棉的含量与其Mθ的相关性不高,死棉含量和成熟棉含量却与其Mθ拥有很高的相关性(死棉的相关性均为负,成熟棉的相关性均为正).由此可见,死棉和不成熟棉参数与整个样品包的成熟度相关.通过比较PA和CA的测试结果,死棉含量增长,增长幅度从0.87%(3074)到6.96%(3008)不等.成熟棉含量下降,下降幅度从-2.14%(3074)到-6.78%(3009)不等.这些变化说明优化后的FIAS具备检测死棉和避免将其识别为成熟棉的能力.PA测试最大的缺陷是将卷曲的死棉判断为成熟棉,从而错误地统计了死棉和成熟棉的数量.
3 结 论
(1) 优化后的FIAS程序不但提升了对不同成熟度棉纤的检测能力,同时有效地降低了优化前程序中不成熟棉的错误率.CA测试的成熟度分布结果与手动编辑棉纤的结果高度关联(R2=0.999),因此优化后的FIAS程序免除了手动编辑.
(2) 单一参数值对非正态分布的大批量棉纤进行成熟度分析是不合理的,往往容易产生错误结果.棉纤维成熟度分布曲线能准确反应批量棉成熟度分布特征,其偏态可作为分布曲线的形态分类参数.根据偏态将批量棉纤维的成熟度分为5个基本型态,可用于批量棉纤维成熟度的基本分类,该分类可为棉纤维后续加工的参数设置、配棉等提供参考.
(3) 根据成熟度分布,死棉含量,不成熟棉含量以及成熟棉含量可以通过累加对应成熟度范围中的概率值得到.对大多数的批量棉纤样本,不成熟棉在成熟度分布中占据主体,但是死棉和成熟棉含量与衡量总体成熟度水平的成熟度均值Mθ高度关联,因此在对批量棉成熟度的评估中,死棉和成熟棉含量应为最主要的因素.死棉含量影响最终成品的强度、染色性和棉结,在纺织加工过程应予以高度重视.
表 7 死棉、不成熟棉和成熟棉含量Table 7 The content of dead cotton, immature cotton and mature cotton
注:R*为该表中棉纤含量与表5中CA测试Mθ之间的相关系数
参考文献(References):
[1] LORD E.Airflow through plugs of textile fibers Part Ⅱ:The micronaire test of cotton[J].Journal of Textile Institute,1956,47(1):16-47.
[2] BOYLSTON E K,THIBODEAUX D P,EVANS J P.Applying microscopy to the development of a reference method for cotton fiber maturity[J].Textile Research Journal,1993,63(2):80-87.
[3] THIBODEAUX D P,RAJASEKARAN K.Development of new reference standards for cotton fiber maturity[J].Journal of Cotton Science,1999,4:188-193.
[4] HEQUET E,WYATT B,ABIDI N,et al.Creation of a set of reference material for cotton fiber maturity measurements[J].Textile Research Journal,2006,76(7):576-586.
[5] BOYLSTON E K,EVANS J P,THIBODEAUX D P.A quick embedding method for light microscopy and image analysis of cotton fibers[J].Journal of Biotechnic and Histochemistry,1995,70(1):24-27.
[6] XU B G,HUANG Y.Image analysis for cotton fibers Part II:Cross-sectional measurements[J].Textile Research Journal,2004,74(5):409-416.
[7] PADMARAJ L,KRIFA M,XU B G.Evaluating immature fiber Bias in cotton fiber cross-section analysis[C].Proceedings Beltwide Cotton Conferences,2011:1476.
[8] MATIC-LEIGH R,CAUTHEN D A.Determining cotton fiber maturity by image analysis Part I:Direct measurement of cotton fiber characteristics[J].Textile Research Journal,1994,64(9):534-544.
[9] PIERCE F T,LORD E.The fineness and maturity of cotton[J].Journal of Textile Institute,1939,30(12):173-210.
[10] FRYDRYCH M Matusiak,SWICH T.Cotton maturity and its influence on nep formation[J].Textile Research Journal,2001,71(7):595-604.
[11] CHEEK L,WILCOCK A.Relationship between direct dye characteristics and coverage of immature fiber neps in dyed cotton fabric[J].Journal of the Society of Dyers and Colourists,1988,104(12):477.
[12] PETER U,BOWES Q.Quality variations in cotton and their effects on bleaching,dyeing and finishing[J].Melli and Textilberichte,1989,70:135-137.
[13] BEL P D,XU B G,YAO X.White speck potential for mechanically harvested cottons[J].AATCC Review,2011,11(4):59-65.