APP下载

基于K-means-RBF的鸡肉品质分类方法研究

2018-08-09邢素霞王九清

食品科学技术学报 2018年4期
关键词:鸡肉纹理灰度

邢素霞, 王九清, 陈 思, 王 睿

(北京工商大学食品安全大数据技术北京市重点实验室/计算机与信息工程学院,北京100048)

鸡肉品质变化受到多种因素的影响,其腐败程度仅凭某一个参数并不能准确辨别,根据 GB 16869—2005《鲜、冻禽产品》[1],生鲜鸡肉的品质检测应包括感官性状检测、理化检测、微生物检测3类。感官检测主要通过组织状态、色泽、气味等外观判别鸡肉的品质优劣;理化检测包括挥发性盐基氮、微量元素、抗生素残留等项目;微生物检测主要包括大肠菌群、沙门氏菌、出血性大肠埃希氏菌等菌落总数。因此,鸡肉品质检测是一个从外在品质到内在品质的综合评测过程,单凭某一个参数无法全面衡量鸡肉新鲜程度。

高光谱成像技术是新一代光电检测技术,将传统二维成像技术和光谱技术有机结合,具有连续多波段、高光谱分辨率和图谱合一等特点[2-7]。其图像信息可以反映肉品的外部特征,而光谱信息则可以用来检测内部品质特性,实现对肉品外部特征和内部品质的综合定性判别和定量分析。

拟通过K-means-RBF集成神经网络智能数据融合处理方法,以高光谱成像光谱特征、图像纹理、颜色特征为并行输入量,实现鸡肉内、外部多项品质指标的并行检测,建立鸡肉品质多源数据融合检测模型,对鸡肉进行检测和识别。

1 材料与方法

1.1 材料与试剂

北京老山市场购买当日鲜白羽鸡胸肉62份,剔除结节组织,编号高光谱1~62、理化1~62。每个高光谱样品长5 cm、宽3 cm、高1 cm,每个理化样本100 g,放在冷藏室里。

1.2 仪器与设备

GaiaSorter“盖亚”型高光谱分选仪系统,北京卓立汉光仪器有限公司;恒温恒湿箱,北京雅士林试验设备有限公司;8011S型组织捣碎机,美国Waring Commercial公司;MATLAB软件,美国 MathWorks公司。

1.3 实验方法

1.3.1 挥发性盐基氮和菌落总数测定

根据GB/T 5009.44-2003《肉与肉制品卫生标准的分析方法》[8]中半微量定氮法测定挥发性盐基氮含量;根据GB 4789.2—2016《食品安全国家标准食品微生物学检验 菌落总数测定》[9]测定菌落总数。62个样本的挥发性盐基氮、菌落总数含量如表1。

表1 鸡肉样品挥发性盐基氮、菌落总数理化指标Tab.1 Physical and chemical indexes of total volatile basic nitrogen and total bacterial count of chicken samples

1.3.2 高光谱数据采集与预处理

每隔一段时间(1、2、8 h不等),从冷藏室拿出2个相邻序号的样品放入20℃的恒温箱里,62个样品中,1、2号20℃ 的恒温箱存放时间最短为0 h,61、62号在20℃环境中存放40 h(同时取2个号是为了获得更准确的数据,避免样品的单一性)。40 h后,利用GaiaSorter“盖亚”型高光谱分选仪系统采集样品1~62号的高光谱数据,同时利用国标法检测1~62号的挥发性盐基氮(total volatile basic nitrogen,TVB-N)含量和菌落总数。

为了保证图像的清晰程度,样品进行图像采集前预先对相机的曝光时间进行设定。为了克服光强分布不均和暗电流的影响,对采集到的样本高光谱图像Ds,进行黑白校正,校正后的相对样品高光谱图像反射率R见公式(1)[10]。

式(1)中,Dw为白板标定图像,Dd为全黑标定图像。高光谱图像数据分析采用ENVI软件平台,高光谱图像数据中的每个像素点,均有一条对应的光谱曲线,如图1。选择高光谱图像的感兴趣区域,设置感兴趣区域长和宽均为150 px,获取该区域的平均光谱曲线,作为该样本的光谱曲线。

光谱预处理方法主要有微分、矢量归一化、多元散射校正(multiplicative scatter correction,MSC)等[11-12],矢量归一化主要是消除由微小光程或者样品厚度引起的光谱变化。微分预处理可有效地分辨重叠峰,其主要功能是将明显但较小的特征峰辨识出来,消除背景干扰,提高分辨率,但同时会引入一定的噪声。MSC可以有效地消除样品颗粒参差不齐和分布不均所产生的散射影响,同时也对近红外扫描样品的光程长短误差进行修正。综合比较,选用MSC作为预处理方法。

1.3.3 光谱、纹理、颜色特征提取

高光谱数据信息量大,存在大量冗余的多重共线性信息[13],既含有大量的有用信息(灰度值、纹理、TVB-N、菌落总数等),也存在大量冗余信息和附加随机误差(噪声),需要一定的数据降维和多源数据融合方法,有效去除冗余、分离混合信号,提取相互独立的观测信息,建立多源数据融合的鸡肉综合评价方法。

主成分分析(principal component analysis,PCA)[14-15]是一种可以去除波段间多余信息、沿着协方差最大的方向由高维数据压缩到更有效的少数几个特征波段的方法。通过主成分分析,数据按方差贡献率大小排列,选取累计方差贡献率大于85% ~95%的主成分,代表原始变量所能提供的绝大部分信息。每个主成分图像都是经过原始数据中各波长经线性组合而成,通过比较线性组合权重系数,优选出最优波长。本文利用主成分分析法提取所有样品的特征波长。

灰度-梯度共生矩阵是一种获取灰度梯度的二阶统计纹理分析方法[16]。它可以从62个主成分灰度图像中提取出15个纹理信息变量,分别为:(大、小)梯度优势、灰度分布不均匀性、灰度均值、梯度均值、灰度均方差、梯度均方差、灰度熵、梯度熵、混合熵、惯性等。

鸡肉图像在采集过程中可能受到噪声干扰,对图像颜色值提取造成影响,本研究采用中值滤波法对图像进行去噪,滤波后的图像边缘信息更加清楚完整。图像颜色特征提取用MATLAB实现,为了充分利用颜色数据,使用RGB和HSI双色空间模型,并计算出R、G、B、H、S、I六个颜色分量一阶矩和二阶矩共12个颜色特征参数,对肉品颜色进行量化表述。其中肉质颜色一阶矩用来表示平均颜色特性,二阶矩用来表示颜色变化范围,使鸡肉颜色特征更加精确、全面。

1.3.4 K-means-RBF多源数据融合算法

对高光谱数据进行特征提取后,得到6个波长特征、5个纹理特征和12个颜色特征,通过 K-means-RBF神经网络进行多源数据融合,实现对鸡肉品质的综合评价。

1.3.4.1 RBF神经网络

RBF神经网络是一个前向神经网络,由输入层、隐含层和输出层3层组成[17],如图2。利用径向基函数作为隐含层,输入向量直接映射到隐含层,不需要权重的连接,为非线性过程。RBF隐含层到输出层为线性叠加,权值为网络的可调参数。设xi∈RN,i=1,2…n是第i个鸡肉样本,每个鸡肉样品都是由6个光谱特征值、5个纹理特征、12个颜色特征组成,则RBF神经网络的输出如式(2)。

图2 径向基神经网络结构Fig.2 Radial basis function neural network structure

式(2)中,yj为输出层的第j个输出,即鸡肉品质分级类型;h为输入样品的个数;wij为第i个隐含层神经元第j个输出的权重;xp为输入向量,ci和di分别表示第i个隐含层神经元中心和宽度。因此,RBF的网络参数设计主要为RBF的中心、方差、隐含层到输出层的权重系数。

1.3.4.2 K-means-RBF聚类算法

RBF的聚类中心利用 K-means算法得到。K-means算法是一种聚类分析算法[18-22],其根本思想是:任意选用空间k个点作为聚类中心,根据其余对象与该聚类中心的相似度,把最接近的样本归类。随后通过迭代来不断更新聚类中心值,直到最优聚类结果得出为止。

当神经网络的基函数是高斯函数时,方差为式(3)。

式(3)中,cmax为所选取中心之间的最大距离。

利用最小均方误差原则,计算从隐含层到输出层的神经元连接权值,可以用最小二乘法直接计算得到,见式(4)。

具体步骤如下:

1)随机选取4个训练样本作为聚类中心ci(i=1,2,3,4);

2)计算剩余数据集样本到每个聚类中心的欧氏距离,将样本加入到使其离聚类中心欧氏距离最短的那个类别簇中,并记下该样本编号;

3)计算每个聚类几何中训练样本的平均值,即新的聚类中心ci(i=1,2,3,4),若新聚类中心与原聚类中心相等,则迭代终止,否则,就返回继续迭代;

4)计算每个聚类中心之间的距离,取最大距离cmax,利用式(3)计算RBF神经网络的高斯基函数的方差;

5)利用式(4)最小二乘法,计算隐含层到输出层之间的连接权值w;

6)根据式(2),对验证集样本进行聚类分析,得到分类结果。

2 结果与分析

2.1 高光谱特征数据分析

利用PCA对每个样品的不同波段图像进行主成分分析,选能量集中在前90%的图像,结果如图3。由图3看出,PC1的图像非常清晰,反映了鸡肉的绝大部分的信息,由此选择PC1的权重系数作为特征波段。PC1主成分图像由256个波段下的图像经线性组合而成,见式(5)。

图3 主成分分析得到的前5个图像Fig.3 Top 5 images of principal component analysis

通过比较256个波长下对应的权重系数,权重系数比较大的是21、39、79、110、136、181六个波长,对应的波长分别为 943.28、1 003.20、1 136.53、1 240.03、1 326.95、1 477.64 nm。

2.2 高光谱图像纹理特征分析

通过灰度-梯度共生矩阵从62个主成分灰度图像中提取出15个纹理信息变量。通过计算结果发现,灰度均值、梯度均值、灰度均方差、梯度均方差、惯性等5个特征变量的数值变化较为明显,前15个样品的5个纹理特征向量值见表2。

表2 纹理特征参数Tab.2 Texture characteristic parameters

2.3 高光谱图像颜色特征分析

RGB和HIS颜色空间分别可以获得6个颜色特征,颜色一阶矩用来表示平均颜色特性,二阶矩用来表示颜色变化范围,前11个样品的颜色特征数据如表3。

2.4 K-means-RBF神经网络训练与预测

根据检测到的挥发性盐基氮和菌落总数的理化数据以及GB 16869—2005《鲜、冻禽产品》[1],将鸡肉品质等级划分为放心食用、可食用、不建议实用、不可食用4个等级,划分依据如表4。

将62个鸡肉样本的高光谱图像数据,分别通过光谱分析法、图像处理法提取感兴趣区域的特征光谱、图像纹理、颜色特征,其中选取42个样本作为训练集,训练K-means-RBF集成神经网络模型,得到聚类中心、方差及输出权值。将剩余20个样本作为测试集以检测分类模型的准确度。实验结果如图4,图4a为经过K-means-RBF集成神经网络模型对20个测试集得到的分类结果。

而图4b、4c、4d分别为以颜色特征、纹理特征、以及综合纹理和颜色(其中纹理特征向量权重是0.8,颜色特征向量权重是0.2)为输入,以LS_SVM为分类器的分类结果。

实验结果显示,基于纹理特征的鸡肉品质分级(图4b)准确率为85%,基于颜色特征的鸡肉品质分级(图4c)准确率是80%,基于纹理特征和颜色特征融合的鸡肉品质分级(图4d)准确率是95%。验证了高光谱图像信息在鸡肉品质分类中的可行性,但是利用纹理和颜色融合的技术方法建立的分类预测模型准确率更高,均高于基于单一特征的分级模型。而基于K-means-RBF集成神经网络模型的预测结果(图4a)与真实值完全吻合,精确度达到100%,说明了鸡肉的外在特征与内在特征在鸡肉品质分级中的重要性,同时证明K-means-RBF数据融合方法在鸡肉品质分类预测中的可行性。

表3 颜色特征参数Tab.3 Color characteristic parameter

表4 鸡肉品质分级标准Fig.4 Chicken quality grading standards

3 结 论

图4 模型验证和分类预测结果Fig.4 Model verification and classification prediction results

研究以国家生化检验结果(挥发性盐基氮和菌落总数)为标准,以高光谱数据的光谱特征、纹理特征、颜色特征为特征向量,设计了基于K-means-RBF的多源数据融合鸡肉品质分类方法,达到了100%的预测精度,与通过单一特征或仅外部综合特征的分类方法相比,该方法的分类精度大大提高。首先,该方法获取的信息更加丰富,综合了高光谱的光谱信息与图像信息,分别反映了鸡肉的内在品质与外在品质,符合国家对生鲜禽类的感官加理化的评价标准;其次,通过鸡肉的外在特征(纹理、颜色以及纹理与颜色综合特征)建立的LS_SVM分类器,分别获得了85%、80%、95%的分类正确率,说明高光谱图像信息在鸡肉品质分类中的有效性,也验证了单一特征在分类中的局限性。最后通过光谱特征、纹理特征以及颜色特征对K-means-RBF集成神经网络的训练,得到100%的分类正确率,验证了K-means-RBF融合方法在高光谱数据分析中的有效性,能够精确地预测鸡肉品质,实现快速、精确地分类。

猜你喜欢

鸡肉纹理灰度
采用改进导重法的拓扑结构灰度单元过滤技术
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
基于BM3D的复杂纹理区域图像去噪
厨房料理小妙招
使用纹理叠加添加艺术画特效
下半年鸡肉市场看好
天热了,吃点鸡肉吧
TEXTURE ON TEXTURE质地上的纹理
基于最大加权投影求解的彩色图像灰度化对比度保留算法
不吃鸡肉