近红外光谱分析技术在鸡肉分类检测中的应用
2014-06-26向灵孜郭培源
向灵孜, 郭培源
(北京工商大学计算机与信息工程学院,北京 100048)
近年来,随着人们饮食消费的多元化和肯德基、麦当劳等快餐在中国市场的强势扩张,鸡肉消费正在慢慢超过猪肉成为国人第一大肉类消费[1].同时,由于人民生活品质的不断提高,健康意识逐步增强,大众膳食的肉类消费结构也由猪肉、羊肉等红肉逐渐转变为以鸡肉为代表的白肉[2].中国是世界鸡肉生产、消费和贸易的大国,根据FAO(联合国粮食及农业组织)统计,2013年生产鸡肉10 640万t,占世界鸡肉产量的88%,是世界第二大鸡肉生产国[3].
然而,近年来市场上不同品种不同级别的鸡肉混杂,且由于土鸡价格的持续走高,以次充好的现象时有发生[4].目前,在鸡肉检测方面,传统的化学分析方法较为常用.然而,化学分析方法通常需要取样化验,过程中涉及较多的专业化学设备和化学试剂,且过程复杂、检测时间长、成本高,种种因素导致测试效率极低.而近红外(near infrared,NIR)光谱特性稳定,含有丰富的信息,能够反映样品的综合信息,是一种高效、绿色的分析测试技术[5].红外光谱分析方法与化学分析方法相比,检测速度快,可在短时间内实现大量样品的快速测定;同时,由于该方法不需要化学试剂,对样品或者环境不会造成污染,属于绿色环保型.
刘炜等[4]应用近红外光谱对148个鲜鸡肉样本扫描,建立了脂肪、蛋白质和水分的定量分析模型,其模型的平均内部交叉验证均方差(RMSECV)为0.111,0.149,0.177 9等,说明利用近红外光谱法能够同时对鲜鸡肉中的脂肪、蛋白质和水分含量进行检测.沈杰[5]采集了禽肉的近红外图像信息,对鸡肉中的脂肪含量和系水力指标建模分析,其相关系数分别是0.818 1,0.873 3,相关系数均达到了0.8以上.燕昌江等[6]对200份高脂系肉种鸡样本进行实验,研究鸡肉胸肌肉质指标,利用偏最小二乘法(PLS)对样本的光谱数据进行分析建模.结果表明,近红外光谱技术对于鸡肉胸肌肉质中水分、蛋白、脂肪等指标有较高的预测能力.
本文运用近红外光谱技术对鸡肉分类进行研究,限于测量环境和实验条件,在通用检测标准允许的范围内,实验样品采用在市场中购买的新鲜鸡肉,对其进行光谱扫描,采集不同种类的鸡肉样品光谱图,并对其进行了聚类分析和建模研究,研究了聚类分析技术应用于检测鸡肉分类的可行性[7-14].
1 材料与方法
1.1 材料与试剂
采样肉鸡品种为白羽肉鸡,土鸡品种为北京本地散养柴鸡.样品取自新鲜胴体的一侧胸肉,剔除可见脂肪和结缔组织,新鲜鸡肉样品来自北京市农贸市场和超市.本实验分别采集了20份新鲜肉鸡鸡胸样品和20份新鲜土鸡鸡胸样品,其中每15份样品作为校正样本集用来建立聚类模型,5份样品作为验证样本集用来检测.
1.2 仪器与设备
采用瑞士FoodScanFoss公司的FoodScan近红外全光栅透射光谱分析仪;光谱范围为850~1 050 nm,分辨率为2 cm-1,每个扫描采集数据点数为100,该仪器采用硅(Si)检测器和固体测量容器,透反射测量有效光程为2 mm,采用光栅投射和相关固体测量柱形杯具,杯具直径为6 cm.采用Win ISI软件对光谱数据进行预处理分析,使用MatLab 2012b工具对其进行聚类分析.
1.3 方法
1.3.1样品制备
在扫描前,仪器需预热0.5 h,样品粉碎成肉糜状.18℃恒温箱保存,扫描过程中严格控制室内湿度,保持环境的一致性.按标号依次将样品杯中的鸡肉样品倒入样品盘,鸡肉样品均匀铺满整个样品盘并保证厚度一致.每个样品扫描3次,采样间隔为2 nm,分辨率为5 nm,剔除异常样本后,取平均值.采集到的光谱图像如图1和图2.
1.3.2特征波段选取
本实验分别在无预处理和采用不同预处理方法的情况下对肉鸡和土鸡的光谱图使用标准方法进行聚类分析.在聚类过程中,首先导入校正集肉鸡鸡胸光谱1~15和土鸡鸡胸光谱1~15.通过交互式选择光谱的频率范围,如图3.由图3看出,在900~1 022 nm光谱内存在较明显的吸收峰,而其余光谱范围内几乎没有吸收信号.因此本实验选择900~1 022 nm为光谱分析区间.在比较不同预处理方法产生的聚类结果后,选择合适的预处理方法建立聚类预测模型,从而准确鉴别验证集肉鸡光谱16~20样品和土鸡光谱16~20样品.本实验采用较为直观的树形图来呈现所得聚类结果.
图1 土鸡样品近红外光谱图Fig.1 Near infrared spectra of domestic chickens samples
图2 肉鸡样品近红外光谱图Fig.2 Near infrared spectra of broiler chicken samples
图3 交互式频率范围选择Fig.3 Range selection of interactive frequency
1.3.3光谱预处理
因为肉鸡肉与土鸡肉的物质组成和化学结构几乎相同,且其内部的化学基团在近红外中的吸光度相近,在同一谱图上谱相似,吸收峰值一致.因此,直接通过谱图很难区分肉鸡肉和土鸡肉[15].因此,为了保证校正模型的稳定性和可靠性,需要对原始光谱进行合理的预处理后再进行聚类分析,以便降噪、减少各种外界干扰的影响并消除光谱中包含的无用信息,提高分析准确度.本研究主要采用的光谱预处理方法包括矢量归一化、一阶导数处理、二阶导数处理和归一化与求导相结合.
矢量归一化,是计算的平均吸光度值能够消除光程或样品稀释等变化对光谱造成的影响[11].其具体计算步骤:1)对一条原始光谱,计算其平均吸光度值;2)用原始光谱值减去平均吸光度值,得到处理后的光谱值;3)计算处理后的光谱值的平方和,再开平方根,设这个值为m;4)将处理后的光谱值除以m,此时光谱的矢量归一化是1,一条光谱的矢量归一化完成[16].
一阶导数可用于消除光谱中基线的漂移,并使较小的特征吸收峰变得明显,二阶导数可消除光谱的散射现象.在有效消除其他背景干扰的同时,分辨重叠峰,提高分辨率和灵敏度.
一阶微分:
式(1)和式(2)中,k为光谱间隔,大小可视具体情况设定,x为吸光度.采用矢量归一化方法预处理后的鸡肉样品光谱曲线如图4,一阶导数预处理后的鸡肉样品光谱曲线如图5,二阶导数预处理后的鸡肉样品光谱曲线如图6.
图4 鸡肉样品矢量归一化近红外光谱图Fig.4 Near infrared spectra of chicken samples after vector normalization
1.3.4聚类分析方法
聚类分析过程包括两种距离的计算,一种是光谱图与光谱图之间距离的计算,另一种是新创建类与其他谱图或类之间距离的计算[17-18].本研究中,光谱距离采用标准法计算,即用欧式距离表示光谱距离.欧氏距离的计算如式(3):
图5 鸡肉样品一阶导数近红外光谱图Fig.5 Near infrared spectra of chicken samples after first derivative
图6 鸡肉样品二阶导数近红外光谱图Fig.6 Near infrared spectra of chicken samples after second derivative
式(3)中,D表示光谱和光谱之间的距离;a(k)和b(k)是光谱图a和b的纵坐标的值,即光谱a和光谱b在k波长点处的吸光度值.欧式距离的主要优点是当坐标轴进行正交旋转时,欧式距离保持不变.因此,如果对原坐标系进行平移和旋转变换,则变换后样本点之间的距离和变换前完全相同.
本研究采用较为常用的平均距离法:
式(4)中,目标p和q聚为一个新目标r.D(p,i)是目标p和目标i的光谱距离,D(q,i)是目标q和目标i的光谱距离.新目标r和目标i的距离D(r,i)小于两个原来距离值.聚类分析分类预测模型构建流程如图7.
2 结果与分析
由扫描所得肉鸡和土鸡鸡胸样品的近红外光谱图(如图5和图6)可见,尽管肉鸡和土鸡属于2个不同的鸡肉品种,且产地不同,但是所有样品的光谱趋势及吸收峰的位置均大体一致.然后选取肉鸡和土鸡的16~20样品光谱作为实验的验证集,余下的30个样品作为校正集.
无任何预处理900~1 022 nm原始谱图的聚类分析树形图见图8.由图8可以看出,对未经优化的光谱数据进行聚类分析时,肉鸡和土鸡的分类较混乱,几乎找不到显著的区分和规律.
图7 聚类分析分类预测模型构建Fig.7 Structure of clustering analysis prediction model
图8 无预处理聚类分析结果树形图Fig.8 Result tree diagram of clustering analysis without pretreatment
经过一阶导数后,谱图在900~1 022 nm范围的聚类分析树形图如图9.由图9可以看出,单纯对原始光谱进行一阶求导,产生的聚类分析结果也不能将肉鸡和土鸡准确分类.
经过二阶导数后,谱图范围在900~1 022 nm的聚类分析树形图如图10.由图10可以看出,单纯对原始光谱进行二阶求导,产生的聚类分析结果依旧不能将肉鸡和土鸡准确分类.
将近红外原始光谱图经过一阶求导+矢量归一化、二阶求导+矢量归一化分别预处理后,所得谱图在900~1 022 nm,聚类分析树形图如图11、图12.
由图8~图12可以得出聚类结果如表1.
唐诗的模糊美初探 ……………………………………………………………… 王华琴,张青华,张 红(5.76)
由表1可以看出,校正集近红外光谱在分别采用矢量归一化、一阶导数+矢量归一化、二阶导数+矢量归一化方法预处理后,通过聚类分析都可以将肉鸡和土鸡准确的区分,且各自归为一类,准确率为100%.
以上实验结果说明谱图的预处理对于计量学分析结果的好坏会起到十分重要的作用,同时也说明不同种类的鸡肉可以通过近红外光谱技术很好分类.
图9 一阶导数后聚类分析结果树形图Fig.9 Result tree diagram of clustering analysis with first derivative
图10 二阶导数后聚类分析结果树形图Fig.10 Result tree diagram of clustering analysis with second derivative
图11 一阶求导+矢量归一化后聚类分析结果树形图Fig.11 Result tree diagram of clustering analysis with first derivative and vector normalization
图12 二阶求导+矢量归一化后聚类分析结果树形图Fig.12 Result tree diagram of clustering analysis with second derivative and vector normalization
表1 肉鸡和土鸡样品聚类分析结果Tab.1 Cluster analysis results of broiler chicken and native chicken samples
在得到准确的聚类分析结果之后,实验选取聚类效果较好的二阶导数加矢量归一方法对光谱进行预处理并建立聚类模型,以便验证集肉鸡和土鸡能准确地归类.
验证集肉鸡和土鸡样品采用已建立好的聚类模型进行聚类测试的结果如图13、图14.
图13 验证集肉鸡的聚类结果树形图Fig.13 Verification result tree diagram of clustering analysis of broiler chicken
3 结 论
肉鸡和土鸡在未经宰杀前可以通过其外部特征利用感官分析法来区分.然而,由于肉鸡和土鸡同属鸡肉品种,肉品性状和色泽较为相似.因此,一旦经过宰杀并将其肉分类售卖,很难通过感官来准确区分肉鸡肉和土鸡肉.本实验研究了近红外光谱分析技术用于鸡肉分类检测的可行性.为了提高分类模型预测的准确度,选用不同的预处理算法.通过聚类分析建立了鸡肉分类的预测模型.实验证明,近红外技术用于判定鸡肉分类采用的聚类分析方案是有效的.研究表明,当预处理方法为一阶导数+矢量归一化、二阶导数+矢量归一化均能使模型的预测准确率达到100%,经过预处理的聚类分析方法能够很好地提高模型的预测能力.这为近红外技术在农业、工业生产中用于分析检测鸡肉类别的可行性及其预测能力的提高与改进提供了一种有效的方法和思路.
图14 验证集土鸡的聚类结果树形图Fig.14 Verification result tree diagram of clustering analysis of native chicken