APP下载

基于太赫兹光谱分析技术的肉类鉴别

2021-06-30杨少壮李灿李辰王志琪黄略略

食品与发酵工业 2021年11期
关键词:虚部冻干介电常数

杨少壮,李灿,李辰,3*,王志琪,黄略略

1(深圳华大生命科学研究院,广东 深圳,518083) 2(深圳市太赫兹科技创新研究院,广东 深圳,518102) 3(深圳麦科田生物医疗技术有限公司,广东 深圳,518055) 4(深圳职业技术学院 应用化学与生物技术学院,广东 深圳,518055)

肉类作为人类生活中重要的营养来源和能量补充物质,具有庞大的市场需求,在百姓生活中扮演着极为重要的角色。近年来,异种肉掺杂、低劣肉伪装高档肉、“僵尸肉”等肉类假冒伪劣和欺诈行为事件频频发生,严重影响消费者的健康和生活,更甚者涉及到宗教信仰问题,破坏社会安定。因此,开发高效、灵敏、快速的肉类鉴别技术尤其是对原料肉的鉴别检验方法和体系,有利于打击肉类掺假和欺诈行为,具有非常重要的实用价值和社会意义。

目前,肉类鉴别技术主要包括传统感官检验技术[1-3]、分析色谱[4-5]和电泳[6-7]等化学方法、基因学技术[8-9]、免疫学技术[10-11]等较为成熟的鉴别技术,在实际应用中也得到较为广泛的应用,但仍受到样品前处理流程繁杂、操作环境要求高、检测设备不便携等方面的限制。随着高效灵敏的光谱分析技术和方法的不断发展,极大提高了肉类检测的效率,其中红外光谱分析技术已经在肉类检测中得到初步应用。同时,具有物质成分分析和细微结构检测能力,可同时获取多种光谱参数信息且无损的太赫兹光谱分析技术,也逐渐应用在相关的肉类检测研究领域中,如利用太赫兹光谱区分不同的组织器官[12]、开展猪肉组织鉴别[13-14]、检测猪肉K值以衡量其新鲜度[15]等肉类本身的识别与检测研究。除此之外,也有相关单位利用太赫兹技术对肉类中可能存在的异物进行检测[16],展现出了太赫兹技术较强的检测能力和应用可行性。目前,关于太赫兹与肉类相关的研究,大部分都是采用新鲜组织作为测试样品,实验结果受水分的影响较大,测试结果稳定性和重复性不佳。主成分分析(principle component analysis,PCA)是面向模式分类的特征提取最典型的工具。PCA作为经典的特征提取方法,是在不减少原始数据所包含的内在信息前提下,将原始数据转化为维数较少的“有效”特征成分来表示(俗称降维),使其在统计均方意义下达到方差最优的目的[17]。支持向量机(support vector machine,SVM)是由Vapnik 提出的基于统计学理论的一种新的机器学习方法,属于一种有监督的学习算法[18]。SVM在解决小样本、非线性以及高维模式识别问题中表现出许多特有的优势,它能够克服“维度灾难”,解决过学习问题,具有良好的分类准确性(由有限训练样本得到的决策规则对独立的测试集仍能够得到小的误差)[19]。PCA与SVM结合可实现物质成分的有效识别。

本文基于太赫兹时域光谱技术(terahertz time domain spectroscopy,THz-TDS),一方面获取不同部位新鲜组织的太赫兹时域/频域信号强度差异,实现同种肉类不同部位之间的判别;同时借助真空冷冻干燥技术,在不破坏样品分子结构和性质的前提下去除其中水分,通过定性分析不同冻干肉类在0.6~1.4 THz上的吸收系数、折射率、介电常数虚部和介质损耗角正切等多维光谱参数,结合主成分分析-支持向量机(principal component analysis and support vector machine,PCA-SVM),实现不同肉类的判别与鉴定。

1 材料与方法

1.1 材料与仪器

新鲜肉类,广东深圳宝安家乐福超市(西乡店),包括鱼肉、鸡肉和牛肉等3种不同品种肉类;品德鲜猪肉(带有脂肪和皮肤)、茂峰猪肉和壹号土猪等3种不同品牌猪肉。(下文中若无特别说明,所述肉类样品则均指瘦肉)FA2004B电子天平,HANGPING;ALPHA 1-4 LD冷冻干燥机,德国Christ;FW-100高速万能粉碎机,北京市永光明医疗仪器有限公司;YP-5T压片机,鹤壁市鑫利煤质分析仪器有限公司;RC-250B切片机,德国FEST;CCT-1800 THz-TDS,华讯方舟科技有限公司。

实验所用检测设备为THz-TDS仪,其系统结构如图1所示。波长为780 nm的飞秒激光器辐射出的激光脉冲经二向色镜后分成泵浦光和探测光,并分别辐射到LT-GaAs为衬底的光电导天线上,从而实现太赫兹波的激发和探测。其中,L1、针孔和L2组合而成的空间滤波器用于缩小激光光束和滤除高频噪声,提高光束质量。光学延迟线主要是由反射镜和移动电机构成,用于调节泵浦光和探测光之间的相对延迟时间,实现太赫兹波的相干探测。另外,为了减少测试时水汽带来的干扰,对测试仓进行密封处理,测试过程中可往其中吹扫氮气排除水汽,以提高测试效果。氮气环境下,系统的空载时域信号和频域谱线如图4中参考信号所示,具有较高的带宽和信噪比[20-21],适用于太赫兹光谱探测和分析。

L1,L2-聚光镜;M1~M5-反射镜;PM1,PM2-抛物面镜图1 THz-TDS系统原理图Fig.1 Schematic diagram of the THz-TDS

1.2 实验方法

1.2.1 样品前处理

1.2.1.1 切片

将新鲜样品清洗干净,并用无尘纸巾吸干表面水分,利用切片机、家用切肉刀和砧板等工具获取若干不同组织和肉类样品,厚度均为0.8 mm,面积约为6 cm2。其中,不同组织包括品德鲜猪的脂肪、皮肤和瘦肉,不同肉类均为瘦肉,包括鱼肉、鸡肉、牛肉、品德鲜猪、茂峰猪和壹号土猪6种,如图2-A~F所示,可以发现,不同肉类之间并无非常明显的差异特征,无法仅凭外观和气味对其精准识别。

新鲜状态:A-鱼肉;B-鸡肉;C-牛肉;D、D1和D2分别为品德鲜猪的瘦肉、脂肪和皮肤;E-茂峰猪;F-壹号土猪;a1~f1和a2~f2分别对应不同肉类的冻干状态和压片形式图2 不同生物组织样品的实物图Fig.2 The photos of different biological tissue samples注:切取瘦肉时需避开骨头和脂肪,并剔除其中的筋膜等,保证所有肉类均为瘦肉,以确保实验结果的可靠性和统一性

1.2.1.2 冻干

每个样品取出16片,按数量平均分成4份,进行冷冻干燥去除水分。首先,物料提前放入-35 ℃的速冻冰箱中冻结10 h,然后放入冻干机中进行冷冻干燥,真空度为20 Pa,冷阱温度为-53 ℃,加热板温度为30 ℃,冻干时间为30 h。在不损坏样品结构的前提下彻底去除其中含有的水分,冻干后样品如图2中a1~f1所示。利用电子天平称取冻干前后的样品质量,记录。

1.2.1.3 压片

利用高速万能粉碎机,将冻干后的肉类进行粉碎处理,然后在电子天平上,称取约200 mg粉碎后的肉类样品,利用压片机制成直径约为13 mm的圆形状压片,如图2中a2~f2所示。

1.2.2 样品含水量测试

研究表明,皮肤的主要组成成分为胶原蛋白,瘦肉的基本成分则是肌纤维蛋白,分布在蛋白质分子表面的极性基团与水分子之间存在静电引力而形成水壳层结构,因此皮肤和瘦肉含水量较高[22]。而由甘油三酯混合物构成的脂肪,属于疏水物质,含水量低[14]。将冻干前后称取的样品质量分别代入公式(1),可获得不同样品的含水量。

(1)

式中:ma、mb分别表示样品在冻干后和冻干前的质量,g。

1.2.3 不同样品的太赫兹光谱测试

测试样品包括不同组织(脂肪、皮肤和瘦肉)和不同肉类(均为瘦肉),由于太赫兹波对水具有非常强的吸收特性,导致含水量高且比例相近的新鲜肉类透射信号的强度和信噪比偏低,影响测量结果的精准性。因此,实验中采用冻干-压片的不同肉类进行检测。而不同组织之间含量差异明显,利用太赫兹波的信号强度差异可明显区分,因此直接采取测量新鲜组织的方式进行实验。

在THz-TDS透射模块下,持续向测试样品中吹扫氮气,获取空载条件下的参考信号。将1.2.1小节中获取到的新鲜组织和冻干肉类压片分别置于样品架上,对其进行太赫兹光谱采集。杨航等[14]通过观察脂肪、皮肤和瘦肉在脱水过程中的太赫兹光谱信号变化发现,在分析含水量较低的组织样品时,其吸收系数和折射率可作为参考指标。而介电常数虚部与物质在电场的弛豫极化相关,介质损耗角正切反映电磁能量转化为其他能量时在其内部引起的能量损耗,这两个参数在生物表征中起到重要作用[23]。因此,除了吸收系数和折射率外,下文中还引入介电常数虚部和介质损耗角正切这2个关键参数,通过多维光谱参数分析实现对不同肉类的精准检测。

1.2.4 太赫兹光谱参数计算

假设THz-TDS的参考信号为Eref(ω),样品(厚度为d)的信号为Esam(ω),则根据太赫兹光学参数模型[24]可求得样品对THz波的光谱响应函数H(ω):

=A(ω)e-iφ(ω)

(2)

(3)

(4)

根据上述公式,样品的介电常数ε*(ω)和介质损耗角正切tanδ如公式(5)(6)所示:

(5)

(6)

式中:ε′(ω)、ε″(ω)分别表示所测样品的介电常数实部和虚部。

1.2.5 分析方法和处理工具

通过1.2.3小节和1.2.4小节可获取到不同样品的时域信号、频域信号、吸收系数、折射率、介电常数(虚部)、介质损耗角正切等太赫兹光谱参数信息。其中,新鲜组织之间的含水量相差较大,可直接通过比较其时域/频域信号强度差异来进行区分;而不同冻干肉类的检测则需结合多维光谱参数之间的差异进行分析评价,使得鉴别结果更加精准可靠。首先,选取有效频段上的光谱数据,以0.1 THz为间隔,获取各光谱参数与频率之间相关性图,并进行定性分析。然后,在选取频段上对各肉类样品的光谱数据做统计分析,加以区分判别。

原始数据中,部分数据较为接近或重叠,仅凭数据差异无法进行有效区分和判别。PCA通过数据降维的方式对原始数据进行有效的压缩处理,使得样品的共有信息中相互重叠的部分得以消除,实现特征信息提取和分析,然后建立SVM分类模型,从而对样品进行精准判别和分类[25-26]。在分析中,常以贡献率的多少来表征该主成分包含的信息,其中,第一主成分往往贡献最大,最能体现样品特征信息,依此类推。因此,通过对不同肉类的光谱数据进行PCA处理和建立SVM多分类模型分析,对不同肉类差异进一步展开深入分析和讨论。

实验中,采用MATLAB R2016a以及LIBSVM v3.22工具箱实施数据的PCA-SVM分析;采用Origin 2018和Excel 2010对数据进行统计、分析并绘制成图。所有实验中,均制备4个相同类型的样品,其实验结果的均值作为该样品的最终测试结果,从而排除因个体差异造成的干扰。

2 结果与分析

2.1 不同来源及品种肉质的含水量分析

如图3所示,不同来源和品种肉质的含水量为70%~80%,其中牛肉含水量最少,鱼肉含水量最高,该结果也与相关文献报道基本吻合[27-28]。不同肉质之间虽具有一定的含水量差异,而个别品种肉质按公式(1)所测得的含水量误差较大,使得肉质含水量不具有较强的差异性和特征性。因此仅依靠所测含水量之间的差异,针对不同来源和品种肉类之间区分难度较高。

图3 不同来源及品种肉质中含水量的对比Fig.3 The comparison of water content of meat from different origin and varieties

2.2 肉质的太赫兹光谱分析

不同肉质的太赫兹时域信号和频域光谱如图4所示,通过比较不同肉质的时域信号峰值和0.2 THz处的频域光谱信号强度,可发现不同肉质的THz波形、随延迟时间变化的时域信号强度、随频率变化的频域信号强度均存在明显差异。THz波的信号强度差异主要受组织含水量的影响,含水量越高,则透过组织的THz信号越弱,通过不同肉质的THz时域信号相比参考信号强度分别衰减了98.69%、96.02%、89.15%,该结果与相关的文献报道一致[13-14]。因此,基于THz对不同肉质内水分的强衰减特性,利用THz-TDS技术可对不同肉质进行快速精准判别。

a-THz时域信号;b-对应的频域光谱曲线图4 新鲜状态下不同组织的太赫兹光谱信息Fig.4 The terahertz spectra of different types of fresh tissue

2.3 不同来源及品种肉质的太赫兹光谱分析

2.3.1 光谱参数定性分析

在0.6~1.4 THz频率范围内,以0.1 THz为间隔,不同肉类的太赫兹光谱参数如图5所示。不同肉类组织的太赫兹光谱参数与频率之间均存在相关性变化,除了折射率随频率的增大而减小外,其余的光谱数值均随频率的增大而增大,同时所测肉类的光谱都没有特征吸收峰或明显的突变,主要原因是由于肉类成分的复杂性,其中包含的氨基酸和核苷酸等生物分子对太赫兹波的响应相互交叠,单一特征性质不明显[29-30]。从光谱数值上看,冻干后不同肉类的折射率在1.66~1.82,彼此之间差异明显,可作为肉类的定性指标;而关于吸收系数、介电常数虚部和介质损耗角正切,鱼肉、鸡肉、牛肉、品德鲜猪、茂峰猪等肉类之间可以实现较好的区分,壹号土猪则易于与其他肉类产生混淆。由此表明,冻干处理后的不同肉类,其主要组成分子、结构、元素含量等方面成分信息仍存在差异,从而导致其太赫兹光谱之间的区别。

a-样品的吸收系数;b-折射率;c-介电常数虚部;d-介质损耗角正切值图5 冻干状态下不同肉类的太赫兹光谱信息Fig.5 Terahertz spectra of different kinds of freeze-dried meat

求取0.6~1.4 THz上的光谱参数平均值和最小/最大值,其结果分别如表1和表2所示。不同肉类的平均THz光谱参数统计值均有明显差异,直观上(图5)与其他肉类样品光谱数据重叠的壹猪土猪,在光谱参数的多种平均值上,壹号土猪与其他肉类,也可实现较好的区分。由此可见,通过结合不同肉类的多维太赫兹光谱参数差异,进行定性分析和统计值处理(均值、最小/最大值),可实现不同品种和同品种不同品牌肉类之间的鉴别。同时,引入介电常数虚部和介质损耗角正切的多维度参数分析方法,也可有效避免因某一参数的交叉重叠而导致区分度较低的情况,提高测试结果的精准性。

表1 不同肉类在0.6~1.4 THz上的光谱参数平均值Table 1 Average values of spectral parameters of different kinds of meat at 0.6~1.4 THz

表2 不同肉类在0.6~1.4 THz上光谱参数的最小值和最大值Table 2 The minimum and maximum values of spectral parameters of different kinds of meat at 0.6~1.4 THz

2.3.2 光谱参数PCA-SVM分析

为了更全面地探索太赫兹时域光谱对6种不同肉类的鉴别能力,研究不同光谱参数对肉类鉴别分类的能力,对不同肉类冻干状态下所得4种光谱参数(吸收系数、折射率、介电常数虚部及损耗角正切值)在0.6~1.4 THz频段的光谱数据实施PCA-SVM分析。

首先提取该频段原始光谱数据进行PCA降维,如图6所示为不同肉类冻干状态下4种光谱参数数据的PCA得分图,结果显示第一、二主成分(PC1和PC2)的累计贡献率已达98%以上,可代表原始数据进一步分析。

a-样品的吸收系数;b-折射率;c-介电常数虚部;d-介质损耗角正切值图6 不同肉类在冻干状态下,4种光谱参数数据的PCA得分图Fig.6 PCA scores plots of four different groups of THz spectral data measured from six different kinds of freeze-dried meat samples

利用任意1种光谱参数数据的进行多分类SVM分析中,运用随机化函数随机抽取不同肉类数据各25条数据(共150条)作为训练集,建立当前光谱参数的SVM多分类模型;利用该模型对未知分类的测试集(共30条)进行分析。6种不同肉类的训练集数据样本和测试集数据样本的数据分布如表3所示。

表3 SVM分析中6种不同肉类的数据分布Table 3 Data distribution of six different meat samples in the SVM analysis

本研究中SVM分类模型均采取径向基函数作为核函数,利用三折交叉验证(K-CV,K=3)和网格划

分搜索的方法寻找最佳的惩罚参数c、核函数参数g,使K-CV方法过程中取得最高训练集分类准确率和最优分类器性能,避免过学习和过拟合状态发生。表4为获得的SVM模型最优参数及对应的训练集分类准确率。

表4 SVM模型的最优参数c&g及对应的训练集准确率Table 4 Best obtained parameter c&g of SVM models and corresp.train accuracy

为了验证SVM模型对不同肉类的分类预测性能,取不同肉类数据各5条数据(共30条)作为测试集,利用4种光谱参数下建立的SVM模型分别进行预测识别,可得到如图7所示的测试集样本分类结果及对应的测试集分类准确率。

a-样品的吸收系数;b-折射率;c-介电常数虚部;d-介质损耗角正切值图7 不同肉类太赫兹光谱参数的测试集样本的分类结果图Fig.7 Classification result of test data-sets of terahertz spectra of different kinds of meat注:类别标签:0-鱼肉;1-鸡肉;2-牛肉;3-品德鲜猪;4-茂峰猪;5-壹号土猪肉(下同)

结果显示,利用4种光谱参数,即吸收系数、折射率、介电常数虚部以及损耗角正切值光谱数据建立的4个SVM模型,测试集分类准确率分别达到96.67%、96.67%、93.33%和90%。同样对测试集30个样本进行预测分类,吸收系数和折射率建立的SVM模型均仅有1例误判,介电常数虚部和损耗角正切值建立的SVM模型分别有2例和3例误判,说明利用吸收系数和折射率建立的SVM模型对不同肉类的预测分类更准确,能够正确无误的对鱼肉、鸡肉、牛肉、品德鲜猪进行预测分类;介电常数虚部SVM模型更适用于鸡肉、牛肉、品德鲜猪的准确分类;损耗角正切值更适用于鱼肉、鸡肉、牛肉的准确分类。不同肉类的太赫兹光谱参数的测试集分类准确率均在90%及以上,说明根据不同光谱参数均能够对肉类进行准确分类识别,这也为肉类的检测提供了一个有效的鉴别分析方法。

上述误判中来自茂峰猪肉与壹号土猪肉之间的误判有5例,占误判总数的71%,说明茂峰猪肉与壹号土猪肉相对于其他肉类类别更容易相互混淆,考虑这2种肉类在所有光谱参数的SVM分类情况,茂峰猪肉和壹号土猪肉的误判率分别为15%和10%,混淆误判率高达12.5%。为了提高太赫兹光谱参数数据对茂峰猪与壹号土猪2种猪肉样本的鉴别能力,我们提取2种猪肉样本的PCA降维数据进行归一化([0,1] 区间)处理后,建立SVM二分类模型,如表5所示,K-CV方法下取最佳参数均可获得100%的训练集验证分类准确率。利用上述参数建立SVM模型,对测试集样本进行预测识别。如图8所示,仅介质损耗角正切数据所得测试集分类准确率为90%,其余3种光谱参数均可获得100%分类准确率;茂峰猪肉与壹号土猪肉的混淆误判率已降低至2.5%,其中茂峰猪肉的误判率为0,壹号土猪肉的误判率为5%,相比于未归一化处理直接实施SVM分类的误判率均有所降低。因此,有效的归一化处理方法,可有助于降低2种猪肉之间的混淆误判率,提高PCA-SVM方法的分类准确率。

表5 SVM二分类模型的最优参数c&g及训练集准确率Table 5 Best obtained parameter c&g of SVM binary classification models and corresp.train accuracy

a-样品的吸收系数;b-折射率;c-介电常数虚部;d-介质损耗角正切值图8 两种猪肉太赫兹光谱参数的测试集样本的分类结果图Fig.8 Classification result of test data-sets of terahertz spectra in two pork samples

3 结论与讨论

本文基于太赫兹光谱分析技术,对不同新鲜组织和冻干肉类进行太赫兹光谱检测,并结合多维光谱参数定性分析和PCA-SVM算法等方法对其进行差异表征,实现不同生物组织之间的精准鉴别。研究表明,含水量差别较大的组织(脂肪、皮肤、瘦肉),可直接通过检测其新鲜状态下的太赫兹时域信号和频域光谱强度差异进行快速检测鉴别;而针对含水量较高且差异较小的肉类,可结合真空冷冻干燥技术去除水分,对不同肉类在0.6~1.4 THz波段上的吸收系数、折射率、介电常数虚部和介质损耗角正切值等多维光谱参数进行定性分析以及建立PCA-SVM分类模型,可以实现不同肉类之间的鉴定。该结果展示了太赫兹光谱分析技术在不同组织、不同品种及同品种不同品牌肉类鉴别上的检测能力,有望在肉类掺假等实际应用场景中发挥作用,为打击肉类掺假和欺诈行为提供高效精准的鉴别手段。

猜你喜欢

虚部冻干介电常数
复数知识核心考点综合演练
冻干益生菌微胶囊保护剂及抗性研究
两类特殊多项式的复根虚部估计
介电常数对比度对光子晶体平带的影响
冻干鸡肉优势突出,2021-2025年市场需求在不断释放
·广告目次·
示踪剂种类及掺量对水泥土混合浆液的电学行为影响研究
例谈复数应用中的计算两次方法
太赫兹波段碲化镉介电常数的理论与实验研究
无铅Y5U103高介电常数瓷料研究