SVM法定性鉴别奶牛饲料中脲醛树脂的可行性研究
2011-12-27星单3李高阳
刘 星单 杨,2,3李高阳,2,3
(1.中南大学隆平分院,湖南 长沙 410125;2.湖南省食品测试分析中心,湖南 长沙 410125;3.湖南省农产品加工研究所,湖南 长沙 410125)
SVM法定性鉴别奶牛饲料中脲醛树脂的可行性研究
刘 星1单 杨1,2,3李高阳1,2,3
(1.中南大学隆平分院,湖南 长沙 410125;2.湖南省食品测试分析中心,湖南 长沙 410125;3.湖南省农产品加工研究所,湖南 长沙 410125)
收集中国常用的、具有代表性的奶牛精补料44个样品,制备176个脲醛树脂(urea-formaldehyde resins,UF)掺假样品。在全光谱范围内进行近红外透反射光谱扫描,选择不同的归一化方式进行前处理,采用支持向量机(support vector machine,SVM)方法,筛选最佳的预处理方法来建立定性鉴别模型。当采用归一化方式与主成分分析(principal component analysis,PCA)相结合时,所建立的SVM 定性分析模型的预测精确率达到97.701 1%。说明利用近红外透反射光谱建立定性分析模型来检测奶牛饲料中是否掺有UF的研究是可行的。
奶牛饲料;脲醛树脂;近红外光谱;支持向量机(SVM);定性鉴别
三聚氰胺(melamine)即蜜胺,又称氰尿酰胺,是一种白色晶体,由于其分子中含氮量高达66.7%,常被不法分子为谋取经济利益而添加在生鲜乳、乳制品及饲料中[1]。2007年3月美国多起狗、猫等宠物中毒死亡事件的发生为建立饲料中三聚氰胺检测标准提出迫切需求。2007年6月14日,中华人民共和国农业部发布实施NY/T 1372——2007《饲料中三聚氰胺的测定》,该法是目前饲料生产企业和各个实验室所用的主要方法,在一定程度上制止了三聚氰胺的非法添加,但对于其他蛋白精的检测仍然处于空白,这为不法分子造假提供了漏洞。
脲醛树脂是由尿素与甲醛反应得到的聚合物,其甲醛/尿素之摩尔比为1.5~2.0,为不溶不熔的热固性树脂。固化后的脲醛树脂颜色比酚醛树脂浅,呈半透明状,耐弱酸、弱碱,绝缘性能好,耐磨性极佳,其主要用途是用作木材胶粘剂[2]。但由于其含氮量高,已有将其掺假在鱼粉中的检测报道[3]。利用脲醛聚合物在浓硫酸的作用下分解成甲醛与氨,甲醛与变色酸(铬变酸,1,8-二羟基萘-3,6二磺酸)的浓硫酸溶液一起微热,形成一种紫色或紫红色的化合物,通过显色反应来检验。该方法为化学方法,需要对样品进行前处理,而且还需要多种化学药品,不便于现场的快速检测。
近红外技术(NIR)是20世纪70年代后发展起来的一种新的快速定性定量分析技术,近红外光谱包含丰富的物质信息,其谱图与物质本身的组成密切相关,通过对光谱特征的分析,可以获得有关物质结构与组成的信息。由于其具有快速、无损和无化学污染等特点,已广泛应用于饲料检测行业[4]。目前国内外尚无利用近红外光谱分析法对奶牛饲料中脲醛树脂含量进行快速定性分析研究的文献报道。本试验用近红外光谱分析的方法定性鉴别奶牛饲料中的脲醛树脂,探讨其作为一种检测奶牛饲料中脲醛树脂存在的快速、无破坏性的绿色分析技术的可行性和实用性。
1 材料与方法
1.1 材料与试剂
奶牛饲料样本:农标普瑞纳(长沙)饲料有限公司;
脲醛树脂(UF):北京益安达宸化工有限责任公司。
1.2 仪器与设备
傅立叶变换近红外光谱仪:Nicolet AntarisⅡ型,美国Thermo Scientific公司;配有金反射板的样品杯(FOSS公司,丹麦),配有 TQ软件(7.2.0.161版)用于光谱的采集,数据转化。
旋风磨:FS-II型,杭州麦哲仪器有限公司;
电子分析天平:AL204型,梅特勒-托利多仪器(上海)有限公司。
1.3 方法
本试验将近红外光谱用于奶牛饲料中脲醛含量快速检测尚属于探索性研究,因此试验采用定性分析方法,即配制含有脲醛树脂的奶牛饲料样品(由于是定性分析,因此可将脲醛的含量范围配制的较宽)和不含有脲醛树脂的奶牛饲料样品,通过采集样品的近红外光谱和定性分析方法相结合来建立定性分析模型。
1.3.1 样本的制备 总样品包括176个,其中不含UF的纯精料补充料44个,不同UF含量的样品132个。含有UF的精料补充料在实验室制备,具体方法如下:收集不含UF的奶牛饲料样本44个,共5类,分别为草食动物补充料、小牛精料补充料、育成牛精料补充料、奶牛精料补充料、干奶牛精料补充料。使用旋风磨粉碎样本,使之全部通过20目的标准筛。用电子分析天平(精度为0.000 1g)称量。采用随机组合在精料补充料中加入不同质量分数(5%~15%)的UF。间隔为5%,共制备132个试验样本[1]。
1.3.2 样品NIR光谱采集 打开电源,仪器预热45min以上。为保持装样量一致,装样时使样品表面与样品池边缘相平,盖上样品池自带的盖子压实。放入检测位置,对样本进行近红外扫描。为减小误差,每个样本旋转扫描3次(由于光谱扫描处加上了偏心轮),以3次扫描的平均光谱作为样品的原始光谱。同时,为了减小仪器的系统误差,样本按随机顺序扫描。
采用透反射积分球模式采集光谱,透反射光程0.1mm,光谱测定范围4 000~10 000cm-1,扫描32次,分辨率为8cm-1,扫描光谱以1g(1/R)的形式存储。整个试验过程保持室内温度在25℃左右。
1.3.3 SVM定性分析模型建立 支持向量机法的主要思想是建立一个分类超平面作为决策面,使得正例和反例之间的隔离边缘被最大化,其主要优点是基于VC(Vapnik-Cher-vonenkis)推广性理论框架,能在很广的各种函数集中构造函数,不需要微调[5,6]。
为了提高建模运算速度,减少运算量,经由主成分分析降维提取出贡献率高的得分变量再来建立SVM定性分析模型。PCA用于光谱的预处理不仅可以消除背景和噪音干扰,而且还可以消除光谱响应的共线,然后在考虑不同归一化方式以及不用归一化预处理后测试集预测分类准确率的不同评价模型的优劣[7]。
2 结果与分析
2.1 样品近红外透反射光谱的主成分分析
主成分数的选择非常重要,如果建立模型使用主成分数过少,就不能反映未知样品被测组分产生的测量数据变化,其模型的预测能力就会降低;如果选择的主成分数过多,就会将一些代表噪声的主成分加入到模型中,同样会使模型的预测能力下降[8,9],因此在做SVM分析之前对光谱进行主成分分析,经主成分分析光谱数据后得到前4个主成分累计贡献率(见表1)。由表1可知,第一主成分的贡献率就达到97.66%,当取到前4个主成分时累计贡献率已达99.85%,就说明前4个主成分基本包括了变量信息。
表1 主成分的累计可信度Table 1 The reliabilities of principal components
2.2 定性分析模型的建立和验证
将样本进行主成分分析后,从44个未掺假样本中抽取前22个为训练集,剩余22个为测试集;从132个掺假样中抽取67个为训练集,剩余为测试集。将其进行归一化处理和不用归一化处理来得出其预测分类的准确率,结果见表2。
表2 不同预处理方法的比较Table 2 The comparison of different pretreatment methods
由表2可知,不进行归一化处理的预测分类准确率为91.954 0%,优于进行归一化预处理的结果,说明归一化预处理并不是必须的;但当归一化处理与PCA处理相结合时,则会出现最优的处理结果,其预测分类准确率达到97.701 1%。结果见图1。由图1可知,有两个样本被错分。
图1 测试集的分类结果图Figure 1 The results of test set classification
3 结论
(1)建立了SVM定性分析模型,经过PCA提取主成分后确定提取4个特征变量,考虑不同的归一化方式对SVM模型的影响,最后选择PCA与进行归一化处理相结合的预处理方法,得到奶牛饲料预测分类准确率为97.701 1%。该方法具有分析时间短、无化学试剂污染、对检测人员要求低、单个样品的分析成本很低,因此可作为快速筛选方法。
(2)本试验对样本掺假范围为5%~15%均能够准确检出。因此NIRS定性分析模型虽然不能给出UF含量的预测值,但掺假量大于5%时,能准确判断奶牛饲料样品是否掺有UF。利用近红外透反射光谱定性分析方法快速判别掺有UF的精补料与纯精补料具有可行性。
1 徐云,王一鸣,吴静珠,等.用近红外光谱检测牛奶中的三聚氰胺[J].红外与毫米波学报,2010,29(1):53~56.
2 荣荣,顾继友.脲醛树脂在复合材料中的研究进展[J].中国胶粘剂,2011,20(2):52~56.
3 郭吉原,杨海鹏,刘大建,等.鱼粉中脲醛聚合物的鉴别[J].粮食与饲料工业,2002(8):49.
4 李辉,秦玉昌,吕小文,等.近红外光谱分析技术在饲料质量安全评价中的应用研究进展[J].农业工程学报,2006,22(11):264~268.
5 Alessandra Borin,Marco Fl^ores Ferr~ao,Cesar Mello,et al.Least-squares support vector machines and near infrared spectroscopy for quantification of common adulterants in powdered milk[J].Analytica Chimica Acta.,2006(579):25~32.
6 Li Hongdong,Liang Yizeng,Xu Qingsong.Support vector machines and its applications in chemistry [J].Chemometrics and Intelligent Laboratory Systems,2009(95):188~198.
7 史峰,王小川,郁磊,等.MATLAB神经网络30个案例分析[M].北京:北京航空航天大学出版社,2010:1~20.
8 谢中华.MATLAB统计分析与应用:40个案例分析[M].北京:北京航空航天大学出版社,2011:112~120.
9 史永刚,粟斌,田高友,等.化学计量学方法及 MATLAB实现[M].北京:中国石化出版社,2010:196~197.
Feasibility study of qualitative identification urea-formaldehyde resins in milk cow feed by support vector machine
LIU Xing1SHAN Yang1,2,3LI Gao-yang1,2,3
(1.Longping Branch,Graduate School,Central South University,Changsha,Hunan410125,China;2.Hunan Food Testing and Analysis Center,Changsha,Hunan410125,China;3.Hunan Agricultural Product Processing Institute,Changsha,Hunan410125,China)
Forty-four samples of representative milk cow concentrate supplement were collected,and 176UF adulterated samples were prepared.The near-infrared transmission and reflectance spectra were scanned in the full spectrum.The qualitative identification mode was established by considering the different normalization ways,using SVM (Support Vector Machine)and getting the optimum pretreatment.When normalization ways combined with PCA(Principal Component Analysis),the accuracy of prediction of SVM qualitative identification mode got to 97.701 1%.Experiments show that it is feasible to distinguish the milk cow concentrate supplement adulterated with UF from the pure samples by means of the qualitative analysis model established by near-infrared transmission and reflectance spectroscopy.
milk cow feed;urea-formaldehyde resins;near infrared spectroscopy;support vector machine(SVM);qualitative identification
10.3969 /j.issn.1003-5788.2011.04.018
国家科技支撑计划《畜禽产品产前重要潜在危害添加物的识别及配套检测标准研究》专题(编号:2009BADB7B07);中南大学学位论文创新资助(编号:2010ssxt256)
刘星(1986-),女,中南大学隆平分院在读硕士研究生。E-mail:liuxinglyg@126.com
单杨
2011-03-30