APP下载

基于特征氨基酸指纹图谱的白燕窝识别掺假模型建立与验证

2016-07-27庄俊钰许佩勤林丹钟舒洁广东省食品质量监督检验站广东广州510308广东省食品工业研究所广东广州510308广东省食品工业公共实验室广东广州510308

食品研究与开发 2016年11期
关键词:多元线性回归主成分分析建模

庄俊钰,许佩勤,林丹,钟舒洁(1.广东省食品质量监督检验站,广东广州510308;2.广东省食品工业研究所,广东广州510308;3.广东省食品工业公共实验室,广东广州510308)



基于特征氨基酸指纹图谱的白燕窝识别掺假模型建立与验证

庄俊钰1,2,许佩勤1,2,林丹2,3,钟舒洁1,2
(1.广东省食品质量监督检验站,广东广州510308;2.广东省食品工业研究所,广东广州510308;3.广东省食品工业公共实验室,广东广州510308)

摘要:测定各类燕窝和掺假样品的氨基酸组成,通过主成分分析构建白燕窝鉴别的综合评价模型,运用多变量统计分析方法,初步建立燕窝掺假模型,并进行验证。结果表明,前两个主成分提取了原来18个指标87.75%的信息;利用综合评价模型计算出各类样品的主成分得分,燕窝样品在主成分得分图中分布的位置较集中,掺假燕窝样品则较分散;以掺假物质含量作为自变量,综合评价得分作为因变量,进行线性回归分析,单一物质掺假的线性模型和混合掺假线性模型的线性系数R2>0.98。模型验证误差平均值为3.25%,说明氨基酸指纹图谱指纹谱图鉴别法是一种有效且可靠性高的鉴别白燕窝的方法。

关键词:白燕窝;掺假;主成分分析;多元线性回归;建模

燕窝是由雨燕科动物金丝燕及多种同属燕类用唾液与续羽等混合凝结所筑成的巢窝,其成分有水溶性蛋白质、碳水化合物、微量元素以及对促进人体活力起重要作用的氨基酸。燕窝按颜色可分为白燕窝、黄燕窝和血燕窝3种。由于其性价比,白燕窝比另外两种燕窝更加受消费者的青睐[1-3]。近年来,我国燕窝的消费量仍在持续增长。由于燕窝产品的珍贵及燕窝行业的高产值。为了牟取高额利润,不法商人利用价廉的材料全部伪制或部分替代真实燕窝产品,以达到增加重量、提高卖相、以假乱真等目的,市场中燕窝产品的质量安全状况令人担忧[4]。

燕窝中氨基酸的含量、种类及比例是评价其营养价值优劣的主要指标之一[4]。所以,对燕窝的氨基酸组成的监测分析具有重要意义。近年来,多变量统计学方法对食品科学研究及其应用产生了非常大的影响,比如食品感官分析、食品风味及化合物分析、食用植物种类的分类与鉴别、食品腐坏的建模与预测等[5-6]。以此为出发点,本研究以白燕窝作为研究对象,采用氨基酸自动分析仪技术测定白燕窝氨基酸组成,通过主成分分析构建白燕窝鉴别的综合评价模型,以掺假物质含量作为自变量,综合评价得分作为因变量,运用多变量统计分析方法,初步建立燕窝掺假模型,并进行验证。对规范燕窝市场秩序、促进产业发展和打击假冒伪劣产品、维护消费者健康安全具有重大意义。

1 材料与方法

1.1材料与试剂

白燕窝:从各大品牌购买的经专家鉴定为真品的燕窝;干猪皮、猪浮皮、银耳、鸡蛋:购于农贸市场;浆糊:购于文具店。

盐酸(GR):广州试剂厂;巯基乙酸(AR):天津科密欧化学试剂有限公司;茚三酮(AR)、柠檬酸钠(AR):国药集团化学试剂有限公司;氨基酸标准品:美国Sigma公司。

1.2仪器与设备

L-8900型高效氨基酸自动分析仪:日本日立公司;DGG-9420A电热恒温干燥箱:上海森信实验仪器有限公司有限公司;分析天平:北京赛多利斯科学仪器有限公司;HHS-2型电热恒温水浴锅等;HGC-12A氮吹仪:江苏汉邦科技有限公司;高纯氮气:南京天泽气体有限责任公司。

1.3方法

1.3.1试验设计

选取4个经鉴定为真品的燕窝作为该研究的对照组,猪浮皮、银耳、琼脂、鸡蛋清和浆糊作为掺假物质,分别在真品燕窝中掺入2%、5%、10%、20%和50%的猪浮皮、银耳和琼脂;以鸡蛋清和浆糊作为涂层掺假物质,在燕窝上涂上均匀的涂层;两种以上不同比例掺假物质的设计见表1。

1.3.2样品的处理

根据各样品蛋白质含量,取一定量的样品于水解管中,加入6 mol/L盐酸15 mL,以及3滴巯基乙酸,混匀。水解管充氮气后封口,置于110℃的恒温干燥箱内,水解22 h后,取出冷却。用去离子水冲洗水解管,将水解液全部转移到50 mL容量瓶中,用去离子水定容。吸取2 mL滤液于小烧杯中,水浴蒸干。残留物用1 mL超纯水溶解,再蒸干,重复2次。冷却后,加入10 mL 0.02 mol/L盐酸溶解,溶液用0.45 μm滤膜过滤,氨基酸自动分析仪检测。

1.3.3色谱条件

离子交换柱规格4.6 mmID×60 mm,不锈钢柱(日本公司生产的氨基酸分析专用树脂);泵流速P1:0.40 mL/min,P2:0.35 mL/min;柱温:57℃,反应温度:135℃;进样体积:20 μL。

1.3.4数据分析

以18种氨基酸作为指标,用SAS 9.1进行主成分分析和多元线性回归分析。Excel进行线性回归分析。

表1 混合掺假样品Table 1 Samples of mixed adulteration

2 结果与分析

2.1燕窝掺假模型的氨基酸组成分析

4个真品燕窝、猪浮皮、银耳、琼脂、鸡蛋清和浆糊的氨基酸组成结果见表2;单一物质掺假燕窝的氨基酸组成结果见表3;两种以上物质不同比例掺假燕窝的氨基酸组成结果见表4。

由表2~表4可以看出,18种氨基酸组成为各类样品特征性指标,不同类型样品的氨基酸组成均有差异。由于变量个数太多,并彼此之间存在一定的相关性,因而使得所观测到的数据在一定程度上反映的信息有所重叠;而当变量较多时,在高维空间中研究样本的分布规律比较复杂,需要将多个指标化为小数综合指标进行统计分析。

2.2各类样品氨基酸组成的主成分分析

主成分分析是一种通过降维技术把多个变量化为少数几个主成分(即综合变量)的统计方法,利用模型“合成”为一个整体性的评价值,进而对样品总体进行评价,不但可将多指标问题转化为较少的综合指标,而且能给出较为客观的权重,为燕窝真伪的鉴别提供科学而客观的评价方法。

表2 燕窝对照组和掺假物质的氨基酸组成Table 2 Amino acid of control group and adulterant g/100 g

表3 单一物质掺假燕窝的氨基酸组成Table 3 Amino acid of single adulteration g/100 g

表4  混合掺假样品的氨基酸组成Table 4 Amino acid of mixed adulteration g/100 g

利用SAS9.1统计分析软件对各类样品的氨基酸组成的原始数据进行主成分分析,表5为相关系数矩阵的特征值,相关系数矩阵的特征值越大,它所对应的主成分变量包含的信息就越多。

表5  特征值和方差贡献率Table 5 Eigenvalues and variance contributionrate

从表5可以看出,第1和第2主成分的特征值较大,说明这两个主成分包含了原来18个指标大部分的信息。第4列为每个主成分的贡献率,第1和第2主成分的贡献率分别为60.35%和27.40%,其余主成分的贡献率较小,最后1列为累计贡献率。由此列数值可知,前两个主成分提取了原来18个指标87.75%的信息。综合以上指标,对前两个主成分进行深入分析。

表6为主成分分析得到的特征向量,根据特征向量构建主成分与各类样品氨基酸组成之间的线性关系如下:

Y1=0.301 9x1+0.262 6x2+0.274 3x3+0.246 1x4+ 0.112 1x5+0.039 3x6+0.154 3x7-0.103 3x8+0.294 9x9+ 0.213 9x10+0.280 4x11+0.300 0x12+0.254 3x13+0.292 3x14+ 0.268 3x15+0.257 6x16+0.255 7x17-0.015 8x18

Y2=0.022 9x1-0.173 9x2-0.108 8x3+0.234 2x4+ 0.326 7x5+0.428 6x6+0.382 8x7+0.311 8x8-0.102 9x9+ 0.108 2x10-0.011 0x11-0.034 1x12-0.204 7x13-0.111 8x14+ 0.142 8x15-0.195 4x16+0.214 0x17+0.431 4x18

式中:Y1、Y2为综合指标,是样品18个氨基酸组成的线性组合。

以两个主成分Y1、Y2与其方差贡献率构建各类样品氨基酸组成的综合评价模型Z,Z为因变量,Y1、Y2为自变量,Z为Y1、Y2的线性组合:Z=0.6535Y1+ 0.274 0Y2。

表6 各指标主成分特征向量Table 6 Eigenvectors of each index on PC

利用该模型计算出各类样品的主成分得分,真品燕窝和掺假样品在第1、第2主成分的得分图见图1。

图1  主成分得分图Fig.1 Diagram of PC scores

从图1可以看出,燕窝样品在主成分得分图中分布的位置较集中,掺假燕窝样品则较分散,可为初步判定燕窝真伪提供一定的参考价值;部分掺假样品与真品有不同程度的交叉重叠,需要建立不同水平的掺假模型进行鉴别。

2.3单一物质掺假燕窝的线性模型建立

以各单一物质的掺假量为横坐标,样品的综合评价得分Z作为纵坐标绘制散点图,见图2。

从图2可以看出,猪浮皮掺假会提高样品的综合评价,银耳和琼脂的掺假则会降低得分。对不同掺假水平下的样品综合得分进行拟合,其回归方程和相关系数R2>0.98,具有良好的相关性,拟合度高,说明该模型可用于单一物质的掺假鉴别。

2.4两种以上物质掺假燕窝的多元线性模型建立

利用综合评价模型Z计算出混合掺假样品的综合评价得分,见表6。将综合得分作为因变量,将变量x1、x2、x3作为自变量,进行多元线性回归分析。回归分析结果如表7、表8所示。

图2 单一物质掺假燕窝的线性模型Fig.2 Linear model of single adulteration

表7  方差分析Table 7 Analysis of variance

表8  参数估计Table 8 Parameter estimates

表7和表8结果表明,模型检验(F=133.66,P<0.000 1),表示模型通过检验,达到显著水平。在回归系数检验中,常数项(t=8.74,P=0.000 3)、x1(t=7.51,P= 0.0007)、x2(t=-15.84,P<0.0001)、x3(t=-9.67,P=0.000 2),达到显著水平,表明Y和常数项、x1、x2、x3存在显著的线性关系。所以回归方程为Y=0.474 3+2.433 3x1-5.135 9x2-3.135 9x3。决定系数(R2)为0.987 7,表明在变量Y的总变异中,由变量x1-x3线性说明的部分占98.77%。

2.5模型验证

测定4个样品的18种氨基酸组成。以各掺假物质的含量为预测变量,综合评价得分为因变量,代入掺假模型,结果见表9。

表9 线性回归模型检验Table 9 Validation of linear regression model

4个样品的模型预测值和观测值的误差在-9.09%~22.22%之间,误差平均值为3.25%,证明该方法建立的线性回归模型对掺假物质含量拟合良好。模型的误差可能归结于本研究中未纳入考虑的将18种氨基酸指标转化为一个综合评价指标过程中所造成的误差。

3 结论

1)利用SAS软件对样品的氨基酸组成进行主成分分析,前两个主成分提取了原来18个指标87.75%的信息。根据特征向量构建主成分与各类样品氨基酸组成之间的线性模型Y1、Y2。以两个主成分Y1、Y2与其方差贡献率构建各类样品氨基酸组成的综合评价模型Z=0.653 5Y1+0.274 0Y2。

2)利用综合评价模型模型计算出各类样品的主成分得分,燕窝样品在主成分得分图中分布的位置较集中,掺假燕窝样品则较分散,可为初步判定燕窝真伪提供一定的参考价值。

3)以掺假物质含量作为自变量,综合评价得分作为因变量,进行线性回归分析,单一掺假的线性模型和混合掺假线性模型的线性系数R2>0.98。模型验证误差在-9.09%~22.22%之间,误差平均值为3.25%,证明该方法建立的线性回归模型对掺假物质含量拟合良好。

参考文献:

[1]乌日罕,陈颖,吴亚君,等.燕窝真伪鉴别方法及国内外研究进展[J].检验检疫科学,2007,17(4):60-62

[2] Lin J,Zhou H,Lai X.Overview of edible bird's nest research[J]. Journal of Chinese Medicinal Materials,2006,29(1):85-90

[3]Sankaran R.The status and conservation of the Edible-nest Swiftlet (Collocalia fuciphaga)in the Andaman and Nicobar Islands[J].Biological Conservation,2001,97(3):283-294

[4]郭丽丽.表征属性识别技术在燕窝真伪鉴别中的应用研究[D].北京:中国农业大学,2014

[5]刘景,王荫榆,郭本恒,等.发酵乳储存期内风味模型的建立与检验[J].食品科学,2011,32(12):296-300

[6]吴有炜.试验设计与数据处理[M].苏州:苏州大学出版社,2002:148-154

DOI:10.3969/j.issn.1005-6521.2016.11.031

基金项目:广东省科技计划项目(2012B040302015)

作者简介:庄俊钰(1981—),女(汉),高级工程师,硕士,主要从事食品安全检测与质量研究工作。

收稿日期:2015-05-08

Construction and Validation of Adulteration Model of Edible Bird's Nest by Amino Acid

ZHUANG Jun-yu1,2,XU Pei-qin1,2,LIN Dan2,3,ZHONG Shu-jie1,2

(1.Guangdong Food Quality Supervision and Inspection Station,Guangzhou 510308,Guangdong,China;2.Guangdong Provincial Public Laboratory of Food Industry,Guangzhou 510308,Guangdong,China;3.Guangdong Food Industry Institute,Guangzhou 510308,Guangdong,China)

Abstract:The amino acid composition of edible bird's nest(EBN)and adulterate EBN were analyzed by using an automatic amino.Principal component analysis(PCA)was applied to establish an evaluative model.Multivariate statistical methods were used to establish an adulteration model of EBN and verify.The results showed that prin 1 and prin 2 reflect 87.75%information of 18 indexes.Every sample was evaluated by PCA mathematical evaluative model and the PCA scores of EBNs were relative concentration than adulterate EBN.The parameters of adulteration content were analyzed as independent variables,and evaluative scores as the dependent variable for linear regression analysis.The final model were R2>0.98.The determined values and the predicted values of the tested samples were fitted well with an average error of 3.25%.Therefore,the amino acids composition fingerprint could be used to distinguish adulterate bird's nest based on changes in content or proportion.

Key words:edible bird's nest;adulteration;multiple linear regression;principal components analysis (PCA);modeling

猜你喜欢

多元线性回归主成分分析建模
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
基于组合模型的卷烟市场需求预测研究
基于多元线性回归分析的冬季鸟类生境选择研究
我国上市商业银行信贷资产证券化效应实证研究
云学习平台大学生学业成绩预测与干预研究
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用