基于红外光谱指纹和挥发性组分信息融合模型鉴别大米产地来源
2018-04-20杜梦佳胡秋辉
杜梦佳,毛 波,沈 飞,李 彭,裴 斐,胡秋辉,方 勇,*
水稻是世界上主要的粮食作物之一,大米品质容易受到原料品种和产地环境如土壤、水等因素影响[1]。目前市场上一些不法商家受利益驱使,用一些低档、劣质稻米冒充地理标志大米,以假乱真,严重侵犯了消费者利益,甚至危及生命安全[2-3]。目前常用的大米产地鉴别技术主要有傅里叶红外光谱(Fourier transform infrared spectroscopy,FTIR)技术、气相色谱-质谱(gas chromatography-mass spectrometry,GC-MS)技术等。FTIR技术可反映含氢基团振动引起的倍频和合频吸收峰信息[4-5]。当生长环境变化时,大米中成分组成或结构可能发生改变,导致不同基团或同一基团在不同环境中产生的近红外光谱在吸收峰的位置和强度上有所不同,利用这种差异可以反映大米产品的地域特征[6-8]。Lin等[9]采集了3 种不同品种超级水稻的光谱指纹信息,结合偏最小二乘回归(partial least squares regression,PLSR)和偏最小二乘判别分析(partial least squares-discriminant analysis,PLS-DA)建立了产地鉴别模型,总体鉴别率可达90%。GC-MS是一种用于检测挥发组分的有效方法,由于产地环境对大米中有机挥发性组分的积累有较大影响,使得利用GC-MS技术进行产地鉴别成为可能[10-12]。Lim等[13]利用GC-MS采集朝鲜和中国大米样品的挥发性组分指纹信息,结合PLS-DA建立了产地鉴别模型,具有一定的鉴别效果。还有研究者采用固相微萃取-质谱技术研究不同程度香气大米样品的挥发性组分指纹信息,并结合类比独立分类法(soft independent modeling of class analogies,SIMCA)进行了分类[14]。
上述大米产地判别方法多是基于单一鉴别指标如光谱指纹信息或挥发性组分指纹信息,尤其是由于大米中的挥发性组分指纹信息的不稳定性,导致单一指标鉴别结果的准确性和可靠性较差。随着食品鉴别检测技术的逐渐成熟,目前,国内学者应用信息融合技术检测食品品质的研究已有较多报道。Sun Wenjuan等[15]采用近红外光谱融合中红外光谱建立鉴别正品和赝品大黄的模型,结合SIMCA,支持向量机、人工神经网络、PLS-DA等分析显著提高了鉴别准确率。陶思嘉等[16]通过融合不同品种葡萄酒的近红外和中红外光谱指纹信息,结合贝叶斯和PLS-DA分析,融合信息后的鉴别准确率优于单独采用一种光谱技术的鉴别结果。虽有研究将不同指纹信息融合起来进行鉴别,但这些指标为同种属性的指纹信息,同样难以保证鉴别结果的客观性和准确性。而且根据查阅文献可知,融合不同属性指纹信息进行大米产地鉴别的方法鲜见报道。
因此,为建立一种红外光谱指纹信息和挥发性组分信息融合鉴别模型,提高模型对大米产地的鉴别率。本研究以盘锦、射阳和五常大米3 种典型地理标志大米为鉴别对象,筛选3 个产地大米样品中具有显著性差异的挥发性组分和光谱吸光度为特征鉴别指标,利用PLS-DA建立融合信息模型,并且与单一指标模型的鉴别效果进行比较,以期为全面客观、准确可靠鉴别地理标志大米提供技术理论依据。
1 材料与方法
1.1 材料与试剂
地理标志大米样品分别采自中国的江苏省射阳县、黑龙江省五常市和辽宁省盘锦市,其中采自江苏省射阳县的大米共19 个样品,分别采自海河镇、临海镇、合兴乡、射阳县、淮海农场、耦耕镇;采自黑龙江省五常市的大米样品共15 个样品,分别采自五常市、安家镇、民乐乡、民意乡、二河乡、志广乡、常卜乡;采自辽宁省盘锦市的大米样品共20 个样品,采自大洼县;大米样品均采自2015年秋季的当地农田,每个采样点采集2 kg样品,采用二分法选择500 g作为分析试样。
2,4,6-三甲基吡啶、甲醇(均为优级纯) 阿拉丁生化科技有限公司。
1.2 仪器与设备
7890A-5975C型GC-MS联用仪 美国安捷伦公司;手动固相微萃取装置(50/30 μm二乙基苯/碳分子筛/聚二甲基硅氧烷纤维头) 美国Supelco公司;CH-9230型恒温水浴锅 瑞士步琪公司;TP-214型电子分析天平北京丹佛仪器有限公司;Tensor27型傅里叶红外光谱分析仪 德国Bruker公司;101-3AS型电热鼓风干燥箱上海苏进仪器设备厂。
1.3 方法
1.3.1 样品处理
分析试样处理按照GB/T 1354—2009《大米》粳米一级加工标准进行加工。
大米粉碎处理:用研磨粉碎机分别对精米样品磨粉30 s,为了获得均匀颗粒,粉碎的样品均通过80 目筛子筛选,粉碎好的样品分装在洁净的样品袋中,密封,置于温度20 ℃,含水量为14%的干燥器中,备用。
1.3.2 FTIR光谱采集[17]
利用Tensor 27型FTIR和45 ℃ ZnSe衰减全反射附件扫描大米样品的光谱指纹信息。采用固体压片法取约0.50 g样品置于直径为13 mm的ZnSe晶体上,铺布均匀,加压至0.8 GPa,保持1 min,光谱区域设定为0~4 500 cm-1,分辨率为8 cm-1,扫描次数为32 次,以空气为背景,室温条件下测定,采集红外光谱,取每个产地大米样品的平均光谱作为该产地的最终红外谱图,每做完一个样品采用酒精棉球擦拭样品槽。
1.3.3 GC-MS检测[18]
称取6.00 g大米颗粒(距样品封存1 周)置于顶空样品瓶中,加入1 μL内标物质(1 μL 2,4,6-三甲基吡啶用甲醇定容在5 mL的容量瓶),密封后置于预先设好的恒温(80 ℃)水浴锅中平衡50 min,再将萃取头插入顶空瓶吸附60 min,于GC-MS进样口解吸5 min。每个样品进行3 次重复。
GC-MS检测参数:HP-5MS毛细管柱(30 m×250 μm,0.25 μm);升温程序:从柱初温50 ℃升至125 ℃,速率为8 ℃/min,保持3 min,然后升至165 ℃,速率为4 ℃/min,保持3 min,最后升至230 ℃,速率为10 ℃/min,保持2 min,后运行为2 min。第1次使用萃取针时,萃取头需要在GC进样口(氮气保护条件下)老化2 h,老化温度为270 ℃。在以后的使用过程中,使用前需要在以上温度条件下老化20 min,脱去萃取头上的杂质。载气N2;载气流速1.0 mL/min;AUX-2温度280 ℃;电子电离源;离子源温度230 ℃;电子能量70 eV;采集模式全扫描。
1.3.4 信息融合[19]
将已获得的共54 份大米样品的特征光谱范围吸光度和特征挥发性组分含量作为自变量,产地分类作为因变量,其中提取的每个样品的特征光谱范围中每个波数点对应的吸光度为一个变量,即将数据列为n×p数据矩阵X和n×q数据矩阵Y,n为样本数,p为自变量,q为分类变量,取2/3的样品作为建模集,1/3的样品作为验证集,建模集用于构建指纹因子-大米产地模型,验证集用于对构建的模型进行验证、评价,利用Matlab 8.0软件对建模样本的自变量矩阵X和分类变量Y建立模型,判断样品所属类别。
为了评价上述基于融合信息建立的PLS-DA模型的适用性与合理性,采用相同方法获得了基于单一指纹信息建立的鉴别模型,即大米产地与大米挥发性组分因子、大米产地与大米光谱指纹因子模型,对这3 种模型进行对比分析。
1.4 数据处理
采用数据处理软件SPSS 16.0进行ANOVA分析,Matlab 8.0软件进行PLS-DA分析。PLS-DA是一种基于PLSR的多变量统计分析方法,它是对原始矩阵(挥发性组分指纹信息或光谱指纹信息)X和类别变量Y之间的关系进行计算,得到X与Y的最大协方差,通常设定模糊变量的临界值(±0.5)来判定样品的分类归属,利用留一交叉验证法获得PLS-DA模型的最优潜变量数(LV),评估模型的鉴别精密度[20]。GC-MS实验数据由计算机检索并与图谱库(NIST 08)的标准质谱图对照进行分析,再结合相关文献进行人工谱图解析,根据大米样品的GC-MS指纹图谱、离子峰的保留时间和峰面积找到共有峰,确认大米样品中挥发性组分的化学结构和名称,其相对含量采用峰面积归一化法分析。
2 结果与分析
2.1 特征光谱指纹信息的提取
图1 盘锦、射阳和五常大米样品的FTIR平均光谱图Fig. 1 FTIR average spectra of rice samples from Panjin,Sheyang and Wuchang
如图1a所示,3 种大米的光谱图整体趋势一致,表明它们的化学成分比较相似。而在特定波数范围内(960~1 060、1 601~1 685 cm-1和3 000~3 620 cm-1),3 种大米的光谱信息存在差异,如图1b~d所示,在这3 组波数范围内,射阳大米光谱吸光度均明显高于盘锦和五常大米,这与其生长环境如土壤、水源等密切相关,有可能是射阳独特的环境气候,水稻生长早期积温偏低,使得营养生长期相对较长,在作物成熟期,积温较高,光照充足等原因,更利于干物质积累和沉淀,加上射阳土壤富钾的特性,更利于大米中多糖的形成[21-23]。其中在960~1 060 cm-1范围内的光谱峰为多糖的特征吸收区,在994 cm-1附近的强吸收峰与多糖的C—O的伸缩振动相关[24-25]。在1 601~1 685 cm-1光谱范围内的吸收峰为酰胺化合物的特征吸收区,在1 643 cm-1附近的吸收峰与—CONH中C—O伸缩振动及有机羧酸盐COO—的不对称振动相关[24,26]。3 000~3 620 cm-1范围为亚甲基(—CH2)、甲基(—CH3)、羟基(—OH)和氨基(—NH)的振动吸收峰,在3 286 cm-1附近强而宽的吸收峰,是核苷酸、氨基酸的N—H伸缩振动和羟基O—H伸缩振动的叠加,这部分的吸收主要反映出大米中核酸、蛋白质、脂肪酸和碳水化合物(纤维素、多糖)等对光谱的贡献[27]。因此,选取光谱范围在960~1 060、1 601~1 685 cm-1和3 000~3 620 cm-1之间的光谱指纹信息做进一步的产地鉴别。
2.2 特征挥发性组分指纹信息的提取
表1 盘锦、射阳和五常大米样品中共有挥发性组分的GC-MS结果Table 1 GC-MS analysis of common volatile compounds in rice samples from Panjin, Sheyang and Wuchang
利用GC-MS对20 份盘锦、19 份射阳和15 份五常大米中的挥发性组分进行分析检测,这3 种大米中分别检测出127、137 种和119 种化合物。在此基础上,找到在相同保留时间条件下,3 个产地的大米样品中共同存在的挥发性组分,通过筛选,获得共有挥发性组分13 种,如表1所示。盘锦大米中反-2-壬烯醛、壬醇、萘、(+)-长叶烯和十六烷的相对含量最高。射阳大米中的2-戊基呋喃、壬醛、反-2-壬烯醛、萘、癸醛和十四烷的相对含量最低。在五常大米中,2-戊基呋喃、壬醛和十二烷的相对含量最高,(+)-长叶烯和十五烷的相对含量最低。此外,在13 种共有挥发性组分中,苯甲醛、2-戊基呋喃、壬醛、反-2-壬烯醛、壬醇、萘、癸醛、十四烷、(+)-长叶烯和十五烷这10 种化合物的相对含量因产地不同而具有显著性差异(P<0.05)。因此选取这10 种物质作为特征挥发性组分指纹信息建立鉴别模型。
2.3 PLS-DA信息融合
图2 基于大米样品特征挥发性组分模型(A)、特征光谱模型(B)和融合信息模型(C)PLS-DA的得分图Fig. 2 PLS-DA score plots of characteristic volatile model (A),characteristic spectral model (B), and information fusion model (C) for rice samples
表2 利用PLS-DA建立3 种鉴别模型的分析结果Table 2 Analysis of three discriminant models established by PLS-DA%
FTIR反映的是化学有机组分中官能团的种类与含量,GC-MS具有定量检测挥发性组分的特征,但是大米样品中的有机化学组分很大程度上受到其生长环境的影响,仅基于该单一指标鉴别不具有全面性和客观性,而挥发性组分的不稳定性,在单一指标鉴别中准确率较低,且可靠性较差,因此,红外光谱和挥发性组分信息融合是多源信息融合,不同维度数据提供的信息具有更强的多样性[28-29]。基于不同鉴别因子指纹信息建立的PLS-DA模型的前2 个因子得分如图2所示,由图2A、B可知,不同产地大米样品的分布具有显著性重叠,其中在图2A中,盘锦大米、射阳大米和五常大米的分布均有交互重叠,在图2B中,盘锦大米、射阳大米与五常大米的分布具有明显的重叠,而盘锦大米与射阳大米的分布基本没有重叠。在图2C中,3 个产地的大米样品的分布区分较为明显,相互之间基本没有重叠。此外,从图2A到图2C可以看出,不同产地样品分布重叠的显著性依次降低,表明基于信息融合建立的PLS-DA模型鉴别大米产地具有一定的可行性。
提取的特征光谱吸光度(范围为960~1 060、1 601~1 685 cm-1和3 000~3 620 cm-1)和10 种特征挥发性组分含量(苯甲醛、2-戊基呋喃、壬醛、反-2-壬烯醛、壬醇、萘、癸醛、十四烷、(+)-长叶烯和十五烷)作为自变量,3 个产地分类作为因变量,导入Matlab统计分析软件,结合PLS-DA法建立融合信息-大米产地的鉴别模型,并与单一指纹信息建立模型的鉴别效果进行比较分析,如表2所示,验证集的灵敏性由91.4%(红外光谱模型)和84.8%(挥发性组分模型)变为融合后的97.4%,特异性由92.1%(红外光谱模型)和82.4%(挥发性组分模型)变为融合后的97.0%,表明信息融合模型的鉴别灵敏度和精确度相比于单一指标模型(红外光谱模型和挥发性组分模型)有所提高。在单一指纹信息鉴别模型中,挥发性组分模型的灵敏性为84.8%,表明15.2%的样品被判为其他类,但其特异性仅为82.4%,说明鉴别精确度不足,这有可能与样品经过脱壳等处理,其挥发性组分信息受到严重干扰,导致样品误判率较高[14]。在这3 种鉴别模型中,挥发性组分模型、红外光谱模型和信息融合模型的验证集准确率分别为88.9%、92.9%和97.4%。相比于挥发性组分模型和红外光谱模型,信息融合模型的准确率分别提高了8.5%和4.5%,这是因为融合的光谱指纹信息和挥发性组分指纹信息反映了可能的相互作用和协同效应[30]。因此,信息融合技术较大的提高了模型的鉴别效果。
3 结 论
大米样品的红外光谱主要体现的是有机组分中分子基频振动的信息,GC-MS体现的是挥发性组分信息,二者信息来源不同且属性不同,PLS-DA信息融合充分利用了这2 种信息,实现了信息互补。本方法可以通过修正部分单独鉴别时混淆或者错判的样品,得出正确结果,从而提高鉴别准确率和可信度,使得信息融合处理后模型的鉴别准确率提高。
参考文献:
[1] 钱丽丽, 乔治, 左锋, 等. 基于电子鼻技术的地理标志大米产地溯源研究[J]. 农产品加工(学刊), 2014(24): 38-41. DOI:10.3969/jissn.1671-9646(X).2014.12.041.
[2] 王树婷, 陈志, 张敏, 等. 国家地理标志产品洋县黑米保护的思考[J]. 陕西农业科学, 2010, 56(1): 114-118. DOI:10.3969/j.issn.0488-5368.2010.01.040.
[3] 王树婷, 刘成武, 张敏, 等. 辽宁大米资源的国家地理标志产品保护分析[J]. 安徽农业科学, 2010, 38(5): 2739-2741. DOI:10.3969/j.issn.0517-6611.2010.05.163.
[4] 葛俊苗, 宋益善, 李燕, 等. 傅里叶变换红外光谱仪及其在食品中的应用[J]. 广东化工, 2017, 44(2): 54-55. DOI:10.3969/j.issn.1007-1865.2017.02.027.
[5] 宋雪健, 钱丽丽, 于金池, 等. 基于近红外光谱技术对建三江大米快速检测分析研究[J]. 食品研究与开发, 2017, 38(14): 138-143.DOI:10.3969/j.issn.1005-6521.2017.14.029.
[6] 夏立娅, 申世刚, 刘峥颢, 等. 基于近红外光谱和模式识别技术鉴别大米产地的研究[J]. 光谱学与光谱分析, 2013, 33(1): 102-105.DOI:10.3964/j.issn.1000-0593(2013)01-0102-04.
[7] 谌蓓, 夏立娅, 窦玉蕾, 等. 基于NIR的模式识别技术在地理标志产品响水大米鉴别中的应用[J]. 河北大学学报(自然科学版), 2013,33(5): 484-488. DOI:10.3969/j.issn.1000-1565.2013.05.008.
[8] 林萍, 陈永明. 利用可见近红外光谱技术快速鉴别大米品种[J]. 江苏农业科学, 2015, 43(12): 320-323. DOI:10.15889/j.issn.1002-1302.2015.12.101.
[9] LIN W S, YANG C M, KUO B J. Classifying cultivars of rice (Oryza sativa L.) based on corrected canopy reflectancespectra data using the orthogonal projections to latent structures (O-PLS) method[J].Chemometrics and Intelligent Laboratory Systems, 2012, 115(7):25-36. DOI:10.1016/j.chemolab.2012.04.005.
[10] CHUANG Y K, HU Y P, YANG I C, et al. Integration of independent component analysis with near infrared spectroscopy for evaluation of rice freshness[J]. Journal of Cereal Science, 60(1): 238-242.DOI:10.1016/j.jcs.2014.03.005.
[11] 曹俊, 刘欣, 陈文若, 等. 基于E-NOSE与SPME-GC/MS技术分析温湿度动态变化过程中稻谷的挥发性成分[J]. 中国农业科学, 2017,50(1): 42-160. DOI:10.3864/j.issn.0578-1752.2017.01.013.
[12] 黄亚伟, 徐晋, 王若兰, 等. HS-SPME/GC-MS对五常大米中挥发性成分分析[J]. 食品工业, 2016, 37(4): 266-269.
[13] LIM D K, MO C, LEE D K, et al. Non-destructive profiling of volatile organic compounds using HS-SPME/GC-MS and its application for the geographical discrimination of white rice[J]. Journal of Food and Drug Analysis, 2017, 25(4): 1-8. DOI:10.1016/j.jfda.2017.04.005.
[14] MICKAEL L, CHRISTIAN M, FABRIES D, et al. Rapid discrimination of scented rice by solid-phase microextraction, mass spectrometry, and multivariate analysis used as a mass sensor[J].Journal of Agricultural and Food Chemistry, 2007, 55(4): 1077-1083.DOI:10.1021/jf0623992.
[15] SUN W J, ZHANG X, ZHANG Z Y, et al. Data fusion of nearinfrared and mid-infrared spectra for identification of rhubarb[J].Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2016, 171: 72-79. DOI:10.1016/j.saa.2016.07.039.
[16] 陶思嘉, 李梦华, 李景明, 等. 红外光谱及Bayes信息融合技术的葡萄酒鉴别研究[J]. 分析化学, 2014, 42(2): 215-220. DOI:10.3724/SP.J.1096.2014.30222.
[17] 王小龙. 稻米和小米的傅里叶变换红外光谱研究[D]. 昆明: 云南师范大学, 2014: 37-40.
[18] 刘敏, 王健健, 刘芳宏, 等. 基于SPME-GC-MS对不同品种大米挥发性物质分析[J]. 中国酿造, 2017, 36(6): 170-174. DOI:10.11882/j.issn.0254-5071.2017.06.035.
[19] 王巧华, 李小明, 段宇飞. 基于CUVE-PLS-DA的鸡蛋新鲜度在线检测分级[J]. 食品科学, 2016, 37(22): 187-191. DOI:10.7506/spkx1002-6630-201622028.
[20] 孙娟. 基于拉曼光谱技术和化学计量学方法的大米品种产地的快速鉴别方法[D]. 无锡: 江南大学, 2016: 2-60.
[21] 黄哲儒, 周正宽, 程兆堂, 等. 做大做强“射阳大米”品牌, 助推粮食供给侧结构性改革[J]. 大麦与谷类科学, 2017, 34(5): 62-64.
[22] 夏立娅, 李小亭, 胡晓玲, 等. 盘锦大米品质与产地环境关系探析[J].安徽农业科学, 2009, 37(31): 15186-15188.
[23] 张泽浩. 五常大米品牌建设研究[D]. 哈尔滨: 东北农业大学, 2016:14-23. DOI:10.3969/j.issn.0517-6611.2009.31.039.
[24] 黄方田, 欧全宏, 刘刚, 等. 云南不同产地大米的傅里叶变换红外光谱研究[J]. 光谱学与光谱分析, 2016, 36(S1): 48-49.
[25] CAREDDA M, ADDIS M, IBBA I, et al. Building of prediction models by using mid-Infrared spectroscopy and fatty acid profile to discriminate the geographical origin of sheep milk[J]. LWTFood Science and Technology, 2017, 75: 131-136. DOI:10.1016/j.lwt.2016.08.053.
[26] THAIR H, XIAO B Z, ZHI H L, et al. Rapid prediction of phenolic compounds and antioxidant activity of Sudanese honey using Raman and Fourier transform infrared (FTIR) spectroscopy[J].Food Chemistry, 2017, 226(1): 202-211. DOI:10.1016/j.foodchem.2017.01.024.
[27] 赵花荣, 王晓燕, 陈冠华, 等. 利用傅里叶变换红外光谱法鉴定小麦品种[J]. 光谱学与光谱分析, 2004, 24(11): 1338-1341. DOI:10.3321/j.issn:1000-0593.2004.11.016.
[28] 潘泉, 王增福, 梁彦, 等. 信息融合理论的基本方法与进展(Ⅱ)[J]. 控制理论与应用, 2012, 29(10): 1233-1244.
[29] 陈科文, 张祖平, 龙军. 多源信息融合关键问题、研究进展与新动向[J]. 计算机科学, 2013, 40(8): 6-13. DOI:10.3969/j.issn.1002-137X.2013.08.002.
[30] JAN U P, DIETMAR R, KAMMERER, et al. On-line application of near infrared (NIR) spectroscopy in food production[J]. Trends in Food Science & Technology, 2015, 46(2): 211-230. DOI:10.1016/j.tifs.2015.10.002.