APP下载

基于主成分分析及聚类分析的不同产地冬枣品质特性分析

2022-05-09武琳霞张国光姜冬梅欧阳喜辉

食品科学 2022年8期
关键词:冬枣乙醛和田

武琳霞,李 玲,张国光,姜冬梅,欧阳喜辉,王 蒙,*

(1.北京市农林科学院质量标准与检测技术研究所,农业农村部农产品质量安全风险评估实验室(北京),北京 100097;2.北京市农产品质量安全中心,农业农村部农产品质量安全环境因子风险评估实验室(北京),北京 100029)

冬枣是我国的特色食用水果,不仅具有鲜脆多汁的口感,还含有丰富的营养物质,如环磷酸腺苷(cyclic adenosine monophosphate,cAMP)、矿物质和VC等[1]。我国枣树种植面积和产量占世界的95%[2],目前我国冬枣种植规模较大地区有新疆和田、山东沾化、河北黄骅、陕西大荔及山西临猗等。但由于降水、温度、气候和土壤等自然环境条件的差异,造成了不同产地的冬枣在感官品质、营养品质及食味品质等方面存在差异,而这些指标是决定冬枣综合品质的重要指标。因此,研究不同产地冬枣感官品质、营养品质及食味品质差异,对冬枣的高价值开发利用具有十分重要的意义。

由于冬枣贮藏期短,目前对其保鲜[3-5]及农药残留[6]的研究报道较多。对冬枣营养成分的研究分析大多集中于单一产地[7]或者不同品种的差异比较[8-9],而关于不同产地冬枣感官指标、营养指标及食味指标的地域差异的全面研究鲜有报道。因此,本实验以采自我国5个冬枣主产地(新疆和田、山东沾化、河北黄骅、陕西大荔、山西临猗)的36 份样品为研究对象,测定其18个品质指标含量,包括感官品质指标(单果质量和果皮色泽)、营养品质指标(VC、钠、镁、钾、锰、铁、铜、锌、cAMP)和食味品质指标(可食率、含水量、可溶性固形物含量(soluble solid content,SSC)、硬度、可滴定酸、乙醇和乙醛)。首先对其进行主成分分析(principal component analysis,PCA),得出不同产地冬枣品质的综合得分,并对影响冬枣品质的特征指标进行筛选确定,进而利用特征指标对不同产地建立分类模型,旨在为冬枣品质评价和产地溯源提供科学依据。

1 材料与方法

1.1 材料与试剂

采集2020年收获的冬枣样品36 份,来自5个主产地,分别为山东沾化10 份、陕西大荔10 份、新疆和田6 份、河北黄骅6 份以及山西临猗4 份。选半红时采收,选取果实饱满、颜色均匀,且无机械损伤和感染的冬枣为原料。

cAMP(色谱纯,≥98%),乙醇(色谱纯,>99.8%)、乙醛(色谱纯,≥99.5%)、氢氧化钠(分析纯,95%)、偏磷酸(分析纯,≥38%)、磷酸三钠(分析纯)、磷酸二氢钾(分析纯,99.5%)、磷酸(分析纯,85%)、L-半胱氨酸(优级纯,99%)、十六烷基三甲基溴化铵(色谱纯,99%)、硝酸(优级纯) 北京索莱宝科技有限公司。

1.2 仪器与设备

CR-400型色差仪 日本Konica Minolta Sensing公司;PAL-1型糖度计 日本Atago公司;1260 Infinity型高效液相色谱仪 美国Agilent科技有限公司;GC-2010型气相色谱仪 日本岛津公司;T50型电位滴定仪瑞士Mettler-Toledo公司;NEXION 350型电感耦合等离子体质谱仪 美国Perkin Elmer公司。

1.3 方法

单果质量:称量1 kg样品计数,求单果平均质量[10];果皮色泽:色差仪测定冬枣果皮颜色的L*、a*、b*值,并利用CIELAB色差公式计算总色差[11];可食率:按公式计算:可食率/%=(全果质量-核质量)/全果质量×100;含水量:直接干燥法[12];SSC:折射仪法[13];硬度:硬度计测定[14];可滴定酸:电位滴定仪测定[15];乙醇、乙醛:气相色谱仪、顶空进样法[16];VC:高效液相色谱法[17];微量元素:电感耦合等离子体质谱法[18];cAMP:液相色谱法[19]。

1.4 数据处理

采用SPSS 21.0数据处理软件进行多重比较、相关性分析、PCA与判别分析。

2 结果与分析

2.1 不同地区冬枣18个品质指标比较

对采集自5个地区冬枣的18个品质指标进行统计,结果如表1所示。经Tukey检验,各指标均存在显著的地区差异,其中新疆和田冬枣的SSC、VC、钠、铁含量均为最高,未检出乙醇。山东沾化冬枣镁、钾、铜含量最高。山西临猗冬枣可食率、锰、锌含量最高,果皮色泽最为鲜红。陕西大荔冬枣单果质量、cAMP含量最高。河北黄骅冬枣可滴定酸与乙醛含量最低。根据前人报道的沾化冬枣VC含量[20]、天津大港冬枣VC、总糖、水分、钾、镁、钠、铁、锌、锰、铜含量[7],以及宁夏灵武市的冬枣单果质量、纵径、横径、硬度、SSC、可滴定酸、VC含量[8],表明本实验结果均在合理范围之内。

表1 不同地区冬枣18个品质指标统计Table 1 Statistics of 18 quality indexes of winter jujube from different production regions

2.2 相关性分析

由相关性分析结果(表2)可知,冬枣各品质指标间共有153个相关系数,在α=0.05水平上存在显著相关的有6个,在α=0.01水平上存在显著相关的有2个。其中VC和镁含量呈显著正相关(0.881),VC和钾含量呈显著正相关(0.897),含水量和SSC含量呈显著负相关(-0.945),镁和钾含量呈显著正相关(0.942),钾和可滴定酸含量呈显著负相关(-0.911),乙醇和乙醛含量呈显著正相关(0.931)。镁和铜含量呈极显著正相关(0.981),锰和乙醛含量呈极显著负相关(-0.967)。从相关性分析结果可知,各指标间均存在不同程度的相关性,使得冬枣品质评价结果会因品质指标所反映的信息重叠而不明确,这就需要对各品质指标进行分类、简化[21],从而提高冬枣品质综合评价结果的准确性。

表2 冬枣品质指标相关性分析Table 2 Correlation analysis of quality indexes of winter jujube

2.3 PCA

PCA不仅能够降低维度,而且能使变量之间的关系更加清晰[22]。碎石图(图1)可用于确定PC的最佳个数。PC数的确定要求既满足数据的降维又能包括原始数据的大部分信息,累计方差贡献率通常反映PC所包含的原始信息的比率。数据经最大方差法旋转后,各因子的载荷值更接近于0或1,可以更好地解释归纳出各PC下的因子。旋转后的PCA结果见表3,本实验根据累计贡献率不低于80%的原则,明确PC数。因此,由于特征值>1的前4个PC累计方差贡献率达100%,基本综合了原始数据的信息,可代表冬枣品质指标。

图1 PCA碎石图Fig.1 Scree plot of principal component analysis

由表3可知,PC1的方差贡献率为37.689%,其中,贡献最大的是钾,其次是镁、铜、可滴定酸和VC,主要反映冬枣的营养品质,也在一定程度上反映了冬枣的酸度。PC2的方差贡献率为27.329%,综合乙醇、乙醛、锰和果皮色泽的信息,主要反映冬枣的气味和色泽。PC3的方差贡献率为21.311%,综合了硬度、钠和单果质量的信息。PC4的方差贡献率为13.670%,综合了SSC、含水量和cAMP的信息。

表3 PC旋转成分矩阵Table 3 Rotational component matrix

PCA法是利用降维的思想,将多个变量转化为少数几个不相关的综合变量的多元统计方法,其目的是通过降维,去除众多信息中相互重叠的信息[23],已被广泛应用于果蔬、药材等品质指标筛选和品质综合评价研究中[23-26]。根据PCA结果,以4个PC对应的方差相对贡献率为权重,将各产地PC得分和相应的权重进行线性加权求和,计算各地区冬枣的综合评价得分,综合得分越高表示该地区冬枣品质越好[16]。5个地区冬枣在各PC下的得分、综合得分及综合排名结果见表4。可知5个冬枣主产地按综合排序从高到低依次为新疆和田、山东沾化、山西临猗、陕西大荔和河北黄骅,表明新疆和田和山东沾化是冬枣的优势产区。

表4 不同地区冬枣的PC得分Table 4 Principal component scores of winter jujube from different regions

2.4 品质指标的聚类分析

系统聚类分析是最常用的无监督模式识别技术之一,是一种基于相似性对样本进行分层分组的方法,无需使用先验信息[14]。根据PCA结果,采用组间联接和平方Euclidean距离对冬枣的18个品质评价指标的载荷系数进行系统聚类分析,通过聚类把冬枣品质指标中相关性较强的指标优先聚在一起,单独分为一类的指标具有相对独立性。聚类分析结果见图2。结果表明,在类间距离为15时,上述指标被分为5类,第1类包括镁、铜、钾、VC、铁、钠、SSC;第2类包括可食率、锌、锰;第3类包括单果质量、硬度、cAMP;第4类包括乙醇、乙醛;第5类包括果皮色泽、可滴定酸、含水量。

由相关性分析可知,同聚为一类的冬枣品质指标间具有密切的相关性,可选用一个或几个指标代表其他指标,予以简化;再根据冬枣有关指标要求和实际情况,分别在每一类中筛选出具有代表性的特征指标。在第1类中,VC、镁、钾彼此间均呈显著正相关,由于钾贡献率最大,故排除镁和VC,钠、铁、铜贡献率相对较低故也排除,SSC是重要的食味品质指标故保留,最终选择钾和SSC为特征指标;在第2类中,锰的贡献率最大,与钾共同反映冬枣的营养品质;在第3类中,单果质量与硬度反映冬枣的外观和口感,故选择单果质量和硬度作为第3类的特征指标;在第4类中,乙醇和乙醛含量具有显著相关性,乙醛贡献率相对较低故排除该指标,因此选择乙醇为特征指标;第5类中,色泽是决定冬枣外观品质的重要指标,含水量反映冬枣的食味品质,因此选择色泽和含水量为第5类的特征指标。综上,可将冬枣品质评价指标简化为SSC、钾、锰、单果质量、硬度、乙醇、色泽和含水量8个特征指标。

图218 个品质指标聚类图Fig.2 Dendrogram obtained by clustering analysis of 18 quality indexes

2.5 不同产地冬枣中核心品质指标的判别分析

Fisher线性判别分析广泛应用于不同产地的样品的区分,实现产品的溯源[27-30]。本实验根据筛选的8个特征指标,利用Fisher线性判别分析对2020年我国5个主产区的冬枣样品进行产地鉴别(图3)。由表5可知,8个特征指标可以成功区分山西临猗、陕西大荔、河北黄骅、新疆和田和山东沾化的冬枣样品,且该方法对5个地区冬枣的整体正确判别率为100.0%。交叉验证结果显示,5个地区的冬枣的正确判别率为97.2%,其中山西临猗有75.0%的样品被正确识别,陕西大荔、河北黄骅、新疆和田和山东沾化所有样品均被正确区分。交叉检验的错判率为2.8%<10%,满足误判率要求。

图35 个冬枣主产地的Fisher判别分类图Fig.3 Fisher discriminant classification of winter jujube from five main production areas

表55 个冬枣主产地的Fisher判别结果Table 5 Fisher discriminant results of winter jujube from five major production areas

3 结 论

采集了我国5个主产地的冬枣样品,并对其18个品质指标进行分析,通过多重比较得知各指标均存在显著的地区差异。采用PCA对不同地区冬枣的18个品质性状进行研究,提取前4个PC,累计贡献率达到100.0%。PCA对5个地区冬枣进行品质评价,按综合排序从高到低依次为新疆和田、山东沾化、山西临猗、陕西大荔和河北黄骅,表明新疆和田和山东沾化是冬枣的优势产区。对结果进一步采用系统聚类,结合相关性和PCA结果,筛选出SSC、钾、锰、单果质量、硬度、乙醇、色泽和含水量8个特征指标。再利用8个特征指标经Fisher判别分析对冬枣产地进行区分,结果表明整体正确判别率为100.0%,交叉检验的正确判别率为97.2%。因此表明筛选的8个特征指标可作为山西临猗、陕西大荔、河北黄骅、新疆和田和山东沾化5个主产地溯源的特征指标,这将在冬枣生产实践中具有重要意义。

猜你喜欢

冬枣乙醛和田
气相色谱法测定乙醛及其杂质含量
和田出土《法华经》古藏译本的初步研究报告(二)
冬枣深加工 延伸产业链
“智耕牛”指尖“种”冬枣
一种锯齿状冬枣采摘装置
基于数字实验探究乙醛的还原性
我的冬枣卖了13万!
纸质包装材料中甲醛、乙醛向食品模拟物改性聚苯醚的迁移行为
对乙醛与新制氢氧化铜反应实验的改进
怪城