APP下载

基于主成分分析法的美八苹果品质综合评价体系构建

2015-02-16孟永宏王晓培魏丽娜马玉娟郭玉蓉

食品工业科技 2015年9期
关键词:鲜果聚类苹果

孟永宏,张 英,王晓培,魏丽娜,马玉娟,邓 红,郭玉蓉

(陕西师范大学,食品工程与营养科学学院,陕西西安 710119)



基于主成分分析法的美八苹果品质综合评价体系构建

孟永宏,张 英,王晓培,魏丽娜,马玉娟,邓 红,郭玉蓉

(陕西师范大学,食品工程与营养科学学院,陕西西安 710119)

用主成分分析得出代表美八苹果品质的综合指标,依据建立的综合评价模型对苹果进行分级。用SPSS 19.0软件对120个美八鲜果的13项品质指标进行主成分分析筛选出主成分因子,Excel 软件辅助得出各个主成分因子的得分以及鲜果的综合得分,然后利用k-均值聚类分析将鲜果分级。结果显示,前7项主成分因子的累计方差贡献率达91.490%,能够反映出原始样本的大部分信息。根据各个样本的前7项主成分因子得分及各个因子的方差贡献率得出样本综合评分公式,计算样本的综合得分。然后根据综合得分利用k-均值聚类分析可将120个美八鲜果划分为5级,各级数量的百分比为15.00%、28.33%、33.33%、19.17%、4.17%。本研究为美八鲜果理化品质分析建立了一种客观、可行的多指标综合评价及分类模型。

美八苹果,主成分分析,k-均值聚类,综合评价体系

我国作为苹果生产第一大国[1],苹果品种丰富,种植广泛,是农业部确定的11种优势农产品之一[2],其产量和消费量在逐年增加。美八苹果于1984年由美国引入我国后其种植量不断增加,是一种品质优良的苹果品种。目前,国内外对于多品种苹果间的评价指标分析、理化品质的评价[3-7]及果品专项专用的品质研究比较多,构建的评价体系相对较完整。但对于单个品种苹果的理化指标分析及综合评价模型的研究则比较少,而且选定的评价标准不一,整体体系不完善。国内外研究中果品的分级标准也较粗略,一般是基于感官品质指标或几种常用指标结合的模式[7-9]。实际生产中,企业在进行原料分级时采用的标准也是比较简单,且不同地区、不同企业采用标准也不统一。此外,现有研究中对苹果品质评价大多是对感官指标和内部理化品质指标的评价,对苹果品质评价指标分析、综合评价及分级相结合模式的研究相对较少[10-11]。单纯的感官评价或内部理化品质评价不能够全面的反映苹果的综合品质,且传统评价法中主观因素较大,评价结果不具有统一性,所以利用数学模型解决这类问题具有重大意义。本研究旨在建立一种苹果品质综合评价模型,以便有效的实现对美八苹果果实品质的综合评价及分级,并为其他食品的理化品质综合评价及分级模型的建立提供参考。本研究对新鲜果品的分类销售以及提高苹果出口竞争力具有很大的现实意义。

1 材料与方法

1.1 材料与仪器

美国八号苹果 选自陕西洛川苹果园。在果实成熟期选择成熟度相似的果树随机挑选单果重为210~360g的无病虫害鲜果120个,采摘后立即测定各项品质指标。

PL203型电子分析天平 梅特勒-托利多仪器(上海)有限公司;手持WZ113型折射仪 北京万成北增精密仪器公司;LXJ-IIB型离心机 上海安亭实验仪器有限公司;722型可见分光光度计 上海光谱仪器有限公司;CR-400/401型色彩色差仪 柯尼卡美能达公司;PAL-1 型色差仪 日本爱拓公司;PHS-3C型精密pH计 上海图新电子科技有限公司;KQ-3200DE型数控超声波仪 江苏省昆山市超市仪器有限公司;RE-52型旋转蒸发器 上海安亭实验仪器有限公司;DG-9073B-1型电热鼓风干燥箱 上海福玛实验设备有限公司。

1.2 实验方法

美八鲜果13项品质性状的测定 测定120个美八鲜果中每个鲜果的如下13项指标:单果重、果型指数、果皮颜色(L值、a值、b值)、硬度、水分、可溶性固形物、总糖、维生素c、可滴定酸、糖酸比、固酸比。采用电子分析天平测定单果重,精确至0.001g;采用游标卡尺直接测定果实的纵径和横径,纵径与横径之比即为果型指数;参照GB/T230.2-2002用硬度计测定果实硬度;参照GB/5009.3-2010中食品中水分测定法测定水分;参照GB/PT500911-2003用手持WZ113型折射仪测定可溶性固形物含量,结果以°Brix计;参照GB/12293-90果蔬中可滴定酸度的测定方法测定可滴定酸度,结果以%计;固酸比用可溶性固形物含量与可滴定酸含量的比值表示;参照GB/10782-2006中总糖的测定方法来测定总糖含量;糖酸比用可溶性糖含量与可滴定酸含量的比值表示;参照GB/T 6195-1986果蔬维生素C含量测定法测定维生素C的含量;采用色差仪直接测定果实果皮颜色L、a、b值。每个样品每个指标平行测定3次,取平均值。

1.2.2 数据标准化 13项不同的指标性状具有不同的量纲,不同的数量级,直接进行数据分析会对结果产生较大的影响,故需要将数据进行标准化处理,消除指标间量纲关系[12-13]。标准化的方法是将各个指标下的每一个数据减去对应的平均值再除以该组数据的标准差,使其变成一组均值为0、标准差为1的无量纲数据。即:

其中:n代表苹果编号;i代表原始指标编号;Yni代表第n个苹果中第i项指标标准化后的数据。

1.2.3 主成分得分计算公式 主成分因子可以被定义为一项新的综合性指标[14-15],它是由原始13项指标数据进行因子分析筛选出的,不能由实验直接测得。样本各个主成分所包含的内容可以被定义为主成分得分(Fnj),根据13项原始指标的标准化数据Yni和对应的载荷eji得出,即:

其中:Fnj代表第n个苹果第j项主成分的得分;eji代表第j项主成分第i项原始指标的载荷。

1.2.4 综合得分计算公式 评价样本的综合品质时,不同指标所占的权重也不相同。表示样本品质的好坏时不能直接用累计结果的大小来表示,需使用线性加权求和法。加权法的关键在于权重的确定,人为规定的权重线有一定的主观误差,不具有通用性。方差贡献率的大小指的是该项指标数据对整体数据的反映的大小,因而可以用其作为权重线。本研究中样本的综合得分就是以各个主成分方差贡献率作为权重,鲜果各个主成分得分与对应的权重线性加权求和得出[16],即:

其中:Wn代表第n个苹果的综合得分;ηj表示第j项主成分的权重,也即第j项主成分的方差贡献率。

1.3 数据统计与分析

利用SPSS 19.0软件中的主成分因子分析、k-均值聚类分析等功能进行统计分析;同时使用Excel软件辅助进行处理数据以及图表绘制。

2 结果与分析

2.1 美八果实主成分分析

2.1.1 主成分因子个数的确定 利用SPSS软件中主成分分析法对美八鲜果的13项原始指标进行数据分析,得出各主成分的特征值(ηj)、方差贡献率和相应的特征向量ej,结果如表1所示。

根据主成分分析一般提取主成分包含90%以上信息的原理[17],由表1可知选取特征值η 在1附近的7项主成分因子,其累计方差贡献率达到91.490%。说明前7项主要成分足以代表原始测定的13项指标品质性状的大部分(91.490%)信息。因此,可将苹果的13项测定指标归结为7项主成分因子。7项主成分因子各自的方差贡献率见表1。

2.1.2 各个主成分因子中主要指标的确定 采用SPSS软件因子分析中的主成分分析法,得出13项指标的因子分析结果以及指标间相关性大小,结果如表2和表3所示。

表2 鲜果13项品质指标因子分析结果Table2 Factor analysis result of 13 indices of fresh apple quality

注:(1)提取方法为主成分分析;(2)从Ⅰ到Ⅶ代表7项主成分因子。

由表2可知:第Ⅰ主成分因子中负荷最大的为可滴定酸含量(0.763);较大的有硬度(0.724)、含水量(-0.655)、明亮度L(0.631)、可溶性固形物含量(0.631)四项;最小的为单果重(-0.071)。这说明第Ⅰ主成分因子主要由可滴定酸含量、硬度、明亮度L、可溶性固形物含量、含水量决定;其与可滴定酸含量、硬度、明亮度L、可溶性固形物含量正相关,与含水量负相关。第Ⅱ主成分因子中负荷较大的有糖酸比(0.726)、固酸比(0.720)、b(0.629)三项指标,负荷最小的为水分含量(-0.062)。这表明糖酸比、固酸比和b对第Ⅱ主成分因子影响较大,含水量对其影响则比较小,可以忽略。第Ⅲ主成分因子中占权重较大的为含水量(-0.599)、a(0.544),可溶性固形物含量为(0.529)、明亮度L(-0.520)四项,负荷最小的为硬度(-0.028)。其中第Ⅲ主成分因子与a、可溶性固形物含量正相关,与含水量、明亮度L负相关;硬度影响最小,可以忽略;a与明亮度L相关性系数为-0.860,且a所占权重大,因而选择a来代表明亮度L。第Ⅳ主成分因子中负荷尤其突出的为单果重(0.713),对其影响最大;负荷最小的为可溶性固形物(-0.001),对该主因子影响也最小。第Ⅴ主成分因子中负荷最大的为总糖(0.725),对其影响最大;负荷最小的为水分含量(-0.025)。第Ⅵ主成分因子中负荷最大的为维生素C含量(-0.624),与其关系为负相关;负荷最小的为明亮度L(0.009)。第Ⅶ主成分因子中负荷较大的有可溶性固形物(-0.418)、硬度(0.360)、维生素C含量(0.348)和果型指数(0.318)四项;负荷最小的为单果重(-0.017);没有任何负荷的为总糖(0.000)。其中该主成分因子与硬度、维生素C含量和果型指数呈正相关关系,与可溶性固形物为负相关关系;与单果重关系最小;与总糖没有关系。由相关性分析可知,美八苹果的13项原指标中某些指标之间具有显著的相关性,使得指标间在一定程度上可相互反映。例如,固酸比与糖酸比的相关性系数为0.872,相关性较大,二者能够互相反映彼此的水平;硬度与可滴定酸的相关性系数为0.580,相关性较大,在美八苹果的相关研究中二者可互相反映;可溶性固形物含量与含水量的相关性系数为-0.684,相关性比较大,且可溶性固形物含量比含水量更具有统计意义,在一些必要的简化统计数据研究时,可以使用可溶性固形物含量来反映含水量。

表1 相关矩阵的特征值、方差贡献率及累计方差贡献率Table1 Eigenvalues,variance contribution andcumulative variance contribution of the correlation matrix

由于各个主成分中所包含的主要影响指标不同,那么以果实的各个主成分得分为目标进行聚类就可以筛选出某些特征比较明显的样本。根据不同的加工要求挑选出对应品种后,可以再利用相应的主成分聚类,进行二次挑选。主成分聚类能够进一步的实现品种内的筛选,使得筛选更加细致化,挑出的原料也更加的符合要求。

表3 鲜果13项指标的相关矩阵Table3 Correlation matrix of 13 indices of fresh apple quality

注:成分从1至13分别代表的是:单果重、果型指数、L、a、b、硬度、可溶性固形物含量、总糖、维生素C含量、可滴定酸含量、含水量、糖酸比、固酸比;指标间相关性:*在0.05水平(双侧)上显著相关;**在0.01水平(双侧)上显著相关。

表4 保留7项主成分因子对应的载荷矩阵Table4 Load matrix with keeping 7 principal component factors

2.1.3 各项主成分得分的计算 利用SPSS软件,采用主成分分析法得出13项指标在各个主成分因子中的载荷如表4所示,按照1.2.3中主成分得分计算公式得出各个主成分因子得分公式如下:

FnⅠ=-0.018Yn1+0.142Yn2+0.159Yn3-0.144Yn4+0.128Yn5+0.183Yn6+0.159Yn7+0.092Yn8+0.060Yn9+0.192Yn10-0.165Yn11-0.134Yn12-0.126Yn13;

FnⅡ=0.152Yn1+0.074Yn2+0.170Yn3-0.153Yn4+0.220Yn5-0.073Yn6+0.040Yn7+0.094Yn8+0.200Yn9-0.190Yn10-0.022Yn11+0.254Yn12+0.252Yn13;

FnⅢ=0.101Yn1+0.262Yn2-0.313Yn3+0.327Yn4-0.196Yn5-0.017Yn6+0.318Yn7+0.073Yn8+0.114Yn9-0.037Yn10-0.361Yn11+0.050Yn12+0.160Yn13;

FnⅣ=0.673Yn1+0.178Yn2+0.033Yn3+0.056Yn4+0.094Yn5-0.281Yn6-0.001Yn7-0.407Yn8+0.159Yn9+0.038Yn10+0.131Yn11-0.348Yn12-0.194Yn13;

FnⅤ=0.306Yn1-0.276Yn2-0.171Yn3+0.154Yn4+0.116Yn5-0.190Yn6-0.210Yn7+0.705Yn8+0.138Yn9+0.214Yn10-0.024Yn11+0.065Yn12-0.299Yn13;

FnⅥ=0.442Yn1+0.465Yn2+0.013Yn3-0.163Yn4-0.140Yn5+0.216Yn6-0.110Yn7+0.268Yn8-0.841Yn9-0.091Yn10+0.106Yn11+0.177Yn12+0.023Yn13;

FnⅦ=-0.029Yn1+0.545Yn2-0.091Yn3+0.159Yn4-0.206Yn5+0.617Yn6-0.716Yn7+0.001Yn8+0.596Yn9-0.098Yn10+0.207Yn11+0.114Yn12-0.155Yn13。

注:FnⅠ、FnⅡ、FnⅢ、FnⅣ、FnⅤ、FnⅥ、FnⅦ分别代表第n个苹果的第Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ、Ⅵ、Ⅶ主成分因子的得分。

利用Excel工具,根据上述主成分得分计算公式分别算出每个样本的各项主成分的得分,为综合得分的计算提供数据支持。

2.2 美八果实品质的综合评价及分类

2.2.1 各个美八果实综合得分的计算 根据1.2.4中综合得分计算公式并结合表1中各项主成分的方差贡献率,得出综合得分计算模型如下,最终利用Excel软件的计算功能得出120个苹果的具体得分,由于篇幅限制不再一一列出。

Wn=0.305FnⅠ+0.220FnⅡ+0.128FnⅢ+0.081FnⅣ+0.079FnⅤ+0.057FnⅥ+0.045FnⅦ

注:式中FnⅠ、FnⅡ、FnⅢ、FnⅣ、FnⅤ、FnⅥ、FnⅦ分别代表第n个苹果的第Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ、Ⅵ、Ⅶ主成分因子的得分。

2.2.2 美八果实的分级 本文将美八苹果品质分为优、良、一般、差、很差五个类别,通过综合得分计算公式计算出120个鲜果的综合得分,用SPSS 19.0软件中的K-均值聚类进行分类,即得出结果,见表5:

表5 最终聚类中心Table5 Final cluster centers

表6 每个聚类中的案例Table6 Number of cases in each cluster

故最终聚类中心得分值大小顺序为聚类2>聚类5>聚类4>聚类1>聚类3,说明聚类2的鲜果品质最好,聚类3的鲜果品质最差。由此可知120个鲜果中品质优、良、一般、差、很差分别有5、23、40、34、18个。

3 结论

通过主成分分析得出美八鲜果综合评价的7项主成分因子累计方差贡献率达91.490%,代表了样本原始理化品质的大部分信息。13项指标在各个主成分中所占的负荷均不相同。以各项主成分的方差贡献率为权重得出的各个鲜果的综合得分,采用聚类分析将其划分为五大类:最差的为聚类3,占15.00%;较差的为聚类1,占28.33%;中等的为聚类4,占33.33%;较好的为聚类5,占19.17%;最好的聚类2,占4.17%。

实验创新之处在于运用主成分分析法,将评价果品理化品质的13项原始指标综合为7项主成分因子,以各项主成分因子的方差贡献率代替人为赋值作为权重,将主观描述和模糊评分转化为数学运算对果品品质进行综合评价和分类。实验最终建立一个多指标的综合评价及分级模型,为美八苹果理化品质的研究和等级划分提供了一种科学、客观、可行的途径。对于新鲜果品的分类销售也具有一定的经济意义,对提高苹果出口竞争力具有很大的现实意义,同时该模型的建立为其他食品的理化品质综合评价及分级模型的建立提供参考。

[1]翟衡,史大川,束怀瑞. 我国苹果产业发展现状与趋势[J]. 果树学报,2007,24(3):355-360.

[2]王海波,李林光,陈学森等. 中早熟苹果品种果实的风味物质和风味品质[J]. 中国农业科学,2010,43(1):2300-2306.

[3]白沙沙,毕金峰,王沛,等. 基于主成分分析的苹果品质综合评价研究[J]. 食品科技,2012,37(1):54-57.

[4]聂继云,李志霞,李海飞,等. 苹果理化品质评价指标研究[J]. 中国农业科学,2012,45(14):2895-2903.

[5]徐吉花,赵政阳,王雷存,等. 苹果果实品质评价因子的选择研究[J]. 干旱地区农业研究,2011,29(6):269-274.

[6]董月菊,张玉刚,梁美霞,等. 苹果果实品质主要评价指标的选择[J]. 华北农学报,2011,26(增刊):74-79.

[7]Fernando Mendoza,Lu Renfu,Cen Haiyan.Grading of apples based on firmness and soluble solids content using Vis/SWNIR spectroscopy and spectral scattering techniques[J].Journal of Food Engineering,2014,(125):59-68.

[8]Roger Harker F,Eugene M Kupferman,Marin B Anna. Eating quality standards for apples based onconsumer preferences[J]. Postharvest Biology and Technology,2008,50:70-78.

[9]Hoehn E,Gasser F,Guggenbühl B,et al. Efficacy of instrumental measurements for determination of minimum requirements of firmness,soluble solids,and acidity of several apple varieties in comparison to consumer expectations[J]. Postharvest Biology and Technology,2007,(27):27-37.

[10]LI Xiaofeng,ZHU Weixing. Apple Grading Method Based on Features Fusion of Size,Shape and Colour[J]. Procedia Engineering,2011,15:2885-2891.

[12]张海英,韩涛,王有年,等. 桃果实品质评价因子的选择[J]. 农业工程学报,2006,22(8):235-239.

[13]李梦琴,张剑,崔惠霞,等. 主成分分析法在面条品质研究中的应用[J]. 河南农业大学学报,2008,24(2):95-99.

[14]公丽艳,孟宪军,刘乃倩,等. 基于主成分与聚类分析的苹果加工品质评价[J]. 农 业 工 程 学 报,2014,30(13):276-285.

[15]叶协锋,魏跃伟,杨宇熙,等. 基于主成分分析和聚类分析的烤烟质量评价模型构建[J]. 农业系统科学与综合研究,2009,25(3):268-276.

[16]张瑞莲,袁海波,尹军峰,等. 主成分分析与聚类分析在茶饮料 汤色稳定性评价中的应用[J]. 茶叶科学,2010,30(4):287-294.

[17]裴鑫德. 多元统计分析及其应用[M]. 北京:农业大学出版,1991:89-203.

Establishing comprehensive evalution system of American No.8 fresh apples based on principal component analysis

MENG Yong-hong,ZHANG Ying,WANG Xiao-pei,WEI Li-na,MA Yu-juan,DENG Hong,GUO Yu-rong

(College of Food Engineering and Nutritional Science,Shaanxi Normal University,Xi’an 710119,China)

Five levels apples were classified by the comprehensive evalution indices of American No.8 fresh apples based on principal component analysis method. In this experiment,thirteen kinds of quality indices of 120 American No.8 fresh apples were determined by using conventional method,and the achieved indices were analyzed by using SPSS 19.0 software which aimed to select principal component factors. The results demonstrated that the former seven principal component factors could reflect the most information of original samples,whose cumulative contribution of variance accounted to 91.490%. The integrated scores were obtained through the former seven principal component values based on the important calculation of the principal component contribution proportion. Then fresh apples were classified into several levels by k-means clustering analysis based on each principal component factor scores and comprehensive scores of fresh apples,and the proportion of each level was 15.00%,28.33%,33.33%,19.17%,4.17%. The comprehensive evaluation and classification model which was established can provide scientific basis for comprehensive quality evaluation and classifying of American No.8 fresh apples.

apple;principal component analysis;k-means clustering analysis;comprehensive evalution system

2014-07-23

孟永宏(1975-),男,博士,副教授,研究方向:果蔬加工。

陕西科技统筹计划项目(2011KTCQ02-03),中国农业研究体系(CA-28)。

TS255.7

A

:1002-0306(2015)09-0296-05

10.13386/j.issn1002-0306.2015.09.056

猜你喜欢

鲜果聚类苹果
基于区块链技术在鲜果与健康领域结合的应用探究
基于K-means聚类的车-地无线通信场强研究
鲜果出远门得用新招儿
基于高斯混合聚类的阵列干涉SAR三维成像
收获苹果
拿苹果
以“互联网+”助推丹东鲜果产业发展
会说话的苹果
一种层次初始的聚类个数自适应的聚类方法研究
南疆4个红枣品种鲜果品质特性分析