APP下载

基于聚核模糊分类的多指标水蜜桃成熟度判别

2021-05-21江亿平卞贝张兆同潘磊庆汪小旵

食品与发酵工业 2021年9期
关键词:糖度水蜜桃成熟度

江亿平,卞贝,张兆同,潘磊庆,汪小旵

1(南京农业大学 信息管理学院,江苏 南京,210095)2(南京农业大学 食品科学技术学院,江苏 南京,210095)3(南京农业大学 工学院,江苏 南京,210031)

我国是水蜜桃生产大国,种植面积和产量均为世界第一[1]。水蜜桃属于呼吸跃变型果实,集中在高温多雨的夏季成熟上市,采后迅速后熟软化、腐烂变质,损耗率高达25%~50%[2],严重影响其食用和商业价值。确定最佳采收时期、选择合适的加工技术成为延长水蜜桃货架期、提高产品附加值的重要途径。然而,考虑到不同成熟阶段的水蜜桃质地、口感差异较大,所适合的产品类型和加工工艺也相应有所不同[3]。因此,设计精准高效的水蜜桃成熟度判别方法应用于生产加工预处理阶段,对确定加工工艺,保障加工产品品质具有重要意义。

水蜜桃采后成熟是一个受多因素影响,连续且复杂的过程。一方面,水蜜桃后熟期较短,轻微机械损伤会加速部分理化特征变化速率,导致果实内部已经软化褐变,而表皮颜色变化较小或几乎无变化[4]。另一方面,水蜜桃成熟是个模糊信息,成熟指标和成熟等级之间的映射关系是区间对区间[5-6],无法划分各成熟阶段的清晰界限。相较于后熟周期较长且表皮特征明显的鲜果,水蜜桃成熟度判别的模糊性和不确定性更为突出,不仅要选择全面的成熟度评价指标,更要解决成熟阶段间的模糊划分。

目前,有关鲜果成熟度判别的研究大多利用图像技术[7-8]或高光谱技术[9-10],提取果实成熟过程中表皮颜色、纹理等特征,通过样本数据建立严格的成熟等级阈值参数,训练得出特征指标和成熟度严格值映射的分类模型[11-12]。考虑到水蜜桃成熟度无法完全由外部特征(如形状、颜色)决定,监测果实成熟过程中重要物质的变化趋势[13-14],如可溶性固形物[15]、硬度[16]、失重率[17]等,成为评价水蜜桃品质和货架期的重要手段。现有依靠表皮特征或单一指标的研究方案,忽视了与成熟状态最相关的内部理化指标,给成熟度判别带来较大的局限性;同时,未考虑成熟阶段间的模糊性,利用严格值映射建立的分类模型不仅容易导致成熟度判别结果的不可靠,也会造成指标信息和成熟度之间过拟合,带来样本不可分类性[18]。

本研究以“阳山蜜露”水蜜桃作为试验对象,拟选择多个成熟相关指标建立多维指标数据集,引入模糊区间重叠度调整隶属度函数参数,建立半梯半岭型隶属度模型,并结合熵值法和聚核权,建立基于聚核模糊分类(fuzzy classification with kernel clustering,FCKC)多维指标水蜜桃成熟度判别模型,实现水蜜桃成熟度准确判别,旨在为水蜜桃食品加工提供成熟度判别的科学方法。

1 材料与方法

1.1 试验材料

选取江苏省无锡市阳山镇“阳山蜜露”水蜜桃作为试验对象,试验于2019年7月在南京农业大学进行。按不同成熟期(表1)采摘水蜜桃样本[19],所选水蜜桃样本形状相似、大小均匀、表面圆润、无病虫害、无挤压痕迹、无机械损伤。选留120个有效样本,其中七成熟、八成熟、九成熟和十成熟的水蜜桃各30个,采后水蜜桃样本不做任何化学处理,立即进行相关指标测量。

表1 水蜜桃成熟度划分标准Table 1 Maturity division standard of peaches

1.2 水蜜桃成熟相关指标测量

1.2.1 出汁率

量取50 g水蜜桃样本果肉,以2 000 r/min的速度离心样本果肉,并以2层纱布过滤,称取过滤后果汁的质量记为m,重复3次取平均值定义为该水蜜桃样本的出汁率,按公式(1)计算:

(1)

1.2.2 糖度

采用WYT型系列手持糖度计测量。用滴管吸取出汁率实验中的过滤液作为测量对象,每个水蜜桃样本重复实验3次,取平均值定义为该样本糖度。

1.2.3 硬度

硬度是与水蜜桃耐储运能力最相关的指标,通常定义为使果实发生定量形变所需要最大的力[20]。采用美国FTC TMS-Pro专业食品物性质构分析仪,选用圆柱形探针来测量水蜜桃的硬度,设置传感器为400 N,位移为0 mm,触发力为0.2 N,检测速度为5 mm/min,形变量为20%。考虑到水蜜桃体积较大,在果实缝合线两侧各测量1次,取两侧平均值作为该水蜜桃样本的硬度值。

1.2.4 失重率

称重测量[21]。称量实验组水蜜桃样本原始质量m0,并分别在贮藏后连续称重第i天的果实质量mi,按公式(2)计算失重率(ω):

(2)

1.3 水蜜桃成熟度判别方法

将水蜜桃样本数据分为训练集和测试集:训练集由60%的水蜜桃样本提供数据,各成熟阶段选择特征较明显且果实表面大致相同的18个有效样本;测试集由40%的水蜜桃样本提供数据,各阶段选择余下的12个有效样本。基于训练集数据建立FCKC模型来判别水蜜桃成熟度(图1)。首先根据模糊区域重叠度,设计水蜜桃成熟指标隶属度函数参数调整规则。然后,通过分析训练集隶属度离散程度,建立成熟指标权重集。再根据相邻成熟等级的模糊性,提出基于聚核权的去模糊化规则,计算调整后的隶属度向量。最后输入测试集样本数据,输出水蜜桃成熟度判别结果。

图1 基于FCKC的多维指标水蜜桃成熟度判别方法Fig.1 Peach maturity discrimination method with multi-dimensional indexes based on FCKC

1.3.1 考虑重叠度的成熟指标隶属度函数建立

偏小型半梯半岭分布函数:

(3)

中间型半梯半岭分布函数:

(4)

偏大型半梯半岭分布函数:

(5)

根据训练集数据分布,确定单个指标论域范围,引入成熟指标的初始模糊区域间隔:

(6)

式中:xmin为该指标测量最小值,xmax为该指标测量最大值;N为训练集样本量;γ为间隔数量调整参数。

(7)

(1)情况1:Lap(MSk,MSk+1)=0

若MSk和MSk+1模糊区域间不存在相同的成熟度等级,则保持MSk和MSk+1的初始边缘属性参数。

(2)情况2:Lap(MSk,MSk+1)=ϑ

若MSk和MSk+1模糊区域存在部分重叠的成熟度等级,则根据重叠度来调整MSk和MSk+1的初始边缘属性参数,计算公式如(8)(9):

(8)

(9)

(3)情况3:Lap(MSk,MSk+1)=1

1.3.2 基于熵值法的水蜜桃成熟多指标权重集

考虑到不同指标提供成熟度信息的差别,利用熵值来测量各指标的信息量,同时确定多指标权重集[23-24]。

(10)

然后,对隶属度矩阵Mi进行归一化处理:

(11)

再计算各水蜜桃成熟指标的信息熵Eindex和各成熟指标权重:

(12)

(13)

(14)

Bi=[EW1×FS1,EW2×FS2,…,EWk×FSk]=

(15)

1.3.3 基于聚核权的去模糊化规则

(16)

步骤3:确定阈值θ;

2 结果与分析

2.1 水蜜桃成熟指标分析

水蜜桃成熟指标的分布情况可以描述不同阶段的果实生长差异、平均值和标准差描述成熟指标随时间的变化趋势[26],变异系数解释各成熟阶段数据的相似性和差异性[27],所有实验和统计分析均在MATLAB 2017a和SPSS 22.0上进行,显著性水平设为0.05。

如表2所示,出汁率和糖度指标在各成熟阶段变化幅度较小,相邻成熟阶段之间数据范围重叠较多,且变异系数较小,分别为7.24%和11.61%,各阶段差异性较小。出汁率和糖度指标区间界限不清晰,仅根据这2个指标来细化4个成熟度,容易带来较多噪声和较大难度。而硬度和失重率指标在水蜜桃成熟过程中变化幅度较大,相邻成熟阶段间数据几乎无重叠,且变异系数分别为39.22%和41.20%,远大于出汁率和糖度。

表2 水蜜桃各成熟阶段指标数据分析Table 2 Data analysis of indexes of peaches at each maturity stage

2.2 基于FCKC的多维指标水蜜桃成熟度判别模型

为了进一步确定隶属度函数,利用模糊统计法研究水蜜桃成熟指标各阶段的频率分布。以出汁率为例,选取中间型成熟阶段(八、九成熟),根据训练集数据绘制频率分布直方图。如图2所示,对于八、九成熟水蜜桃出汁率而言,论域两端样本较少,而论域中间区域样本较多且集中,呈现越靠近中间区域样本

a-八成熟;b-九成熟图2 水蜜桃出汁率指标中间型阶段频率分布Fig.2 Frequency distribution of peach juice yield index at intermediate stages

数增长越快的趋势。因此,选择半梯半岭型分布隶属度函数来描述水蜜桃成熟指标分布,更符合水蜜桃生长特征。

表3 出汁率指标隶属度函数参数调整Table 3 Parameter adjustment of membership functions of juicy peach fruit yield index

表4 水蜜桃成熟指标隶属度函数属性参数Table 4 Attribute parameters of membership functions of peach maturity indices

a-出汁率;b-糖度;c-硬度;d-失重率图3 水蜜桃各成熟指标隶属度函数表示Fig.3 Membership functions of each peach maturity index

2.3 水蜜桃成熟度判别模型结果分析

将测试集48个水蜜桃样本用于成熟度模型的正确率检验,训练结果如表5所示,基于FCKC模型的水蜜桃成熟度判别模型整体正确率为93.75%。在七成熟阶段,由于果实相对偏硬,且口感欠佳,糖度指标较低,阶段特征较明显,因此该阶段模型判断正确率较高。在八、九成熟阶段,果实处于呼吸跃变阶段,呼吸速率增长较快且易达到高峰,受环境和果实生物特征的影响,不同果实之间指标变化速率不一致,给模型判别带来难度。而对于十成熟阶段,其硬度降到最低,且果实含水率达到顶峰,给水蜜桃成熟度识别提供了较强依据。

表5 水蜜桃成熟度FCKC判别模型正确率Table 5 Accuracies of peach maturity FCKC discrimination model

2.4 基于FCKC的水蜜桃成熟度判别模型评价与验证

为了分析聚核权去模糊化规则的判别性能,选择常见的三角分布、梯形分布隶属度函数,分别与最大隶属度法、聚核权模糊化规则相组合进行对比。保持输入的训练集和测试集样本数据不变,选择半梯半岭分布隶属度函数边缘属性参数和训练集样本平均值,定义其为三角分布隶属度函数属性参数,梯形分布隶属度函数属性参数与表4参数保持一致,建立相对应的水蜜桃成熟度分类模型。

表6 不同水蜜桃成熟度判别模型对比Table 6 Comparison of different peach maturity discrimination models

表6所示,对比三角分布和梯形分布隶属度函数,采用平滑且具有区间性的半梯半岭分布隶属度函数能够提高水蜜桃成熟度判别正确率2.08%~12.50%。对比常见的最大隶属度法,采用聚核权规则能够减少相邻成熟阶段之前的混淆信息,平均提高各成熟阶段判别正确率9.91%。举例而言,当输入某七成熟的水蜜桃样本指标值:出汁率74.86%,糖度8.16%,硬度24.70N,失重率4.45%,计算得出原始隶属度向量组B=[0.57,0.64,0.31,0.04],若根据最大隶属度法,输出该水蜜桃样本为八成熟。根据聚核权规则,由于p′-p″<0.1,引入聚核权向量,调整后隶属度向量组B1=[0.49,0.44,0.37,0.29],则正确输出该水蜜桃样本为七成熟。此外,对水蜜桃不同成熟阶段而言,七成熟和十成熟判别准确率较高。成熟等级较低的水蜜桃,根据其隶属度可以较为容易的判别为七成熟;而一些成熟等级较高的水蜜桃,较大的果实生理指标变化能够提高该阶段的判别准确率。因此,FCKC模型更好地考虑了水蜜桃成熟度的模糊性和不确定性,更符合其生长成熟趋势。

为了对比FCKC模型与其他常见分类器的判别效果,选择广义神经网络(GRNN)和多分类支持向量机(MSVM)[28],固定训练集和测试集样本数据,设置最优参数获取最佳判别结果,如表7所示。MSVM模型正确判别了44个水蜜桃样本(七成熟样本11个,八成熟样本10个,九成熟样本11个,十成熟样本12个);GRNN模型正确判别了42个水蜜桃样本(七成熟样本10个,八成熟样本10个,九成熟样本10个,十成熟样本12个)。模型各阶段判别正确率如图4所示,MSVM和GRNN对水蜜桃成熟度判别整体正确率分别为91.67%和87.50%,基本实现水蜜桃成熟度的判断,但正确率略低于FCKC方法。尤其是对于八成熟和九成熟的水蜜桃而言,传统的分类方法因其成熟度界限量化的明确性,出现模糊区间信息时,误判的可能性会增大。考虑到成熟阶段间模糊信息较多,利用FCKC方法能够提供更科学合理、包容性更强的判断依据,对水蜜桃等模糊成熟度判别更有效。

表7 水蜜桃成熟度MSVM和GRNN模型判别结果Table 7 Peach maturity discrimination results of MSVM and GRNN models

图4 FCKC模型与常见分类器判别方法正确率对比Fig.4 Comparisons of discrimination accuracy between FCKC model and classifiers

3 结论

本研究以提高水蜜桃成熟度判别精度为目的,选择与水蜜桃成熟相关的出汁率、糖度、硬度和失重率指标构建多维指标数据集,建立基于FCKC的水蜜桃成熟度判别方法。该方法能够融合评价水蜜桃成熟等级的多个指标信息,考虑了成熟度的模糊性和区间性,极大程度减少指标数据映射成熟度过程的不确定性和相邻成熟阶段的混淆性,判别正确率达到93.75%。结果发现,影响水蜜桃成熟的指标综合权重由大到小依次为糖度、出汁率、硬度和失重率。此外,对比传统的三角分布隶属度函数和最大隶属度去模糊化规则,所提的FCKC模型提高了测试集正确率2.08%~12.50%;对比GRNN和MSVM分类器,FCKC模型能够提高各成熟阶段的判别精度,证明了本研究提出的水蜜桃成熟度判别方法有效性,能够更精确地识别水蜜桃成熟状态,为水蜜桃食品加工提供科学精准的品质划分依据。

本研究围绕水蜜桃成熟度识别做了初步探索,未来仍有改进空间和更多应用场景。一方面,考虑到水蜜桃品种差异,通过增加成熟评价指标,设计符合多品种的模糊分类方法,提高判别模型的精确度和普适性。另一方面,结合水蜜桃成熟度判别方法,区分出不同成熟状态的水蜜桃,匹配最佳的储运条件;同时,根据成熟度变化规律,提前制定科学的定价和销售策略,以降低水蜜桃腐烂滞销的风险,提高水蜜桃产业的经济效益。

猜你喜欢

糖度水蜜桃成熟度
‘蜜红’‘白玉龙’火龙果果实糖度分布规律分析
糖度高、类型多、瓜味足 “炫彩”系列小西瓜 亩产值3.5万元
七彩夏令营“恋”上水蜜桃
聪聪吃水蜜桃
产品制造成熟度在型号批生产风险管理中的应用
整机产品成熟度模型研究与建立
芳香甜美的水蜜桃儿
水蜜桃价格下跌 后期恐难以走高
不同成熟度野生水茄果实的种子萌发差异研究
刚好够吃6天的香蕉