APP下载

基于外部特征及子带谱质心法的西瓜糖度检测

2018-10-10为李臻峰宋飞虎李静朱冠宇

食品与机械 2018年8期
关键词:子带糖度质心

庄 为李臻峰宋飞虎李 静朱冠宇

(1. 江南大学机械工程学院,江苏 无锡 214122;2. 江苏省食品先进制造装备技术重点实验室,江苏 无锡 214122)

研究和利用农产品的声学特性检测农产品品质一直受到重视[1]。声学检测法不易受干扰,设备成本低廉、可在野外等各种环境中工作,且易实现智能化,应用前景广阔[2]。目前对西瓜的敲击声学特性已有大量的研究,证实了通过敲击声学判断西瓜成熟度的可行性,但因设备比较昂贵,不易操作,体积较大,而不能普及[3]。

Abbasadeh等[4]利用激光多普勒测振仪检测西瓜的成熟度;Mao等[5]利用麦克风、数据采集卡(DAQ卡)等设备组成声学装置检测西瓜的成熟度;Taniwaki等[6-7]利用激光多普勒测振仪检测西瓜,利用第二共振频率f2研究西瓜的成熟度;陆勇等[8]利用NI采集卡、加速度传感器、适调仪等设备搭建声学振动检测平台,建立第一响应基频频率和贮藏时间的模型;高宗梅[9]11-17利用激光多普勒测振系统检测西瓜,提取3个共振峰频率和幅值为特征参数。目前,通常使用共振峰位置[8]、声透过率[1]、共振峰高度[9]16等作为声学振动检测的特征值,但准确获得这些参数,需要性能较好的硬件以及良好的检测条件,从而提高了成本,并且应用场合受到限制。

为了减少成本以及降低对应用场合的依赖性,不仅要简化硬件,而且要选用对硬件以及检测条件依赖较小的特征参数。因此,利用自行开发的便携式振动检测系统对某品种西瓜进行检测,对时间信号进行小波阈值去噪后,提取子带频谱质心作为特征值,提出横径的平方与纵径乘积作为体积参数,同时研究质量、激励力度和体积参数对子带频谱质心频率点的影响,利用逐步多元线性回归分析和曲面建模,建立糖度检测模型。

1 材料和方法

1.1 试验样本及其处理

西瓜:早佳8424,成熟度为8~10,样本的数目为61个(校正集51个和预测集10个),2017年7月采摘于无锡市某大棚,确保西瓜没有空心且无损伤。选定西瓜样本后,对西瓜进行清洗,自然晾干。西瓜外观基本参数见表1。试验在实验室内完成,控制室内的相对湿度为60%,温度设置为25 ℃。

表1 西瓜外观基本参数Table 1 The basic parameters of watermelon appearance

1.2 试验设备

加速度传感器:352C68型,美国PCB公司;

数字手持折射仪:PAL-1型,日本爱拓公司。

1.3 试验方法

1.3.1 试验系统搭建及手拍击测试 系统由加速度传感器(型号352C68,灵敏度为100 V/g,谐振频率≥35 kHz)、小型电子耳、计算机和工作台组成(图1)。工作台材料为硬质海绵。小型电子耳是自主研发的STM32数据采集及处理系统。西瓜置于工作台上,使瓜脐和瓜蒂方向处于水平,由于在瓜脐位置检测、瓜蒂位置拍击时子带频谱质心频率点能够更好地描述糖度[10],加速度传感器通过蜂蜡[10]贴于瓜脐部位,手拍击瓜蒂部位,振动信号通过传感器,经小型电子耳传送给电脑。小型电子耳的程序通过keil5编写,可以控制采集过程和数据处理以及结果显示。

1.3.2 研究敲击力度对子带频谱质心影响 本研究分析不同敲击力度对子带频谱质心的影响,手拍击的情况下不能精确控制拍击力度的大小,因此,试验时在上述试验系统基础上设置小球摆动装置以及刻度板。如图2所示,将木质小球分别从30°,45°,60°的位置释放,小球敲击西瓜瓜蒂位置,控制其它因素相同,以此模拟不同力度的敲击。

图1 西瓜敲击振动检测系统图Figure 1 Vibration testing system for watermelon

图2 不同敲击力度振动检测系统图Figure 2 The diagram of different tap strength vibration testing system

1.3.3 糖度测量 将西瓜沿着瓜蒂和瓜脐对半切开,取西瓜的不同部位(瓜脐,瓜蒂,中心)瓜瓤榨汁,利用PAL-1型数字手持折射仪测量,每次测量前须清洗清零。每个西瓜样本取3次进行测量,然后取平均值。

1.4 数据处理

1.4.1 时间信号的小波阈值去噪 小波分析具有优良的时频分析能力,因此被广泛应用于非平稳信号处理及特征提取[11]。采用小波阈值法去噪,通过Matlab R2015a编写处理程序,首先对信号进行正交小波变换,然后设一阈值,保留大于阈值的小波系数,将小于阈值的小波系数进行削弱。最后,将阈值处理后的小波系数进行重构,从而得出信号。

1.4.2 子带频谱质心特征 在语音识别系统中,常用子带频谱质心法对特征值进行提取。子带频谱质心的提取按式(1)实现。

(1)

式中:

C——质心在频率轴上的位置;

fc——子带中心频率,Hz;

Δf——半子带宽度,Hz;

w(f)——各子带滤波器组,全取0或全取1;

A(f)——频率点f处的能量密度,即频率点f处的幅值。

对于每一个子带来说,用fc表示该子带的中心频率,半子带宽度Δf则表示子带的边界到子带中心频率的距离。fc+Δf、fc-Δf为子带的上限频率和下限频率。语音信号是一种非平稳的时变信号,通常采用一个长度有限的窗函数来截取语音信号形成语音帧,因此需要利用子带滤波器组w(f)。

2 结果与分析

2.1 小波阈值去噪对振动信号及特征值提取的影响及最优子带频谱质心的提取

图3(a)信号中包含大量随机干扰信号,图3(b)是滤波后的信号图,通过小波阀值去噪,信号变得更加平滑。时间信号经去噪后进行FFT,利用MATLAB编写程序提取最优的子带频谱质心。由于拍击力量不能准确控制,人为因素对质心高度影响较大,因此,研究子带频谱质心的水平位置(频率点)与糖度的关系。

为了找到最优的子带频谱质心,以步长4.88 Hz将样本的频谱在0~1 220.7 Hz内分成15 750个子带,由于校正集有51个样本,所以采集51组数据,共有51组子带。将每组相同位置的子带频谱质心频率点与糖度建立线性回归模型,然后根据确定系数的大小确定最优子带,将最优子带代入式(1) 计算得出最优子带频谱质心频率点。

图4为滤波前后最优子带频谱质心提取分析图,用确定系数表示色轴强度,根据颜色的分布,可以清晰地看出各子带频谱质心频率点与糖度的相关性,白色部分表示的相关性较低,红色部分表示相关性较高。由图4(a)可知,当子带中心频率为551.44 Hz、半子带宽度为190.24 Hz时,确定系数R2最高,为0.800 1,其附近区域的颜色为红色和黄色,确定系数较高;由图4(b)可知,滤波后最优子带的位置不变,确定系数达到0.832 1,红色区域颜色加深并且面积扩大。可见小波阈值去噪法有效地对信号进行了降噪。选取子带中心频率为551.44 Hz、半子带宽度为190.24 Hz的子带为最优子带,选取该子带的频谱质心为最优子带频谱质心,建立该子带的频谱质心频率点与糖度的模型。

2.2 质量对子带频谱质心频率点的影响

Mao等[5]研究发现西瓜的声学特征受西瓜质量的影响很大,其共振频率与西瓜质量呈负相关。因此,本研究有必要研究西瓜质量是否对子带频谱质心频率点有影响。

图3 滤波前后加速度冲击响应信号

图3 Acceleration shock response acceleration signals filtering before and after the shock response signal filtering signal

图4 滤波前后最优子带频谱质心提取分析图

图4 The analysis diagram of the optimal sub-band spectrum centroid extraction before and after filtering

根据西瓜的质量将其划分为四类,1、2、3和4分别表示质量范围是2 500~3 500,3 500~4 500,4 500~5 500,5 500~6 500 g 的西瓜,各类西瓜样本个数分别为23,10,9,9。从图5(a)看出,对四类西瓜分别进行线性回归分析,各类西瓜的确定系数有提高,甚至2、3和4类的确定系数大于0.9。可见,质量对质心频率点及建模有一定的影响。王书茂等[12]研究发现西瓜的第1阶固有频率与含糖量有较好的关系。因此为了进一步分析质心频率点与质量关系时,需要考虑糖度的影响。分析发现当糖度<6.9%时,频率点集中分布在530 Hz以上,均值达到530 Hz,糖度介于6.9%~7.6%时,频率点集中分布在500~525 Hz,均值达到520 Hz,当糖度>7.6%时,频率点集中分布在500 Hz以下,可见以糖度6.9%和7.6%为界可以明显地分开频率点。同理,根据频率点的差异,发现以糖度6.9%,7.6%,8.3%,9.0%,9.7%,10.4% 作为分类界限的效果较好。根据西瓜的糖度将其划分为7类,分别为1、2、3、4、5、6和7表示糖度范围为6.2%~6.9%,6.9%~7.6%,7.6%~8.3%,8.3%~9.0%,9.0%~9.7%,9.7%~10.4%,10.4%~11.1%的西瓜。如图5(b)所示,分别对各类西瓜的频率点进行线性回归分析,各线性模型的斜率相近,在同一糖度范围内,西瓜的质量与频率点呈负相关,与Mao等[5]的结论相似。

2.3 横、纵径对子带频谱质心的影响

西瓜可以简化为多层球状弹性体[12]。球体的固有频率与其材料的密度、几何尺寸和弹性模量等因素有关[12]。可见,通过子带频谱质心建模时,有必要研究西瓜几何尺寸是否对子带频谱质心频率点有影响。实际应用中,测量西瓜的体积比测量横、纵径复杂,如果用体积作为变量会大大增加系统的复杂度,不利于工程应用,球体的体积正比于半径的三次方,因此提出横径的平方与纵径乘积d12作为体积指标来研究横、纵径对子带频谱质心的影响。

图5 质量与子带频谱质心频率点关系图Figure 5 The diagram of mass and sub-band spectrum centroids frequency point

图6(a)为d12与子带频谱质心频率点关系图,随着d12的增大,频率点有下降的趋势,西瓜的d12与频率点呈负相关,但是d12与频率点的相关性较低。根据西瓜的体积参数将其划分为四类,分别为1、2、3和4表示体积参数范围为5 000~7 000,7 000~9 000,9 000~11 000,11 000~13 000 cm3的西瓜。如图6(b)所示,分别对各类西瓜的频率点进行线性回归分析,1、2、3类的确定系数减小,可见,虽然整体上d12与频率点呈负相关,但将d12作为因素分析糖度建模的效果不佳。

2.4 拍击力度对子带频谱质心的影响

如图7所示,对比锤头分别从30°,45°,60°激励西瓜的振动频谱,以子带中心频率为551.44 Hz、半子带宽度为190.24 Hz的子带为例,提取并用点标出各组曲线在该子带处的频谱质心。可见,力度越大,曲线的幅值越大,子带频谱质心的高度变化较大,但是子带频谱质心频率点的变化很小,几乎不变。按照弹性体振动理论,由冲击造成的振动响应的频率是弹性体的固有频率[12],力的大小影响振动的幅度,而振动频率与激振力无关。因此,子带频谱质心频率点对拍击力度的依赖性较小。

图6 所有西瓜样本的d12与子带频谱质心频率点关系图

图6 The diagram of thed12of all watermelon samples and sub-band spectrum centroids frequency point

图7 拍击力度对子带频谱质心的影响Figure 7 The analysis diagram of the influence of different strength on sub-band spectrum centroid

2.5 利用子带频谱质心频率点建立模型

同一尺度下,共振峰位置主要受西瓜,尤其是瓜皮的弹性模量影响,而瓜瓤的性质(如糖度)更多影响了阻尼,故使用子带谱质心方法来估计西瓜的糖度要优于传统使用共振频率估计糖度的方法[10]。

2.5.1 利用逐步多元线性回归建模 建立糖度预测模型时,只利用子带频谱质心频率点作为变量不够全面,需要考虑质量、体积参数的影响。当有多个自变量时,各自变量之间可能存在相互关联,因此可以利用逐步多元线性回归分析筛选3个变量,建立效果更好的模型。

利用SPSS 21.0软件进行建模,变量逐步引入,在每一步F的概率小于设置值的自变量被引入,F的概率大于设置值的自变量被移除,当没有更多的变量被纳入或移除的时候逐步多元线性回归就结束了。为了量化模型的预测能力,得到模型的确定系数和标准估计的误差,如表2所示,只用频率点建模时,确定系数较低,标准估计的误差较大,当依次代入质量、横径的平方与纵径乘积建模时,确定系数依次升高,标准估计的误差依次降低。因此,选用模型:T=-0.000 165m-0.038C+0.000 062d12+27.205。

表2子带频谱质心频率点与物理参数建立模型的比较†

Table 2 The comparison of the model built by sub-band spectrum centroid frequency point and the physical parameters

特征模型确定系数标准估计误差C、TT=-0.041×C+28.8220.8320.531C、m、TT=-0.000 195×m-0.04×C+28.1520.8450.523C、m、d12、TT=-0.000 165×m-0.038×C+0.000 062×d12+27.2050.8470.521

†T表示样本糖度,%;C表示样本子带频谱质心频率点,Hz;m表示样本质量,g。

2.5.2 曲面建模 曲面拟合是通过试验测得的数据来求目标函数与2个变量之间的关系式,使试验测试点尽可能地分布在关系式所表示的曲面上。

通过图5(a)和6(b)可知,将质量作为因素分析糖度建模的效果较好,因此选择质量和子带频谱质心频率点作为变量对糖度进行曲面建模。选取频率点相同或相近的样本来研究质量与糖度的关系,由于频率点较离散,选取的样本数较少。如图8所示,通过多项式拟合发现,当质量维度为4时,糖度与质量的拟合关系较好。同理,分析质量相近时糖度与频率点的关系,如图9所示,糖度与频率点的线性关系和二次关系均较好。因此分别通过式(2)、(3)进行曲面拟合:

T=a+b×x+c×y+d×x×y+e×y2+f×x×y2+g×y3+h×x×y3+i×y4,

(2)

1. 频率为450~460 Hz的频率点;2. 频率为476~486 Hz的频率点

图8 频率点相同或相近时质量与糖度关系图

图8 The diagram of the quality and the sugar content of the same or similar frequency points

1. 质量为2 800~2 999 g的西瓜;2. 质量为3 050~3 370 g的西瓜;3. 质量为3 650~4 220 g的西瓜

图9 质量相同或相近时频率点与糖度关系图

图9 The diagram of the frequency points and the sugar content of the same or similar quality

T=a+b×x+c×y+d×x2+e×x×y+f×y2+g×x2×y+h×x×y2+i×y3+g×x2×y2+k×x×y3+l×y4,

(3)

式中:

x——频率点,Hz;

y——质量,g;

T——糖度,%。

利用MATLAB中的curve fitting工具箱进行建模,利用式(2)进行曲面建模的确定系数为0.878 4,标准误差为0.497 7,而利用式(3)进行曲面建模的确定系数为0.881 1,标准误差为0.480 0,因此利用式(3)进行曲面建模。图10为曲面建模分析图。

图10 曲面建模分析图Figure 10 The analysis diagram of surface modeling

2.5.3 模型的确定 将曲面建模法与逐步多元线性回归法建立的模型进行比较,曲面建模法所建模型的确定系数较大,标准误差较小,因此选用该模型作为糖度预测模型,模型如下:

T=-424.6+1.719x+0.237 6y-0.001 833x2-0.000 855 4xy-3.631×10-5y2+8.899×10-7x2y+1.005×10-7xy2+1.948×10-9y3-1.032×10-10x2y2-2.267×10-13xy3-1.024×10-13y4。

(4)

2.6 预测模型的验证及误差分析

图11为糖度预测模型的预测能力分析图,校正集样本数为51个,预测集样本数为10个,校正集样本的标准差(RMSEC)为0.101,预测集样本的标准差(RMSEP)为0.217。RMSEP略大于RMSEC,并且RMSEP和RMSEC均小于最大糖度的10%。表3为预测集样本的实际糖度值与预测糖度值的比较及误差分析结果,预测集样本平均误差为3.61%。可见,该糖度预测模型可以很好地利用216~268 Hz 的子带频谱质心频率点对8~10成熟西瓜进行糖度预测。

图11 糖度预测模型的预测能力分析图Figure 11 The prediction ability analysis diagram of the sugar content prediction model表3 预测集样本实际糖度值与预测糖度值的比较及误差分析

Table 3 The comparison and error of the actual sugar content and the predictive sugar content of the prediction set sample %

样本实际测量值模型测量值相对误差平均误差19.99.424.8127.67.323.66310.39.814.67410.610.872.5959.79.952.64610.410.122.6978.18.423.9689.49.132.82910.210.573.69109.89.344.593.61

课题组前期利用信号调理仪、数据采集卡、加速度传感器等仪器搭建系统检测西瓜糖度,主要利用共振峰作为特征参数,也有研究[10]尝试利用子带频谱质心作为特征参数,但是没有考虑到外部特征的影响,建模方法较简单,相关性较低,并且系统较为复杂,不易携带,检测时易对西瓜表面造成损伤。目前,大多数研究利用较复杂的设备检测西瓜糖度,比如激光多普勒测振系统[9]11、利用数据采集卡等设备搭建的振动检测系统[8],但是得到的糖度预测模型的预测效果较差,虽然模型的相关系数能够达到0.8[1],但是校正均方根误差和预测均方根误差较大,甚至均达到1.5[9]41,而本研究所得到模型的确定系数为0.881 1,校正均方根误差和预测均方根误差均不超过0.3。因此,利用小型电子耳系统检测西瓜糖度,将外部特征与子带频谱质心频率点结合,不仅优于传统的检测方法,而且更具有实际意义。

3 结论

本研究利用自行开发的便携式声学振动检测系统基于外部特征及子带频谱质心对西瓜糖度进行检测,以早佳8424西瓜品种为研究对象,通过手拍击方式激励西瓜。对时间信号进行小波阈值去噪后,提取了振动信号的子带频谱质心,并提出了横径的平方与纵径乘积d12作为体积参数。研究发现频率点与西瓜的质量、d12呈负相关,对激励力度依赖性较小。选取子带中心频率为551.44 Hz、半子带宽度为190.24 Hz的子带为最优子带,提取该子带的频谱质心,利用逐步多元线性回归分析以及曲面建模法,建立糖度检测模型。研究发现利用曲面建模的确定系数较高,为0.881 1,标准误差较小,为0.480 0,因此选用曲面建模作为糖度预测模型。研究发现RMSEP略大于RMSEC,并且RMSEP和RMSEC均小于最大糖度的10%,预测集样本平均误差为3.61%。可见,该糖度预测模型可以很好地利用216~268 Hz 的子带频谱质心频率点对8~10成熟西瓜进行糖度预测。本研究从实用的角度出发,将子带谱质心法与外部特征结合,简化了硬件并降低了对应用场合的要求,但本研究只是对适熟瓜进行检测,还需要进一步对未熟西瓜、过熟西瓜进行研究。

猜你喜欢

子带糖度质心
糖度高、类型多、瓜味足 “炫彩”系列小西瓜 亩产值3.5万元
重型半挂汽车质量与质心位置估计
基于GNSS测量的天宫二号质心确定
一种基于奇偶判断WPT的多音干扰抑制方法*
子带编码在图像压缩编码中的应用
甜菜块根糖度检测使用重复检测进行质量控制的方法
基于虚拟孔径扩展的子带信息融合宽带DOA估计
基于不同物候期苹果树叶片光谱特征预测果实糖度
基于RSSI测距的改进加权质心定位算法
全国首条蜜橘糖度分选机落户南丰