APP下载

模拟退火算法用于食醋总酸含量近红外光谱模型的波数点优选

2011-10-28石吉勇邹小波王开亮黄晓玮孙乐六

食品科学 2011年10期
关键词:食醋控制参数模拟退火

石吉勇,邹小波,,*,王开亮,黄晓玮,孙乐六,夏 蓉

(1.江苏大学食品与生物工程学院,江苏 镇江 212013;2.江苏恒顺醋业集团研究所,江苏 镇江 212013)

模拟退火算法用于食醋总酸含量近红外光谱模型的波数点优选

石吉勇1,邹小波1,2,*,王开亮1,黄晓玮1,孙乐六2,夏 蓉2

(1.江苏大学食品与生物工程学院,江苏 镇江 212013;2.江苏恒顺醋业集团研究所,江苏 镇江 212013)

为优选食醋总酸对应的特征波长并提高模型的预测精度,采用模拟退火算法优化窗口宽度和特征波数点,并结合偏最小二乘法建立食醋总酸光谱模型。在全国范围内收集90个不同品牌的食醋样本,用近红外光谱仪采集近红外光谱数据(波数4000~10000cm-1)和常规理化分析方法检测总酸含量。采用模拟退火算法共优选出17个总酸特征波数点,结合样本总酸含量建立偏最小二乘光谱模型,模型对应的预测集相关系数为0.9210,优于全光谱偏最小二乘法和区间偏最小二乘法对应的预测效果。结果表明,近红外光谱技术结合模拟退火算法能够快速预测食醋中总酸含量。

食醋;总酸;近红外光谱技术;模拟退火算法;波数优选

食醋味酸而醇厚,液香而柔和,是烹饪必不可少的调味品。食醋中含有丰富的营养物质,经常食用可以软化血管、降低血压、预防动脉硬化和糖尿病等[1]。食醋品质同其内部理化指标密切相关,其中总酸是评价食醋品质等级的重要指标之一。食醋中总酸的标准测量方法为电位滴定法[2],该方法虽然准确性好,但是检测过程费时费力,对操作人员要求高,且每次仅能测定单个理化指标,不能满足食醋品质快速检测的要求。

近红外光谱分析技术是近年来快速发展起来的分析技术,近红外光谱能反映有机分子中含氢键(C—H、N—H、O—H)基频震动的倍频和合频信息,其光谱特性与有机物类型和含量高度相关,同传统的化学检测方法相比,近红外光谱分析技术具有不破坏样品、速度快、效率高、成本低、重现性好、运用范围广等特点,被广泛的运用到食品、药品等行业,如运用近红外光谱分析技术快速检测梨[3]、苹果[4-5]、樱桃[6]、山竹[7]等的品质。陈斌等[8]利用近红外吸收光谱快速检测了食醋的主要成分;王莉等[9]应用近红外光谱技术快速检测白醋品牌和pH值及果醋糖度;王晓晖等[10]通过短波近红外光谱-偏最小二乘法(partial least squares,PLS)对食醋的总酸进行了定量分析。上述研究建立了食醋的近红外光谱检测模型,但是在建模过程中使用的特征波数点选择方法比较简单,难以进一步提高模型的稳定性和准确性。

模拟退火算法(simulated annealing algorithm,SAA)是20世纪80年代初发展起来的一种随机组合优化方法[11]。该算法依据Metropolis准则接受新解,除了接受优化解外,还在一个限定的范围内接受恶化解,这是模拟退火算法同其他局部搜索算法的本质区别,使得其能在较短的时间内求得全局更优近似解[12]。SAA已经成功应用于很多领域,但鲜有将SAA应用于近红外光谱技术。本实验尝试用近红外光谱技术快速检测食醋中的总酸含量,为了使模型具有好的预测能力,在建模的过程中必须选取合适的波长。为此,本实验设计和实现一种用于优选近红外光谱波数点的模拟退火算法,并将该方法与偏最小二乘法相结合,建立食醋近红外光谱同总酸的相关关系。

1 材料与方法

1.1 材料、试剂与仪器

从全国市场上收集各类食用醋共90种,随机选择其中60个样品作为校正集,30个样品作为预测集。

实验所用化学试剂皆为分析纯。

AntarisⅡ型傅里叶变换近红外光谱仪 美国Thermo Fisher公司;pHS-29A pH METRE酸度计 上海精密科学仪器有限公司。

1.2 总酸测量

食醋中总酸含量按国家标准规定的电位滴定法[2]进行测定,吸取5.0mL样品,置于100mL容量瓶中,加水至刻度,混匀后吸取20.0mL,置于200mL烧杯中,加水至60mL,开动磁力搅拌器,用氢氧化钠标准滴定溶液[c(NaOH)=0.05mol/L]滴定至酸度计指示pH8.2记下消耗氢氧化钠标准滴定溶液(0.05mol/L)的毫升数,即可计算总酸含量。每个样品进行3组平行测定,3组平行测定的最大相对误差不大于3%,总酸含量的统计结果如表1所示。

表1 总酸测量值统计描述Table 1 Descriptive statistics for total acid content

1.3 光谱采集及预处理

样本近红外数据采集,以空气为参比,将食醋样品注入石英比色皿(近红外光谱仪自带附件)中,采用InGaAs检测器,光谱范围10000~4000cm-1,扫描次数为16次;波数间隔为1.9280cm-1,每条光谱包含3112个波数点变量。数据采集过程中,室内温度保持在25℃左右,湿度保持基本不变。每个样本平行采集3次,取其平均光谱作为该样本的原始光谱。光谱数据以ASCII码形式导出,用Matlab7.4.0和Itoolbox工具包进行处理。原始光谱如图1所示,在区间4000~5376cm-1以及6490~7160cm-1范围内,光谱响应值很小,几乎为0。为了提高信噪比和减少光谱变量数,将这两段光谱数据删除。

图1 食醋近红外漫投射原始光谱图Fig.1 Original NIR spectra of vinegar

1.4 模拟退火算法优选波数点的原理

1.4.1 模拟退火算法

1953年Metropolis等提出重要性采样法[13-15],用于模拟固体在恒定温度下达到热平衡的过程,当固体粒子在温度T时趋于平衡的概率P为:

式中:E为温度T时粒子的内能;ΔE为内能改变量;k为Boltzmann常数。

用固体退火模拟组合优化问题,先确定初始温度T0,随机选择一个初始状态并考察该状态的目标函数值;然后在当前解的领域中,以一定概率选择一个非局部最优解,并令这个解重复下去,从而不会陷入局部最优。算法由一个控制参数T决定,经过大量迭代变换后,可求得给定控制参数T时优化问题的相对最优解。然后缓慢减小控制参数T,重复上述迭代过程。对温度为T时的所有迭代过程称为一个马尔科夫链,迭代次数称为马尔可夫链长度Lk。当计算完温度T对应的马尔科夫链时,温度T按一定冷却率α逐渐减小,重复上述过程直至温度T趋于零,最终得到问题的全局最优近似解。

1.4.2 控制参数设计

使用模拟退火算法解决实际问题时,必须合理选择目标函数f对应退火过程中粒子的能量E。算法收敛速度取决于起始温度T0、冷却率α和马尔可夫链长度Lk,因此如何合理选择一组控制算法进程的参数,使算法在有限时间内返回一个近似最优解,是该算法的关键。这样的一组控制参数通常称为冷却进度表,它主要包括以下参数:起始温度T0;温度衰减函数α(Tk+1=αTk);终止温度Tf;马尔科夫链长度Lk。

1.4.2.1 目标函数的选取

在波长优化过程中,常采用交互验证法来评价模型的预测能力,即采用交互验证均方根误差、预测残差平方和、待测组分预测值与实测值之间的相关系数等作为目标函数。如采用交互验证均方根误差作为评价指标,交互验证均方根误差的值越小,对应校正模型的预测能力越好。将目标函数转换成求最大值问题,即:

式中:xk为优选出来的波数点组合;f(xk)为用xk中波数点建立的偏最小二乘模型对应的交互验证均方根误差值。

1.4.2.2 冷却进度表的设计

冷却进度表的构造是基于算法的准平衡概念,其定义如下:设Lk是第k个马尔科夫链的长度,Tk是相应的第k个温度控制参数值。若第k个马尔科夫链的Lk次变换后,解的概率分布充分逼近T=Tk时的平稳分布,则称模拟退火算法达到准平衡。根据上面的准则,可以得到两个结论:只要T充分大,算法会立刻达到准平衡;控制参数Tk的衰减量越大,需要的马尔可夫链的长度Lk越长,才能恢复准平衡,通常选取Tk的小衰减量以避免过长的马尔科夫链。同时有效的冷却进度表还要兼顾算法的收敛性和执行效率。综合上面的结论以及参数设置的经验,模拟退火算法使用以下冷却进度表:T0=200℃;Tk=0.95T;Tf=0℃;Lk=50。

模拟退火算法程序在Matlab7.4平台下编程实现。

2 结果与分析

根据1.4.2节设定的控制参数,采用模拟退火算法优选总酸的特征波数点,并建立偏最小二乘模型。为考察窗口宽度对模型精度的影响,在10~50波数点范围内,对食醋光谱优化了偏最小二乘模型窗口宽度。结果如图2所示,其中横坐标为波数点数即窗口宽度,纵坐标为目标函数值,目标函数值越大,说明对应的窗口宽度越好。从图2可以看出,当窗口宽度为17个波数点时,目标函数值取得最大值,对应模型的预测性能最佳。

图2 波数点优化结果Fig.2 Selected wavenumber after SAA

将优选出来的17个特征波数点同样本的总酸含量值相结合,采用偏最小二乘法建立食醋总酸的近红外光谱模型(SA-PLS),结果如表2所示。模型对应的交互验证均方根误差(RMSECV)为0.2562,校正集相关系数为0.9371,预测集均方根误差(RMSEP)为0.2930,预测集相关系数(r)为0.9210。为了比较建模效果,采用全光谱偏最小二乘法(PLS)和间隔偏最小二乘法(iPLS)建立了对应的总酸近红外光谱模型,结果如表2所示。从表2可以看出,基于模拟退火算法建立的总酸模型无论对校正集还是预测集,效果均要好于其他两种方法得到的光谱模型。

表2 不同建模方法得到的光谱模型比较Table 2 Comparison of PLS, i-PLS and SA-PLS models

3 结 论

本研究在全国范围内收集了90个不同品牌的食醋样本,分别采集各个样本的近红外光谱数据以及测定了总酸含量,采用模拟退火算法优选食醋近红外光谱中同总酸含量高度相关的特征波数点,并在特征波数点的基础上建立总酸近红外光谱模型。同前人的研究相比,本研究收集的样本更加广泛,因此得到的模型更加具有代表性;同时本研究采用模拟退火算法对特征波数点进行优选,充分考察各个波数点变量组合同食醋中理化指标的相关性,能够筛选出同总酸高度相关的波数点,保证模型对未知样本的预测能力。研究为食醋内部理化指标的快速检测提供了一定的根据。

[1] 许俐, 陈斌. 近红外光谱技术在食品和农产品领域的应用[J]. 农业机械学报, 1997(28): 180-193.

[2] 北京市卫生防疫站. GB/T 5009.41—2003食醋卫生标准的分析方法[S].

[3] BUTZ P, HOFMANN C, TAUSCHER B. Recent developments in noninvasive techniques for fresh fruit and vegetable internal quality analysis[J]. Journal of Food Science, 2005, 70(9): 131-141.

[4] CAMPS C, GUILLERMIN P, MAUGET J C, et al. Discrimination of storage duration of apples stored in a cooled room and shelf-life by visible-near infrared spectroscopy[J]. Journal of near Infrared Spectroscopy,2007, 15(3): 169-177.

[5] LU R, ARIANA D. A near-infrared sensing technique for measuring internal quality of apple fruit[J]. Applied Engineering in Agriculture,2002, 18(5): 585-590.

[6] GUYER D, YANG Xiukun. Use of genetic artificial neural networks and spectral imaging for defect detection on cherries[J]. Computers and Electronics in Agriculture, 2000, 29(3): 179-194.

[7] TEERACHAICHAYUT S, KIL K Y, TERDWONGWORAKUL A, et al. Non-destructive prediction of translucent flesh disorder in intact mangosteen by short wavelength near infrared spectroscopy[J]. Postharvest Biology and Technology, 2007, 43(2): 202-206.

[8] 陈斌, 陆道礼, 吴珏. 利用近红外吸收光谱快速检测食醋的主要成分[J]. 中国调味品, 2002(10): 39-42.

[9] 王莉, 刘飞, 何勇. 应用可见-近红外光谱技术进行白醋品牌和pH值的快速检测[J]. 光谱学与光谱分析, 2008, 28(4): 813-816.

[10] 王晓晖, 霍玉杰. 短波近红外光谱-偏最小二乘法对食醋中总酸含量的无损定量分析[J]. 内蒙古大学学报: 自然科学版, 2009, 24(1):26-30.

[11] JOHN H K. Chemometrics with undergraduates[J]. Chemometrics and Intelligent Laboratory Systems, 1992, 15(2/3): 127-135.

[12] KIRKPATRICK S, GELATT C D Jr, VECCHI M P. Optimization by simulated annealing[J]. Science, 1983, 220: 671-680.

[13] 许禄, 邵学广. 化学计量学方法[M]. 北京: 科学出版社, 2006:259-275.

[14] ZOU Xiaobo, ZHAO Jiewen, MALCOLM J W, et al. Variables selection methods in near-infrared spectroscopy[J]. Analytica Chimica Acta,2010, 667(1/2): 14-32.

[15] UWE H, JOHN H K. Further investigation on a comparative study of simulated annealing and genetic algorithm for wavelength selection[J].Analytica Chimica Acta, 1995, 311(1): 1-13.

Simulated Annealing Algorithm based Wavenumber Selection for Total Acid Content Analysis in Vinegar by Near Infrared Spectroscopy

SHI Ji-yong1,ZOU Xiao-bo1,2,*,WANG Kai-liang1,HUANG Xiao-wei1,SUN Le-liu2,XIA Rong2
(1. School of Food and Biological Engineering, Jiangsu University, Zhenjiang 212013, China;
2. Jiangsu Hengshun Group Co. Ltd., Zhenjiang 212013, China)

To extract the characteristic information of total acid and improve model accuracy, simulated annealing algorithm was used to optimize window width and wavenumber in a total acid model obtained by the partial least squares analysis. Ninety different brands of vinegar samples collected from the whole country were used to acquire near infrared spectral data, and total acid content was measure by the general analytical method. Pre-processing methods were used to smooth the vinegar NIR spectra. A total of 17 wavenumbers were selected and the predictive model for total acid model revealed a correlation coefficient of prediction set of 0.9210 and its prediction ability was superior to that of the whole spectral partial least square model and interval partial least square model. These results showed near infrared spectroscopy in combination with simulated annealing algorithm allows to quickly predict total acid content of vinegar.

vinegar;total acid;near infrared spectroscopy;simulated annealing algorithm;wavenumber selection

O657.33

A

1002-6630(2011)10-0120-04

2010-07-20

全国优秀博士基金项目(200968);国家博士后基金项目(20070411024)

石吉勇(1984—),男,博士研究生,研究方向为农产品、食品品质无损检测。E-mail:stoneboy_2007@vip.sohu.com

*通信作者:邹小波(1974—),男,副教授,博士,研究方向为农产品、食品品质无损检测。E-mail:zou_xiaobo@ujs.edu.cn

猜你喜欢

食醋控制参数模拟退火
高超声速飞行器滑模控制参数整定方法设计*
关于《食品安全国家标准食醋》(GB 2719—2018)的探讨
Birkhoff系统稳定性的动力学控制1)
模拟退火遗传算法在机械臂路径规划中的应用
食醋与人类生活
基于PI与准PR调节的并网逆变器控制参数设计
催陈食醋工艺技术研究前沿
基于模糊自适应模拟退火遗传算法的配电网故障定位
防晕车
SOA结合模拟退火算法优化电容器配置研究