APP下载

基于高光谱成像技术快速无损测定花生中水分含量

2016-03-01于宏威刘红芝石爱民

农产品加工 2016年23期
关键词:波长校正花生

于宏威,刘红芝,杨 颖,石爱民,刘 丽,胡 晖,王 强

(中国农业科学院农产品加工研究所,农业部农产品加工综合性重点实验室,北京 100193)

基于高光谱成像技术快速无损测定花生中水分含量

于宏威,刘红芝,杨 颖,石爱民,刘 丽,胡 晖,*王 强

(中国农业科学院农产品加工研究所,农业部农产品加工综合性重点实验室,北京 100193)

花生中水分含量的高低直接影响花生及其制品的贮藏期,而现有的测定方法存在步骤多、时间长等问题。试验利用高光谱成像技术对花生中水分含量进行快速无损检测分析。通过采集120个花生样品的图像信息,从校正后的图像中提取花生目标区域的平均光谱作为花生光谱信息进行分析;同时,优选最佳的光谱预处理方法和建模方法建立花生中水分含量全波段模型,在此基础上利用回归系数法,确定重要波长并建立模型。结果表明,二阶导数(2nd-der)偏最小二乘法(PLS)全波段模型预测水分含量能力最佳,校正集和预测集的相关系数分别为0.91和0.84,标准偏差分别为0.28和0.38;回归系数法确定的14个波长所建简化模型的性能与全波段相当,校正集和预测集的相关系数分别为0.82和0.81,标准偏差分别为0.39和0.43。因此,高光谱成像技术可以快速无损测定花生中水分含量,其具有快速运算特点的重要波长模型可以更加方便地应用于花生加工产业中。

花生;水分含量;高光谱成像技术;偏最小二乘法;无损检测

花生是世界第四大油料作物、第三大蛋白质来源,具有很高的经济价值和营养价值,在世界食品市场地位举足轻重[1]。据FAO统计,2014年世界花生总产量约4 238×104t,我国花生年总产量约1 578×104t,占全球总产量的37.23%,位居世界首位[2]。花生中水分含量的高低直接影响花生及其制品的贮藏期,水分含量低的贮藏期较长,水分含量高的贮藏期较短[3],因此GB/T 1532—2000花生中要求花生仁的安全水分含量在9.0%以内。目前,测定花生中水分含量公认的方法是AOAC 950.46和GB 5009.3—2010中干燥法,该方法简单、易操作,且结果准确,但是操作过程中破坏样品,不能在线测定,恒质量需要花费大量时间。据估算,测定1个花生样品中水分含量平均需要6 h,因此亟需一种快速无损检测花生中水分含量的方法。

整合光谱和图像优势的高光谱成像技术是一门新兴的快速无损检测方法,其数据包括了某个波长下的图像信息和图像平面内某个像素点的光谱信息[4]。图像信息是指像素点的分布情况;光谱信息是由物质中的分子从基态向高能级跃迁时,含氢基团(OH,CH等)振动所产生的[5]。随着物质分子组成及含量变化,其产生光谱吸收峰的位置和强度都有明显差异,其光谱特征也发生相应的变化[6]。因此,可以基于高光谱成像技术获得光谱信息,并利用化学计量学定量分析物质的组分含量。目前,高光谱成像技术已经得到国内外许多学者的关注,并取得许多研究结果。其中,测定水分含量方法广泛应用到脱水对虾、羊肉、火鸡火腿、蘑菇、鲑鱼等农产品中[7-11]。随着花生加工产业的迅猛发展,创建花生中水分含量的高光谱快速无损检测方法也迫在眉睫。

以我国主要种植的花生品种为试验材料,旨在建立花生中水分含量的高光谱检测方法。采集了120个花生样品的图像信息,从校正后的高光谱图像中,提取花生目标区域的平均光谱信息作为花生光谱信息进行分析,优选最佳的光谱预处理方法和建模方法建立花生中水分含量全波段模型。在此基础上,利用回归系数法确定重要波长并建立模型,从而简便模型、减低运算复杂程度,为快速无损监控花生原料的品质提供先进手段。

1 材料与方法

1.1 材料

从我国11个花生主栽省份(河南、山东、广东、新疆、辽宁、广西、河北、江苏、福建、江西和湖北等)收集120个花生品种(白沙1016号、海花1号、丰花1号、鲁花11号、鲁花9号、花育19号等)。高光谱成像系统每次可以同时扫描6个花生品种,因此以每6个花生品种为一组进行试验,共计20组。从每个花生品种中挑选尺寸相同、正常饱满的花生仁30粒,进行高光谱数据的采集和水分含量的测定。

1.2 高光谱成像系统和图像获取

试验采用的高光谱成像系统是SisuCHEMA NIR(Spectra Imaging公司,芬兰),包括成像光谱仪、照明系统、输送单元、电脑控制单元及其他附件。其中,成像光谱仪由ImspectorN17E型光谱仪配有TE-cooled InGaAs photodiode array检测器组成;照明系统是由10 W的卤素灯(Osram公司,德国)和照明盖组成;输送单元由样品盘和线性输送平台组成;电脑控制单元:I7处理器,16 GB内存,并配备有ChemaDAQ高光谱数据采集软件;其他附件包括采集区域大小为20 cm×30 cm的OLE15镜头,以及对焦板和白参考板等。在扫描高光谱图像前,先开机预热仪器30 min。用表面皿盛放花生,每次采集图像都需晃动表面皿,且重复采集3次。扫描参数:成像仪曝光时间5.6 s,电动机的移动速度8 mm/s。

SisuCHEMA NIR见图1。

图1 SisuCHEMA NIR

1.3 高光谱图像分析处理

获得的高光谱原始图像需要进行校正,以减少环境光、检测器暗电流和光谱仪物理结构对图像信息的影响。图像校正需要利用2个特别的图像,分别是白参考板(Teflon)提供的100%反射图像和盖上镜头盖得到的0%反射图像。图像校正公式如下:

式中:Rraw——高光谱原始图像;

Rwhite——100%反射图像;

Rdark——0%反射图像;

Rnorm——高光谱校正图像。

高光谱成像系统采集波长为884~1 735 nm的光谱图像,但在波长884~900 nm和1 700~1 735 nm处有较大的噪音,仅有波长为900~1 700 nm的高光谱图像可以用于光谱数据的提取。由于在采集花生图像时,同时采集了大量的背景图像和边界图像等无关信息,因此需要利用主成分分析 (Principle component analysis,PCA)将花生像素点和其他像素点区分开,以剔除这些无关信息。结合花生轮廓分割图像,将相同花生品种当作目标区域(Region of interest,ROI)用于光谱数据的提取。同时,将采集的120个花生品种3次图像平均光谱储存为矩阵形式,用于下步分析。

利用Evince 2.7.1(UmBio公司,瑞典)进行图像分析处理。

1.4 水分含量的测定

按照GB 5009.3—2010中干燥法测定花生中水分含量,将花生仁磨碎,装入铝盒中称质量,然后放入烘箱。利用花生中水分的物理性质,在101.3 kPa,101~105℃下除去花生中水分,再通过干燥前后的质量变化计算出花生中的水分含量。

1.5 化学计量学

1.5.1 光谱的预处理

高光谱图像提取的光谱除了含有花生自身的化学信息外,还包含有其他无关信息和噪声,如杂散光、电噪声和样品背景。因此,在利用回归分析建立花生中水分含量模型之前,需要采用光谱预处理方法消除光谱数据的无关信息和噪声,以提高水分信噪比。常用的谱图预处理方法有导数(Derivative,Der)、标准正态变量变换(Standard normal variate tranformation,SNV)、基线校正(Baseline)、矢量归一化法(Normalization)等。试验将考察不同预处理方法和复合预处理对模型的影响,从而确定最佳的光谱预处理方法。

1.5.2 全波段模型的建立

由于光谱各波长点处的信息重叠严重、谱峰宽,花生中水分含量定量模型的建立通常需要依靠相应的回归分析方法。常用的建立定量模型方法有多元线性回归(Multi-linear regression,MLR)、主成分回归(Principal component regression,PCR) 和偏最小二乘法(Partial least squares,PLS),其中多元线性回归是方程式中有2个或2个以上自变量的线性回归模型;主成分回归通过线性组合的方式重新组合成一组较少的线性无关的综合指标来代替原来的指标,新变量能反映原变量的绝大部分信息;偏最小二乘法在考虑所计算的主成分方差尽可能最大的同时,还使主成分与浓度最大程度的相关[6]。模型验证常用内部交叉验证和外部预测集,考核的指标有校正模型的相关系数(RC)和标准偏差(Standard error of calibration,SEC)、内部验证模型的相关系数(RCV)和标准偏差(Standard error of cross validation,SECV)以及预测模型的相关系数(RP)和标准偏差(Standard error of prediction,SEP)。相关系数越高且标准偏差越小的模型稳定性越好。

1.5.3 重要波长的确定及模型建立

全波段数据中仅有部分光谱与水分含量相关,连续光谱信息造成了数据的冗余,降低了预测的准确性和运算速度,因此需要选择重要波长,简化全波段模型,降低运算的复杂性。根据简化模型,可以进一步开发低成本、快速运算的多光谱图像系统。本研究将根据全波段模型的回归系数(Regression coefficients,RC)确定重要波长,回归系数绝对值越高的波长,其重要性越大。基于筛选出来的重要波长建立模型,考察其预测性能与全波段模型的关系。

利用Unscrambler 10.3(CAMO公司,挪威)进行化学计量学的分析。

2 结果与分析

2.1 高光谱图像处理和光谱数据提取

利用PCA处理校正后的高光谱图像,确定花生目标区域,并从中提取光谱数据,按此方法依次提取120个花生品种的光谱数据。各个花生品种的光谱数据在相同的波长处有吸收峰,但是相同吸收峰的数值不一样,这主要是由不同花生品种组成含量差别所造成。

单一品种的光谱数据(a)和120个花生品种的光谱数据(b)见图2。

图2 单一品种的光谱数据(a)和120个花生品种的光谱数据(b)

2.2 花生中水分含量分析

将120个花生样品按照水分含量从高到低依次排列,每隔3个样品挑选1个样品为预测集,校正集样品共90个,预测集样品共30个。其中,校正集水分含量范围为4.11%~6.94%,平均值为5.46%± 0.69%,其水分含量分布范围广,能够涵盖绝大多数花生品种;预测集水分含量范围为4.17%~6.85%,平均值为5.35%±0.70%。按照水分含量高低成比例挑选预测集,预测集水分含量能够位于校正集水分含量分布内,有利于对校正模型进行验证。

花生校正集和预测集的水分含量见表1。

表1 花生校正集和预测集的水分含量

2.3 化学计量学分析

2.3.1 光谱的预处理

不同光谱预处理的花生水分含量PLS模型见表2。

原始光谱建立的PLS水分模型,RC,RCV和RP分别是0.46,0.45和0.44,SEC,SECV和SEP分别是0.41,0.47和0.52,模型的稳健性具有较大的上升空间。因此,分别采用不同的单一预处理和复合预处理提高模型稳健性,其中2nd-der预处理是最佳的单一光谱预处理方法,RC,RCV和RP分别是0.91,0.81和0.84,SEC,SECV和SEP分别为0.28,0.43和0.39。无论是相关系数还是标准偏差,与原始模型相比,有了较大的改善。Baseline和Normalization仅对光谱进行简单的校正,并没有消除噪声对光谱的影响,其所建模型的稳健性只比原始模型有了略微提高。

表2 不同光谱预处理的花生水分含量PLS模型

复合预处理中,2nd-der结合2nd-der方法最佳,其RC,RCV和RP分别是0.92,0.81和0.85,SEC,SECV和SEP分别为0.28,0.45和0.40。该方法虽然比单独进行2nd-der预处理效果更好,但是光谱数据进行了2次预处理,加重了运算负担,降低了光谱处理的速度,如果将该方法用于实际生产,必定会影响检测效率。因此,确定预测水分含量最佳的光谱预处理方法为2nd-der。与国内外研究相比较,杨传得等人[12]收集了116份花生于波长833~2 500 nm处的反射光谱,比对了单一预处理和复合预处理对水分模型的影响,结果表明未经任何预处理的光谱建模效果最好,但只进行的内部交叉验证,SECV为1.37,远高于本研究方法。Govindarajan等人收集了于波长1 000~1 800 nm处的反射光谱,确定了Normalization结合一阶导数为最佳的预处理方法,建立的水分模型SEC为1.23,模型的准确性与本研究存在差距。

2.3.2 水分含量全波段模型的建立

不同建模算法花生水分含量全波段模型见表3,花生水分含量全波段校正模型(a)、内部验证模型(b)和预测模型(c)见图3。

3种建模算法中PLS结果最好,其校正模型和内部验证模型稳健性明显高于其他2种方法,RC和RCV分别是0.91和0.81,SEC和SECV分别为0.28和0.43;PLS预测模型与PCR预测模型相当,均优于MLR预测模型,RP和 SEP分别是 0.84和 0.38。PLS,MLR和PCR 3种建模算法相互连贯,PCR克服了MLR光谱信息不能充分利用的弱点,显著提高了模型的预测能力;PLS则对光谱阵和浓度阵同时进行分解,并在分解时考虑二者之间的关系,从而保证获得最佳的校正模型。PLS校正模型散点图(图3(a))表明,在4.11%~6.94%范围内花生样品的水分含量均匀分布回归直线两侧。因此,确定PLS为建立水分含量模型最佳数学方法。

表3 不同建模算法花生水分含量全波段模型

图3 花生水分含量全波段校正模型(a)、内部验证模型(b)和预测模型(c)

2.3.3 水分含量重要波长的选取和模型的建立

采用回归系数法选取β-coefficient绝对值最高的14个波长,分别为957,970,977,1 070,1 033,1 147,1 317,1 337,1 390,1 400,1 544,1 551,1 654,1 681 nm。根据Workman J J等人研究,水分中的重要波长是水分子对称和反对称伸缩振动的组合吸收,以及OH伸缩振动引起的倍频吸收。分别比较了上述12,13,14个波长建模效果,随着波长数量的增加,模型稳健性越好,采用14个波长建立模型稳健性最好,RC,RCV和RP分别是0.82,0.80和0.81,SEC,SECV和SEP分别为0.39,0.44和0.43。在14个波长的基础上增加1个波长,模型的稳健性并没有得到显著提高,反而增加了运算复杂性。同时,与全波段中任意14个波长所建模型相比较,上述14个波长模型稳健性优势明显。结合回归系数和模型性能,确定上述14个波长为重要波长,并建立花生中水分含量重要波长模型。与已建全波段模型相比,虽然重要波长校正模型的表现力略差,但其仅利用14个波长,计算的复杂性远低于含有240个波长的全波段模型,因此可以利用重要波长模型代替全波段模型对花生中水分含量进行预测。

花生中水分含量重要波长模型与其他波长模型见表4,花生水分含量重要波长校正模型(a)、内部验证模型(b)和预测模型(c)见图4。

表4 花生中水分含量重要波长模型与其他波长模型

图4 花生水分含量重要波长校正模型(a)、内部验证模型(b)和预测模型(c)

3 结论

本文建立了花生中水分含量高光谱快速无损的检测方法,分别比较了单一光谱预处理和复合预处理,以及建模算法对模型的影响,确定了最佳的光谱预处理方法是2nd-der,最佳的建模方法是PLS,所建全波段校正模型(RC=0.91,SEC=0.28)、内部验证模型(RCV=0.81,SECV=0.43) 和预测模型(RP= 0.84,SEP=0.38)良好。在此基础上根据回归系数和模型性能,确定957,970,977,1 070,1 033,1 147,1 317,1 337,1 390,1 400,1 544,1 551,1 654,1 681 nm为14个重要波长,所建重要波长模型预测花生中水分含量能力与全波段模型相当,其中RC,RCV和RP分别是0.82,0.80和0.81,SEC,SECV和SEP分别为0.39,0.44和0.43。重要波长模型仅利用14个波长建立模型,具有运算复杂性低的特点,可以更加方便地应用在花生加工产业中,为快速无损监控花生原料的品质提供先进手段。

[1]王强.花生加工品质学 [M].北京:中国农业出版社,2013:76-81.

[2]FAO.Statistical Yearbook[EB/OL].Rome:Food and agriculture organization of the united nations,2014.http://faostat3.fao.org/download/Q/QC/E.

[3]周瑞宝.花生加工技术 [M].北京:化学工业出版社,2012:43-56.

[4]Gowen A A,O'Donnell C P,Cullen P J,et al.Hyperspectral imaging-an emerging process analytical tool for food quality and safety control[J].Trends in Food Science &Technology,2007,18(12):590-598.

[5]陆婉珍.现代近红外光谱分析技术 [M].北京:中国石化出版社,2007:126-134.[6]严衍禄.近红外光谱分析的原理技术与应用 [M].北京:中国轻工业出版社,2013:219-238.

[7]Wu D,Shi H,Wang S,et al.Rapid prediction of moisture content of dehydrated prawns using online hyperspectral imaging system[J].Analytica Chimica Acta,2012,726:57-66.

[8]Kamruzzaman M,ElMasry G,Sun D W,et al.Non-destructive prediction and visualization of chemical composition in lamb meat using NIR hyperspectral imaging and multivariate regression[J].Innovative Food Science&Emerging Technologies,2012,16:218-226.

[9]Iqbal A,Sun D W,Allen P.Prediction of moisture,color and pH in cooked,presliced turkey hams by NIR hyperspectral imaging system[J].Journal of Food Engineering,2013,117(1):42-51.

[10]Taghizadeh M,Gowen A,O'Donnell C P.Prediction of white button mushroom(Agaricus bisporus)moisture content using hyperspectral imaging[J].Sensing and Instrumentation for Food Quality and Safety,2009,3(4):219-226.

[11]He H J,Wu D,Sun D W.Non-destructive and rapid analysis of moisture distribution in farmed Atlantic salmon(Salmo salar)fillets using visible and near-infrared hyperspectral imaging[J].Innovative Food Science&Emerging Technologies,2013,18:237-245.

[12]杨传得,于洪涛,关淑艳,等.近红外反射光谱技术预测花生种子含水量 [J].花生学报,2012,41(1):6-9.◇

Rapid and Non-destructive Determination of Moisture Content in Peanut Based on Hyperspectral Imaging Technology

YU Hongwei,LIU Hongzhi,YANG Ying,SHI Aimin,LIU Li,HU Hui,*WANG Qiang
(Key Laboratory of Agro-Products Processing,Ministry of Agriculture,Institute of Agro-Food Science and Technology,Chinese Academy of Agricultural Sciences,Beijing 100193,China)

Moisture content directly affects the storage period of peanut and its products.The existing methods of determination of moisture content are more steps and time-consuming.In this paper,moisture content in peanut is rapidly and non-destructively detected by hyperspectral imaging technology(HSI).Image information of 120 peanut samples is acquired,and average spectra of peanut of resign of interest are extracted from the corrected image as peanut spectral information to analyze.The whole wave-band model of moisture content in peanuts is established by selecting the best spectral pre-processing method and modeling method.Based on regression coefficient method,important wavelengths are identified and model is set up.The results show that 2nd-der-PLS whole wave-band model had best ability to predict moisture content with Rc of 0.91 and SEC of 0.28,Rp of 0.84 and SEC of 0.38.The performance of the simplified model established by the regression coefficient is equivalent to that of the whole wave-band with Rc of 0.82 and SEC of 0.39,Rp of 0.81 and SEC of 0.43.The research show that HIS could quickly and non-invasively determine the moisture content in peanuts,and the important wavelength model with the characteristics of fast operation could be more convenient for the application in the peanut industry.

peanut;moisture content;hyperspectral imaging technology;partial least square;non-destructive testing

S37

A

10.16693/j.cnki.1671-9646(X).2016.12.011

1671-9646(2016)12a-0039-05

2016-05-09

国家科技支持计划课题(2012BAD29B03);中国农业科学院科技创新工程(CAAS-ASTIP-201X-IAPPST)。

于宏威(1991— ),男,硕士,研究方向为粮油加工与副产物综合利用。

*通讯作者:王 强(1965— ),男,博士,研究员,研究方向为粮油加工与副产物综合利用。

猜你喜欢

波长校正花生
掏花生
劉光第《南旋記》校正
在Lightroom中校正镜头与透视畸变
机内校正
到底埋在哪棵树下
花生去哪儿了
日本研发出可完全覆盖可见光波长的LED光源
RP—HPLC波长切换法同时测定坤泰胶囊中6个成分的含量
便携式多用途光波波长测量仪
一种基于eNode B的主动式频偏校正算法