面粉湿面筋近红外定量分析中的光谱预处理方法研究
2016-09-18孙营伟中国地质大学北京地球科学与资源学院北京100083
孙营伟,周 萍(中国地质大学(北京)地球科学与资源学院,北京 100083)
面粉湿面筋近红外定量分析中的光谱预处理方法研究
孙营伟,周萍*
(中国地质大学(北京)地球科学与资源学院,北京 100083)
采用10种不同的预处理方法对面粉湿面筋含量的近红外光谱数据进行预处理,并比较了10种预处理方法对偏最小二乘法(PLS)建立定量模型效果的影响。结果表明,采用近红外光谱(NIRS)分析技术对面粉中的湿面筋含量进行定量分析时,一阶导数+减去一条直线的预处理方法对面粉湿面筋含量的预测效果最好,内部交叉验证相关系数R为0.901 8,内部交叉验证标准差(RMSECV)为0.708;预测相关系数R为0.920 9,预测标准差(RMSEP)为0.083,提高了预测模型的精度和准确性。
近红外光谱;预处理;湿面筋;偏最小二乘法
面粉是人们日常生活中重要的食品原料之一,生活水平的提高使人们对面粉的品质问题尤为重视,面粉中的湿面筋含量对面粉的品质有重要影响。湿面筋是面粉经过加水揉制成面团,在水中反复揉洗后剩余的有弹性和黏弹性的不溶于水的胶状物质,用百分比表示(%)[1]。国家标准中规定,强筋面粉中的湿面筋含量≥32.0%,弱筋面筋中的湿面筋含量≥24.0%,北方中筋面筋中湿面筋含量≥28.0%,南方中筋面筋中湿面筋含量≥24.0%[2]。传统的湿面筋含量测定方法主要有手工洗涤法、仪器设备洗涤法和化学测定法。这些检测方法受人为因素、面团放置时间、加水量等因素的影响较大,而且检测时间长,对技术要求高[3-4]。因此,采用安全性高、检验速度快的近红外光谱(near infrared spectroscopy,NIR)检测方法对面粉中湿面筋含量进行测定十分必要。
近红外光谱光电磁波的波长范围是介于可见区与中红外区之间的区域,其波长范围为780~2 526 nm,波数范围为从12 500 cm-1到4 000 cm-1的区域,是人们最早发现的非可见光区域[5]。近红外区光谱数据不仅信息量丰富,而且数据容易获取,随着近红外光谱技术的日益完善,近红外光谱检测技术在食品及农产品作物加工检验、石油化工行业、生态及社会环境污染检测、生物医学等各个学科和领域得到了广泛的应用[6-7]。王欣[8]对光谱预处理中的常用方法进行了综合论述,并对傅里叶变换(Fourier transform,FT)、小波变换(wavelet transform,WT)进行了重点介绍;吴静珠等[9]以小麦为研究对象,比较了多种常见的光谱预处理方法对模型精度的影响;索少增等[10]初步探讨了多种预处理方法对近红外光谱技术检测微量农药溶液含量的影响,并指出近红外光谱技术结合预处理方法和偏最小二乘建模方法能够用于初步检测微量农药溶液含量。通过对样品的光谱数据进行一定的预处理,能够有效地消除噪声信息和无关变量,从而提高模型的准确性和精度。
本研究采用10种不同的预处理方法对面粉湿面筋的近红外光谱数据进行预处理,主要结合近红外光谱技术,采用化学计量学方法进行光谱预处理,并建立偏最小二乘法(partial leastsquares,PLS)模型对面粉湿面筋含量进行定量分析,初步探讨了数据预处理对PLS建模效果的影响。以期提高模型的预测能力,为近红外光谱面粉品质检测奠定基础。
1 材料与方法
1.1料与试剂
试验样本从北京海淀、东城、西城、丰台、房山、密云六大地区的多个不同超市购买的不同生产日期、不同种类的面粉,共计237个。
氯化钠(分析纯):国药集团化学试剂有限公司。
1.2器与设备
MATRIXTM-F近红外光谱分析仪(配有漫反射积分球附件):德国Bruke公司;GLUTOMATIC2200洗面筋仪器:瑞典波通公司;JJ200型天平:常熟双杰测试仪器厂。
1.3法
1.3.1本化学值的测定
采用洗面筋仪器对面粉洗涤,根据双试验结果允许误差≤1.0%的原则,秤取10 g面粉样品置于洗涤皿中,并放入4.6~5.2m L质量浓度为20 g/L的氯化钠缓冲溶液,将洗涤皿放入洗面筋仪指定位置后启动仪器,20 s搅拌和成面后,仪器自动进行洗涤,洗涤5m in后取出面筋,用挤压板去除面团中的水分,最后取出面筋后准确测量面粉中的湿面筋含量,并将测量的湿面筋含量值作为建立PLS模型的真值。面粉中湿面筋含量的计算公式如下:
式中:W为湿面筋质量,g;M为每100 g面粉中含水量,g;86为换算为14%基准水分试样的系数;10为试样面粉质量,g。
1.3.2本的近红外光谱采集
面粉为不透明的粉末状固体,透射方式采集的近红外光谱不能达到较好的测量效果,本试验采用漫反射的方式采集光谱数据,近红外光谱分析仪配有漫反射积分球附件,试验采用积分球的漫反射测验方式。光谱参数设置如下:检测温度为20~25℃,光谱范围10 000~4 000 cm-1,分辨率8 cm-1,扫描次数64次,测量3次后取平均值。将面粉样本放置在漫反射样本杯中,进行近红外光谱采集。
1.3.3红外光谱数据的预处理
选取常用的10种不同的预处理方法(消除常数偏移量、减去一条直线、矢量归一化、最大-最小归一化、多元散射校正、一阶导数、二阶导数、一阶导数+减去一条直线、一阶导数+矢量归一化、一阶导数+多元散射校正)对237个面粉样本原始的光谱数据进行预处理。采用偏最小二乘法建模,以模型相关系数R、内部交叉验证标准差(root-meansquares error of cross-validation,RMSECV)、预测标准差(root-mean-squareerrorofprediction,RMSEP)为评价指标,建立经过预处理后的面粉光谱数据和面粉湿面筋含量之间的PLS定量模型,并将预处理后的模型与无预处理的模型进行比较[11-13]。
2 结果与分析
2.1粉样本的近红外光谱分析
以波数为横坐标,吸光度值为纵坐标,获得237个面粉样本的近红外光谱图,结果如图1所示。
图1 面粉样本的近红外光谱图Fig.1 Near-infra red spectra of flour sam p les
由图1可知,面粉的近红外光谱图中包含大量的化学官能团信息,除C-H外,还含有蛋白质、淀粉、纤维素以及水分中的N-H、O-H和C=H的合频吸收信息。不同的官能团的特征谱带有重叠现象,每个明显的吸收谱带中均含有不同类型化合物的官能团信息。8336.64 cm-1附近的吸收谱带中含有甲基、亚甲基C-H伸缩振动的二次倍频峰;6 812.02 cm-1附近含有N-H键伸缩振动一次倍频;5 168.72 cm-1附近含有O-H、HOH变形振动、蛋白质仲酰胺CONH中的C=O二级倍频吸收等;4 766.31 cm-1及4 314.57 cm-1附近含有N-H、C-H等多种不同的合频吸收信息。因此,能够采用近红外光谱分析法对面粉品质进行检测。
2.2红外光谱数据的预处理
表1 面粉湿面筋PLS模型优化参数及预测结果Table 1 Optimum parameters and prediction results of PLSmodel for wet gluten in flour
在优化模型时,对同一样品集的同一组分,内部交叉验证相关系数R越大、内部交叉验证标准差RMSECV越小,则PLS算法所提取的光谱信息与分析组分的相关性越好,所建模型的预测能力和稳健性越高,但是由于过拟合现象的存在,也会出现内部交叉验证相关系数较好,模型的预测精度降低的情况。由表1可知,光谱预处理方法不同,所建模型预测效果存在差异,10种预测处理方法相关系数R最大为0.9301,最小为0.8597;内部交叉验证标准差RMSECV最大值为0.775,最小值为0.473;预测标准差RMSEP最大值为0.977,最小值为0.083。采用预处理后的校正模型与无光谱预处理的校正模型相比,校正模型的相关系数R均有所提高,预处理后的湿面筋校正模型的相关系数R都在0.85以上,内部交叉验证标准差RMSECV均在0.78以下,说明针对本试验的237个面粉样本的近红外光谱数据,采取一定的预处理方式能够提高模型的预测精度。其中,综合考虑各模型的内部交叉验证结果和模型预测结果,一阶导数+减去一条直线的预处理方法的内部交叉验证相关系数R为0.901 8,内部交叉验证标准差RMSECV为0.708,37个检测样本的预测相关系数0.920 9,预测标准差RMSEP仅为0.083,在优化面粉湿面筋定量模型、提高预测精度方面效果最佳。
图2 不同预处理校正模型及模型预测结果Fig.2 Correction m odeland m odel predictions results of different pretreatments
由图2可知,10种不同的预处理方法对面粉样本的光谱数据进行预处理后建立的偏小二乘模型精度不同,预测结果也不相同。而多元散射校正预处理方法的内部交叉验证结果较好,但是从预测集结果来看,出现了过拟合现象。矢量归一化由于主成分数较大,包含的光谱信息中含有较多无用信息,而使模型预测精度降低。一阶导数+减去一条直线、最大-最小归一化、一阶导数+多元散射校正、减去一条直线、一阶导数+矢量归一化、一阶导数、二阶导数及消除常熟偏移量对杂质无用信息进行了有效的处理,提高了模型的预测精度。其中,一阶导数+减去一条直线预处理后的模型的精度和预测结果优于其他9种预处理结果。
图3 无光谱预处理校正模型及模型预测结果Fig.3 Correction mode land modelpredictions results of no spectralpretreatments
由图3可知,对光谱数据不进行任何预处理时,由于原始光谱信息中含有大量的噪声信息和无关变量,建立的偏最小二乘模型的性能和精确度低于预处理过后的光谱数据所建立的模型。
通过表1、图2、图3可以发现,与原始光谱数据相比,经过预处理的光谱数据在一定程度上去除了部分杂质信息和无用信号,建立的模型的内部交叉验证相关系数均在0.85以上,说明采用校正能力强、适应性好的预处理方法对近红外光谱面粉品质检测的进一步发展提供了较好的数据分析平台。
3 结论
本研究对面粉的近红外光谱数据进行10种不同的预处理方法,并建立预处理后的光谱数据与湿面筋含量之间的PLS定量分析模型,通过校正模型的内部交叉验证评价指标和预测结果比较了10预处理方法对PLS建模效果的影响。结果表明,一阶导数+减去一条直线的预处理方法对PLS模型的优化效果最好,内部交叉验证相关系数R为0.901 8,内部交叉验证标准差RMSECV为0.708,37个检测样本的预测相关系数0.9209,预测标准差RMSEP仅为0.083。通过预处理和无预处理的校正模型和预测结果比较,可以发现采用预处理后的光谱数据在一定程度上降低了主成分数,去除部分无用的光谱信息,降低了光谱信息的线性相关性,从而提高了模型的预测精度和准确性[14-18]。可见对原始的近红外光谱数据进行一定的预处理在面粉湿面筋定量分析方面有很好地应用。
[1]白剑侠,赵欣.制粉厂的生产检验[J].技术粮食工程,2010,52(3):53-54.
[2]王晓曦,陈颖,徐荣敏,等.小麦加工工艺与小麦粉品质[J].粮食与饲料工业,2006(10):9-12.
[3]胡玉君,刘翠玲,窦森磊,等.基于近红外光谱的小麦粉湿面筋含量检测[J].四川大学学报:自然科学版,2015,52(4):800-804.
[4]WESLEY I,LARROQUE O,OSBORNE B G,et al.Measurement of gliadin and glutenin contentof flour by NIR spectroscopy[J].J Cereal Sci,2001,34(2):125-133.
[5]褚小立,许育鹏,田高友.近红外光谱解析实用指南[M].北京:化学工业出版社,2009.
[6]胡玉君,刘翠玲,孙晓荣,等.基于近红外光谱的芝麻油酸价含量的预测[J].中国酿造,2014,33(8):131-135.
[7]徐一茹,刘翠玲,孙晓荣,等.基于近红外和中红外光谱技术的小麦粉品质检测及掺杂鉴别方法[J].食品科学,2014,35(12):128-132.
[8]王欣.近红外分析中光谱预处理方法的研究与应用进展[J].科技资讯,2013(15):2.
[9]吴静珠,李慧,王克栋,等.光谱预处理在农产品近红外模型优化中的应用研究[J].农机化研究,2011(3):178-181.
[10]索少增,刘翠玲,吴静珠,等.微量农药溶液近红外光谱PLS模型的不同预处理方法对比研究[J].食品工业科技,2012,33(11):330-332,337.
[11]WANG D,MA Z H,HAN P,et al.Research on detection of lime in wheat flour by NIRmicro-imaging[J].Sens Lett,2012,10(1/2):252-257.
[12]宦克为.小麦内在品质近红外光谱无损检测技术研究[D].长春:长春理工大学博士论文,2014.
[13]高居荣,韩秀兰,孙彩玲,等.DA7200近红外仪在小麦品质分析中的应用研究[J].实验室科学,2009(1):173-176.
[14]王伟明,董大明,郑文刚,等.梨果糖浓度近红外漫反射光谱检测的预处理方法研究[J].光谱学与光谱分析,2013,33(2):359-362.
[15]尼珍,胡昌勤,冯芳.近红外光谱分析中光谱预处理方法的作用及其发展[J].药物分析杂志,2008,28(5):824-829.
[16]吴静珠,李慧,王克栋,等.光谱预处理在农产品近红外模型优化中的应用研究[J].农机化研究,2011(3):178-181.
[17]夏俊芳,李培武,李小昱,等.不同预处理对近红外光谱检测脐橙VC含量的影响[J].农业机械学报,2007,38(6):107-111.
[18]高荣强,范世福,严衍禄,等.近红外光谱的数据预处理研究[J].光谱学与光谱分析,2004,24(12):1563-1565.
Research on spectralpretreatmentmethods forquantitativeanalysisofwetgluten in flourby near infrared spectroscopy
SUN Yingwei,ZHOU Ping*
(SchoolofEarth Science and Resources,China University ofGeoscience,Beijing 100083,China)
Near infrared spectrum dataof thewetgluten contentin flourwaspreprocessed by 10 kindsof differentpretreatmentmethods.Theeffectof 10 pretreatmentmethodson quantitativemodelbased on partial leastsquares(PLS)was com pared.The results showed thatwhen thewetgluten content in flour was analyzed quantificationally by near infrared spectroscopy analysis technology,the predictive effect of first derivative+m inus a straight line pretreatmenton thewetgluten content in flourwas the optimal.The R and RMSECV valuewere 0.901 8 and 0.708,respectively.The R and RMSEP valuewas0.920 9 and 0.083,respectively.Thepretreatmentmethod improved theprecision and accuracy of predictionmodel.
near infrared spectroscopy;pretreatment;wetgluten;partial leastsquares
TS211.7
0254-5071(2016)01-0137-04
10.11882/j.issn.0254-5071.2016.01.030
2015-11-11
国家自然科学基金资助项目(49902019);中国科学院知识创新工程(KZCX2-209-05)
孙营伟(1990-),男,硕士研究生,研究方向为多光谱技术在资源勘探及食品检测的应用。
周萍(1964-),女,副教授,博士,研究方向为高光谱遥感技术。