APP下载

全包围光源结构的单粒小麦蛋白质含量检测装置研究

2018-10-20吴婷婷ARMSTRONG张海辉高维瑞

农业机械学报 2018年10期
关键词:单粒谷物光源

吴婷婷 ARMSTRONG P R 张海辉 杨 玲 高维瑞

(1.西北农林科技大学机械与电子工程学院, 陕西杨凌 712100; 2.陕西省农业信息感知与智能服务重点实验室, 陕西杨凌 712100; 3.美国农业部农业研究局粮食与动物健康研究中心, 曼哈顿 KS 66502; 4.农业农村部农业物联网重点实验室, 陕西杨凌 712100)

0 引言

谷物种质在长期的自然进化和人工创造过程中积累了丰富的遗传变异,种质资源的鉴定是资源引进、筛选、评价和身份构建时的工作之一[1]。谷物育种过程中,对种质的鉴定和选择往往基于单个籽粒的表型,这样可以使后代种质在保持某些优异农艺性状的同时,更好地分析目标性状的表达能力,而基于多颗谷物群体进行单个或少量几个目标性状的选择,则容易造成后代遗传力的降低,出现遗传学上的稀释效应[2]。

表型(Phenotype)是指某一生物的全部性状特征[3],谷物籽粒鉴定时的表型传统上是指明显的、外在的,诸如颜色、形态、粒质量等外表型(Exophenotype)[3],内表型(Endophenotype)则是指相对独立、有各自特定遗传基础、更为微观和内在的特征,可以通过生化测试或显微观察发现的内在表现型[4-5],诸如各种碳水化合物、蛋白质、脂类、酶类等营养成分的含量,激素的水平甚至物质结构等。近红外光谱(NIRS)技术因具有检测准确、快速和无损等优势,广泛应用于谷物表型检测分析,尤其是营养组分的内表型鉴定方面。DELWICHE等[6]和MAGHIRANG等[7]分别证明了利用多颗小麦籽粒(10~100粒)的近红外平均光谱建立模型,预测单粒小麦的蛋白质含量和硬度指标可行性。还有不少研究者基于NIRS建立了大豆[8-9]、玉米[10-11]、小麦[12-13]的单粒营养组分预测模型,并研制了相应的单粒测量、分选装备[14-17]。时伟芳等[18]、宋乐[19]进行了小麦和水稻单粒种质的活力检测,王纯阳[20]利用傅里叶NIR光谱仪进行单粒水稻品质的蛋白质和水分测量,吴静珠等[21]分别将傅里叶NIR光谱(近红外光谱)仪和近红外高光谱成像系统用于单粒小麦蛋白含量预测的探索,结果表明,近红外高光谱模型的准确性和稳定性会受其颗粒形状、采样面积、装样等测量条件的限制,因而需要改善测量条件,获取样本更全面信息。

现代小麦育种技术除依赖于基因型,越来越多依赖于高质量的表型数据分析,遗传育种早期筛选时,往往以单粒种子为单位进行,但是常规的NIRS(近红外光谱成像)谷物分析仪器检测时,至少需要250 g以上的籽粒样品,不能用于单粒检测,傅里叶型近红外光谱仪由于其复杂性和价格昂贵,更多在实验室中使用,与传统色散型近红外光谱仪相比,在近红外波段上性能优势并不明显,因而不能作为首选[22]。

针对单粒谷物品质检测的需求,本文设计专用的光源机构,与传统色散型近红外光谱仪结合使用,建立单粒小麦蛋白质含量的定量预测模型,以实现单粒谷物内部表型信息无损、实时测量。

1 材料与方法

针对谷物单籽粒内部品质表型的检测需求,研制了一种波长范围覆盖近红外波段的全包围结构光源,并设计了一套无损实时近红外光谱获取装置。光源实物图和整个装置工作原理图如图1所示。

图1 谷物单粒品质近红外光谱检测装置示意图Fig.1 Single kernel near-infrared spectra detection systematical block diagram1.全包围光源结构 2、7.光电检测光纤 3.光电检测器 4、8.一分二型漫反射光纤 5.光谱仪 6.计算机

该装置包括光谱采集模块、一分二型漫反射光纤、全包围结构光源模块和光电检测模块4部分。当谷物籽粒进入光源时,首先会被光电检测器捕捉,产生触发信息,光谱采集模块通过定制一分二型光纤立刻开始捕获籽粒处于光源通道内的漫反射光谱,上传给计算机进行处理与预测。

1.1 全包围结构的光源设计

近红外光谱法有透射测定法、镜面反射测定法和漫反射测定法[23],镜面反射只发生在待检测样品的表面,缺少负载样品的结构和组成的信息,不能用于定性或定量分析;透射分析中由于辐照直径不能超过样品直径,对于麦粒(籽粒厚度一般在3 mm左右)这样的小样品来说,分析光容易在其边缘处泄漏而导致光饱和,即使是玉米或大豆这样的大颗粒谷物,也容易在边缘处被过度照射导致不均匀光照。而漫反射光是分析光进入样品内部后,经过多次反射、折射、衍射、吸收后返回表面的光[24],因而本文选定漫反射法采集单粒小麦的光谱。

在光谱采集过程中,谷物颗粒样品状态、入射光束界面的稳定性以及重复装样的随机性等因素均对漫反射测试有重要影响。因此精巧合理的采集机构是获取高效稳定的光谱数据的重要保障[25]。本文选用美国International Light Technologies公司生产的1150-4型NIR LED微型灯珠,工作电压5 V,电流0.116 A,用以产生恒定近红外光。以圆柱形灯筒的两个底面为平行面,以灯筒轴心为对称轴,48颗灯珠以6行8列形式均匀分布于内径23 mm、外径31 mm的圆柱形铝合金灯筒壁上,形成向心全包围的物理结构,灯珠行间距为8 mm,引脚通过16根导电铜柱并联连接。灯筒内部有直径为12 mm的高纯度硼硅玻璃管,作为谷物颗粒经过的自由滑道,其上顶部入口处设有FV-V11型高灵敏度光纤红外对射传感器(中国深圳博亿精科科技有限公司),用以检测谷物籽粒是否经过此处进入光源。

整体光源模块剖面图和光路传输如图2所示,当籽粒经由人工放置跌落玻璃滑道时,在光源内部获得了强度、均匀性和一致性良好的360°全包围光照。当对射光纤采集到籽粒经过的光电信号,调用上层程序,触发光谱仪采集籽粒在灯筒内的漫反射光,由采集光纤传输至光谱仪进行解析,采集光纤采用海洋光学公司定制的一分二型漫反射光纤,长1 m,尾纤两端分别固定于灯筒上顶端和下底端。在保障籽粒顺利进入灯筒通道的同时,为使两端尾纤和灯筒轴心保持同轴,进而保证谷物籽粒在灯筒内任何位置光纤都可以采集其表面漫反射光,设计了上下进出料通道轴心和灯筒轴心呈15°角,避免了光纤和进出料通道的互扰。考虑到谷物小颗粒检测的需求,光纤芯径采用相对较粗的400 μm,以获得更高的耦合效率和相对均匀的输出光斑。

图2 光路及信号传输示意图Fig.2 Schematic diagram of optical path and signal transmission1.进料口 2.采集光纤 3、8.对射光纤 4.LED灯珠 5.导电铜柱 6.采集光纤 7.出料口

选用美国海洋光学公司生产的体积最小的FLAME-NIR型近红外光谱仪用于系统设计,其波段是900~1 700 nm。该仪器结合了128个带有新型非冷却的InGaAs探测器,功耗需求低,且可互换狭缝,同时有40针Micro USB多用途扩展口,非常适合整合到手持式系统和便携式系统。选用狭缝尺寸为50 μm,以获得更大的进光量,外部扩展接口与红外对射模块接通获得触发信息,触发模式选用外部上升沿触发,为实现有效光谱采集和避免光照度饱和,积分时间设为400 ms,光谱仪通过USB与计算机进行双向通讯。

1.2 检测软件设计

单粒谷物蛋白质含量实时检测软件基于Visual Studio 2010平台开发,采用C++语言编程,基于JAVA语言编写的嵌入式OmniDriver软件开发包, 实现光谱仪软件的功能设置和调度。软件主要功能模块如图3所示,当外部硬件边沿触发时,软件延迟200 ms启动光谱仪进行实时采集,将光强信息转换成吸光度并进行预处理后,代入到预先植入的预测模型中,对单粒谷物的内部蛋白质等品质表型进行实时预测,同时对样品的光谱曲线和预测结果实时显示。

图3 检测软件功能模块图Fig.3 Function modules diagram of detection software

1.3 供试样品

已有研究表明,近红外光谱技术是小麦组分含量无损测定的有效手段[24-25],本研究选择单粒小麦的蛋白质组分为研究对象,验证该全包围光源结构的谷物单粒品质表型检测装置的性能,为获得更好的蛋白质含量分布宽度,供试样选定6个品种,分别为高筋品种西农20、西农979,中筋品种矮抗58、西农388,低筋品种苏3826、苏2858,每个品种50粒,共300粒。

2 单粒小麦蛋白质含量检测试验

2.1 近红外光谱采集与预处理

为了减少环境温湿度对光谱采集的影响,试验过程保持室温为20~25℃。启动光源和光谱仪后,预热30 min至稳定,开始采集光谱。经优化采集参数,光谱分辨率设定为5 nm,扫描点数为128,扫描次数为2。本装置暗光谱不是通过标准白板采集,而是在光源关闭时,光纤采集到自然光下的光谱,参考光谱是打开光源无样品时的稳定光谱。其吸光度转换公式为

(1)

(2)

式中A——籽粒吸光度

R——发射率

Xraw——籽粒在光源内的反射光强

Xref——无样品时光源的反射光强

Xdark——自然光下的反射光强

采集到的吸光度光谱曲线如图4所示,由于谷物籽粒体积小、形状不一、表面不规则,内部物质非均匀等因素,近红外光谱采集过程会加入大量基线漂移、高频噪声、光散射等噪声信息,直接影响模型的鲁棒性,标准正态变量变换(Standard normal variate, SNV)主要是用来消除固体颗粒大小、表面散射以及光程变化对NIR漫反射光谱的影响,因而本文对每条光谱曲线进行SNV预处理。

图4 样本吸光度曲线Fig.4 Spectral absorbance curves of single wheat kernels

2.2 预测模型建立和评价

为验证装置对单粒小麦蛋白质含量检测的可行性,基于联合X-Y距离的样本划分 (Sample set partitioning based on jointX-Ydistance, SPXY) 方法,将供试样本按2∶1的比例划分为校正集和验证集,然后在Matlab软件中,建立基于全光谱(Full spectrum, FS)的多元线性回归模型,利用决定系数R2、校正集标准分析误差(Standard error of calibration, SEC)和验证集标准分析误差(Standard of prediction, SEP)对预测模型进行评价分析。

考虑到全波段光谱数据在进行定性分析时存在冗余,为建立一个简单有效的预测模型植入检测软件,本文利用连续投影算法(Successive projections algorithm, SPA)[23]对光谱数据进行了降维,找到含有最少冗余信息的变量组。再采用与全光谱预测模型相同的样本集划分和评价方法,建立基于特征波长的多元线性回归预测模型,并与全光谱预测模型进行比较分析。

2.3 单粒小麦蛋白质含量测定

单粒小麦质量小,达不到谷物蛋白质测定常用的凯氏定氮法最低样品质量要求,本文采用意大利Costech公司生产的ECS 4024型元素分析仪,基于杜马斯燃烧法进行单粒小麦氮元素含量的检测,然后参照GB 2905—82乘以麦类、豆类的蛋白质调节系数5.7,将其转换成蛋白质含量。

3 结果分析

3.1 单粒小麦蛋白质含量预测模型的建立

根据所建立的全光谱(FS)预测模型,供试样本蛋白质含量预测值与实测值的关系如图5所示,可以看出,二者有良好的线性相关性且偏离程度很小,其中校正集R2为0.960 4,SEC为0.562 3,验证集R2为0.801 6,SEP为1.083 5,显著相关,说明可以用本文研制的装置进行单粒小麦的蛋白质含量预测,所建立的全光谱模型具有良好的预测性。

图5 基于全光谱的小麦蛋白质含量实测值与预测值比较Fig.5 Comparison of predicted and reference protein contents based on FS

图6 SPA算法的特征波长选择分布图Fig.6 Distribution diagram of selected variables wavelength

如图6所示,经过SPA算法所选的9个特征波长分别是961、1 189、1 194、1 200、1 223、1 338、1 400、1 435、1 632 nm,所选的特征波长大部分位于C—H键二倍频吸收谱带1 120~1 260 nm和C—H键、O—H键、N—H键的一倍频复合吸收谱带1 350~1 480 nm附近,可见,SPA特征提取后保留了蛋白质的特征谱段,因而可以实现基于所选特征波长的蛋白质含量预测。

基于所提取的特征波长,建立多元线性回归方程为

y=12.71-561.91x1+5 500.74x2+2 533.42x3-4 248.54x4-5 659.53x5+185.89x6+15.84x7-1 207.89x8+180.46x9

(3)

式中y——蛋白质质量分数预测值,%

x1~x9——9个特征波长下的吸光度

将该线性模型嵌入系统软件,对300粒供试小麦进行蛋白质含量预测之后,拟合实测值和预测值如图7所示,其校正集R2为0.844 6,SEC为1.042 6,验证集R2为0.819 0,SEP为1.037 4。

图7 基于特征波长的小麦蛋白质含量实测值与预测值比较Fig.7 Comparison of predicted and reference protein contents based on characteristic wavelengths

与基于全光谱的预测效果相比,校正集中基于特征波长的预测模型R2降低,这是由于蛋白质分子中的含氢基团有C—H键、N—H键与O—H键,其伸缩和弯曲振动非常复杂,有限个特征波长不能完全表达这些振动,故全光谱的预测效果优于特征波长的预测效果,但是在验证集中,对于新样本的检测,这两种模型效果接近。尽管如此,使用基于特征波长的预测模型可以大大减少计算量,便于嵌入式开发和在线快速预测。

3.2 检测装置的性能指标

为了验证所设计的全包围结构光源的技术指标,从波长重复性、吸光度重复性以及预测重复性等3个方面进行了试验和分析。

(1)波长重复性

波长重复性对校正模型的建立以及模型的传递均有重要的影响,一般用稀土氧化物玻璃或高压汞弧灯等标准物质多次扫描,在某谱峰上所得波长或波数的标准偏差来表示。在光源稳定工作时,不放置样品,每隔1 min左右采集一次当前参考光谱,每次采集时长是当前积分时间400 ms,各波长的误差棒图如图8所示,结果可见各波数的误差很小,可达到一般扫描型近红外光谱仪器的要求[26-27]。

图8 参考光谱各波长上的误差棒图Fig.8 Error bar at each wavelength of reference spectra

(2)吸光度重复性

吸光度重复性对近红外检测来说是一个极其重要的指标,它直接影响模型建立的质量和测量的准确性,一般用同一条件下对同一样品连续进行多次光谱测量,整个光谱区间或某一特征谱峰的吸光度标准偏差来表示[27-28]。对同一颗小麦随机采样30次,在整个光谱区间上的吸光度标准偏差和误差如图9所示,基本满足一般吸光度重复性的要求。

图9 各波长上的吸光度标准差和误差Fig.9 Error bar at each wavelength of absorbance spectra

(3)预测重复性

随机选取5颗样品,在相同条件下,对每个样品采集5次吸光度光谱[25],采用式(3)进行蛋白质质量分数预测,结果如表1所示,可见,预测结果重现性良好,说明采用全包围光源结构的近红外光谱系统可以消除谷物颗粒形状和随机装样对品质预测的影响[29]。

表1 预测重复性试验结果Tab.1 Test results of prediction model repeatability %

4 讨论

近红外光谱检测技术具有无损、快速、低成本等优点,在种子质量检测行业已广泛应用。从上述分析可知,基于全包围光源结构的单粒谷物品质检测系统,只需收集一定数量的标准样品,并建立相应的定标模型,将模型嵌入该系统中,即可满足其他谷物单粒品质表型,如蛋白质、淀粉、赖氨酸、水分测量等的实际应用需求,为快速发展中的表型鉴定技术提供一种方案和解决途径,可帮助育种专家快速、无损地评估育种群体中后代表现,更迅速筛选符合育种目标的优良后代。

本系统测量时间约为每粒2~3 s,其中装样所用时间长,因而在今后的工作中仍需扩展系统功能,实现自动化的谷物颗粒自动输送与测量,以期将检测速度提高至6~10粒/s,从而获得高通量的品质表型在线检测。

5 结论

(1)设计了一种全包围结构的谷物近红外检测光源和基于该光源的单粒谷物内部品质表型检测装置。该装置可以实现对单粒小麦种质内部蛋白质质量分数进行无损、快速、实时测定。

(2)利用该检测装置,分别建立了单粒小麦蛋白质质量分数的全波段光谱预测模型和基于特征波长的预测模型,结果表明,基于全波段的预测模型具有更高的预测精度,而基于特征波长的预测模型具有更简单的表达式。

(3)分别从波长重复性、吸光度重复性和预测重复性出发,验证该检测装置的性能,试验结果表明,该装置设计可行,性能良好,可完成单粒谷物品质表型的实时检测。

猜你喜欢

单粒谷物光源
五寨燕麦晋粒康“边煮边发芽”的神奇谷物
家蚕种质资源单粒缫丝成绩评价
乌克兰谷物和油料作物库存远低于2020年同期
玉米单粒播种子质量标准实施我国精量化播种步入规范化新时代
乌克兰谷物和油料作物库存远低于2020年同期
光源改变光环境
享受LED光源的卓越色彩 Acer(宏碁)PD1530i
击打式谷物加工农具
具有单粒精量播种功能的玉米播种机设计与研究
家蚕单粒缫丝质评价体系初报