太赫兹时域光谱及成像技术在农作物品质检测中的应用研究进展
2022-02-17吴静珠李晓琪孙丽娟刘翠玲孙晓荣
吴静珠, 李晓琪, 孙丽娟, 刘翠玲, 孙晓荣, 余 乐
1. 北京工商大学食品安全大数据技术北京市重点实验室, 北京 100048
2. 中国农业科学院作物科学研究所, 北京 100081
引 言
太赫兹波(terahertz, THz)通常是指频率在0.1~10 THz、 波长在3 mm~30 μm、 波数在3.3~330 cm-1之间的电磁波。 该波段位于微波和红外之间, 正是电子学向光子学、 宏观经典理论向微观量子理论过渡的特殊区域。 THz波所处区域的特殊性决定了THz科学技术是电子学与光子学交叉融合的一个电磁波谱新领域[1-3]。 20世纪80年代以前, 由于缺乏有效的THz波段辐射的高效发射源和灵敏探测器, 使得THz波长期以来没有得到充分的研究与应用。 近几十年来, 随着超快激光技术的发展, THz辐射源和探测器研究不断取得新进展, 极大地促进了THz辐射的理论和应用研究[4-6]。
THz辐射在高低频段分别呈现出光波和电磁波特性。 与其他波段的电磁辐射相比, THz辐射具有很多独特的性质, 如瞬时性、 宽带性、 相干性、 低能量性、 穿透性和吸收性, 能够探测到其他技术无法获取的样本信息。 THz辐射以其独特的技术优势受到了全世界各国政府、 高等院校、 科研机构等的高度重视[7-8], 目前已成为生物医学[9-11]、 材料科学[12]、 物理学[13]、 环境科学[14]、 航空航天[15]、 国家安全[16]等多个领域的新兴研究热点。
近年来, THz时域光谱(terahertz-time domain spectroscopy, THz-TDS)及成像技术在农业领域的应用研究也初见成效[17-20]。 大多数生物大分子和极性分子的振动(包括集体振动)和转动能级间距正好处于THz频段, 因此农作物产品主要成分如水分、 蛋白、 脂肪、 淀粉等在THz谱区有较为丰富的吸收。 THz时域光谱与成像技术结合可获取信息量极为丰富的三维时空数据集, 不但能用于农作物样本的组织形态辨别, 而且还能够实现对农作物产品的理化成分检测和品质评价等。 另外, THz的低辐射特性和穿透性相较于其他光谱技术在农业生物样本、 带包装样本的检测方面更具优势。 因此THz时域光谱及成像技术目前正逐渐发展为农业领域一项极具应用潜力和应用前景的前沿分析技术, 有望成为近红外光谱、 X光透射等技术的有力补充。 本文重点聚焦于THz时域光谱及成像技术在农作物品质检测领域的应用研究现状, 深入探讨该技术在农作物种子质量评价、 农作物成分分析、 农作物贮藏品质判别、 农产品安全检测等方面的最新进展和存在问题, 并对该技术在农作物品质检测领域的应用前景和发展趋势进行展望。
1 THz时域光谱及成像技术
1.1 THz时域光谱技术
THz时域光谱技术是20世纪90年代发展起来的一种新兴的相干探测技术, 它能够同时获得THz脉冲的振幅信息和相位信息[21]。 THz时域光谱检测的基本原理是利用飞秒脉冲产生并探测时间分辨的THz电场, 分析THz脉冲通过样品的样品信号和它在自由空间中传播同等长度距离后的参考信号这两个THz脉冲时间分辨电场的相对变化, 再通过傅里叶变换等计算得到待测样本的复折射率、 介电常数和电导率等光学参数。 由于通过不同结构和成分的样本的THz脉冲存在差异, 因此THz时域光谱可为样品分类、 成分检测等提供丰富的信息。
目前世界范围内已经有多家企业开始生产商用THz时域光谱仪, 主要是美国, 欧洲和日本的厂家。 典型THz时域光谱系统主要是由飞秒激光器、 THz波发射器、 THz波接收器及时间延迟系统组成[22]。 根据THz波与样品的作用方式, 主要分为透射式和反射式, 其中透射式应用最为广泛。 图1所示为英国TeraView公司的TeraPulse 4000 THz时域透射式光谱系统结构示意图。
图1 TeraPulse 4000 THz时域光谱系统结构示意图
1.2 THz时域光谱成像技术
THz时域光谱成像技术是基于时域光谱技术发展起来的。 自美国的Hu等于1995年在THz-TDS 系统中增加二维扫描平台成功搭建第一套THz成像装置后[23], 世界各地的研究小组相继开展了各种THz成像技术在各领域的应用基础研究[24-26]。
THz时域光谱成像系统根据扫描方式的不同可分为透射成像和反射成像两种。 通常强吸收的物质宜采用反射成像方式; 弱吸收物质宜采用透射成像方式。 与红外成像技术相比, 样品对THz辐射的散射较小, 能够获得更为清晰的THz图像; THz辐射具有透视性, 能够对被包装的物品进行无损检测; 并且THz光谱图像(如图2所示)是信息极为丰富的三维时空数据集(二维空间(x,y)轴向和一维时间轴向t/z), 不仅包含目标物的几何信息, 而且还具有目标物对脉冲响应的强度、 相位和时间等完整信息。 综上, THz时域光谱成像技术在生物医学、 环境监测、 食品质量监控、 安全检查等领域存在着巨大的应用潜力。
图2 THz时域光谱图像数据集示意图
2 THz时域光谱及成像技术在农作物品质检测中的应用研究
农作物作为国家重要的战略储备资源, 在播种、 种植、 收获、 储存各个阶段都会受到不同因素影响导致其品质发生变化, 因此针对农作物品质进行全过程的快速、 准确检测是现代农业发展的重点任务之一。 相较于THz技术在材料科学, 生物制药、 无线通讯和国家安全领域的应用研究, THz时域光谱及成像技术在农业领域的应用研究还处在早期阶段。 表1所示是目前该技术在农作物品质检测领域应用研究现状的总结。
表1 THz时域光谱及成像技术在农作物品质检测中的应用研究总结列表
2.1 农作物种子质量评价
种子是农业生产中最基本和最重要的生产资料。 作为世界第二大种子大国, 我国种业市场规模接近千亿元。 种子质量测定的新方法和新理论研究对于我国现代农业发展具有重要的意义。 THz技术的低辐射特性可以确保种子生物样本检测时不产生电离; 其透视性为非破坏性测定带包装或是包衣种子质量提供可行性; 种子成分如水分、 蛋白、 脂肪等在THz频段有丰富吸收, 且THz 时域光谱结合成像技术可为单粒种子理化性质检测提供切实可行的理论基础。 近年来, THz 技术的独特优势迅速受到了国内外学者的密切关注并在种子相关领域展开了广泛的探索研究。
2.1.1 品种鉴别
梁川等[27]采用THz时域光谱在透射成像模式下对不同品种玉米进行探测。 通过采集得到玉米种子不同部位在0.2~3 THz范围内的时域谱、 吸收谱和折射率谱, 探究玉米种子测定部位、 平滑度、 品种等因素对所得谱图的影响。 得出结论如下: 不同品种的玉米胚乳谱在太赫兹谱区存在明显差异, 且存在特征吸收, 可为进一步判别高、 低油玉米品种及其主要成分的检测等提供参考。 李慧等[28]提出将THz时域光谱与学习矢量量化(LVQ)神经网络相结合鉴别4类玉米品种。 实验利用衰减全反射(ATR)采样方式获取了玉米种子在全谱(0~275 cm-1)范围内的吸收系数谱, 并分别对全谱(0~275 cm-1)和特征谱(0~70 cm-1)建立基于LVQ的玉米品种快速鉴别模型, 模型预测准确率可达80%~100%。
杜勇等[29]提出了将THz时域光谱和支持向量机(SVM)结合快速检测棉花种子的方法。 利用太赫兹透射成像方式采集4个品种的棉花共计40个样本在0.2~1.2 THz范围内的太赫兹光谱数据, 采用遗传算法优化SVM模型参数, 最终建立棉花种子品种鉴别模型的识别率可达93.75%。
Ge等[30]根据8个不同品种小麦在0.2~2.0 THz范围内的吸收光谱数据, 利用区间偏最小二乘法(iPLS)算法选择特征谱区优化种子品种分类模型。 模型相关系数(R)和交叉校验均方根误差(RMSECV)分别为0.992和0.967, 为THz光谱结合多元统计分析快速无损鉴别小麦品种提供了可行性参考。
王芳等[31]将THz时域光谱技术应用于牧草种子的识别中, 根据THz波段的时域谱、 频域谱计算得到5种常见牧草种子在0.2~1.4 THz频域范围内的光学参数。 结果表明, 基于折射率建立的PLS模型预测效果最好。
刘翠玲等[32]利用THz衰减全反射技术结合距离匹配(DM)算法, 对不同品种花生进行快速分类鉴别。 实验采集3个花生品种在0.3~3.6 THz的THz衰减全反射光谱, 对其吸收系数进行一阶导数及归一化预处理, 建立花生品种的距离匹配快速鉴别模型, 模型总体识别准确率可达93.3%, 可实现对不同花生品种的快速分类鉴别。
综上研究表明THz时域光谱及成像技术与化学计量学方法相结合在玉米、 棉花、 小麦、 牧草和花生种子的品种鉴别领域极具应用潜力。 THz技术有望为农业选种、 规范种子产业、 保障农作物质量安全提供一种新型、 快速、 安全的检测手段。 但是除了低辐射特性和透视特性, 目前研究中相较于近红外光谱, 农作物种子无明显THz吸收峰, 待测样本光学参数的可解释性相对较为困难, 且实验操作相对复杂, 如大部分实验中样本制备需要经过压片等预处理, THz光谱实验过程中通常需要保持氮气吹扫、 温度恒定等环境要求。
2.1.2 转基因鉴别
Xu等[33]利用THz时域光谱技术分别结合判别分析(DA)和主成分分析(PCA)方法对含有Cry1Ab蛋白的转基因水稻与其亲本进行区分, 将样本0.1~2.6 THz光谱经一阶导数预处理后建立用于判别转基因和非转基因水稻的DA模型, 其校正集和验证集的准确率分别达到89.4%和85.0%。 Liu等[34]应用THz光谱成像技术结合化学计量学方法对转基因与非转基因水稻种子进行区分。 从采集得到的0.1~5 THz水稻种子样本的THz时域光谱图像中提取THz光谱信息可得, 转基因和非转基因水稻种子在频域光谱上两者存在明显差异; 比较基于LS-SVM和PCA-BP以及随机森林(RF)的转基因/非转基因种子判别模型可得, 经一阶导数预处理后建立的RF模型预测集准确率可达96.67%。 Hu等[35]应用THz光谱成像技术对转基因和非转基因水稻种子进行鉴别, 同样发现转基因与非转基因水稻种子在THz谱带上(0.1~4 THz)存在差异。 采用稀疏表示(SR)从原始THz数据中提取特征并降低输入特征的维数, 然后结合RF建立转基因水稻种子判别模型可得: SR-RF模型校正集准确率为100%, 预测集准确率分别为95%。
涂闪等[36]采用THz时域光谱技术对8种转基因棉花种子主成分特性进行分析。 根据转基因棉花种子在0.3~1.5 THz内的吸光度谱, 采用PCA提取累计贡献率超过65%的前3维主成分进行分析可得: 外源基因片段导致不同转基因棉花种子具有不同的吸收峰; 不同转基因棉花种子的3种主成分含量比重不同, 不同转基因棉花种子在THz频段的吸收程度不同。 由此可对不同的转基因棉花种子进行无损检测, 该研究可为检测其他转基因品种奠定实验基础。 Liu等[37]基于THz光谱建立了一种可以鉴别具有相似特征的4种不同转基因棉花种子的识别模型。 实验采集4种样本的原始光谱(0.2~1.5 THz), 利用PCA提取特征数据作为SVM分类模型的输入, 并通过遗传算法(GA)对SVM中的惩罚因子c和核参数g进行优化。 结果表明, GA方法相较于网格搜索法可以更全面地找到全局最优参数, GA-SVM模型识别转基因棉花种子的准确率可达96.67%。
Chen等[38]利用THz时域光谱技术对84份转基因和非转基因甜菜进行分类判别。 实验采集0.2~1.2 THz频率范围的甜菜样本的光谱数据, 通过分析吸收光谱可得转基因甜菜吸收光谱略低于非转基因甜菜; 进而采用PCA提取累计贡献率高于95%的前两个主成分, 利用DA方法对甜菜样本进行划分, 实验结果表明, DA模型可以有效地区分转基因和非转基因样本, 总体识别率可达97.6%。 潘学文等[39]提出了一种基于THz光谱和超香肠(HSN)神经元网络的检测方法实现对转基因甜菜的无损鉴别。 采集样本0.1~1.5 THz光谱数据, 利用PCA提取前3个主成分建立超香肠神经元鉴别模型, 该模型对第一测试集的平均正确识别率达97.86%, 对第二测试集的平均正确拒识率达95.08%, 该方法能较好地鉴别转基因甜菜且识别准确率高。
Liu等[40]利用THz时域光谱成像系统采集60份抗草甘膦大豆种子、 60份常规大豆种子及其杂交后代种子样本在0.1~4 THz范围内的光谱数据并进行鉴别。 分别应用PCA、 LS-SVM以及PCA-BP网络建立3类大豆种子鉴别模型。 实验结果表明, 基于SNV预处理光谱的LS-SVM模型识别准确率可达88.33%。 Chen等[41]提出一种基于THz光谱技术的转基因大豆鉴别方法。 采用THz-TDS系统测量2种转基因和1种非转基因大豆种子在0.2~1.2 THz波段的THz光谱, 采用布谷鸟搜索(CS)算法优化判别转基因种子的SVM模型。 实验结果表明, 应用THz光谱技术结合CS-SVM方法为转基因、 非转基因生物的检测和识别提供了一种快速、 无损和可靠的分析方法。
Lian等[42]利用THz时域光谱技术对转基因和非转基因玉米进行识别。 采集4类玉米样本在0.2~1.6 THz范围内的THz光谱, 利用PCA对前4个主成分进行提取(累积贡献率95%以上), 分别建立基于PCR、 PLSR、 BP和SVM的判别模型, 结果表明采用PCA-SVM建立的模型效果优于其他方法, 总体识别率可达92.08%。
上述文献研究将THz时域光谱及成像技术与化学计量学、 智能优化搜索算法等相结合应用于水稻、 棉花、 甜菜、 大豆、 玉米种子的转基因鉴别, 初步研究结果表明该技术在农作物种子转基因鉴别方面具有较为光明的应用前景。 与常用的种子转基因鉴别方法如定性PCR检测、 实时荧光定量PCR检测、 特异蛋白检测和生物表现型检测法相比: (1) THz时域光谱技术无需复杂的样品前处理, 操作更为高效、 便捷、 绿色, 更具通用性; (2) THz技术需要与较为复杂的算法相结合, 才能提高该方法的鉴别准确度; (3)现有的THz研究结果大都仅限于少量的实验数据, 有待实际、 大量数据测试该方法的实用性和可靠性。
2.1.3 活力鉴别
吴静珠等[43]选取3个品种的玉米种子, 制备5种不同老化天数的种子样本, 采用ATR附件采集从样本分离得到的种胚和胚乳粉末的THz吸光度谱(0.2~80 cm-1), 应用移动窗口相关系数法筛选与种子老化密切相关的THz特征波段。
饱满度是反映向日葵种子活力的重要指标, Sun等[44]利用THz透射成像技术扫描了蠕虫、 缺陷和健全葵花籽的THz数据(0.5~2.0THz)。 在通过阈值分割处理的THz和RGB图像之间建立了饱满度模型, 独立预测集的决定系数为0.91、 预测均方根误差为4%。 实验结果表明, 利用THz透射成像技术测定完整葵花籽饱满度是可行的, THz成像技术可为带壳类样本提供一种新颖的质量评估解决方案。
Gente等[45]利用THz技术对正常和有缺陷的甜菜种子的光谱数据(0.25~0.3 THz)进行研究, 发现有缺陷种子的THz辐射的透射率更高。 利用最大似然方法进行建模可以实现种子检测并自动分类, 总检测率可达到87%。
应用THz技术判别种子活力的研究目前尚处在探索阶段。 从已发表的研究文献可以看出在单粒种子品质判别方面, THz时域光谱成像技术以其自身的辐射特性较传统分子光谱成像技术有明显优势, 尤其是对硬壳类种子或是组织结构不均匀、 成分差异显著的种子。
2.2 农作物成分分析
成分分析对于作物生长状况监测、 作物产品质量评价等具有十分重要的意义。 近年来已有专家学者开始探索利用THz时域光谱及成像技术检测农作物成分的研究。 但农作物形态不一且作物成分繁多, 易在光谱采集过程中造成对目标成分检测的严重干扰。
2.2.1 糖类分析
Josette等[46]采用THz时域光谱技术结合化学计量学方法开展对糖类的研究。 采集柠檬酸、 D-(-)果糖和α-乳糖混合物及三者纯物质在0~3 THz内的吸收光谱, 由纯物质吸收光谱可知三者样本都存在吸收峰, 但混合物光谱并不是三者叠加, 因此不能简单通过观察光谱进行分析, 实验利用PCA可以将不同样本正确定位到三维图中; 其次, 采用PLSR和人工神经网络(ANN)对三种混合物浓度进行定量分析, RMSE值低于0.9%。
李斌等[47]以D-无水葡萄糖为研究对象, 采集葡萄糖样本的THz时域光谱并计算得到频域光谱及光学参数, 根据吸收光谱曲线可知D-无水葡萄糖在0.1~2.2 THz频率范围内存在较为明显的吸收峰; 基于特征波长建立D-无水葡萄糖含量THz多元线性回归(MLR)模型, 预测集相关系数为0.992 7, 预测均方根误差为0.055 2。 该研究为利用THz光谱技术在农产品、 食品中糖类含量检测提供了理论基础及方法参考。
针对小麦中麦芽糖含量检测, 蒋玉英等[48]提出了一种基于Boosting的多源数据融合方法以实现最小二乘支持向量机(LS-SVM)基本模型参数的自动优化, 将光谱和图像特征的数据融合建模可以有效实现对农产品中糖类的定量检测。
2.2.2 水分分析
赵旭婷等[49]采用THz光谱技术检测大豆冠层叶片含水量, 探究该技术用于实时获取大豆健康状况的可能性。 实验通过设置不同梯度水分灌溉以模拟田间不同程度的干旱胁迫情况。 通过THz时域透射系统采集样本光谱数据并提取光学参数, 可以发现随着水分胁迫程度的降低, 时域光谱的峰值不断衰减, 吸收系数值及折射率值逐渐升高。 利用PLS和多元线性回归(MLR)方法建模分析可得, 基于时域光谱最大值和最小值的MLR模型与含水量呈较高的相关性, 模型预测效果最好。
步正延等[50]提出一种基于THz时域光谱成像技术的大豆叶片水分含量测定方法。 实验利用THz透射成像系统采集0~2 THz范围内96份大豆叶片的光谱图像; 采用自适应阈值分割方法对3个水分敏感特征波段下的叶片图像进行分割, 划分出叶片特征组、 叶脉特征组和叶肉特征组; 分别采用MLR, BP和LS-SVM算法建立叶片水分含量预测模型。 实验结果表明, 基于叶肉特征组的LS-SVM模型预测结果最好, 预测集的决定系数和均方根误差分别为0.963 2和0.046 5。
水分在THz波段有敏感吸收, 上述研究文献也表明应用THz技术检测作物水分具有实际可行性, THz光谱成像技术相较于THz光谱技术在无损检测作物水分方面更具有优势。 但是实际检测过程中, 若无严格的实验室环境条件控制, 环境水分会对目标物水分的检测存在较为严重的非线性干扰, 因此通常采用非线性建模的结果要优于传统的线性建模方法。
2.2.3 淀粉分析
Nakajima等[51]探索了THz时域光谱技术定量检测作物中淀粉含量的应用潜力。 实验采集了绿豆种子萌发后1~7 d的吸光度谱(3.0~13.5THz), 并与淀粉及葡萄糖的THz光谱比较分析可得, 9.0 THz是表征淀粉共价振动的一个特征峰; 基于该THz特征波长建立的绿豆幼苗淀粉含量预测模型, 相关系数可达0.98。 尽管THz测量过程中对样品预处理具有破坏性, 但初步的实验结果表明, THz技术在不需要纯化预处理的情况下具有监测和量化作物基质中淀粉的潜力, 有待实验进一步确认该技术在农作物淀粉测定中的实际可行性。
2.3 农作物贮藏品质判别
农作物在贮藏过程中由于年限、 病虫害、 环境温湿度等因素的影响可能导致其品质发生劣变, 对贮藏农产品进行及时、 有效的检测可以避免因贮藏不当引起的更大经济损失。
2.3.1 新陈度判别
葛宏义等[52]采用THz时域光谱判别4个不同年份储藏的小麦样品, 根据样品的THz时域光谱(0.2~1.2 THz)计算折射率和吸收系数等光学参数, 发现不同年份储藏小麦样品的折射率和吸收系数均存在差异, 且样品的吸收系数都随着频率的增加而增加。 该研究为小麦新陈度的检测分析提供了新的参考方法, 对进一步进行小麦品质的检测具有指导意义。
王冬等[53]利用THz时域光谱系统结合化学计量学算法判别老化小麦样本。 采用ATR附件采集人工老化后小麦样品的THz光谱(0~2 THz)并计算得到吸收光谱和折射率谱, 基于PCA提取累计贡献率较高的2个主成分建立PLS-DA模型。 其中基于吸收光谱建立的模型自预测识别准确率在81%以上, 外部验证样品识别准确率在73%以上; 基于折射率谱建立的模型自预测识别准确率在76%以上, 外部验证样品识别准确率在84%以上。
2.3.2 劣变判别
Jiang等[54]利用THz成像技术结合多源数据分析方法对不同霉变程度(正常、 轻度、 中度和严重)的小麦样本进行识别。 在0.2~1.6 THz波段内从小麦图像中获取光谱数据, 利用PCA提取不同霉变程度的小麦样品光谱数据中前3个主成分(累计贡献为98.25%), 然后分别基于SVM、 PLSR和BP网络建立判别不同霉变程度样本的分类模型。 结果表明, 基于SVM建立的分类模型总体识别率为95%, 识别效果优于PLSR和BP网络建立的模型, 能够有效区分不同霉变程度的小麦样本。
王冬等[55]利用THz-ATR技术对电离辐照导致劣变的花生进行快速无损鉴别, 采集2种花生THz时域波谱数据(0~2 THz), 并计算得到吸收系数谱、 折射率谱, 采用PLS-DA结合全交互验证算法建立劣变花生鉴别模型, 并采用外部盲样对模型预测性能进行验证, 实验结果表明, 校验集正判率均高于80%, 外部盲样正判率均高于87.2%。
刘翠玲等[56]应用THz时域光谱技术结合化学计量学算法判别不同霉变程度的花生样本。 采用THz-ATR附件采集正常、 轻度、 中度与严重霉变的两个品种花生样本的时域光谱(0.3~3.6 THz), 分别建立基于BP神经网络及SVM的花生霉变程度判别模型。 基于BP网络的模型对两个品种预测集识别准确率均达到85%以上; 基于SVM的模型对两个品种不同霉变程度的二分类模型、 三分类模型的预测集识别正确率均为100%。
2.3.3 虫蚀判别
谭佐军等[57]利用THz时域透射光谱针对农作物早期害虫玉米象进行检测。 获取玉米象和不含玉米象的谷粒样品压片在0.2~1.6 THz范围内的时频域光谱并计算得到折射率与吸收光谱, 可知玉米象与谷粒的时域光谱在幅值和时间延迟上存在明显差异, 进而利用偏最小二乘-判别分析(PLS-DA)建立判别模型, 总体识别率可达100%。
琚新刚等[58]利用太赫兹反射成像技术对受虫蚀的麦粒内部结构进行层析成像, 采用最大类间方差法分割麦粒内部结构刨面图中的蛀食区域, 并引入遗传算法, 该方法能够有效地识别出麦粒内部的虫蛀区域。
2.3.4 综合判别
蒋玉英[59]利用THz-TDS结合图像处理、 化学计量学和信息融合技术对储存小麦的芽变、 霉变、 异物进行无损探测, 研究表明该技术是一种潜在的储粮品质无损精准检测手段。 赵中原[60]利用THz光谱对正常小麦、 发芽小麦、 虫蚀小麦以及霉变小麦分类识别进行研究, 采集0.2~1.6 THz波段时域光谱并计算得到吸收系数及折射率, 由于吸收谱无明显吸收峰, 故提取吸收系数谱前4个主成分(累计贡献率为98.54%), 提取折射率谱前3个主成分(累计贡献率为97.74%), 基于上述提取特征构建SVM模型进行分类识别, 预测精度可达90%以上。
李明利[61]利用太赫兹时域光谱技术对正常、 虫蛀和霉变的小米样品进行分析。 根据折射率谱及吸收系数谱可知正常样本折射率高于霉变及虫蛀样本, 不同品质小米样本吸收峰虽存在差异, 但不能依靠光谱完全区分。 实验进而采用直接正交信号校正+标准正态变量交换+卷积平滑(DSOC+SNV+SG)及竞争性自适应重加权法+连续投影法(CARS+SPA)进行预处理及特征提取, 建立区分小米不同品质的模型。 结果表明: 应用改进粒子群-支持向量机(IPSO-SVM)建立的模型预测性能较高, 测试集的准确率识别可达97.78%。
上述文献研究表明农作物在贮藏过程中由于年限、 病虫害、 环境温湿度等因素导致的自身成分或是形态发生变化的, 采用THz时域光谱及成像技术可以进行有效判别, 但是由于农作物成分复杂, THz时域光谱在探究其目标成分变化时易受到其他成分、 环境水分等干扰而难以得到直接、 明确的谱吸收峰信息, 现有研究报道中THz技术大都需要与较为复杂算法相结合才能对目标物进行判别, THz谱的有效解释还有待进一步探究。
2.4 农产品安全检测
近年来随着经济的发展, 农产品安全质量问题已成为社会关注的焦点, 加强农产品质量管控, 完善品质安全检测体系是现阶段面临的重大挑战。 目前我国农业种植过程中农药残留及污染超标造成癌症比率明显升高, 为了追求利润超量加入添加剂导致其品质大大降低严重影响国民健康。 探索发展快速、 便捷、 高效的检测方法, 强化监督检查体系对于保障农产品质量安全推动农业经济发展具有重要的意义。
2.4.1 农药残留检测
焦丽娟[62]建立了基于THz-TDS系统的农药光谱检测实验平台, 研究了氟氯氰菊酯THz波谱的光学信息提取方法和定性定量分析建模算法, 为THz光谱技术在农产品质量检测领域的初步应用提出了理论和实验依据。 马吉祥[63]发现4种常用固体农药(三氯杀螨砜、 敌百虫、 亚胺硫磷和六氯苯)在0.3~2.2 THz范围内存在不同的特征吸收峰; 利用Gaussian09量子化学计算软件包, 以密度泛函理论模拟计算了上述4种农药在太赫兹波段的理论振动光谱, 对与实验相匹配的吸收峰的振动模式进行了指认分析; 分别采用C4.5决策树和SVM建立鉴别4种农药的THz模型。 陈倩等[64]利用THz光谱系统采集不同质量分数的吡虫啉在0.4~1.1 THz的频谱数据, 确定吡虫啉在0.88 THz处存在明显的特征吸收峰; 建立的PLSR模型定量分析吡虫啉含量具有较高的相关系数和较低的预测均方根误差。 结果表明: THz-TDS结合化学计量学具有检测吡虫啉浓度的潜力。
Maeng等[65]制备了不同配比吡虫啉小麦粉混合物压片并采集0.1~3 THz内的光谱数据进行定量分析, 根据特征吸收峰确定了吡虫啉吸收系数与含量之间的线性关系, 结果表明: 利用THz光谱技术检测农产品中的农药残留具有一定的潜力。 Chen等[66]利用透射方式采集吡虫啉与大米粉末压片在0.3~1.7 THz的吸收系数谱, 分别建立了基于PLS, SVR, iPLS和biPLS的吡虫啉定量分析模型, 平均预测误差均低于0.7%, 因此THz时域透射光谱结合化学计量学方法可以实现大米粉末中吡虫啉的准确定量分析, 该方法也可以为应用THz定量检测其他农产品中的农药残留提供参考。
Baek等[67]探索应用THz光谱检测小麦粉和大米粉压片中灭多虫等农药残留的可行性, 根据灭多虫的实测透射光谱(0.1~3 THz)与密度泛函理论计算得到模拟光谱, 共同确定灭多虫THz特征频率为1 THz, 建立了基于该频率吸收系数的一元回归定量分析模型, 模型相关系数>0.974, 检测限<3.74%, 研究结果表明THz-TDS可用于农产品中灭多虫残留快速检测, 但是检测限还有待提高。
Qin等[68]基于THz时域透射光谱对多菌灵与番茄粉的混合物检测进行了探究。 首先利用PCA提取样本光谱数据集中前2个主成分作为输入, 建立基于密度峰值聚类方法(CFSFDP)的分类模型, 能够对含不同质量分数的农药混合物准确区分。
覃斌毅等[69]以4种农药(吡虫啉、 多菌灵、 福美双和敌草腈)和3种农作物(大米、 茶叶和玉米)为检测的对象, 采用THz时域光谱技术从农药太赫兹光谱解析、 农药固体定性识别和定量分析、 基于THz超材料的农药溶液检测方法、 混合物光谱分离方法这五个方面进行研究, 探索应用THz技术检测农作物中农药残留的新方法。
上述文献介绍了应用THz时域光谱技术进行农药残留检测的探索发展过程: 从纯农药THz光谱研究到农药与农作物混合物定量分析, 以及基于THz超材料的灵敏度提高方法等。 现有研究报道表明THz技术与化学计量学结合在农产品农残检测领域具有一定的应用潜力, 但是文献中的实验样本都是人为配置的单一或是确定农残种类的样本, 实际农产品中农药残留的情况更为复杂, 因此THz检测农作物农残的实际可行性还有待进一步验证。
2.4.2 添加剂检测
针对农产品添加剂及有害物质分析方面, 付秀华等[70]研究了小麦粉、 滑石粉及其混合物在0.2~1.5 THz内的吸收谱和折射率谱, 发现滑石粉存在明显的特征吸收峰, 采用PLS方法对小麦粉中滑石粉的含量进行定量分析, 结果表明小麦粉中的滑石粉含量与太赫兹吸收系数具有较高的相关性, 相关系数为0.993 9, 均方根误差为1.48%, 检出限优于2.0%, 初步证实了THz-TDS技术用于物质识别及混合物中非法添加剂检测方面的可行性。
夏燚等[71]基于THz时域光谱技术开展了吊白块(甲醛次硫酸氢钠)、 增白剂(过氧化苯甲酰)及混合物检测的研究。 在室温下利用THz时域光谱系统测量了0.2~1.5 THz时域光谱并计算得到吸收光谱和折射率谱。 由光谱图可知在该波段过氧化苯甲酰存在明显的特征吸收峰, 同时混合物中吊白块含量越高, 样品吸收系数越小, 折射率越大; 采用PLS建立检测混合物中吊白块含量定量分析模型, 结果表明吊白块含量与吸收系数呈强相关, 相关系数为0.999 8, 均方误差(RMSE)为1.21%, 检出限优于2.0%。
方虹霞等[72]基于THz时域光谱技术在室温条件下对小麦粉添加剂(偶氮甲酰胺)、 小麦粉及两者混合物进行检测, 分析其在0.2~2.0 THz频率范围内的吸收谱与折射率谱可知, 小麦粉在THz频段没有特征吸收, 而偶氮甲酰胺在1.93 THz处存在特征吸收峰, 可对两者进行有效区分; 对11份不同含量的偶氮甲酰胺小麦粉混合物分别测量得到吸收和折射率谱可以发现, 随着添加剂含量增加, 样品吸收系数逐渐下降, 折射率逐渐增加。 利用PLS建立定量分析模型, 其中基于吸收光谱模型相关系数可达99.99%, 均方根误差仅为0.06%。
欧阳爱国等[73]采用THz光谱技术对玉米粉中苯甲酸含量进行定量检测。 采集玉米粉中不同质量分数的苯甲酸在0.5~3 THz的光谱数据, 基于PLS, LS-SVM和SPA-MLR分别构建苯甲酸定量分析模型, 其中LS-SVM模型预测性能最优, 预测集RMSEP为0.005 7, 相关系数R为0.998 5。 胡军等[74]利用THz时域光谱技术检测面粉中苯甲酸, 并分别研究比较了PLS, LS-SVM和BPNN模型, 实验结果表明, 与PLS和LS-SVM模型相比, BPNN模型预测效果更好, 预测相关系Rp和均方根误差(RMSEP)分别为0.994 5和0.66%。 Sun等[75]采用PLS和LS-SVM建立了苯甲酸浓度和THz吸收系数之间的定量分析模型, 其中LS-SVM模型预测相关系数为0.994, 预测均方根误差为0.12%。 上述实验结果表明, 将太赫兹光谱与支持向量机结合在定量分析小麦粉中苯甲酸添加剂方面具有潜力。
2.4.3 异物检测
针对农产品中常见异物的检测, Ok等[76]利用亚THz技术针对含有3种异物(金属、 昆虫、 塑料)的奶粉样本进行检测, 根据反射及透射成像中异物及奶粉的对比度差异及边缘可以清晰将两者划分。
Shin等[77]探究了利用THz时域光谱反射成像技术检测食品中存在异物的可能性。 实验选取多种食品(糖、 大米、 奶粉)以及昆虫异物通过采集样本在0.2~1.3 THz范围内的光学参数进行分析可知随着频率的增加吸收系数增大, 折射率减小, 尽管昆虫异物的折射率和吸收系数也显示出类似的规律, 但在特定频率处可以将昆虫异物与食品明显区分开。
3 结论与展望
上述文献表明, 太赫兹时域光谱及成像技术作为一项新兴的检测技术, 以其丰富的波谱性、 穿透性以及低辐射特性, 在农作物种子质量评价、 农作物成分分析、 农作物贮藏品质判别以及农产品安全检测方面极具应用潜力和应用前景, 但是目前THz技术在农业领域的应用仍处于探索发展阶段, 目前还存在以下几个方面的问题: ①THz光谱仪器普遍成本较高、 体积大, 集成度不高, 且THz系统对实验环境要求较高, 极大地限制了THz技术在现实环境中的应用; ②由于极性液体(如水)中分子的转动和振动在THz波范围内存在强烈吸收, 而农业生产中绝大多数产品都存在水分子, 因此在使用THz技术对其进行检测时排除水分的干扰是研究的难点, 含水率较高的物质难以获取精准度高的光谱数据; ③农产品成分复杂, 就现有文献检索, 直接采集农产品THz光谱几乎没有明显的吸收特征, 待测物质本身与THz波的作用机理有待进一步解析; ④混合物检测研究方面, 目前还处于初步摸索阶段, 需要借助较为复杂的预处理、 建模、 参数寻优等算法才能进行定性定量分析处理; ⑤关于THz时域光谱成像在农业领域的应用有待拓展, 就现有的研究文献来看, 硬壳类种子的THz成像检测相对于传统光谱成像技术而言独具优势, 但是THz时域光谱成像中存在图像模糊、 振动噪声、 以及重构图像与样本理化性质的解析还有待探索解决。
THz光谱解析技术在不断发展与完善, 应进一步对THz硬件系统进行改进, 开发具有低成本、 高灵敏度的探测器, 更加有效地拓宽THz技术的应用范围; 结合机器学习、 深度学习等领域的高效、 精准的数学模型合理去除噪声、 提高信噪比, 增强光谱解释能力; 结合已有的研究, 开展针对农产品谱图及数据库的建立, 进一步探究农产品成分与THz波段的相互作用。 相信随着对THz的深入了解及研究应用, THz技术在农作物品质快速无损检测领域必将能得到更快速的发展, 为现代农业发展发挥实际作用。