小麦粉品质在线无损快速检测系统设计与实现
2022-03-05孙晓荣郑冬钰刘翠玲吴静珠靳佳蕊
孙晓荣 郑冬钰 刘翠玲 吴静珠 靳佳蕊
(1. 北京工商大学人工智能学院,北京 100048;2. 食品安全大数据技术北京市重点实验室,北京 100048)
小麦粉是由小麦籽粒经研磨粉碎制成的粉体[1],在中国需求极大。目前,小麦粉品质检测采用传统的离线检测方法[2-3],测量时间长、对样品有损害,因此,设计一个小麦粉在线快速、无损检测系统极为重要。
Xue等[4]使用近红外光谱实现了在线测量秸秆作物的燃料特性,并分析了焦距、传送带速度、积分时间等对近红外在线采集的影响;郝勇等[5]使用可见—近红外光谱技术建立了Adaboost分类模型,可对鸭梨黑心病进行在线检测和识别;杨盛杰等[6]开发了可作为卸粮装置的机载式谷物水分近红外光谱实时检测系统样机;沈广辉等[7]利用自主搭建的在线近红外平台扫描样品的动态光谱,通过竞争自适应重加权法(CARS)筛选出与品质参数密切相关的变量,结合偏最小二乘法建立了玉米籽粒中水分、粗蛋白、粗灰分和总能在线定量分析模型;王乐等[8]通过在豆粕生产线上安装在线近红外检测设备建立了近红外光谱分析模型。龚中良等[9]为在线获取干燥过程中油茶籽含水量,采用基于干燥工况参数与干燥腔进出口含湿量差、含湿量差变化率参数,建立了随机森林模型。综上,近红外光谱分析技术以其多成分同时检测,采集速度快、成本低、无前处理、无破坏性、无污染、可应用于在线检测等特点[10-12],被广泛应用于食品和农产品生产流水线持续工作的在线检测领域中[13]。
由于实验室近红外检测装置体积大,费用高,不适宜安装在小麦生产线管道附近对小麦粉品质进行实时检测,因此,研究拟选择结构紧凑、轻便、成本相对低的MicroNIR-2200微型近红外光谱仪作为采集设备,以古船小麦粉厂的小麦粉为研究对象,以水分、灰分、面筋的实际含量作为检测指标,设计并搭建基于近红外光谱分析技术的小麦粉品质在线检测系统,旨在实现在线、快速、无损检测小麦粉品质,为小麦粉生产工厂和企业及市场监督提供更高效的检测手段。
1 总体方案设计
基于微型近红外光谱仪的小麦粉品质在线无损检测系统整体结构设计如图1所示。
图1 小麦粉品质在线检测系统总体设计方案图
微型近红外光谱仪集成装置和生产线可调速模拟装置用于在线采集小麦粉样品的近红外光谱。微型近红外光谱仪与内置S3C2416嵌入式开发板通过USB数据线实现数据交互,S3C2416嵌入式开发板与光谱采集软件通过网线实现数据交互,接收分析软件的指令并将最终的吸光度数据保存至指定路径,生成建模所需的光谱数据。光谱在线采集控制软件由实验室自主研发,实现微型近红外光谱仪集成装置和生产线可调速模拟传输装置的配合。在线建模分析软件包括数据载入、数据处理、数据分析、可视化输出与异常捕获4个模块,实现多种预处理算法和定量建模算法在上位软件上的可视化选择,以及建模结果和预测结果的可视化输出。
2 系统硬件设计
2.1 微型近红外光谱仪集成装置
微型近红外光谱仪集成装置主要由微型近红外光谱仪MicroNIR-2200、激光发射器、S3C2416嵌入式开发板、反射板、步进电机、220 V转5 V变压器、USB转换口、网线、蓝宝石玻璃等组成,外部封装由JDSU公司提供的金属外壳进行封装。
微型近红外光谱仪MicroNIR-2200内部配备了一个128像素探测器阵列,每次采集光谱得到128个数据点的矩阵,包含波长和吸光度信息,吸光度数据可直接通过USB接口供电和数据传输,每个样品扫描后得到3条光谱,以便于求平均光谱,减少单次扫描产生的随机误差。S3C2416嵌入式开发板将光谱分析软件发出的命令,通过网线传输,发送给微型近红外光谱仪,同时将光谱仪采集到的数据打包转发返回至计算机上。
在数据处理接口,采用三次样条插值算法,对采集到的吸光度数据进行平滑处理,由128个数据点变为125个,使得最终获取的光谱更加光滑,减少噪声等干扰。反射板、步进电机和变压器等主要是为了进行暗电流校正和100%反射校正,相当于背景校正,暗电流校正数据、100%反射数据与有效光谱数据一起经过计算得到最终的吸光度数据。
2.2 生产线可调速模拟传送装置
该模拟装置由4部分传送装置组成,包括两个直线传输装置和两个180°转弯传输装置,组成一个大的环形传送装置,传送带顺时针转动,方向不可逆。电动机通过联轴器、减速器带动传动滚筒转动和其他驱动机构,借助滚筒和其他驱动机构与传送带之间的摩擦力,使输送带运动,并通过电子调速器进行调速。
3 系统软件设计
3.1 光谱在线采集控制软件
光谱在线采集控制软件是实验室根据小麦粉样本自主研发的光谱采集软件,主要包括仪器初始化、硬件性能测试,仪器信息获取、光谱测试4个部分。仪器初始化主要是连接服务器,配置光谱采集的积分时间,单次采集的光谱数和光谱保存路径,以及打开光谱仪。硬件性能测试包括光源、信号灯、步进电机控制反射板和激光器性能是否正常,能否保证正常工作。仪器信息主要是在采集过程中随时获取检测温度,这是因为随着检测时间的延长,光谱仪的内部温度会逐渐升高,容易导致基线漂移和光谱失真等情况,因此定时获取仪器温度,便于保证光谱仪在正常工作温度范围内采集光谱。光谱测试包括暗电流校正、100%反射校正和光谱采集,每次采集光谱前都要进行暗电流校正和100%反射。光谱在线采集控制软件功能如图2所示。
1. 仪器初始化 2. 仪器信息获取 3. 硬件性能测试 4. 光谱检测
在原光谱检测软件手动控制单次采集光谱的基础上,实现了自动采集光谱的功能:当选择自动扫描工作模式,就会自动采集光谱,并进行保存。单次扫描光谱包括暗电流校正、100%反射和光谱采集3步,同时每次扫描均获取仪器温度接口,判断其是否在正常工作范围内,当温度超过范围,光谱采集软件自动停止工作,待温度恢复至正常范围时,再重新开始工作。
绍圣五年(1098),山谷54岁,以避表外兄张向之嫌,迁戎州(今四川省宜宾)安置。山谷初到戎州,居南寺无等院,在院中自筑小屋,取名“槁木寮”,或称“死灰庵”。山谷《书遗道臻墨竹后与斌老》:“元符三年三月,戎州无等院涪翁借地所筑槁木庵中书。”(《山谷题跋》卷八)山谷寓居南寺无等院,心已如槁木死灰,为居室起名“槁木寮”“死灰庵”。(未完)
3.2 在线建模分析软件
在线分析软件主要对采集到的光谱数据和各组分化学值进行数据处理和数据分析,主要包括样本划分、预处理、特征提取、建模及预测。
在线分析软件工作流程:用户在获取账号名、密码后,通过登录进入主界面,首先以读取本地文件的方式配置数据源,然后依次选择样本划分、预处理、特征提取、建模、预测的算法和相应参数,系统将自动生成相应的模型并展示在UI界面,同时界面提供了完备的异常捕获和运行日志,方便用户实时查看算法执行情况。
3.2.1 数据载入 用户在使用在线软件分析数据时,需先通过获取数据模块加载数据源。数据源是在线采集到的光谱数据(包括波长文件、吸光度文件、化学值文件)并通过转储成Matlab可读文件。
3.2.2 数据处理 数据处理模块是预处理阶段,用户在使用该模块时需选择预处理算法以及相应算法的参数。获取用户输入后,通过Matlab数据处理后,生成数据源的建模集、预测集、吸光度、组分含量,并将上述结果返回至UI展示。
预处理算法包括一阶导数、二阶导数、线性分段校正(PLC)、矢量归一化(SNV)多元散射校正(MSC)、S-G卷积平滑和直接差分法(NDF)。
3.2.3 数据分析 数据分析模块主要包括建模和预测两个阶段,用户在使用该模块时需选择特征提取算法、建模算法以及对应算法的参数,获取输入后传递给建模方法并得到处理结果。
定量建模算法包括多元线性回归(MLR)、主成分回归(PCR)及偏最小二乘回归(PLSR)。
3.2.4 可视化输出与异常捕获 模型展示与日志模块主要包括运行模型图像的展示、软件运行日志的记录、展示、清空。该模块的模型图像展示基于Python Canvas,通过将Canvas注册至Tkinter中并制定master,将数据模型展示至GUI中;运行日志基于Tkinter ScrolledText实现,在程序执行的关键步骤后调用insertTolog方法将执行结果输出至ScrolledText中滚动展示,并自定义方法emptyLog用于清空当前存储的运行日志。
4 系统测试
4.1 试验样本
试验样本全部取自北京古船小麦粉厂不同生产日期、不同批次以及不同种类的小麦粉产品,小麦粉样品共120个,对所有样品从1~120进行编号,其中100个作为校正集样本,20个作为预测集样本。小麦粉样本水分、灰分和面筋含量特性见表1,由该系统微型近红外光谱仪集成装置采集的小麦粉样本近红外光谱如图3所示。
4.2 小麦粉品质检测
该系统以决定系数(R2)、校正均方根误差(RMSEC)和预测均方根误差(RMSEP)为模型的评价指标,并分别按式(1)~式(3)进行计算。R2值越接近1,预测结果越准确,RMSEC和RMSEP值越小,误差越小,预测精度越高。
表1 小麦粉样本特性
图3 小麦粉样品近红外光谱图
(1)
(2)
(3)
式中:
yi,actual——第i个样本测定值;
yi,predicted——校正集或预测集预测过程中第i个样本的预测值;
n——校正集或预测集样本数;
ERMSEC——校正均方根误差;
ERMSEC——预测均方根误差;
m——预测集样本数。
选用多元线性回归(MLR)、主成分回归(PCR)和偏最小二乘回归(PLSR)3种定量算法结合多种预处理方法,建立小麦粉的水分、灰分、面筋定量分析模型,并各选择较好的9个模型进行对比,结果见表2。
由表2可知,由试验系统采集并进行数据分析的模型预测集R2均在0.9左右,满足市场检测要求,偏最小二乘回归(PLSR)建立的小麦粉水分、灰分、面筋定量分析模型整体优于多元线性回归(MLR)和主成分回归(PCR)算法,表明试验设计的小麦粉在线无损快速检测系统具有可行性。
表2 小麦粉水分、灰分、面筋建模结果对比表
4.3 试验条件对建模结果的影响
试验系统在线采集光谱环节需要考虑很多因素,包括样品包装材质的选择、采集速度以及积分时间,同时还要考虑试验环境、温度、光照等因素。为了保证试验效果,严格控制在相对密闭的试验空间,保证温度、光照相同,在此基础上测试不同包装材质、采集速度和积分时间对建模结果的影响。
4.3.1 包装材质 包装材质考察塑料袋和石英杯两种,采用样本划分后的100个校正集和20个预测集样本进行研究。静态试验中,对于MicroNIR-2200探头的最佳积分时间为5 500 ms,在同一采集速度(1.676 cm/s)同一积分时间(5 500 ms)的情况下采集光谱数据,并以水分为例建立偏最小二乘回归(PLSR)模型,建模结果如表3所示。由表3可知,用石英杯盛放样本进行光谱采集的建模结果较好。
表3 包装材质对建模效果的影响
4.3.2 采集速度和积分时间匹配测试 在线采集光谱数据时,传送带速度接近或等于样本通过光源的时间为最佳积分时间。近红外光谱检测中,传送带运行速度和微型近红外光谱仪积分时间可能存在最佳匹配。试验使用的光谱仪探头直径约为45 mm,选定5 cm距离,并依此算出15档速度(0.835 cm/s)、20档速度(1.676 cm/s)、25档速度(2.196 cm/s)下光谱仪的积分时间取整分别为6 000,3 000,2 300 ms,涵盖了微型近红外光谱仪静态采集的最佳积分时间为5 500 ms,通过3组匹配测试得到的水分PLSR建模结果如表4所示。
由表4可知,传送带保持15档速度(0.835 cm/s),微型近红外光谱仪积分时间为6 000 ms时,PLSR建模效果最佳,该测试数据成功验证了在线光谱采集速度与积分时间存在最佳匹配,为选择传送带速度和光谱仪积分时间提供了可能性。
表4 3组速度与积分时间匹配试验建模结果对比
5 结论
搭建了小麦粉在线模拟可调速传送装置,开发了小麦粉在线建模分析软件,结合微型近红外光谱仪集成装置和光谱采集控制软件,搭建了基于微型近红外光谱仪的小麦粉在线无损快速检测系统,将定量分析模型稳健性优化实现了软件可视化选择。但由于小麦粉样品数量的局限性、试验环境和仪器自身因素的影响,以及建模算法不够完善,该系统的稳健性和模型预测精度还有待进一步提高。