APP下载

基于BP神经网络的棉花回潮率预测模型研究

2022-07-20王婷婷张学东

计算机仿真 2022年6期
关键词:籽棉神经网络误差

王婷婷,张学东

(塔里木大学信息工程学院,新疆 阿拉尔 843300)

1 引言

棉花是中国重要的经济作物之一,在经济发展中占据重要地位。棉花回潮率是指棉花中所含水分的重量与干燥棉花纤维重量的百分比,水分所占比例越高,棉花回潮率就越高。回潮率是棉农进行棉花贸易时的重要依据,也是存储时的一项重要的数据指标,然而现存设备存在检测的数据不准确或者设备价格高昂等问题。因此,研究一套价格便宜且数值精确的回潮率检测设备是我国现代棉花行业急需解决的问题。

我国棉花回潮率检测方法分为直接法和间接法两种类型。直接法根据回潮率的定义,用烘箱得到干燥的棉花纤维,根据重量进行计算得出回潮率数值;间接法又分为微波式、红外式、CCD式、电容式和电阻式等。其中较为常见的是电阻式检测方法,乌斯特公司的Intelligin产品利用电阻式检测原理实现棉花回潮率的在线检测,该系统在设计时,需要将温度补偿、外加电压等误差因素考虑进去,增加了系统的复杂性和成本。安少元等研究了YZ-1型智能在线检测系统,实现棉花在加工生产线上的回潮率的检测,该系统不适用于棉花交易收储时使用。李怀珍等基于微波相位法测定皮棉回潮率,有利于提高回潮率检测时的效率,但是设备的成本较高。院志霞等通过微波法建立微波衰减和籽棉整体回潮的对应关系,为籽棉回潮率验收提供了一种新的方法,同样设备成本高。

本文提出一种基于BP神经网络的方法得出回潮率数据,该方法需要先通过硬件检测出籽棉样本的温度、湿度以及电阻值的数据,建立BP神经网络预测模型,利用该模型对籽棉回潮率的数值进行预测。夏春江等提出了一种基于深度信念网络的木材含水率预测模型,通过该模型得出的预测值与实际值之间的均方根误差小,预测精度较高,通过该神经网络预测模型可知,将深度学习算法应用到回潮率预测方面是有效可行的。

神经网络是模拟人脑智能化处理过程的一种技术,是处理非线性问题的较好方法,具有处理任意复杂的模式分类能力和优良的多维函数映射能力。尽管存在样本量需求较高等困难,但目前尚无研究表明样本量与精确度之间存在对应关系。在样本量较少的情况下,设置合适的参数也可以最大限度的突出其优点,BP神经网络也是该方法较成熟的表现形式。因此本文选用BP神经网络对籽棉回潮率的数值进行预测,为南疆当地的棉农提供一个准确率较高、成本低的回潮率检测设备,从而促进棉花产业的健康发展。

2 BP神经网络的基本内容

BP(Back Propagation)神经网络是人工神经网络的分类中的多层前馈型神经网络。BP神经网络的主要特征为传递信号向前传播,而误差向后传播。在前向传递中,输入信号从输入层经隐含层逐层处理,直至输出层。如果输出层得不到想要的输出,则进行逆向传播,根据预测误差调整网络的权值和阀值,从而使BP神经网络预测输出不断的逼近期望输出,BP神经网络的拓扑结构如图1所示。

图1 三层BP神经网络拓扑

2.1 信息正向传播过程

BP神经网络信息传播过程和生物体的突触结构类似,样本从输入层输入后,经过每个隐含层计算后输出,上一层中输出的数值加权值后再求和,就作为下一层的输入,每层都需要进行计算直到输出为止。

W

是两层之间的两个节点

i

j

之间的权值,

b

是节点

j

的阈值,每个节点都会有一个输出值为

x

,输出值

x

与上层每一个结点的输出值,当前层与上一层之间的权值和阈值,以及激活函数有关。其计算公式如下

(1)

X

=

f

(

S

)

(2)

g

(

z

)=max(0,

z

)

(3)

其中

f

为激活函数,常用的就是sigmoid函数、tanh激活函数、Relu以及带泄露的Relu函数,本文选用的是Relu激活函数,计算公式如式(3)、函数图像如图2所示:

图2 Relu函数图像

2.2 信息逆向传播过程

当输出的结果与期望值不符时,进入逆向传播过程,主要工作是反复修正权值和阈值,使误差函数达到最小。假设输出层的结果都为

d

y

为理想输出,误差函数式如(4)所示

(4)

根据梯度下降法,对于隐含层和输出层权值和阈值更新公式如式(5)、(6)所示

(5)

(6)

同样,隐含层与输入层也适用此公式,式中字母代表含义同上,

η

为学习率。

3 基于BP神经网络的棉花回潮率预测模型

要想创建一个好的神经网络模型用于预测,网络结构设计非常重要。BP神经网络建立模型的思路是:确定输入输出端,选择合适的网络层数以及隐含层的神经元个数,选取初始权值,确定学习速率,利用合适的激活函数训练模型,使误差减小达到理想值。

本文采用南疆棉花测得的数值为样本,构建基于BP神经网络的棉花回潮率预测模型,如图3所示。

图3 基于BP神经网络的棉花回潮率预测模型图

3.1 影响因素确定

通过文献调研的方式对棉花回潮率影响因素进行详细的研究,倪玉婷等做了温湿度对棉花回潮率测定的影响,实验结果明确指出棉纤维与其水分含量与温湿度之间具有相关关系,水分含量可间接用电阻值表示出来。何启平做了棉花加工回潮率对棉纤维长度影响的实验,该实验分为两个车间对比进行,实验表明手采棉和机采棉的平均回潮率有一定的差距,同时回潮率的高低对棉纤维长度影响较大。所以本文选取了如表1所示的温度、湿度、电阻值、长绒棉细绒棉、手采棉机采棉五项因素作为影响回潮率数据的变量。

表1 变量说明表

3.2 数据归一化处理

样本选用2020年测得籽棉的550组数据做为网络训练数据,50组数据为测试组数据对其训练,部分数据截取如表2所示。籽棉回潮率的预测因子包括温湿度电阻值等,这三项的预测因子的物理意义和数量等级均有所差异,所以对原始的数据进行归一化处理,处理后的数据介于[0,1]之间,更有利于使用梯度下降法训练网络。机采棉

/

手采棉和长绒棉

/

短绒棉这两项参数直接可以用0

/

1输出,在本文中机采棉和长绒棉定义为1,手采棉和短绒棉定义为0。

表2 部分实验数据截取

数据归一化处理有两种方法,最大最小法和平均数方差法,本文采用最大最小法来处理数据,公式如下

(7)

x

为处理之后的数据,

x

为原始数据,

x

为样本最大值,

x

为样本最小值。样本训练时采用的是处理后的数据,后期输出的预测值也需要对其进行转化。

3.3 训练网络

本文利用Tensorflow深度学习框架训练网络,它支持Python语言,并且内置了全面的神经网络各种算法,具有很好的扩展性。Tensorflow中的Tensor的含义就是“张量”,用数组和矩阵来表示,训练网络的基本流程和结构如图4所示。

图4 网络训练基本流程图

构造的神经网络模型可以通过Tensorflow中自带的可视化工具Tensorboard查看,构造好的BP神经网络模型如图5所示:

该模型输入层包含 5个节点,分别对应5个影响因素,隐藏层 3 个节点,输出层一个节点,对应预测值籽棉回潮率数值。考虑到输入特征与结果存在较为明显的规律,故使用网络层数较少。这样在保证准确率的前提下,有效减少训练以及预测的耗时,同时防止出现过拟合现象。

表3 参数设置表

图5 BP神经网络模型图

4 模型检验与优化

4.1 检验

利用得到的训练模型在测试集中使用,其均方误差均MSE符合要求。如图6均方根误差图所示,模型未出现过拟合现象,且训练、测试中MSE都很小,能达到精度的要求,梯度也是稳步下降的,可用于实际生成环境中。

图6 均方误差图

4.2 优化

BP神经网络中的参数设置,都会对预测结果产生一定的影响。目前对于模型训练时参数设置并没有统一的理论指导,通常情况下时根据经验或者进行多次网络训练得到最优结果。本文从隐含层和隐含层节点数的选择来优化模型,最终确定最优模型。

一般来说数据量越多,选择的模型越复杂,数据量越少模型越简单。本文分别对三层神经网络和四层神经网络进行训练,结果如图7、8所示。

图7 三层神经网络误差

图8 四层神经网络误差

通过图6、图7对比,可以明显看出三层神经网络效果更好一些,误差在逐步减小,四层神经网络随着迭代次数增加,并未出现明显下降趋势。无论是从理论知识还是从训练结果来看,三层结构更适合回潮率的预测模型,故本文选用三层结构。

5 结论

应用Tensorflow框架搭建了预测回潮率数据的BP神经网络模型,并且对该模型进行了训练和优化,结果表明:

1)BP神经网络模型能够处理好温湿度、电阻值、机采棉/手工棉、长绒棉/短绒棉这5个参数与回潮率之间的非线性关系,对BP神经网络模型进行训练学习之后,能够用来对籽棉回潮率数据进行预测。

2)基于深度学习Tensorflow框架的神经网络建模较简单,网络参数和结构修改较灵活,预测结果精度较高,具有一定的推广意义。

猜你喜欢

籽棉神经网络误差
基于神经网络的船舶电力系统故障诊断方法
基于人工智能LSTM循环神经网络的学习成绩预测
2021 年度新疆兵团一师阿拉尔市籽棉收购相关数据分析
MIV-PSO-BP神经网络用户热负荷预测
新棉价格上涨
隧道横向贯通误差估算与应用
隧道横向贯通误差估算与应用
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
精确与误差
籽棉存放时间与公检颜色级结果关系探讨