APP下载

GA-BP神经网络在铜合金海洋腐蚀 预测中的应用

2021-12-30张彭辉肖攸安赵建仓丁康康侯健

装备环境工程 2021年12期
关键词:权值遗传算法染色体

张彭辉,肖攸安,赵建仓,丁康康,侯健

(1.中国船舶重工集团公司第七二五研究所 海洋腐蚀与防护重点实验室,山东 青岛 266101; 2.武汉理工大学,武汉 430063)

海洋是一种非常严苛的腐蚀环境,各种材料在海水环境中均存在不同程度的腐蚀。材料的耐海水腐蚀性能关系到各类船舶、海上平台、跨海大桥等海洋装备及工程设施的安全问题,因此,有必要研究各类材料在海水中的腐蚀规律,并准确预测材料的服役寿命[1-10]。由于海水成分复杂,各环境因素的协同作用机制不明朗,与材料的腐蚀结果也并非简单的线性关系,传统的回归分析法难以适用。BP(Back Propagation)人工神经网络是目前使用最广泛的神经网络算法,通过误差逆向传播算法训练对非线性、不确定性数据进行高精度拟合。近年来,BP神经网络被广泛应用于材料在海洋环境中的腐蚀规律预测[11-16]。但是,在具体使用过程中,发现BP神经网络存在收敛速度慢、易陷入局部极小值等问题。因此,为提高BP神经网络的适用度,需要通过其他方法对其进行优化。遗传算法(Genetic Algorithm)也属于人工智能算法的范畴,是通过模拟自然进化的过程搜索最优解。遗传算法可优化BP神经网络的初始权值和阈值,有效克服BP神经网络的缺陷,并提高拟合效率和算法稳定性[17]。

文中采用GA-BP神经网络,以铜合金在海洋环境中的长期腐蚀数据为样本,通过设计自动训练的流程,输入参数自动选择样本数据并调整相关参数,建立腐蚀预测模型,并对自动建模的可行性和可用性进行验证。

1 原理及方法

1.1 BP神经网络

人工神经网络(Artificial Neural Networks, ANN)是一种模拟生物神经系统信号处理和运行机制的人工智能分析方法,在非线性、不确定系统的数据处理方面具有较高的适应能力。BP(Back Propagation)神经网络是目前应用最广泛的神经网络模型之一,通过误差逆传播算法训练对网络进行优化,实现对数据的精确拟合。BP神经网络包括输入层、隐藏层和输出层,其基本结构如图1所示。BP神经网络的基本原理是:由输入层接收输入信号,经隐含层计算后传播至输出层,再由输出层后处理计算结果,最后逆推,对神经网中的权重进行反馈修正,从而增强整个网络的适应能力。

图1 BP神经网络基本结构 Fig.1 Typical structure of BP neural network

与传统的分析方法相比,BP神经网络具有较强的非线性映射能力、较高的自学习和自适应能力以及一定的容错能力,在非线性、不确定数据的规律分析方面具有较大的优势。然而,由于算法的固有缺陷,导致BP神经网络在实际使用过程中存在局限。例如,由于网络的初始阈值和权值是随机生成的,缺乏依据,可能导致生成的预测结果不稳定;由于权值及阈值的修正是基于梯度下降法,不同的权值和阈值可能导致网络不收敛或陷入局部极值点,导致BP神经网络训练时间长、学习效率低、过拟合等问题[18-19]。因此,考虑将遗传算法和BP人工神经网络结合,用全局搜索算法优化BP神经网络的初始阈值和权值,使整个搜索的过程更加灵活,提高搜索效率,最终提高BP神经网络的泛化性,提升预测的准确性。

1.2 遗传算法

遗传算法(Genetic Algorithm, GA)是一种通过模拟自然进化过程来寻找最优解的方法。其基本原理是模拟自然界优胜劣汰的进化现象,把搜索空间映射为遗传空间,把搜索空间内可能的解编码成一个向量,对应生物染色体,向量的每个元素对应生物基因;通过不断计算各染色体的适应值,选择最好的染色体,从而获得最优解。遗传算法的主要特点是直接对结构对象进行运算,不受求导和函数连续性的限定;具有内在的隐式并行性和更好的全局寻优能力;采用概率化的寻优方法,能自动获取和引导优化搜索空间;自适应地调整搜索方向,不需要确定的规则[20-21]。遗传算法可以很好地克服BP人工神经网络的局部最优缺陷,优化BP人工神经网络的初始权值和阈值,提高其稳定性。

遗传算法的基本流程如图2所示。在预设范围内随机生成一定数量的初始解并进行编码,生成初始种 群,即第一代染色体;计算每一条染色体的适应度,适应度越高则被选择的概率越大;选择适应度高的染色体进行保留,然后通过一定的交叉和变异概率生成新一代染色体,即完成一次“进化”;对新生成的染色体进行新一轮“进化”,通过反复迭代预算直至满足停止条件,获得最优解。

图2 遗传算法流程 Fig.2 Algorithm flow of genetic algorithm

1.3 GA-BP神经网络

遗传算法的全局最优解可以很好地优化BP神经网络的初始权值和阈值,克服局部最优等缺陷,提高网络收敛速度和稳定性。GA-BP神经网络的算法流程如图3所示。首先,初始化BP神经网络,并根据网络结构确定GA染色体的编码长度;然后,以BP神经网络计算误差作为构建适应度评价函数的依据,通过遗传操作获取优化后BP神经网络的初始权值和阈值;最后,执行BP神经网络运算,获得计算结果。

图3 GA-BP神经网络运算流程 Fig.3 Algorithm flow of GA-BP neural network

2 铜合金海水腐蚀速率预测模型构建

2.1 数据预处理

建模的数据主要来自中国腐蚀与防护网,数据种类包括材料类别、牌号、地点、区带、材料属性、加工工艺、试验时长、腐蚀情况等。对原始数据进行清洗,去除重复、异常、不合规的数据,然后对材料的类别、牌号、地点、区段等信息进行数字化处理,具体方法如下。

1)在以年为单位的尺度范围内,同一个地点和区带的海洋环境因素数据(如温度、盐度、溶解氧、PH值等)是基本不变的。这样,海洋环境类型参数仅与地点和区带相关,可以用“地点+区带”对应的数字代码进行替代。按从北向南,分别以1—5的数字替代青岛、舟山、厦门、榆林、三亚共5个地点;按高度,分别以1—4的数字替代潮差区、飞溅区、大气区、全浸区共4个区带。

2)考虑到材料属性、加工工艺、材料类别与牌号密切相关、一一对应,故采用“材料类别+牌号”对应的数字代码进行替代,即将铜合金材料牌号按字母顺序,分别以数字进行替代。

3)考虑到部分实验结果的输出参数缺失或者包含非数值内容,如:“—”或“蚀光”等,将这些数据作为离群数据处理。如果数据为“无明显腐蚀”等,则以数值0进行替代。变量的最大值为1,对替代后的数据进行归一化处理,处理后的数据表中各类数据的数量见表1。

表1 数据处理结果 Tab.1 Results of corrosion data processing

2.2 模型设计

研究表明三层BP神经网络可以解决绝大部分的数据分析问题,且误差精度可以通过增加隐含层的神经元数量进行调整[21]。因此,文中GA-BP神经网络结构设计为三层。

经处理后,模型的输入量可简化为“材料类别+牌号”、“试验地点+区段”、试验时长这3个参数,故输入层的神经元数量确定为3个;输出变量包括腐蚀速率、平均点蚀深度、最大点蚀深度、缝隙腐蚀深度这4个参数,故输出层的神经元数量确定为4个。隐含层节点数由式(1)确定:

式中:m代表本系统输入节点数;n代表本系统输出节点数;a代表[1,10]之间的调节常数。计算可知,隐含层神经元数量的取值范围为[4,13]。通过试错法对隐含层神经元在不同取值时的拟合情况进行分析,当隐含层神经元数量为10,网络较稳定且拟合情况较好。因此,本文BP神经网络结构设计为3-10-4。

金属材料在海水环境中进行腐蚀试验,所得到的相关数据在经过归一化处理后大多是小数,因此可以采用实数编码的方式对染色体个体进行编码。根据网络结构确定编码长度为3×10+10×4+10+4,其中3×10对应连接输入层和隐含层的节点权值矩阵,10×4对应连接隐含层和输出层的节点权值矩阵,10对应隐含层神经元节点阈值矩阵,4对应输出层神经元节点阈值矩阵。由此,种群中的每一个个体均为包含了海洋腐蚀预测神经网络的全部权值和阈值的实数串,在神经网络结构确定的情况下,每一个个体均可重构为一个神经网络。

式中:fi代表第i个染色体个体的适应度值;dk和ok代表根据这个个体生成的海洋腐蚀神经网络的 预测值和实际值;θ是为了保证分母不为0而取的一个数值较小且大于0的偏移量。fi越大说明误差越小,染色体的适应度越高。

按8∶2的比例将原始数据集划分为样本集和测试集,使用样本集建立腐蚀模型,采用MATLAB软件进行运算,得到连接输入层和隐藏层的节点权值矩阵win,hidden0如下:

连接输入层和隐藏层的节点阈值矩阵bin,hidden0如下:

连接隐藏层和输出层的节点权重矩阵whidden0,out如下:

连接隐藏层和输出层的节点阈值矩阵bhidden0,out如下:

3 铜合金海水腐蚀速率预测模型评价分析

对于建模得到的神经网络模型,分别使用样本数据集和测试集数据,以极差、方差、决定系数等为评估指标,对建模结果进行分析,结果见表2。

表2 预测结果分析 Tab.2 Prediction results analysis

为了进一步统计分析偏差/误差的分布情况,所有偏差绝对值的分布情况如图4所示。样本集数据中,偏差值最大为7.3046%,最小为0.0634%;测试集数据中,偏差值最大为7.2897%,最小值为0.0063%,所有数据的偏差均低于10%。这些数据说明,本模型的泛化能力较好,预测精度较高。

图4 铜合金海洋腐蚀预测偏差分布 Fig.4 Error distribution of marine corrosion prediction value of copper alloys: a) deviation distribution of sample set; b) deviation distribution of test set

4 结论

讨论了GA-BP人工神经网络的原理及构建方法,并将其应用于铜合金海洋腐蚀预测。基于实际样本数据的试验结果表明,该建模方法是可行的、有效的,所得到的模型具有较好的泛化能力,能较好地满足要求。

猜你喜欢

权值遗传算法染色体
一种融合时间权值和用户行为序列的电影推荐模型
基于改进遗传算法的航空集装箱装载优化
基于改进遗传算法的航空集装箱装载问题研究
基于遗传算法的高精度事故重建与损伤分析
多一条X染色体,寿命会更长
为什么男性要有一条X染色体?
物流配送车辆路径的免疫遗传算法探讨
真假三体的遗传题题型探析
能忍的人寿命长
财务风险跟踪评价方法初探