APP下载

BP神经网络预测石化塔顶系统腐蚀的应用研究*

2014-05-05樊玉光林红先周三平

石油化工腐蚀与防护 2014年2期
关键词:数据量个数标准化

樊玉光,何 敏,林红先,陈 兵,周三平

(西安石油大学机械工程学院,陕西西安710065)

炼油厂塔设备的生产工艺参数、腐蚀性物质参数都处于一个非常大的波动范围,其中导致设备发生腐蚀的因素多种多样,各种腐蚀因素之间的关系已无法利用传统研究方法说明。近年来,越来越多的研究人员将BP神经网络应用于金属的腐蚀研究中。1995年,郭稚弧[1]等人开始利用人工神经网络从已有的土壤腐蚀试验数据预测碳钢在土壤中的腐蚀速率。2001年,付冬梅[2]等人利用300组高温硫腐蚀数据和200组环烷酸腐蚀数据分别建立腐蚀预测模型,从而构建炼油设备腐蚀专家系统。2006年,邓春龙[3]等人利用BP结构神经网络,综合17种影响碳钢、低合金钢在海水环境中腐蚀速度的参数建立神经网络预测模型,其预测结果与材料在海水环境中的腐蚀规律基本一致,能够满足使用要求。本研究首次将BP神经网络应用于解决塔设备的腐蚀问题,并探究塔设备腐蚀预测模型在建立过程中出现的问题。

神经网络是一种可以将多元化信息进行有效融合的算法。利用神经网络建立腐蚀预测模型时,信息参数的多少、原始数据的精度、数据处理方法和数据量等因素对模型预测结果的精度和稳定性有很大影响。信息参数和原始数据是由实验或现场监测采集,监测现场的仪器、仪表本身具有的测量误差会对信息参数的原始值有所影响。信息参数的多元化决定了原始数据在进行神经网络训练之前必须经过标准化处理,不同的处理方法会对神经网络的数据训练过程带来影响。数据经过标准化处理后,使用BP神经网络进行训练。BP神经网络是“黑箱”计算,通过多项重复训练信息参数数据来找出它们之间的关系,数据量对预测模型的预测结果有明显影响。

根据某石化企业催化分馏塔塔顶系统监测到的pH值、总硫、总氯、总氮和总铁(Fe2+和Fe3+)含量数据(共30组样本),利用BP神经网络建立4-10-1的腐蚀预测模型。通过对30个训练样本进行处理、训练,在信息参数较少的情况下,比较Min-max和Z-score两种标准化方法对腐蚀模型预测精度的影响;分析数据量对腐蚀预测模型稳定性的影响。

1 建立模型

1.1 数据标准化方法

信息参数的多元化造成多种腐蚀参数的数量级、量纲不同,BP神经网络在对数据进行训练之前需进行标准化处理。数据标准化方法有很多,本文选取在数据处理过程中常用的min-max标准化方法和z-score标准化方法[4]对原始数据进行处理并对比分析。

一般,用x代表原数列,xmin和xmax分别代表其最小值和最大值,mean(x)代表其平均值;std(x)代表其标准差。

Min-max标准化方法公式为:(x-xmin)/(xmax-xmin),

Z-score标准化方法公式为:(x-mean(x))/std(x)。

某石化催化分馏塔塔顶系统腐蚀监测数据[5]见表 1。

表1 催化分馏塔塔顶系统腐蚀监测数据Table 1 Collected data from the catalytic fractionation tower top system mg/L

1.2 建立模型与误差评价

1.2.1 样本个数

样本是建立腐蚀预测模型的基础,为了比较不同标准化方法和数据量对模型精度的影响,本文使用6组不同数量的样本建立腐蚀预测模型。在30 组样本中随机选择5,10,15,20,25 和29 组样本为训练数据,1个样本为测试数据。为了消除样本选择带来的不确定性,每种数据的样本随机选择3次。

1.2.2 参数设置

本次BP神经网络预测模型使用的程序基于Matlab自带工具箱和自编代码。构造2层BP神经网络,输入信息为pH值,Cl-,H2S和氮化物,输出信息为Fe2+和Fe3+,10个隐层神经元,1个输出神经元,传输函数为logsig,输出函数为purelin,训练函数选取LM(Levenberg-Marquardt)算法trainlm[6]。

1.2.3 误差评价

为了得到使腐蚀预测模型预测结果更加准确的数据处理方法,选择将预测值和实际值逐点比较的平均相对误差(Mean Relative Error,MRE)作为两种数据处理方法的误差评价标准。为了分析数据量对腐蚀预测模型稳定性的影响,选择监测预测系统的长期工作状态的均方根误差(Root Mean Squared Error,RMSE)对预测系统的误差特性进行“宏观”评价[7]。

用yi代表实际数据序列,y'i代表预测数据序列,预测绝对误差为:

MRE的评价标准定义如2式所示,它将误差除以相对应的真值进行规范化,以便比较:

RMSE的评价标准定义如3式所示,它可以衡量误差的分散程度:

其中:n为样本数量。

2 预测结果分析

2.1 标准化方法精度比较

将6组样本数据分别使用min-max与zscore标准化方法进行处理,将处理后的样本利用神经网络算法各训练100次建立腐蚀预测模型,计算100个模型预测结果的平均相对误差(eMRE)。为了消除样本的不确定性,每组训练样本均随机选择3次,两种标准化方法的预测误差见表2、表3。

由表2的横向比较可以看出,当训练样本数小于15时,Min-max标准化方法的有很大波动;当样本个数超过20时,随着训练样本个数的增加eMRE逐步减小。纵向比较表2可以看出,在样本个数较少时,由于样本数据的选择具有不确定性,所以在相同的样本容量下,eMRE差异很大;随着样本的增加,样本的不确定性对预测结果的影响减小,eMRE逐步稳定,腐蚀预测模型得到较好的精度。

表2 Min-max标准化方法预测误差Table 2 Min-max standardized method’s prediction error

表3 z-score标准化方法预测误差Table 3 Z-score standardized method’s prediction error

由表3可以看出,随着训练样本个数的增加,Z-score标准化方法在3种随机选择下的都是先减小后增大再逐步减至最小。在样本个数小于20时,相同的样本容量的eMRE波动很大,说明样本数据的不确定性对其影响极大。

综合比较表2、表3可得,在相同样本下,Minmax比Z-score标准化方法的预测误差小;在样本较小时,样本的不确定性对预测模型有很大影响;在样本个数超过25时,样本带来的不确定性对预测模型的影响逐渐减小。

在以炼油厂实际监测数据为基础建立腐蚀预测模型时,使用Min-max标准化方法对监测数据进行处理,在已知腐蚀数据较少的情况下,至少需要25组监测数据进行神经网络训练,这样得到的腐蚀预测模型有实际应用价值。

2.2 数据量分析

数据量对预测模型的影响很大,由前面的分析可以看出,数据量越多,腐蚀预测模型的预测结果越接近于实测值。但是为了判断宏观上腐蚀发生的可能性,不能仅仅评价预测点和实测点的数值上的精确性,还需要研究数据量对模型稳定性的影响。

本文选择Min-max标准化处理过的样本,每个样本训练100次,其中每20次计算其均方根误差(eRMSE)。

图1 数据量误差比较Fig.1 Comparison of training data error

由图1可以看出,当样本个数为5和10时,eRMSE比较分散且数值较大;当样本个数为15时,eRMSE集中在0.6附近;当样本个数超过20,eRMSE小于0.4且趋于平稳,数值波动在±0.1范围内。由此可知,随着样本个数的增加,eRMSE逐步变小;训练数据量越多,所建立的模型对腐蚀的发生趋势预测就越稳定。

综合表2、表3和图1,可以看出随着数据量的增加,腐蚀预测模型的预测结果不仅能够达到更好的精度,也能够在宏观上更加准确的判断腐蚀发生的可能性。本文建立的炼油厂腐蚀预测模型,在有效监测数据超过25组时,能够得到预测结果准确、稳定的腐蚀预测模型。

3 结论

本文在某石化催化分馏塔塔顶系统腐蚀监测数据的基础上,探讨在建立腐蚀预测模型过程中,数据处理方法和数据量对预测模型的影响。主要结论如下:

(1)BP神经网络建立的腐蚀预测模型的预测结果与实测数据误差较小,表明将BP神经网络应用于石化塔系统的腐蚀预测是可行的;

(2)在相同条件下,利用Min-max标准化方法处理后的数据进行神经网络训练得到的腐蚀预测模型的预测误差较Z-score标准化方法的小。在已知腐蚀参数有限的情况下,监测数据超过25组,由此建立的腐蚀预测模型预测结果更准确;

(3)监测数据大于25组时,采用经过Minmax标准化方法处理的数据进行训练,能够得到预测结果准确、稳定的石化塔设备腐蚀预测模型。

[1] 郭稚弧,金名惠,桂修文,等.神经网络在金属土壤腐蚀研究中的应用[J].腐蚀科学与防护技术,1995,7(3):258-262.

[2] 付冬梅,李晓刚,董超芳,等.炼油设备腐蚀与防护管理规范化专家系统[J].北京科技大学学报,2001,23(2):189-192.

[3] 邓春龙,李文军,孙明先.BP神经网络在碳钢、低合金钢海水腐蚀中的应用[J].腐蚀科学与防护技术,2006,18(1):54-57.

[4] 张仲彬,李煜,杜祥云,等.水质对板式换热器结垢的影响权重及其机制分析[J].中国电机工程学报,2012,32(11):69-74.

[5] Fan Yuguang,Piao Zaidong,Chen Bing,et al.BP Neural Network set up the Corrosion Prediction Model of Low Temperature Parts of Atmospheric Pressure Device [J].Mechanical Engineering and Materials,2012:152-154,1138-1142.

[6] 韩立群.人工神经网络教程[M].北京:北京邮电大学出版社,2006.

[7] 徐曼,乔颖,鲁宗相.短期风电功率预测误差综合评价方法[J]. 电力系统自动化,2011,35(12):20-26.

[8] 周开利,康耀红.神经网络模型及其MATLAB仿真程序设计[M].北京:清华大学出版社,2005:89-91.

猜你喜欢

数据量个数标准化
标准化简述
怎样数出小正方体的个数
基于大数据量的初至层析成像算法优化
计算Lyapunov指数的模糊C均值聚类小数据量法
高刷新率不容易显示器需求与接口标准带宽
宽带信号采集与大数据量传输系统设计与研究
等腰三角形个数探索
怎样数出小木块的个数
怎样数出小正方体的个数
标准化是综合交通运输的保障——解读《交通运输标准化体系》