基于机器学习的弯管固液两相流流动特性研究1)
2024-04-15肖盛鹏朱宏博
肖盛鹏 朱宏博 周 岱 包 艳
(上海交通大学船舶海洋与建筑工程学院,上海 200240)
引言
管道水力输送作为典型的颗粒-流体的固-液两相流,是采矿和石油等工业中一种常见运输方式,具有运输距离长、安全性高、运营和维护成本低、环境友好的优点[1],此外,输送系统中的直管之间通过弯曲短管进行连接,具有很好的布局灵活性.当固液两相流中的颗粒进入弯曲段,与弯曲壁面首次碰撞后,会减速并以一定角度向弯管出口偏转,在颗粒从弯曲段出口流入直管段,加速并恢复到完全发展状态之前,会经历与壁面一次或多次的碰撞,整个过程导致了管道压降与壁面磨损率的增加[2].
管道压降是管道输运优化设计的主要物理量之一[3-4].管道压降过大,输送两相流所需要的能量则越多,导致资源浪费;压降过小,则不能保证颗粒的顺利输送,甚至导致管道堵塞[5].周游[6]通过对垂直管道进行数值模拟,发现压降由颗粒重力、壁面摩擦等引起.Doron 等[7]和Song 等[8]对直管道压降进行了测试,发现管道压降大小与流体速度、管道直径、固体进料浓度及其他参数有关.Peretz 等[9]针对90°弯管,结合文献数据和数值模拟,建立了包含几何和流动条件的弯管压降经验方程.
壁面磨损是管道输运优化设计的另外一个主要的物理量.Vieira 等[10]通过理论与实验相结合,提出了适用于不同流率和粒径的壁面磨损模型.Adedeji等[11]将数值模拟结果与前人的实验数据进行对比,发现颗粒碰撞角、速度和颗粒质量分数是磨损程度的主要影响因素.Chen 等[12]研究了输送细颗粒的45°,60°和90°弯管的壁面磨损,发现最大磨损率明显不同.Pei 等[13]发现,改变弯曲段的曲率半径直接影响颗粒的流动磨损特性.Zhang 等[14]在计算磨损率时考虑了颗粒碰撞速度和角度并讨论了模型的适应性.
随着计算技术的发展,数值模拟已成为预测管道水力输送流动特性的有效工具[15-16].对固液两相流进行数值模拟的方法主要分为两种:Euler-Euler方法和Euler-Lagrange 方法[17].与Euler-Euler 方法将固液两相均视为连续介质相比,Euler-Lagrange 方法将流体视为连续相而将颗粒视为离散相,更好地模拟了颗粒的碰撞[18].对于运动中的各向异性大颗粒(>1 mm),Euler-Lagrange 方法的计算结果更符合实际情况[19].离散单元法(DEM)是Euler-Lagrange框架中模拟颗粒之间、颗粒与壁之间相互作用的最常用方法之一.在该方法中,有限数量的离散颗粒通过接触力和非接触力相互作用,并具有由牛顿运动方程描述的平移和旋转运动.
近年来,机器学习方法在解决工程应用和科学领域的复杂问题中表现出了优异性,为管道水力输送流动特性的预测提供了一种新的思路,目前已被应用于多相流流型识别、压力预测和颗粒系数等的预测[20].Liu 等[21]采用卷积神经网络来计算不同体积分数下固液两相流的流速,精度比现有流速计算方法高21%.Li 等[22]使用K近邻回归模型对固液两相流的湍流波动进行预测,显示出很好的一致性.颜建国等[23]研究了极限学习机等模型在螺旋流动条件下对过冷沸腾两相流的临界热流密度的预测效果,比传统经验公式有大幅提升.贺登辉等[24]基于随机森林模型,实现了对离心泵气液两相流的压升问题的准确预测.但针对颗粒-液体两相流的压降和磨损问题,相关机器学习模型还鲜有应用.
另一方面,与对管道水力输送系统中的垂直、水平和倾斜直管道的广泛研究相比[7,18,25],对弯管的研究要少得多.然而,在管道系统的所有部件中,弯管是最有可能出现问题的.与水力输送相类似的颗粒输送方式——气力输送已证明了这一情况,在此系统中,由颗粒在弯曲段碰撞后再恢复完全发展状态所引起的压降增加较为明显,在一些系统中占总压降的90%[26],同时,弯曲段的磨损率可能比直管的磨损率高50 倍[27].Wang 等[28]基于气固流动数据,比较了不同机器学习模型对弯管最大磨损率的预测效果并与实验结果基本一致.然而,对于大颗粒水力输送,这些问题研究较少,如果处理不好,会导致输送过程中的流动不稳定、能耗增加和弯曲磨损破坏,甚至导致整个输送过程的失败.因此,有必要评估和预测弯曲段的压力损失、管道壁面磨损来确保输送稳定性,以便更好地设计和规划输送系统.
本文采用CFD-DEM 方法,计算了弯曲段水力提升管道在不同的几何、流场和颗粒参数条件下的压降和磨损性质,分析了各参数的影响机理,并结合机器学习方法,基于CFD-DEM 方法计算的数据,研究了不同机器学习模型对弯曲提升管的压降和磨损率的预测能力,以期为管道系统的设计和优化提供参考.
1 两相流模型
1.1 流体控制方程
将流体视为连续相,其控制方程以N-S 方程为基础,在动量方程中引入了由于颗粒存在而引起的流体扰动项.对于不可压缩黏性流体,方程为
其中,ρf是流体密度,uf是流体速度,pf是流体压力,g是重力加速度,fsf是颗粒对流体的体积力,Rf是应力张量,包括黏性应力和雷诺应力,εf为流体体积分数,表示为
其中Vi,part是颗粒总体积,Vcell是网格体积,n是与网格体积重叠的颗粒数.
1.2 颗粒控制方程
在DEM 模型中,颗粒的平移和旋转运动分别通过动量和角动量方程来考虑
其中mp是颗粒质量,up是颗粒速度,ffs是流体对颗粒的作用力
其中fd是曳力[29],fl是升力[30],fp是压力梯度力,fam是附加质量力.fc表示颗粒之间的接触力,采用Hertz-Mindlin 非滑动接触理论模型.Ip为质点转动惯量,ωp为颗粒的角速度,Mct为颗粒与其他所有颗粒的接触力矩,Mfs为颗粒受流体作用的力矩.
1.3 磨损率方程
采用Zhang 等[31]设计的E/CRC 模型
式中,ER为磨损率,定义为单位时间和面积下管壁因颗粒碰撞而损失的质量;Aface为管道系统内壁总面积;BH为壁面材料的布氏硬度;Fs为颗粒形状系数;Vp为颗粒撞击速度;θ是以弧度为单位的撞击角;n与C为经验常数,分别为2.17×10-7和2.41.
1.4 CFD-DEM 耦合过程
首先计算得到流场参数,如流场压力和速度,用于DEM 计算,计算颗粒所受的流场力和颗粒对流场的反作用力,之后将颗粒对流场的作用力代入流体控制方程,得到相应的流场信息.最后,将所有信息作为下一次迭代的参数,重复迭代直至收敛,计算完成.
2 数值模拟设计与验证
针对由水平直管道、弯曲管道和提升直管道组成的组合管道系统,研究其在不同的管道弯曲角度Ab、管道弯曲半径Rb、输入速度U、颗粒浓度Cp、颗粒直径dp条件下的压降ΔP和磨损率ER变化规律.假设管道变形极小,并简化为刚性管道.水平直管道和提升直管道的设置是为使进出弯曲管道的两相流发展到稳定状态,以便更完整准确地模拟两相流流经弯管的过程.
2.1 边界条件和参数设置
如图1 所示,水平段和提升段均长1 m(独立性验证见后),管径D为3.06 cm,管道两端设置速度入口和压力出口边界条件,壁面采用无滑移边界条件.管道划分成六面体网格,通过O 型网格拓扑结构,可以细化壁面附近的网格来更好地预测壁面附近的液体流动.边界层共有9 层,伸长率为1.2,第一层厚度为5.0×10-4m,网格数量为1.25×105左右.流体的密度与动力黏度分别为998 kg/m3和0.001 Pa·s,颗粒的杨氏模量、泊松比和密度分别为1.0×107Pa,0.3 和2450 kg/m3.颗粒彼此间碰撞恢复系数以及颗粒与壁面间的碰撞恢复系数分别为0.85 和0.95;颗粒间的滑动摩擦系数和静摩擦系数分别为0.01 和0.1;颗粒与壁面间的滑动摩擦系数和静摩擦系数分别为0.01 和0.2.
图1 模拟弯管的几何和网格示意Fig.1 Geometry and mesh representation of the simulated bend
2.2 数值格式
控制方程采用有限体积法离散.瞬态问题时间离散采用二阶隐式格式,空间离散采用二阶迎风格式.液相模拟采用可实现的k-ε湍流模型.在CFDDEM 模拟中,颗粒相的时间步长受Rayleigh 时间∆tp的限制,Li 等[32]计算的Rayleigh 时间为
其中,μp,Ep分别为颗粒的泊松比和杨氏模量.考虑准确率和时间代价,颗粒时间步长设定为1.0×10-5s.根据Tsuji 等[33]的工作,流体时间步长可以是固体时间步长的10~100 倍.为减少模拟时间,将液相时间步长定为1.0×10-4s.
2.3 模型验证
Toda 等[34]针对此类组合管进行了纯流体与流体-颗粒两相流的实验.实验的颗粒密度为2.5 g/cm3,弯曲半径为12 cm,管道直径为3.02 cm,输入速度为2.18 m/s.实验取水平管中距离弯管入口0.69,0.48,0.3 和0.09 m 的横截面以及提升管中距离弯管出口0.12,0.33,0.51 和0.84 m 的横截面,8 个截面之间的管道依次为1~7 段,第4 段主要为弯管,对每一段进行了压降测量.模拟结果与实验结果相似,每段的压降见图2,证明了压降模拟的准确性,也说明了弯曲段的压降显著大于直管段,在管道系统总压降中占比较大.
图2 压降的模拟结果与实验结果验证Fig.2 Verification of simulated (SL) and experimental (EXP) results of pressure drop
利用E/CRC 磨损模型,Zhang 等[31]进行了水-硅粉流的壁面磨损模拟,Chen 等[12]进行了管道直径为4 cm、弯曲半径为6 cm、输送速度为3 m/s 的水-砂流管道磨损模拟,均与实验测量的结果基本一致,证明了在CFD-DEM 框架中应用E/CRC 磨损模型的计算准确性,本文不再验证.
2.4 独立性验证
网格独立性依次对细、中和粗网格进行验证,模拟结果相似,见图3(a).考虑到计算精度和计算时间,采用了中网格.计算时间独立性取每0.5 s 结果的均值,见图3(b),从第2 s 以后,每0.5 s 的均值基本相同,认为计算收敛,因此计算时间取3.5 s.
图3 计算结果随(a)网格数量和(b)计算时间的变化曲线Fig.3 Curve of the change in calculation results with (a) the number of grids and (b) computing time
管道长度独立性验证部分,对水平段和提升段均为2 m 的同类管道系统进行模拟,得到管道各横截面的颗粒径向体积分数分布,如图4,可以发现在水平段和提升段内经过约0.75 m 后两相流均发展到稳定状态.因此,水平段和提升段总计算域均取1 m.水平段的前0.75 m 作为两相流发展段不计入组合管道的压降和磨损率测量,后0.25 m 作为组合管道的水平直管部分计入测量,提升直管部分则全部测量.
图4 长度独立性验证Fig.4 Length independence verification
3 数值模拟结果分析
管道压降与水力输送的能量消耗有关,由颗粒与颗粒、颗粒与流体、颗粒与壁面、流体与壁面的相互作用以及颗粒重力等的耗能导致[6],管道磨损率则主要由于颗粒碰撞和冲击导致,两者是工程实际应用中的主要关注点.下面展开管道弯曲角度、管道弯曲半径、输入速度、颗粒浓度和颗粒直径这5 个因素对压降和磨损率的影响分析.
3.1 输入速度U
管道系统的弯曲角度为90°,弯曲半径为0.06 m,粒径0.003 m,颗粒浓度4%,输送速度分别为2,3.2,4.4 和5.6 m/s.图5 显示了颗粒的瞬时流动速度,可划分为3 个过程:入口直管段充分发展状态,弯曲段的碰撞减速状态以及出口直管段加速至恢复充分发展状态.如图6 所示,随着输入速度增加,管道系统的压降和磨损率增大.
图5 不同输入速度的颗粒流速Fig.5 Particle velocity at different input velocity
图6 压降、磨损率随输入速度的变化曲线Fig.6 Curve of pressure drop and erosion rate with input velocty
当输入速度增加,颗粒以更大的速度与弯曲壁面碰撞,对壁面的磨损程度增加,与1.3 节磨损率模型中磨损率与颗粒撞击速度的关系相符合,而且颗粒与壁面的碰撞耗能增大;同时,从图5 可以看出碰撞后颗粒的速度减幅变大,动能损失增大,且随着输入速度增大,颗粒间的相互碰撞更加频繁和剧烈,碰撞后的颗粒一部分向管道壁面运动,导致颗粒与壁面的碰撞次数也增多,颗粒与壁面的每次碰撞都是一次减速再加速的耗能过程,导致壁面磨损与输送耗能增大;由于输送速度的增加,管道每秒输送的颗粒增多,导致颗粒总重力的增加,流体需提供更多能量给颗粒,增大耗能;随速度的增大,液体与壁面的相互作用也增加.管道系统总能耗增大,因此压降增加,且磨损率增大.
3.2 颗粒浓度Cp
管道系统的弯曲角度为90°,弯曲半径为0.06 m,粒径0.003 mm,颗粒浓度分别为1%,2%,4%和8%,输送速度为3.2 m/s,颗粒瞬时流动速度见图7.由图8 可知,随着输送浓度增大,管道系统的压降和磨损率增大.
图7 不同输送浓度的颗粒流速Fig.7 Particle velocity at different particle concentration
图8 压降、磨损率随颗粒浓度的变化曲线Fig.8 Curve of pressure drop and erosion rate with particle concentration
当输送浓度增大,输送的颗粒数量增多,流体需要转递更多的能量到颗粒以克服颗粒重力,同时,管道内颗粒数量的增多导致颗粒与颗粒以及颗粒与壁面的碰撞次数增加,颗粒产生的变速运动以及旋转同时也对流场产生极大扰动,颗粒与流体间相互作用增大.以上因素导致了耗能与磨损,因此压降增加,且管壁的磨损率增加.
3.3 颗粒直径dp
管道系统的弯曲角度为90°,弯曲半径为0.06 m,粒径分别为0.0015,0.003,0.0045 和0.006 m,浓度为4%,输入速度为3.2 m/s,颗粒瞬时流动速度见图9.图10 表明,随着粒径增大,管道系统的压降和磨损率增大.
图9 不同颗粒直径的瞬时颗粒流速Fig.9 Particle velocity at different particle diameter
图10 压降、磨损率随颗粒直径的变化曲线Fig.10 Curve of pressure drop and erosion rate with particle diameter
相同浓度下,随着粒径增大,颗粒数量急剧减少,输送过程中颗粒间的相互碰撞减少,因此颗粒的动量损失更少,会以更大的速度与弯曲壁面相碰撞;且大颗粒与小颗粒相比,贴近弯曲壁面的一层颗粒之间距离更近,具有一定的“屏障”作用,减少了非最外层颗粒与弯曲壁面的碰撞,如图9(a)和图9(b)中的弯曲段较内侧的颗粒比贴近壁面侧颗粒的速度减幅更小,因此大颗粒比小颗粒对壁面的磨损率要大.对于大颗粒,在颗粒重力不变的情况下,虽然颗粒间的相互碰撞减少导致耗能减少,但由于颗粒与壁面碰撞的速度更大次数更多,导致总能耗增大,压降增大.
3.4 弯曲半径Rb
管道系统的弯曲角度为90°,弯曲半径分别为0.03,0.06,0.09 和0.12 m,粒径0.003 mm,浓度为4%,输入速度为3.2 m/s,颗粒瞬时流动速度见图11.
图11 不同弯曲半径的瞬时颗粒流速Fig.11 Particle velocity at different bending radius
由图11 可以看出,在颗粒流经弯曲段的过程中,由于离心力的作用,颗粒呈现贴近外侧壁面的流动状态并沿外侧壁面分散.因碰撞外侧壁面而减速形成低速流,且速度减小幅度随弯曲半径的增大而减小,即弯曲段半径越大越平缓,其中的颗粒流速越接近完全发展状态的速度,颗粒以更大的速度与弯曲壁面发生碰撞,且弯曲段距离随弯曲半径的增大而增大导致颗粒贴近外侧壁面的流动距离增大,碰撞范围更大,碰撞和摩擦次数增加,导致磨损率增加.随弯曲半径的增大,颗粒在弯曲段的速度减幅变小,动能损失减小,与颗粒和壁面间的相互作用增大导致的耗能的增量基本相抵消,因此不同弯曲半径的管道系统压降变化不大.
由图12 可以看出,随弯曲半径的增大,压降基本不变,磨损率增大.
图12 压降、磨损率随弯曲半径的变化曲线Fig.12 Curve of pressure drop and erosion rate with bending radius
3.5 弯曲角度Ab
管道系统的弯曲角度分别为30°,60°,90°,120°和150°,弯曲半径为0.06 m,粒径0.003 mm,浓度4%,输入速度3.2 m/s,颗粒瞬时流动速度见图13.
图13 不同弯曲角度的瞬时颗粒流速Fig.13 Particle velocity at different bending angle
如图13 所示,随着弯曲角度从150°减小到90°,弯折程度趋于平缓,弯曲段的长度减小,颗粒在弯曲段贴近壁面流动的距离减小,与壁面的碰撞和摩擦减少,磨损率降低,同时造成了耗能降低,导致压降的下降.随着弯曲角度从90°减小到30°,弯折程度更加平缓,接近于水平直管,弯曲形状对颗粒的影响减小,颗粒贴近弯曲壁面的程度降低而更加均匀地分散在管道中,颗粒间的相互作用减少,耗能减少,压降变小;颗粒速度减幅有所降低,以相对大一些的速度与壁面碰撞,导致颗粒与壁面的磨损率小幅上升.
如图14 所示,随着弯曲角度从150°减小到90°,压降和磨损率下降;随着弯曲角度从90°减小到30°,压降下降,磨损率小幅增加.
图14 压降、磨损率随弯曲角度的变化曲线Fig.14 Curve of pressure drop and erosion rate with bending angle
4 机器学习数据集及模型
由于固液两相流不同条件下流动状态的复杂性,以及弯管几何特征的多样性,导致多参数条件下弯管的压降和磨损率预测难度较大,基于CFDDEM 的方法将耗费大量的计算时间和资源.因此,采用机器学习方法,通过对已有数据的学习,来实现良好预测效果.
4.1 机器学习数据集
表1 列出了前文弯曲角度、弯曲半径、颗粒输送浓度、颗粒直径和输入速度5 个参数的常见取值.将参数组合为工况时,若各参数一一组合,工况数量将十分庞大,故采用Pairwise 配对法,它是对正交分析方法优化后得到的方法,在保证较大测试覆盖度的情况下,缩减测试用例,降低算例耗时.本文在完成数值模拟验证的基础上,对5 个参数的不同取值进行组合,共计255 个工况.经CFD-DEM 数值模拟计算后,检查并剔除计算异常的数据,剩下234 个有效数据,组成了最终的数据集.
表1 工况的各参数取值Table 1 Parameter values for cases
使用Python 中sklearn 库将此数据集按照80%和20%的比例随机划分为训练集和测试集,并以训练集为标准对训练集和测试集进行归一化,以提高数据的表现
其中xmax和xmin数据所在特征列的最大值和最小值,经归一化后x的范围为[0,1].利用训练集来训练机器学习模型,并通过测试集来对模型的准确性进行评估.
4.2 机器学习模型
基于4.1 节的数据集,总共6 个模型被开发和评估.接下来对每个模型进行简要介绍.
4.2.1 线性回归(LR)
线性回归是基于输入特征和输出是线性关系的假设,进而求解线性方程.当数据量较小时,能达到与复杂模型相当的精度.模型如下
4.2.2K近邻回归(KNN)
K近邻回归是回归分析中经典的非参数方法.在给定输入变量x的情况下,K近邻算法使用输入空间中最接近x的K个点的均值来确定输出值.模型的预测效果受K值的影响.
4.2.3 支持向量回归(SVM)
支持向量回归基于从训练数据确定的一维或多维超平面对数据进行拟合,使靠超平面最远的样本点之间的间隔最大,并限制超平面与真实值的偏差必须小于等于ε.同时,由于无法保证所有点都在ε范围内,故对每个样本设置超出范围上下界的松弛变量ξ+和ξ-,并乘正则化参数C.模型如下
SVM 的预测效果主要受到正则化参数C和范围ε这两个超参数的影响.
4.2.4 人工神经网络(ANN)
人工神经网络由多个人工神经元组成,这些神经元以一定权重相连组成神经网络,并分为输入层、隐藏层和输出层.整个过程为:开始时为连接输入层、隐藏层和输出层中神经元的权重wij分配随机值,输入值被馈送到输入层中的神经元中,乘以权重wij并加偏置bj,再经非线性激活函数的处理,输出到隐藏层的神经元中,并经过相同过程继续输出和传递,最终传递到输出层输出.每个神经元的计算过程为
其中f为非线性激活函数.将输出层输出的预测值与真实值进行比较,两者之间的差值用于通过反向传播算法调整权重.重复前馈和反向传播算法以迭代地调整权重,直到真实值和预测值之间的误差达到可接受的范围.模型的预测效果受到网络结构、学习率等较多超参数的影响.
4.2.5 随机森林(RF)
随机森林是由许多决策树组成的集成模型,即采用不同的随机选择的子集和特征属性建立多个独立的决策树,最后将多个决策树的结果进行平均或加权平均,合并成一个效果更佳的集成学习的模型
式中,Ti代表每颗决策树的结果,xinput为决策每棵树采用的子集数据,ntree为决策树的数量.模型的预测能力主要与决策树的最大深度和数量有关.
4.2.6 XGBoost
XGBoost 属于集成学习中的boosting 框架里的算法,采用多个基学习器,即不断生成新的基学习器,每个基学习器都是基于前面基学习器和目标值的差值来学习,从而不断降低模型的偏差,最终模型的预测结果是所有基学习器预测结果的加和
4.2.7 模型评价指标
为了量化机器学习模型的预测准确性,使用了3 个评价指标,即决定系数(R2)(范围在0~1 之间)、均方根误差(RMSE)和平均绝对误差(MAE)
其中yi表示真实值,表示预测值,表示各真实值的平均值,n是数据的数量.
R2表示模型能够解释数据方差的比例,通常用于比较不同模型的表现,MAE计算了预测值和真实值之间差异的确切幅度,RMSE计算了误差的平均大小,并且对异常值敏感.越接近1 的R2值和越低的RMSE和MAE值表明模型准确性越高.
5 机器学习模型预测效果及讨论
5.1 特征相关性分析
图15 给出了各特征之间的相关性,可以初步看出,5 个输入特征相互之间的相关性均在0.1 以下,相关性低,独立性高,较好地表示管道固液两相流的不同特征.输出特征压降与弯曲角度、输入速度、颗粒浓度和颗粒直径呈正相关,其中与输送速度正相关性程度最高,与弯曲半径呈弱负相关;磨损率与弯曲角度呈弱负相关,与弯曲半径、输入速度、颗粒浓度和颗粒直径呈正相关;两个输出特征压降与磨损率之间也存在一定的相关性,即磨损率的增加代表着颗粒与壁面的相互作用增大,产生的能量损耗增大,一定程度导致压降增大.各特征的相关性与前文第3 节分析的规律大致吻合.为了便于后续定量计算分析输入特征对于压降和磨损率各自的影响程度大小,对这两个物理量分别建立机器学习模型并预测.
图15 特征相关性Fig.15 Feature correlation
5.2 各机器学习模型对压降的预测效果
通过Python 的sklearn 库以及torch 库建立机器学习模型,并对模型中由用户自行设置大小的超参数采用随机搜索方法进行自动寻优,以得到最好的模型预测效果.
预测压降的各模型超参数设置和在测试集的预测结果见表2,以R2为准确率的主要评估指标进行排序,可以发现,神经网络、随机森林和XGBoost 的准确率均为0.96 左右,其中以神经网络的0.9654 为最高,同时3 个模型的MAE和RMSE也较为相近,以神经网络MAE=0.0325 和RMSE=0.0472 为最低,3 个模型均有较好的预测效果,在测试集的预测表现见图16.预测效果最差的为K近邻模型,R2仅为0.8212.
表2 预测压降的各模型超参数及预测效果Table 2 Hyper parameters and prediction effects of various models for pressure drop
图16 各模型对压降的预测效果Fig.16 Prediction effect of various models on pressure drop
5.3 各机器学习模型对磨损率的预测效果
预测磨损率的各模型超参数设置和在测试集的预测结果见表3,可以发现,神经网络、随机森林和XGBoost 的准确率同样较为相近,其中以神经网络的0.9907 为最高,同时3 个模型的MAE和RMSE也较为相近,以XGBoost 的MAE=0.0086 和神经网络RMSE=0.0126 为最低,3 个模型仍均有良好的预测效果,在测试集的预测表现见图17.预测效果最差的为线性回归模型,R2仅为0.6184.
5.4 数据量大小与预测准确率的关系
采用5.2 节和5.3 节中对压降和磨损率预测准确率最高的神经网络模型,分别用数据量为50,100,150,200 和234 的数据集进行训练和评估.由表4可知,对于压降,当数据集从50 增长到150,预测准确率总体呈增长的趋势,从150 增长到234 后,预测准确率基本持平,R2在0.96 左右;对于磨损率,则更为明显,当数据集从50 增长到150,预测准确率显著增长,从150 增长到234 后,预测准确率基本持平,R2在0.987 左右.说明数据量已经基本达到机器学习模型的要求,从计算成本的角度出发,234 个数据的量可以实现模型的较高准确性.
表4 数据集大小与预测准确性的关系Table 4 The relationship between data size and prediction accuracy
5.5 特征相对重要性分析
机器学习模型可以计算每个输入特征的相对重要性,以衡量每个特征对构建预测模型的相关性和贡献程度.选取对压降和磨损率预测R2分别最高的神经网络模型,计算各特征的相对重要性,结果见表5.可以看出,输入速度对于压降的预测影响最大,弯曲半径对压降的预测影响最小;颗粒浓度对磨损率的预测影响最大,弯曲角度对磨损率的预测影响最小,为弯管固液两相流的进一步研究指明了方向.
表5 各特征对于压降和磨损率预测的相对重要性Table 5 Relative importance of each feature for prediction of pressure drop and erosion rate
6 结论
通过CFD-DEM 耦合方法和机器学习方法,针对弯管内颗粒水力输送的压降和磨损率问题,探讨了弯曲角度、弯曲半径、输入速度、颗粒浓度和颗粒直径这5 个特征因素的影响并对结果进行预测,主要结论如下.
(1)基于CFD-DEM 数值模拟计算的结果,发现弯管的压降随着输入速度、颗粒浓度、颗粒直径和弯曲角度的增大而增大,受弯曲半径的影响较小;弯管的磨损率随输入速度、颗粒浓度、颗粒直径和弯曲半径的增大而增大,随弯曲角度的增大,在90°前先略有下降,在90°后增大.
(2)根据Pairwise 配对法确定了工况并进行数值模拟计算,最终建立了包含数百个数据的数据集.基于此数据集训练了6 个机器学习模型,分别对弯管的压降和磨损率进行预测.其中,神经网络、随机森林和XGBoost 3 个模型的预测效果最为良好且相近,对压降和磨损率的R2表现分别在0.96 和0.99 左右.并发现输入速度和颗粒浓度分别是对压降和磨损率的预测影响程度最大的因素.
相比于对磨损率0.99 左右的准确率,机器学习模型对压降的预测准确率仍有提升空间,因此下一步的一项工作是将目前效果良好且相近的多个模型进行组合,形成集成学习模型,以进一步提高机器学习模型的准确性;另一方面,针对更加完整和复杂的输流管路,增加对管道弯曲的垂直或水平朝向、管道直径等因素的考虑,计算更多工况以训练适应度更高的机器学习模型.