基于聚类分析和支持向量机的非等间隔应力谱编制方法
2023-11-22尹怀彦胡李军
薛 海,杜 文,尹怀彦,胡李军
(兰州交通大学机电工程学院,甘肃,兰州 730070)
实测的应力-时间历程综合反映了结构在实际服役条件下所受的载荷和环境信息,但由于其随机交变性,不宜直接用于结构的疲劳寿命评估或疲劳试验[1-2],需采用计数方法对应力-时间历程进行应力循环统计处理,编制能真实反映应力信息的应力谱,获得各级应力大小与其出现次数的关系[3-4]。
分级是应力谱编制中需要解决的关键问题之一,若级数过少,过大的应力区间改变了应力循环特征,导致分组后每个新的应力循环产生的结构疲劳损伤与实际结果产生的疲劳损伤存在差异;级数过多,一方面不宜应力谱的工程化应用,另一方面在中高应力区出现次数为零的应力级使得总体统计特性较差。传统方法是基于样本直方图进行分级,如Moore 公式、Sturges 公式、Doane公式等,仅仅是从数学角度进行考虑,忽略了应力作用于结构所造成的疲劳损伤,缺失工程边界条件的考虑。目前在工程应用中,国内外的分级方法主要基于等间隔和非等间隔两种方法开展研究和应用。在等间隔分级方面,高延杰等[5]根据载荷-时间历程采用雨流计数法得到所有的载荷循环,并对每个循环的均值和幅值进行统计分析,编制了等间隔16 级载荷谱;ZHANG 等[6]通过统计应力幅值和均值的分布特性,建立了幅值等间隔的8 级谱;孙晶晶等[7]基于提速客车转向架构架实测载荷-时间历程,应用雨流计数法编制构架等间隔8 级载荷谱。非等间隔分级中,刘永臣等[8]通过雨流计数获得轮式装载机载荷的均值频次和幅值频次分别服从正态分布和威布尔分布的拟合数学模型,编制了非等间隔8 级载荷谱;PRATUMNOPHARAT等[9]采用短时傅里叶变换和小波变换的方法,根据分解信号的累积功率谱密度提取造成结构疲劳损伤贡献大的部分,在此基础上编制了非等间隔8 级载荷谱;高云飞等[10]基于雨流计数法,通过假设检验确定应力分布数学模型,编制了非等间隔8 级齿轮程序应力谱。但上述等间隔方法未考虑编谱前后造成的损伤误差,且级数的确定科学依据性欠佳,而非等间隔分级均采用固定比例系数编谱,得到的疲劳损伤与实际差异较大,且在编谱中分级数没有明确的统一标准。同时,载荷谱编制中也有机器学习算法应用,但机器学习算法主要用在载荷样本数据较小、不能全面反映结构受载特性的情况下进行载荷谱的外推或预测,如杨博文等[11]和霍军周等[12]通过采用BP 神经网络算法,建立载荷谱预测模型,有效模拟了实测或仿真过程中未表征的载荷信号,提高了载荷谱的精度。
针对上述存在的问题,本文根据实测的应力-时间历程建立疲劳损伤与应力谱分级数的数学模型,以损伤相对误差和分级准确率为分级依据,采用聚类分析和支持向量机进行应力谱编制,并与目前常用的等间隔和非等间隔应力谱编制方法所造成的疲劳损伤进行比较,验证该方法编制应力谱的可行性。
1 基于疲劳损伤的分级模型
应力谱主要用于承载结构的疲劳损伤分析,为此,在应力谱的编制过程中,分级数的确定要尽可能体现应力循环所造成的疲劳效应,使编制的应力谱在便于应用的情况下尽可能降低与实际疲劳损伤的误差。
由于以双参数为基础的雨流计数法是基于材料的应力-应变迟滞回线进行应力统计,较好反映了材料的疲劳损伤特性[13]。为此,采用雨流计数法得到每个应力循环的均值和幅值,根据材料的S-N曲线和线性累积损伤理论,推导得到每个应力循环所造成的损伤Di为:
式中: σi为每个循环的等效应力;ni为 σi对应的循环次数;m、c为材料相关参数。
为了根据有限的级数尽可能准确地反映应力分布特性,且减小所编制应力谱造成的疲劳损伤与实际损伤差异,建立疲劳损伤和应力谱分级数的数学模型。对比不同分级数编制的应力谱所造成的损伤与实际损伤,选取最接近实际损伤的分级数可有效降低因应力谱分级数选取不合理导致的误差。目前非等间隔应力谱分级方法采用8 级进行描述,其各级应力按最大应力σmax的1 倍、0.95 倍、0.85 倍、0.725 倍、0.575 倍、0.425 倍、0.275 倍、0.125 倍进行阶梯划分[14-15],但在实际分级中,8 级不一定为最佳分级数,故为了更准确对实测应力数据进行非等间隔分级,引入各级应力自适应比值系数 βj进行各级等效应力 σej的确定。
若对雨流计数得到的每个应力循环不进行分级处理,则保留了每个应力循环的特征,能真实反映实际应力所造成的损伤。为此,根据每个应力循环所造成的损伤Di表达式(1)和各级应力与最大应力的关系表达式(2),推导得到不进行分级的应力循环所造成的总损伤D1和非等间隔分级造成的总损伤D2分别为:
式中:n0为应力循环总次数;s为非等间隔分级数;nj为第j级对应的循环次数。
当实际总损伤D1和非等间隔分级造成的损伤D2相等或相对误差较小时,说明所确定的分级数是合理的。由于应力的分级归类改变了应力循环特征,所编制的应力谱与实际应力循环所造成的损伤存在误差,故采用相对误差τ进行最佳分级数的确定。
2 应力循环聚类分析
经雨流计数后,每个应力循环不同于原始应力-时间历程,由连续信号变为离散应力循环。采用目前等间隔分级方法归类时,由于提取的应力循环分散性,容易出现次数为零的应力级,且应力谱编制方法缺少根据应力本身的属性特征进行分级,导致产生的损伤与实际结果差异较大,与实际不符。聚类分析方法是根据样本本身的属性特征进行归类,很大程度保留了样本原来的特性[16]。故采用聚类分析法,以每个应力循环的等效应力为指标特征,对所有的应力循环进行聚类。
通过计算每两个应力循环间的距离度量其相似程度,各应力循环间的距离为:
对于各类之间的合并,采用离差平方和法,该方法适用于多因素、多指标的分类和特征识别,能依据每个循环等效应力的特征进行分类,以体现每个应力循环之间的综合差异。
若应力谱分级数为s,将n0个应力循环分成s类,分别记为G1,G2,···,Gs,采用Cti表示第t类Gt中的第i个应力循环的等效应力,nt表示该类包含的应力循环数,表示Gt的均值,则Gt类的离差平方和St为[17]:
对于任意两类Gα、Gβ,对应的离差平方和分别为Sα和Sβ,合并为一类,记为Gr,则Gα与Gβ之间的平方距离为:
合并后的Gr对应的离差平方和Sr满足式(10)~式(12)。
通过对合并后的Gr依据式(10)~式(12)进行推导,得出:
从而由式(8)得两类间的平方距离为:
对所有类依次进行合并,并循环计算,直至所有应力循环合并为一类,从而得到任意一类Gξ与合并后的Gr的离差平方和距离递推表达式为[18]:
通过上述步骤将所有应力循环的等效应力进行聚类,从而实现所有应力循环不同类别的归类。在实际应力谱编制中,分级数基本选取4 级、8 级、16 级、32 级、64 级等[19]。因此,将所有循环聚成4~64 类,得到不同分类数下各类的应力循环数。
3 分类效果评估
由于聚类分析是无监督分类方法,缺少明确的理论依据判断分类结果的准确性,而支持向量机在多分类判别中具有优良的性能,相对于神经网络、最邻近等分类算法,能比较准确反映不同类别的分类效果[20]。因此,采用支持向量机的多分类预测得到的分类准确率评价聚类分析中不同类别下的聚类效果。
假设选定部分应力循环 {σ1,σ2,···,σn'}为训练集,其中类别数为yi={1,2,···,s},共s类,通过训练后决策函数f(x)对剩下的应力循环进行分类,得到训练集和预测集的分类准确率。
每两个不同类别应力循环构成一个分类器,对于任意第i类和第j类应力循环,其最优分类面为[21]:
为了在任意两类之间构造一个分类器,求解其二次规划问题,约束条件为:
式中:ω为行向量; φ表示输入空间到特征空间的非线性映射; ξ为松弛变量;P是惩罚系数。
由于变换 φ的核函数为K(σi,σj),则式(15)~式(16)的对偶问题转化为求解目标函数的最小值[22]:
添加其约束条件为:
采用Lagrange 乘子最优化方法将函数f(α)在支持向量上展开,求得最优解选取 α*中的一个分量,可得分类阈值b为:
构造第i类和第j类应力循环的支持向量机决策函数为:
采用高斯径向基核函数K(σi,σj)进行支持向量机分类,其表达式为:
式中: δ为尺度参数; α为Lagrange 乘子。
根据决策函数判别训练集应力循环是属于i类还是j类,并将属于类别i的数据标记为正,属于类别j的数据标记为负。通过该算法不断循环对所有测试集应力循环的等效应力经支持向量机投票决策,采用式(23)计算不同分类结果下的分类准确率η:
式中:n1为训练集样本训练结果与实际类别一致的样本数量;n2为测试集样本预测结果与实际类别一致的样本数量;n0为总的样本数量。
分类准确率越接近100%,说明聚类效果越好,故通过分类准确率大小进行聚类效果的评价。
4 实例应用
4.1 应力谱编制
根据上述方法,对某型地铁焊接构架电机吊座根部实测应力-时间历程数据进行应力谱编制,取焊接构架疲劳性能参数m值为3.5[23]。为避免频混导致采样信号的失真,根据信号采集相关理论和构架随车振动频率,设置采样频率为2000 Hz。
由于小应力在疲劳损伤计算时基本不产生损伤,故对实测信号中的小应力进行处理,通过MATLAB 小波工具箱,选用haar 小波,进行信号5 层小波分解,取应力幅值变程的5%作为小波处理阈值[24],剔除不产生损伤的大量小幅值信号,在保留了应力整体趋势的基础上,提高了应力循环统计效率。小波处理前后对比如图1 所示。
图1 应力-时间历程处理前后对比Fig.1 Comparison of stress-time history before and after processing
通过聚类分析,将所有的载荷循环样本分成4~64 类,以聚为16 类为例,取各类样本的应力平均值为等效应力,则对应的各类样本循环数如表1 所示。
表1 聚类分析分为16 类时各类样本数Table 1 The number of samples of each type when cluster analysis is divided into 16 categories
雨流计数得到的应力循环经聚类分析,通过建立的疲劳损伤数学模型表达式(5)进行计算,得到不同分级数对应的损伤相对误差,并将聚类分析所得分类的应力循环50%作为训练集,剩下50%的作为测试集,进行支持向量机多分类判别,获得应力谱在不同分级数下的分级准确率与损伤相对误差,结果如图2 所示。
图2 分级数-准确率/相对误差关系Fig.2 Classification numbers-accuracy/relative error relationship
从图2 可得出:
1)随着分级数的增加,应力造成的损伤相对误差逐渐减小,相对每个应力循环所造成的损伤总和,分为16 级时损伤相对误差为2.22%,大于16 级时损伤相对误差基本小于2.00%。
2)随着分类数增加,聚为16 类时分类准确率为98.67%,大于16 类时分类准确率基本低于97.00%,其主要原因是随着分级数的增多,更能保留应力循环的特性,使得所得的疲劳损伤更接近实际值,而级数过多使得支持向量机分类判别的波动性和分散性增大,导致分类准确率降低。
综合考虑分类准确率和损伤相对误差,为便于疲劳损伤计算,取编制应力谱的分级数为16 级,用支持向量机训练得到的模型预测测试集的分类类别,获得了16 级下的分类预测图,如图3 所示。
图3 支持向量机分类预测图Fig.3 Support vector machine classification prediction map
从图3 可以得出:分级数为16 级时,应力的测试集分类预测与聚类分析的得到的分类结果吻合度达到98.00%以上,表明在该分类数下聚类效果较好。
通过式(2)计算应力谱非等间隔分级数为16 级时各级应力对应的自适应比值系数 β,得到图4 所示的应力-比值系数-循环次数关系,自适应比值系数从小到大依次为0.007、0.050 、0.116、0.173、0.226、 0.292、 0.359 、 0.429、 0.512、 0.562、0.613、0.687、0.758、0.863、0.931、1.000。采用上述方法所得的结果与目前等间隔编谱所得的损伤进行对比,结果如表2 所示。
表2 不同分级方式下16 级应力谱损伤比较Table 2 Comparison of 16-level stress spectrum damage under different grading methods
图4 应力-比值系数-循环次数Fig.4 Stress-ratio coefficient-cycle number
从图4 和表2 可得出:
1)通过聚类分析和支持向量机得到的各级应力及比值系数是基于疲劳损伤模型,与目前应力谱编制方法差别较大。
2)该方法进行编谱是根据应力本身特性和造成的疲劳损伤进行分级编制,与目前等间隔分为16 级进行编谱比较,损伤相对误差降低了7.43%,有效降低了实测应力信号由于随机性和分散性造成的编谱偏差。
4.2 应力谱有效性验证
由于目前编谱采用的非等间隔固定比值系数法只有8 级谱,且等间隔常用8 级谱进行结构应力谱的编制,故为了验证本文所采用方法编制的应力谱有效性,取分级数为8 级所编制的应力谱与目前等间隔和非等间隔编谱方法进行对比验证。
采用目前非等间隔固定比值系数法进行应力谱编制时,参考文献[25 - 26]对各级频次计算方法,取最大应力对应次数为1,其他各级频次ΔN=Nj-Nj-1(j=2, 3, …, 8),由于通过该方法编制应力谱时,最小应力级为最大应力的0.125 倍,使得低于最小应力的大部分小幅值应力被舍弃,获得的应力谱在进行疲劳问题分析时提高了计算效率和实用性。为了便于对比分析,采用其他分级编谱方法前对小载荷的处理方法与目前非等间隔小载荷的舍弃保持一致,得到不同分级方法下分级数为8 级的结果,如表3 所示。
表3 目前分级方法与本文编谱方法分析比较Table 3 Comparison of the current grading method and the proposed compiling method
从表3 得出:采用常用的8 级谱进行编谱时,本文采用的编谱方法得到的疲劳损伤相对误差为4.10%,相对于目前等间隔和非等间隔编谱,损伤误差分别降低了0.36%和3.70%;相对于目前等间隔分级方法,该方法保留了实测数据的最大应力,得到最大应力级为15.28 MPa,目前等间隔最大应力级为14.45 MPa。
通过比较验证,表明本文所采用的编谱方法不仅很大程度上保留了应力的分布规律,且能比较准确的反映应力疲劳特性。
5 结论
本文通过采用聚类分析和支持向量机方法,引入自适应比值系数,提出了一种基于疲劳损伤的非等间隔应力谱编制方法。以某型地铁焊接构架电机吊座根部实测应力-时间历程数据为例,根据本文应力谱编谱方法和传统分级方法进行比较,验证了本文编谱方法的可行性,并得出以下结论:
(1)考虑不同分级数和分级方式对疲劳损伤的影响,根据损伤一致原则,引入各级应力自适应比值系数,建立应力谱非等间隔分级数学模型,确保了应力级数确定的科学性;
(2)通过聚类分析对所有应力循环进行判别归类,可得出各循环等效应力间的分布规律是影响聚类效果最主要的因素,且随着分类数的增多,特征相近的应力可归为一类;
(3)随着分类数的增加,支持向量机构造的分类器增多,类别预测效率降低,自成一类的大幅值应力循环增多,导致其分类准确率减小;
(4)通过引入自适应比值系数,采用聚类分析和支持向量机,提出的基于疲劳损伤的非等间隔分级方法,提高了所编制应力谱的准确性,可为载荷、加速度、位移等其它信号的编谱过程提供参考,以此提高结构疲劳设计和评估的准确度。