基于共词分析的航空发动机系统失效案例研究
2021-10-26邓姝娟王卫泽张成成涂善东
邓姝娟, 王卫泽, 张 英, 张成成, 涂善东
(1. 华东理工大学机械与动力工程学院,上海 200237;2. 中国航发商用航空发动机有限责任公司,上海 200241)
航空发动机被誉为飞机制造业“皇冠上的明珠”,是具有高度复杂性的动力装置,作为航空飞行器的核心部分,直接影响飞机的安全运行。它的发展可以带动机械、材料、能源、计算机等多产业和多学科共同发展,对国家的经济和科技发展具有巨大的推动作用。航空发动机系统的工况复杂,在恶劣条件下服役时,往往容易发生故障。在1982~1996 年,航空发动机故障造成的事故约占飞机总事故的43%,其中结构故障约占航空发动机故障的50%;在1998~2003 年,航空发动机结构故障造成的事故约占飞机总事故的50%[1]。我国多年来仿制、改进和自主研发的几十种航空发动机几乎都发生过叶片断裂故障,约占航空发动机故障的45%[1-3]。因此,开展航空发动机系统失效分析的研究,可以为航空发动机设计维修和安全运行提供重要参考。
共词分析法作为一种有效的文本数据技术,是利用文献集中词汇对或名词短语共同出现的情况,确定该文献各集中主题之间的关系。通过主题词两两之间在同一篇文献出现的频率,即主题词之间的共现关系,便可形成由这些词汇对关联所组成的共词网络[4]。结合聚类分析、多维尺度分析(Multidimensional Scaling, MDS)、因子分析等多元统计方法,对反映文献集主要内容的词汇进行分类,可以归纳出研究领域的主题[5]。国内外学者利用多元统计分析方法,从不同切入点对航空发动机失效数据进行了分析及研究。在自动化挖掘工具和现有数据库的基础上,用计量统计的方法进行误码率诊断,降低了航空公司的事故率[6]。多种信息分析及数据处理技术被广泛应用于航空发动机等的故障诊断及预测中,聚类分析是其中常见的分类方法之一。王有远等[7]采用模糊聚类理论对航空发动机产生的实时数据以及维修数据库中的数据进行聚类,提出了一种基于模糊聚类的航空发动机故障预测的数据挖掘模型,通过分析航空发动机产生的数据,对航空发动机进行故障预测。王银坤等[8]针对FJ44 发动机,通过对发动机运行和故障时数据的收集和整理,运用灰色聚类的分析方法,探析了FJ44 发动机常见故障的诊断技术。辜振谱等[9]提出一种基于马氏距离的自动搜索发现密度峰值聚类的改进算法,相比K 均值(Kmeans)聚类和模糊C 均值聚类,可以更加有效地应用于航空发动机转子故障诊断。亦有研究将多元统计分析方法运用于特定航空发动机部件的失效分析中,以获得规律性结论。舒畅等[10]对某型航空发动机压气机转子叶片外物损伤数据进行了统计分析,揭示出了损伤类型、缺口尺寸和位置沿压气机轴向和径向的分布规律,并对缺口宽度与深度尺寸采用K 均值(K-means)聚类分析进行了分类。曹惠玲等[11]运用统计分析方法,确定了高压涡轮转叶前缘涂层脱落失效分布模型。针对航空发动机系统失效案例分析的相关研究中,更多地应用了理论研究或传统统计分析,基于共词分析并与多元统计方法相结合的研究暂未得到广泛应用。
本文拟采用共词分析法进行文本数据处理,结合因子分析、聚类分析和多维尺度分析3 种多元统计方法,实现对航空发动机系统失效领域重要主题词的分类及结果可视化。
1 数据处理
1.1 数据来源
本文的失效案例选自研究室自主建立的失效数据库−失效分析专家网站(www.failureanalysis-ecust.com)[12],选取失效数据库中收录的航空发动机系统相关失效案例共93 篇,利用传统定量统计对发动机系统失效设备进行初步分类。结果表明发动机系统的失效部件主要集中在叶盘、机械传动系统和其他附件这3 类,其中叶盘类失效占比最大,占统计总数的49%,机械传动系统失效占25%,其他附件失效占26%。
1.2 关键词抽取
采用Jieba 分词器并结合自行建立的整体分词词典、同义词词典和停用词词典将文本进行分词预处理。然后利用关键词分配的方法,将分词后的文章与构建的关键词词典进行匹配,得到每篇失效文本的关键词。通过构建同义词词典并与关键词匹配尽可能地降低了特定表达方式对共词分析结果的影响。
1.3 构建矩阵
统计每对关键词的共词词频,汇总共词词频不小于1 的关键词,重复至整个案例集合中的所有文本都统计完毕,形成共词矩阵[13]。采用Cosine 系数的标准化算法,利用Matlab 软件将共词矩阵分别转化为相似矩阵,并根据相异矩阵=1−相似矩阵得到对应的相异矩阵[14-16],以适应不同的统计方法对数据的要求。如表1、表2 所示,分别为叶盘类关键词的相似矩阵和相异矩阵;表3、表4、表5 分别为叶盘、机械传动系统、其他附件的失效关键词。
表2 叶盘失效相异矩阵(部分)Table 2 Dissimilar matrix of blade and wheel disc failure (Part)
表3 叶盘失效关键词Table 3 Failure keywords of blade and wheel disc
表4 机械传动系统失效关键词Table 4 Failure keywords of mechanical transmission system
2 航空发动机系统失效案例的共词分析
2.1 因子分析
利用SPSS(Statistical Product and Service Solutions)软件对关键词的共词矩阵进行因子分析。将标准化后的相似矩阵数据导入SPSS,采用主成分分析法(Principal Component Analysis, PCA)进行因子分析,分析得到总方差解释表(表6)与碎石图(图1)。表6 按照特征值从大到小排列,列出了部分主成分。当有7 个因子被提取时,累计方差解释贡献率为89.663%。根据“特征值大于1”和“累计贡献率达到85%以上”的原则[17],进行聚类分析时,可将叶盘失效研究的高频关键词分为7 个类团。结合图1 的碎石图验证,可知这样分类是较为合理的。
图1 叶盘类因子分析碎石图Fig. 1 Scree plot of factor analysis of blade and wheel disc
表6 叶盘类因子分析总方差解释表Table 6 Explanatory table of total variance of factor analysis of blade and wheel disc
以相同的方法及步骤,对航空发动机系统的机械传动系统及其他附件两类文本进行因子分析。结合总方差解释表与碎石图结果,机械传动系统的失效关键词可被分为11 个类团,如表7 所示其样本总方差解释为96.176%;其他附件的失效关键词可被分为10 个类团,如表8 所示,其样本总方差解释为92.345%。
表7 机械传动系统因子分析总方差解释表Table 7 Explanatory table of total variance of factor analysis of mechanical transmission system
表8 其他附件因子分析总方差解释表Table 8 Explanatory table of total variance of factor analysis of other accessory equipment
2.2 聚类分析
利用SPSS 软件,以欧氏距离(Euclidean Distance)作为度量标准[17],采用聚类分析中最常用的系统聚类法进行聚类分析,输出叶盘失效分析的聚类树状图如图2 所示。结合因子分析的结果,通过关键词的直观理论分析,确定7 类叶盘失效的关键词:(1)异物撞击等机械损伤;(2)疲劳断裂失效;(3)高低周复合疲劳失效及零件的微动磨损;(4)叶片涂层恶化或结构劣化;(5)高温下的热损伤及热腐蚀;(6)点蚀等局部腐蚀;(7)高温下蠕变损伤及材料缺陷引起的失效。
2.3 考虑自相关性与否的聚类效果对比
共现矩阵预处理的争论焦点之一是对角线元素的取值[5]。自相关性是对象的关键性特征之一,对角线元素的取值会对后续的聚类分析结果产生影响。本文采取两种不同的对角线元素取值,对比了考虑自相关性与否的聚类分析效果。一种是取对角线元素全部为0,另一种是取对角线元素所属行或列的最大值加1[18]。
将未考虑自相关性时标准化处理后的相关矩阵导入SPSS 中进行系统聚类,得到的树状图如图3 所示。如表9 所示,结合因子分析结果,可将其分为8 类,此时未考虑自相关性的总方差解释度已高达95.772%,但对比图2 考虑自相关性时的聚类结果,前者聚类效果明显不佳。未考虑自相关性时,关键词之间相似度明显降低,类团的中心概念也不清晰,甚至概念明显相关的关键词却较为离散,分类较混乱。可见,对角线元素的取值会对聚类结果产生很大的影响,因此建议进行共词分析时应研究是否需要考虑自相关性,以提高数据处理的准确度。本研究结果表明考虑对角线元素自相关性的数据预处理更为合理。因此,后续聚类分析均基于考虑对角线元素的自相关性,共词矩阵对角线元素的取值为所属行/列的最大值加1。
表9 叶盘类因子分析总方差解释表(未考虑自相关性)Table 9 Explanatory table of total variance of factor analysis of blade and wheel disc(without considering autocorrelation)
图2 叶盘失效分析的聚类树状图Fig. 2 Dendrogram of failure analysis of blade and wheel disc
图3 未考虑自相关性的叶盘聚类树状图Fig. 3 Dendrogram of blade and wheel disc without considering autocorrelation
2.4 多维尺度分析
将关键词相异矩阵导入SPSS 软件,进行多维尺度分析(Multidimensional Scaling, MDS),实现对关键词相似度的结果可视化[19],结合因子分析和聚类分析的结果,叶盘、机械传动系统和其他附件失效关键词的MDS 图分别如图4、5、6 所示。在MDS 分析结果中,失效关键词以点状分布,各点之间的平面距离直观可见,平面距离可以反映出关键词之间的相似度[20]。
如图4 所示,位于坐标系中心的核心类团是疲劳断裂失效,说明这类失效形式是叶片及轮盘最常见的失效形式;其次,距离坐标原点较近的是高温下蠕变损伤及材料缺陷引起的失效、高温下的热损伤及热腐蚀这两类失效形式;紧接着是异物撞击等机械损伤、高低周复合疲劳失效及零件的微动磨损这两种失效形式;最边缘化的失效形式是点蚀等局部腐蚀、叶片涂层恶化或结构劣化。王冠超[21]的研究表明航空发动机叶片故障占相当大的比例,据统计振动故障率占发动机中总故障率的60%以上,而叶片故障又占振动故障的70%以上。常见的故障现象有:外来物损伤、强度不足和高低周疲劳损伤,其中以疲劳损伤为多。本文的分析结果与其吻合,且对失效机理的分析更具体、全面,并通过MDS 结果分析出了不同失效形式发生的频率高低。
图4 叶盘失效关键词的MDS 分析图Fig. 4 MDS analysis chart of failure keywords of blade and wheel disc
如图5 所示,机械传动系统的核心失效形式是不同形式的疲劳断裂失效、表面接触疲劳失效及局部腐蚀这两类。如图6 所示,其他附件的核心失效形式是不同形式的疲劳断裂失效。王冠超[21]提出航空发动机的常见故障现象主要包括腐蚀和疲劳两种,两种故障现象之间是相互影响的,在发动机受到腐蚀的作用下,会加剧零部件疲劳,由此导致发动机失效,并指出航空发动机零部件疲劳是比较常见的故障形式。本文基于聚类分析和MDS 分析得到的结果与其吻合。
图5 机械传动系统失效关键词的MDS 分析图Fig. 5 MDS analysis chart of failure keywords of mechanical transmission system
图6 其他附件失效关键词的MDS 分析图Fig. 6 MDS analysis chart of failure keywords of other accessory equipment
实际应用中,检测故障时若初步发现关键词中的一个或少量几个,可以结合失效关键词的MDS 图和设备的运行工况分析,寻找相似度高的关键词,结合聚类分析的分类结果来预判可能发生的失效形式,更快速地检测到失效原因和提出维修防护措施。
3 航空发动机系统的失效分析结果
已有研究对航空发动机的故障模式进行了分类[22],主要包括稳定类故障、磨损故障和疲劳故障、气路故障(主要有气路部件故障、附件故障、转子机械故障等)、振动故障、控制系统故障、熄火故障和轴承故障。本文研究的叶盘、机械传动系统、其他附件涵盖了以上主要的故障设备,并对常见失效形式和具体失效机理进行了分析。
3.1 叶盘的失效分析结果
航空发动机系统的转子作为一种结构复杂的高速旋转机械,其上的叶片和固定叶片的轮盘是关键件,叶盘部分的结构和受力都极其复杂。叶盘是航空发动机系统最主要的失效部件,主要集中在涡轮、压气机、风扇这3 类设备。压气机叶片还受发动机进气道外来物的冲击,受风沙、潮湿的侵蚀;涡轮叶片受燃气的腐蚀和高温热应力等[21]。根据共词分析的结果,将叶盘失效研究归纳为以下7 类:(1)异物撞击等机械损伤;(2)疲劳断裂失效(以高周疲劳为主,常与机械性能异常和生产缺陷有关,如过载、循环交变载荷、机械加工痕迹、摩擦、应力集中等);(3)高低周复合疲劳失效及零件的微动磨损;(4)叶片涂层恶化或结构劣化;(5)高温下的热损伤及热腐蚀;(6)点蚀等局部腐蚀;(7)高温下蠕变损伤及材料缺陷引起的失效(失效源包括蠕变产生的孔洞缺陷、腐蚀或局部氧化缺陷、锻造缺陷、再结晶等异常显微组织)。
对于涡轮的失效分析,谢广平等[23]研究表明基于蠕变和热循环的综合考虑,航空发动机涡轮叶片的失效形式主要有疲劳、蠕变、磨蚀、氧化、涂层恶化、过热引起的表面退化、腐蚀等。对于压气机的失效分析,傅国如等[24]研究表明压气机转子叶片常见的失效模式有断裂失效和非断裂失效。断裂失效可分为疲劳断裂失效和过载断裂失效;非断裂失效包括变形失效和腐蚀失效。引起叶片失效的原因包括共振、外来物打伤、腐蚀、材质缺陷、微动磨损等。本文的研究结果不仅同时涵盖了以上失效形式和具体的失效原因,且分类更加合理与精准。
3.2 机械传动系统的失效分析结果
航空发动机机械传动性能的好坏直接影响到轴系的运转状态,进而影响到发动机的性能,主要包含轴承、轴承保持架、轴承滚珠等轴承相关零件以及齿轮等部件。根据共词分析的结果,将机械传动系统的失效形式归纳为以下6 类:(1)表面接触疲劳损伤及局部腐蚀(第1 类及第10 类团的点蚀、剥落、摩擦等均为典型现象);(2)不同形式的疲劳断裂失效(第2 类团代表的轴类典型疲劳断裂,第3 类团代表的选材、设计或维修工艺不当、材料夹杂、机械加工痕迹等引起的高周疲劳,第5 类团代表的弯扭复合疲劳失效及零件的微动磨损如轴承保持架铆钉、调速器惰轮等,第6 类团代表的共振引起的扭转疲劳如花键轴;第7 类团代表的设计不合理、异常载荷等造成的旋转弯曲疲劳);(3)制造或维修工艺不当引起的传动齿轮断裂(如表面硬化不当等);(4)异常冲击等引起的过载失效(如轴承保持架、轴承滚珠等);(5)磨损失效(失效机理包括黏着磨损失效和磨粒磨损失效
等,失效原因一般有配合面磨损、润滑不良引起的划伤擦伤、摩擦氧化、打滑损伤、电弧破坏等);(6)高温下的热损伤(具体包括过热过烧、受热变色等现象)。
在对轴承的失效分析中,刘德林等[25]依据国标将滚动轴承的失效模式分为6 大类,即滚动接触疲劳、断裂和开裂、磨损、腐蚀、塑性变形和电蚀。孔德龙等[26]提出发动机主轴轴承的损伤模式主要有剥落、微粒引起的损伤、压延印痕、工作表面或次表面夹杂物引起的损伤、打滑蹭伤、引导面和非工作面磨损、接触腐蚀、断裂、轴承元件尺寸不稳定及变色等。本文的分析结果不仅包含了以上研究中典型的失效形式,还提出了含轴承在内的整个机械传动系统常见的失效形式及一般的失效机理。
3.3 其他附件的失效分析结果
发动机系统附件装置所包含的组件杂多,不同组件的工况环境有所差异,引起失效的原因也更具有针对性。这类设备涵盖的范围较广,包括燃烧室、液压管道系统、输油系统、控制系统、空气散热器、作动筒、汽缸、气瓶、辅助电力装置等在内的多种组件。
根据共词分析的结果,其他附件的失效形式主要归为以下8 类:(1)不同形式的疲劳断裂失效(第1 类团代表应力集中引起的疲劳断裂失效,常发生在液压管线、燃油管、引气管卡箍等不同管道系统构件中,存在机械加工痕迹、扭结、外来损伤等的位置都可能成为应力集中的部位;第3 类团代表汽缸及零件等材料缺陷引起的疲劳失效,缺陷往往由制造或生产工艺不规范引起;第4 类团代表高周疲劳失效,尤以焊接设计或工艺不达标引起的这类失效最为突出);(2)排气系统管道的高温表面损伤;(3)应力腐蚀失效(典型的部件有发动机作动筒、发动机连接放气阀的夹紧螺栓、发动机进气口弹片、压力信号器波纹管、输油管道等,处于腐蚀性环境中的组件,尤其是材料耐腐蚀性较差时,在高应力条件下便容易引起应力腐蚀失效);(4)燃烧器衬垫的热疲劳失效;(5)过载引起的轮盘连接销剪切断裂失效;(6)滚焊缺陷引起的燃烧室壳体爆炸失效;(7)活塞式发动机的挺杆体磨损失效;(8)气瓶导管的腐蚀失效。
其他附件类含有的设备繁杂,失效形式的分类与设备之间的对应性相比前两类更强,因此与数据来源密切相关。采用不同的数据库文本集得到的结果可能存在一定差异,但针对失效案例分析的共词分析法同样具有很好的适用性。
3.4 多元统计分析与传统统计分析对比
传统统计分析通过筛选案例文本的关键词统计出失效设备、失效模式等信息来进行定量统计,并以简单的饼图形式展现分析结果。多元统计分析基于整个失效案例文本集,通过有效的文本挖掘技术−共词分析的方法,提取出可表征具体失效机理的多个关键词,借助因子分析、聚类分析及MDS 分析工具,将关键词进行分类,并对其之间的相似度进行了可视化。
航空发动机系统失效形式的共词分析结果与Lyv 等[27]研究中的传统统计分析结果对比,失效形式的整体分析结果是基本吻合的,但基于共词分析的多元统计分析结果显然更加完整和准确。具体表现在:
(1)在传统统计分析中,对于航空发动机系统仅定量统计了叶盘、轴承这两类常见的失效部件,而本文以所有失效设备为样本,划分为叶盘、机械传动系统、其他附件这3 类并对其进行了研究。
(2)以叶盘为例,传统统计分析结果为:叶盘的疲劳破坏是发动机失效的主要原因,其次是过热失效,腐蚀、外来物打伤、材质缺陷、磨损也是常见的失效模式[27]。本文通过共词分析将叶盘失效详细划分为7 类:异物撞击等机械损伤、疲劳断裂失效、高低周复合疲劳失效及零件的微动磨损、叶片涂层恶化或结构劣化、高温下的热损伤及热腐蚀、点蚀等局部腐蚀、高温下蠕变损伤及材料缺陷引起的失效。进一步对比机械传动系统的分析结果,可以看出,传统统计分析结果中仅给出了轴承笼统的失效形式占比,而以疲劳断裂失效为例,本文给出了确切的不同失效机理。整体看来,失效形式分析结果是基本吻合的,但传统统计分析的结果仅仅停留在笼统的定量分析层面,对于实际工程应用仅能指明大体的失效方向。本文的共词分析结果不仅得到了航空发动机系统主要的故障形式,而且准确详细地归纳出了不同的失效机理,在实际工程应用中,对故障检测分析方法及维修方案的确定具有更精准的指导意义和参考价值。
(3)此外,本文还通过MDS 分析对失效关键词实现了直观的相似度可视化,越靠近坐标原点的类团越核心,即对应的失效形式发生的频率越高。越靠近中心轴的关键词越核心,便于实际应用中技术人员更快速地根据关键词发现故障设备的失效原因,更准确地把握工作重点,更有效地确定防护方案。
综上所述,本文采用的基于共词分析的多元统计分析方法可以非常有效地应用于航空发动机系统失效文本案例的分析。
4 结 论
本文以研究室失效数据库中航空领域的发动机系统失效案例作为研究对象,通过构建关键词词典并提取其高频关键词,基于共词分析方法进行了文本数据挖掘。利用因子分析、聚类分析及多维尺度分析的方法,分别得出了航空发动机系统的叶盘、机械传动系统及其他附件主要的故障形式及失效原因。研究发现对失效案例分析需要采用考虑自相关性的数据预处理方式。采用基于共词分析的多元统计分析方法,与传统统计分析结果基本吻合,且对不同设备失效机理的研究更加全面和准确,可以有效应用于航空发动机系统失效案例的分析。结合聚类分析结果和多维尺度图,对这些服役过程中的常见故障,可以更准确、快速地采取检查手段进行失效分析,找出失效原因和问题症结,有效避免类似事件的再次发生,延长发动机的使用寿命,保障飞机的安全运行。
这种方法可以进一步拓宽到其他行业的失效案例分析中,如石油液化、交通运输、医疗器械等领域。通过建立所研究领域的失效文献数据库,采用共词分析的方法可以有效地归纳对应领域设备的主要失效形式,有利于避免类似事故的再次发生,延长设备寿命。