APP下载

非参数假设检验在直升机振动阈值设定中的应用

2021-08-09王宝栋蒋陵平陈康

新型工业化 2021年2期
关键词:比雪夫假设检验概率分布

王宝栋,蒋陵平,陈康

(1.中国民用航空飞行学院航空工程学院,四川 广汉 618300;2.中信海洋直升机股份有限公司,广东 深圳 518000)

0 引言

直升机具有垂直起落、无需跑道、能够空中悬停等诸多优点,其在森林灭火、医疗救援、科学考察、石油勘探等民用领域,以及物资运输、火力支援、预警等军用领域起到了重要作用。因此,直升机的安全性、维修性与经济性越来越受到重视。

目前对直升机的健康检测是以振动监控为主。由于振动数据所服从分布并不一致[1],因此,在役通航直升机中常用的阈值设定方法一般都基于切比雪夫不等式。此方式会淡化先验分布对阈值的影响,能够扩大该方法的适用范围,但这是以牺牲阈值准确性为代价的。所以,本文针对服从不同分布的数据集,单独设定阈值,以提升阈值的准确性。

1 综述

1.1 直升机健康管理

直升机保持飞行的动力是由主旋翼与尾桨提供的,并且从提供动力的发动机到主旋翼与尾桨之间只有一条传载路径,也就是说,这些传动部件是直升机中无冗余备份的关键部件。这些关键部件在真实工况中承受了较大的交变载荷,容易发生疲劳失效[2-4]。

1.2 振动样本

旋转部件的故障诊断大致可分为如下三个步骤:信号的预处理,信号的特征提取以及阈值设定。在直升机故障诊断领域,受限于数据来源,一般需要搭建实验平台,因此大量研究人员的工作重点都在前两步上[5-9]。而进行阈值设定的前提是,保证信号预处理及特征提取的结果能够达到应用级别。

本文所使用的振动数据,从现役直升机HUMS中获取,满足进行阈值设定的前提。

2 阈值设定方法

2.1 切比雪夫方法

切比雪夫不等式描述了这样一个事实,即随机事件大多会集中的发生于该事件的期望附近。设某振动信号为X,则其数学期望E(X)=μ,方差D(X)=σ2,对于任意的实数ε>0,都存在

另设定阈值系数k>0,令ε=kσ,故式(1)可化为

因此,故障误警率就可以定义为

那么振动信号特征X的阈值thresche可以设定为

由于式(2)对任意具有限数学期望和标准差的随机变量都是成立的,因此在给定误警率a的前提下,由式(4)确定的阈值也是振动信号X最大的正常阈值,当然此方法也存在问题,当样本数据不足时,此方法确定的阈值会有较大的误差。

2.2 假设检验方法

统计推断中的检验方法有两种,分别为参数检验与非参数检验。本文中样本服从分布未知,符合使用非参数检验的条件,故使用KS检验。KS检验是通过,比较观测值的经验分布函数(Empirical Distribution Function,EDF)与随机变量的概率分布函数(Cumulative Distribution Function,CDF)之间的最大偏差,来确定单样本是否服从假设分布,或两样本是否服从同一分布。

3 数据试验

主减速器是直升机传动系统“三轴两器”中,结构最为复杂的一个重要部件。依托于通航运营单位,获取某型直升机主减速器左后风扇齿轮组中风扇齿轮的真实振动数据,如图1所示。

图1 振动样本

3.1 切比雪夫阈值

直接使用切比雪夫方法确定阈值,设分位数(误警率)为0.01,由公式(2)可知,当k=11时,

3.2 非参数假设检验阈值

使用非参数假设检验方法,首先画出该振动样本集的频率直方图,如图2所示。

图2 振动样本频率直方图

因其近似高斯分布,又已知样本均值μ与样本标准差σ,故以KS检验方式检验样本是否服从高斯分布,即X~N(μ,σ2)是否成立。求得检验统计量Dn与P值,分别为Dn=0.041152,P=0.033391取显著性水平α=0.01,由表给出方法求得临界值Dna=0.047054。

此时Dn<Dna,因此不拒绝原假设,认为振动样本服从该高斯分布。样本服从的概率密度函数与概率分布函数分别为:

以此画出样本点拟合的概率密度函数图及概率分布函数图,如图3。

图3 样本概率密度函数与概率分布函数对比图

在分位数(误警率)为0.01的前提下,对于正态分布可根据拉依达准则(又称3σ准则)确定阈值,其原理与式(6)相同,当样本服从正态分布时,样本中至少有99.7%的数据位于的区间内。

因此,可以使用逆概率分布函数求阈值,将a=F(x)=0.01带入公式(10),求出对应的x,此x即为阈值;对于正态分布,也可以使用拉依达准则确定阈值thresks=μ+3σ=0.382888。

4 结论

对比原切比雪夫阈值设定方法,本文使用了假设检验的统计方法,按照先确定样本所分布,再依据预先设定的误警率(分位点),求解逆累积密度函数的对应值,从而确定阈值的思路。提升了所设定阈值的准确性与可用性。直升机在高空的工况错综复杂,但针对已经明确分布的零部件,应当使用更为精确的阈值来监控部附件的健康状况,以提高整机的维修性、经济性与安全性。

在之后的工作中,重点应该在如何进一步在提升阈值的精度,同时尽量降低虚警率和漏警率。数据量的增加能够部分解决上述问题,实际应用时,无法凭空生成更大量的数据,因此从短期来看,增加数据量的效果并不明显。不过,单维数据不能随意扩充,可以尝试引入其他特征,进行联合评判,也就是增加数据维度。若不改变数据维度,也可使用其他统计机器学习算法对阈值设定的逻辑进行优化。

猜你喜欢

比雪夫假设检验概率分布
分圆多项式与切比雪夫多项式的类比探究
离散型概率分布的ORB图像特征点误匹配剔除算法
第四类切比雪夫型方程组的通解
关于概率分布函数定义的辨析
统计推断的研究
基于方差的切比雪夫不等式的推广及应用
双幂变换下正态线性回归模型参数的假设检验
基于概率分布的PPP项目风险承担支出测算
Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
统计学教学中关于假设检验问题探讨