APP下载

对数正态分布可靠性模型及应用

2019-03-13付晶园

统计与决策 2019年3期
关键词:后验正态分布对数

陶 鹤,刘 伟,付晶园

(1.兰州财经大学陇桥学院;2.甘肃省高校区域循环经济重点实验室,兰州 730101)

0 引言

近年来,随着科技水平的发展,产品安全性和可靠性引起了人们的普遍关注。一旦产品零部件发生故障,将影响产品正常运行,甚至影响消费者的人身安全。可靠性分析在产品系统和零部件安全性中得到广泛应用。由于产品内部结构复杂,为其可靠性分析带了困难。对于大部分耐用型消耗品,使用时间越长,其零部件磨损程度越大,可靠性越低,保障费用和维修次数也在逐渐增加。研究产品的可靠性可以减少维修费用和使用费用,从而提高了消费者的经济效益。本文已有研究基础上[1-9],主要讨论的是产品可靠性问题,零部件可靠性评估是可靠性评估的基础。结合神经网络以及MCMC算法提出了关于产品对数正态分布可靠性模型的测定方法。

1 对数正态分布可靠性模型

可靠性数学理论大约起源于20世纪30年代,最早研究的领域之一是机器维修问题。可靠性是指产品在规定时间内,规定条件下,完成规定功能的能力(ISO,1986)。产品的可靠性通常是用概率指标进行度量的,其寿命是一个非负随机变量,研究其特征主要采用的工具是概率论。

通常产品的寿命用一个非负随机变量T来表示,其分布函数为:

产品在t时刻以前都正常使用的概率,即产品在时刻t的可靠度函数为:

产品的平均故障时间为:

其中,E(T)表示时间T的期望值,MTTF也称期望寿命。

对于不可维修产品,可靠性数量指标主要是可靠度函数(R(t))及平均故障时间(MTTF)。假设时刻t=0汽车电池开始正常工作,若T是它的寿命,则产品的运行时间的进程图,如图1所示。由于产品是不可维修产品,一旦失效便一直处于失效状态。可靠度函数和平均故障时间描述了产品零部件的可靠性特征。

图1 产品使用进程图

服从对数正态分布的故障时间t的概率密度函数为:

式中:μ和σ分别为对数故障时间x=log(t)的均值和标准差。对数正态分布的故障率和可靠度函数分别为

式中:f(x)是对数正态概率密度函数;φ(·)是标准正态分布的累积分布函数。

从图2和图3(见下页)中可以看出,在先验分布中σ的取值不同,得到的曲线形状有一定的区别,选择先验分布需征求专家意见和参考大量文献。基于贝叶斯的零部件可靠性分析,主要分为两部分,首先确定可靠性分布即确定先验分布。其次,根据现场实验数据,对产品先验信息获取与预处理,给出似然函数,利用贝叶斯公式给出后验分布。

图2 对数正态分布的密度函数

图3 对数正态分布的累计分布函数

2 基于神经网络的可靠性评估

人工神经网络是模拟生物神经网络,主要模拟大脑的某些机理以实现一些特定的功能。可以将大量的功能简单的神经元通过一定的拓扑结构组织起来,构成群体并行处理的计算结构。神经网络的学习也称为训练,是指神经网络调整自身网络参数的过程。神经网络的设计与应用遵循以下几个步骤,分别为:数据收集、创建网络、设计网络的结构、初始化权重与阈值、训练网络、验证网络、使用网络。

收集故障数据作为原始的小样本数据,建立对数正态分布模型,利用Gibbs算法,计算经验可靠度值。作为神经网络的输入,原始数据作为输出,训练BP神经网络,对训练完成的BP神经网络进行模拟仿真,输入随机可靠度值,输出扩充后的可靠性数据。确定原始数据的分布模型,并进行可靠性评估。但是先验分布在样本比较少的情况下,通常会产生很大的误差,为了减少误差,可采用以下三个公式计算可靠度。

海森公式:

近似中位秩公式:

数学期望公式:

公式(7)至公式(9)对于不同分布模型的参数估计,其误差不同。

3 算法描述

近年来,随着马尔可夫链蒙特卡罗算法(MCMC)的出现,高维积分计算问题得到了解决,可靠性领域的研究也更近了一步。常见的MCMC算法有两类,分别是Metropolis-Hastings算法和Gibss算法。但是,Metropolis-Hastings算法的应用依赖于一个重要的前提条件:先验分布的密度函数必须较为接近真实的后验分布密度函数。在产品零部件的研究中,这一条件很难满足。在专家的建议下,给出的先验密度函数可能出现“过窄”和“过宽”的情况。若给出的先验密度函数比后验密度函数“过窄”,Metropolis-Hastings算法将大部分时间都在先验分布的密度函数覆盖区域内进行迭代,而无法访问到后验分布函数所覆盖的其他区域。此算法计算的结果有较强的自相关性,导致得到的有效的独立样本量很小。若先验密度函数“过宽”,将导致该算法在成百上千次迭代后仍停留在一个状态,产生的有效样本非常少。Gibbs抽样也有其缺点,必须要推导出所有参数或者参数向量的全条件概率分布。但是实际应用中并不是所有参数的全条件概率分布都可以通过解析推导出来。在Gibbs算法中,能够获得全条件概率分布的参数可以用这种算法进行仿真实验,而不能获得的参数则利用M-H算法进行处理。在产品零部件故障模型中,μ和σ的条件分布可以计算出其解析解。为避免Metropolis-Hastings算法对先验密度函数要求过高,这里采用Gibbs算法。针对产品零部件的故障时间数据,具体算法如下所示:

记故障时间为Ti,i=1,2,…,n,并假设对数正态模型为:

取先验分布为:

μ和σ2的后验分布为:

经计算得出μ和σ2的条件后验分布为:

使用Gibbs抽样算法计算对数正态分布可靠度步骤如下:

(1)对故障时间取对数,令yi=log(ti);

(2)令μ=μ(i-1),σ=σ(i-1);

(4)生成随机数μ,μ~N(m,s2);

(5)令μ(i)=μ;

(7)生成随机数τ,τ~Gamma(a,b);

(8)令σ2=τ以及σ(i)=σ;

(9)循环结束,输出μ和σ均值及标准差;

(10)计算可靠度后验中值。

以上步骤是Gibbs抽样在产品零部件可靠性分析中的应用。本文是使用R语言进行编程,将零件故障的原始数据输入,输出其可靠度后验中值。然后,采用贝叶斯x2对各个模型进行相关检验。最后,对得到的结论作出相关的文字分析说明。

4 贝叶斯x2拟合优度检验

对于任意一个统计模型,不可或缺的环节是检验模型的适用性。这种方法是由Pearson提出的贝叶斯x2拟合优度检验法。通过贝叶斯x2拟合优度检验衡量对数正态分布的适用性。

假设t1,t2,…,tn是来自f(t|θ)的独立同分布的样本,其累计函数是F(t|θ),θ的值已知。假设0=a0<a1<a2<…<aK-1<aK=1表示规定的均匀分布的分位点,并定义pj=aj-aj-1。最后,假设mj表示ti的观测值,并且有aj-1<F(ti|θ)<aj。则皮尔逊x2检验统计量R0,具体数值为:

如果模型合适,则R0将服从一个具有自由度为K-1的x2分布。因此,可以通过R0的实际值与作为参考的x2分布的对比来进行拟合优度检验。

5 仿真实验及分析

由试验可知,汽车电池寿命近似服从对数正态分布。选用某型号汽车电池进行寿命统计实验。选取13个单位做为样本,具体故障时间数据如表1所示。

表1 蓄电池使用寿命

假设样本数据服从对数正态分布:

式中μ和σ2相互独立,分别表示对数故障时间的均值和方差:

使用Gibbs方法,可以获得(μ,σ2)的联合后验分布曲线。第一步,根据最新μ的仿真样本,从σ2的条件InverseGamma分布中生成σ2的样本;第二步,根据最新的σ2样本中生成μ的样本。以上两个步骤交替进行,直到平稳,获得满意的结果。(见表2)。

表2 经验可靠度

当训练误差小于0.001,结束训练。本文将得到样本量为100的扩充样本,将0~1区间内的100个随机数按从大到小的顺序排列成向量,输入已经训练完成的BP神经网络进行仿真,得到100个新的故障数据,将其作为原始数据的扩充样本,进行进一步研究。

对扩充的数据进行对数正态分布参数估计,通过从(μ,σ2)联合后验分布中抽样,得出可靠度函数的后验分布,结果如表3所示。

表3 对数正态模型的后验分布

对扩大数据样本,采用Gibbs抽样进行对数正态分布的估计,其结果如表3所示。对数正态分布模型在海森公式下,其扩充数据样本与原始数据的参数估计最接近,即通过仿真实验可知,海森公式的误差最小。扩充数据的相关系数相比原始数据的相关系数更接近与1,即扩充数据比原始数据恨到的参数估计更加准确,可靠性评估效果更好。随着样本量的增大,对数正态分布模型参数的MCMC仿真的误差越来越小,估计结果就越来越接近真值,说明可靠性模型的适用性。对数正态分布变量的均值和方差分别为:

利用公式(16)和公式(17)计算汽车电池使用寿命的均值和方差估计结果,如表4所示。

表4 汽车电池使用寿命的均值和方差估计结果

对数正态分布模型可以作为汽车电池可靠性评估的分布模型,这与对数正态分布曲线形状是相符的,且通过模型的判别和选取,可以根据曲线拟合的相关系数来实现。

下面对此模型进行拟合优度检验,取K=130.4=3,将(0,1)区间划分为3个等概率的子区间,α=(0,0.3333,0.6666,1)。从后验分Normal(7.0594,0.10200)中抽取一个样本,͂=7.0266,m=(4,5,4)。

6 结论

汽车电池是不可维修产品,研究相对可维修产品相对更复杂一些。本文对产品的使用寿命进行可靠性分析,利用海森公式、近似中位秩公式和数学期望公式,对原始数据样本和扩充都得数据样本,建立了对数正态分布模型,使用MCMC方法对模型进行仿真,得到参数估计值。在数据扩充的同时需要考虑各个经验公式计算的误差,选择合适的经验公式很有必要。在对数分布模型下,海森公式的误差最小,模拟的结果最为接近真实值。扩充后的数据与原始数据的变化规律基本相同,得到的结果,作为可靠性指标参数估计的参考数据。最后,对模型进行了Bayes可靠性检验,通过检验证明模型的适用性。通过R语言编制程序,可应用于汽车电池数据分析,从而为可靠性工程研究人员解决实际问题提供行之有效的方法。

猜你喜欢

后验正态分布对数
关于n维正态分布线性函数服从正态分布的证明*
指数与对数
一类传输问题的自适应FEM-BEM方法
指数与对数
比较底数不同的两个对数式大小的方法
定数截尾样本下威布尔分布参数 ,γ,η 的贝叶斯估计
生活常态模式
神奇的对数换底公式
一种基于最大后验框架的聚类分析多基线干涉SAR高度重建算法
正态分布及其应用