基于运维数据的医用电气设备使用故障时间数学分布研究与工程评估实践
2020-06-12郁红漪邹金林张尉强
郁红漪,邹金林,张尉强
1 上海市医疗器械检测所,上海市,201318
2 广州然因普电子科技有限公司,广州市,510610
0 引言
提高医气电气设备可靠性水平对保障我国医用电气设备长期的安全性和有效性有着关键作用,而市场运维数据是最能真实准确反映上市设备可靠性状况的信息来源。但准确的运维数据的获得并不容易,因此规范运维数据的收集方法、内容,充分挖掘运维数据蕴含的可靠性信息方能充分利用市场在用设备反馈的可靠性信息以助于企业改进产品的可靠性。
伴随信息技术的发展,部分设备运维大数据的收集已能够通过软件平台和服务器实现自动化,使可靠性工程评估更方便快捷。
基于收集的运维数据可建立医用电气设备及主要部件的工程可靠性模型,其可靠性水平的评估可为产品设计开发、物料选型、失效分析、质量决策提供可靠的数据支撑[1]。
1 运维数据收集内容、方法及特征
1.1 运维数据收集内容
医用电气设备运维数据收集的内容包括以下几个方面[2-3]:
(1)设备信息:设备型号、序列号、安装使用开始时间等。
(2)故障信息:故障时间、故障部件、故障现象、维修情况等。
(3)使用工况:工作时长、使用频次、医院等级、温度、湿度、气压、电力稳定性、使用者熟练程度等。
1.2 运维数据收集方法
可靠性信息可分为内场和外场两大类。内场数据由企业内部可靠性试验所得,虽然内场数据准确性高,但是与实际有一定差异,而外场数据是来源于客户现场的运维数据,真实性较高,其作用是内场数据无法替代的[4]。
运维数据一般通过连续收集、定期集中收集、专项收集的方法进行收集。对于用于产品故障时间分析、建模和预测的运维数据则连续收集的方法比较适用。采取连续收集方法,现场维护人员直接在售后维护系统中记录各类相关信息,经济且便利。系统中统一运维数据的格式、内容,并提供常用可选项,便于现场人员填写及选择,以使运维数据更全面、准确,提高数据采集质量及效率。
1.3 运维数据特征
市场运维数据为产品实际运行过程中产生的可靠性数据,受限于多种因素的影响,庞大但杂乱,对其分析前需进行数据筛选,剔除异常数据,选取有价值的信息,再进行分析处理[5],可提高使用可靠性分析的准确性。
运维数据具有以下主要特征[3]:随机性、时效性、高值性、不确定性、时间性、可追溯性、统计性。
2 医用电气设备使用故障时间模型与工程评估
2.1 设备使用可靠性指标
本文主要针对较为复杂且可维修的医用电气设备的运维数据开展研究,作为可维修设备,平均无故障时间MTBF是评价设备使用可靠性的最有实际意义的指标,记为θ。
2.2 设备运维数据统计分析及评估
MTBF数值变化趋势可反应市场上设备处于何种失效期,如果设备处于早期失效期,则MTBF随时间变化逐步增大,且增大的幅度逐步减小;若设备进入随机失效期,则MTBF随时间变化基本不变;当设备进入损耗期,MTBF开始随时间变化逐步减小,且减小的幅度逐步增大。这就为设备维修维护、维护周期设定、保修期制定、可靠性指标修订及新产品可靠性指标的制定等决策提供依据。
同时,MTBF预测值可用于预警,当设备MTBF连续低于阈值时,进行预警提示,为设备维护维修提供依据,保证市场上设备的可靠性水平。MTBF阈值由企业自定义。
2.2.1 统计分析及评估方法
医用电气设备MTBF使用可靠性指标评估一般以批次为研究对象,分批次进行运维数据的收集、整理、统计分析及预测。
以月为单位,统计每个时段某个批次的运维数据。所统计时段记作Pj,Pj=30天,60天,90天……。假设某个批次的产品共有Q台设备,截止统计日期,每个时段每台设备的总运行时间为pjq,每时段此批次产品的总运行时间为pj,此批产品累计运行时间为p,Njq为每时段每台设备的总故障次数,Nj为每时段此批次产品的总故障次数,N为此批产品累计故障次数,则此批次产品Pj时段的瞬时MTBF可由下式推导得出:累积MTBF可由下式推导得出:[7]。
通过上述过程,得到医用电气设备每个批次每个时段的瞬时MTBF和累积MTBF数据,由线性回归法获得各个批次瞬时MTBF和累积MTBF随时间的变化趋势。将X=ln(Pj)和Y1=ln(θj),X=ln(Pj)和Y2=ln(θ)作为两个直角坐标系的横轴和纵轴,按照时间顺序依次将X和Y1、X和Y2各点在直角坐标系内描点,最后利用线性回归法拟合得到能够表征MTBF时间特性的线性方程Y1=k1X+b1和Y2=k2X+b2[8]。拟合结果需经过拟合优度检验合格,才能在实际中应用。一般通过拟合优度(其中Y1n为拟合值,Yn为实际值,Y1为均值)计算确定是否检验通过,检验通过阈值大小由企业根据产品情况自行定义。若R2大于阈值说明拟合结果比较理想,若R2小于阈值则说明实际值和拟合值偏差比较大。当瞬时MTBF拟合优度小于阈值时,说明产品已进入随机失效期。判断进入随机失效期后,累积MTBF只选取一段时间内的数据比如半年的数据[9],当累积MTBF拟合优度小于阈值时,说明产品已进入退化期。
一般企业及客户比较关心的是下个时段内设备故障次数多少,瞬时MTBF即可表征。对于瞬时MTBF拟合模型Y1=k1X+b1,在早期失效期,k1>0;在随机失效期,k1=0;在退化期,k1<0。为了更精准地预测设备下一时段的瞬时MTBF,需对数据进行分段处理分析。当设备处于早期失效期,则对所有时段数据进行拟合,得到拟合线性方程当设备处于随机失效期,瞬时MTBF基本处于恒定状态,直接取平均值;当设备处于退化期,则对退化期内所有数据进行拟合,得到拟合线性方程Yt=kt X+bt,通过拟合优度检验,若R2大于阈值,则直接通过拟合线性方程预测下一时段的瞬时MTBF,即若R2小于阈值,则取平均值作为预测值。
2.2.2 MTBF统计分析及评估
以一批产品的运维数据作为统计分析对象,时间跨度60个月。统计各时段此批设备的瞬时运行时间和故障数、累积运行时间和故障数,以此计算出每个时段此批次设备瞬时MTBF和累积MTBF值,以及时间和MTBF的对数值。
从此批产品投入使用时间开始进行统计分析,将各时段对应时间和MTBF对数值在直角坐标系内依次描点,再利用线性回归法拟合出ln(Pj)和ln(θj)、ln(Pj)和ln(θ)间的线性关系。企业设定拟合优度阈值为0.9。当到第10个月时,瞬时MTBF拟合优度开始小于0.9,第10个月瞬时MTBF拟合图如图1所示,则表示设备已进入随机失效期,从整个失效期瞬时MTBF拟合图如图2可见,由早期失效期进入随机失效期的拐点时间也约在第7个月左右,这可以说明判断的方法可行;从第10个月开始,累积MTBF只取最后半年的数据进行拟合,当到第57个月时,累积MTBF拟合优度开始小于0.9,第57个月累积MTBF拟合图如图3所示,则表示设备已进入退化期,从整个失效期累积MTBF拟合图如图4可见,由随机失效期进入退化期的拐点时间也约在第54个月左右,这也可以说明判断的方法可行。
图1 第10个月瞬时MTBF拟合图Fig.1 Instantaneous MTBF fitting diagram of the 10th month
根据上述失效期的判定,可分别预测每个失效期内下个月的瞬时MTBF。在前9个月的早期失效期内,取所有早期失效期数据进行拟合,可预测下个月的瞬时MTBF,如现在处于第4个月末,则取1个月~4个月的瞬时MTBF数据进行拟合得到Y=0.848 8X-0.180 8,拟合优度大于0.9,可通过预测第5个月瞬时MTBF为871 h。在10个月~56个月的随机失效期内,取随机失效期内所有数据的平均值作为下个月瞬时MTBF的预测值,比如现在处于第20个月末,可取10个月~20个月的瞬时MTBF的平均值805.57 h作为第21个月的瞬时MTBF的预测值。在57个月后的退化期内,取退化期的所有数据进行拟合,预测下个月的瞬时MTBF,如现在处于第60个月末,则取57~60个月的数据进行拟合,拟合方程为Y=-28.314X+307.38,由于拟合优度小于0.9,则取平均值作为第61个月的预测值即为415.48 h。
图2 整个失效期的瞬时MTBF拟合图Fig.2 Instantaneous MTBF fitting diagram of the whole failure period
图3 第57个月累积MTBF拟合图Fig.3 Cumulative MTBF fitting diagram of the 57th month
2.3 统计分析及评估工程实践意义
通过设备MTBF运维数据的统计分析及评估,可在实际工程应用中为设备维修维护、维护周期设定、保修期制定、可靠性指标修订及新产品可靠性指标的制定等决策提供依据[10]。
(1)根据MTBF运维数据分析判断设备失效期转变时间拐点,可分时段制定维护周期的长短:在早期失效期可缩短维护周期,并且维护周期随时间推移而逐渐增长;在随机失效期,维护周期可为恒定值;在退化期,可缩短维护周期,并且维护周期随时间推移逐渐缩短。
(2)根据拐点时间设置合适的保修期,保证市场产品质量的同时降低企业维保费用。
(3)根据随机失效期进入退化期的时间,可验证企业声称的可靠性指标是否满足要求,若不满足则可进行产品改进或修订可靠性指标,同时也为同类新产品可靠性指标的制定提供比较可靠的依据。
(4)企业也可设定MTBF最小阈值,当预计的MTBF值低于阈值时,可适当缩短维护周期或采取改进措施,提高产品的MTBF[4]。当预计值高于阈值时,可适当放宽维护周期,这样在保证市场上产品质量的同时也降低维护费用。
3 医用电气设备主要部件使用故障时间模型与工程评估
3.1 部件使用可靠性指标
医用电气设备主要部件一般为不可维修产品,故障发生后,直接更换新的部件安装使用,所以在使用过程中关注的是部件的瞬时失效率和累计失效率,记作λ(t)和F(t)。
3.2 基于故障模式的统计及分析方法和意义
3.2.1 统计及分析方法
每个部件的结构/材料/工艺等方面的各异性,都存在特有的多种不同的故障模式,每种故障模式对应的失效机理和诱发应力也不相同,其分布模型也不一致,因此不能使用相同的模型进行预测分析,否则误差会较大。将部件的运维数据依据不同故障模式进行统计分析,分别建立分布模型进行预测,所有故障模式的失效率之和即为部件的失效率。
主要部件依据不同故障模式的运维数据统计与分析流程如下:
(1)对部件进行故障模式分类。对于故障很少的故障模式可不单独分类,进行合并统计分析,共有U种故障模式。
(2)每种故障模式运维数据统计。以月为统计时间单位,时间段记作tp,以某批次此部件共A个作为统计分析对象。统计每个时段内,此部件该批次第u种故障模式的失效数为mp,则累计失效数为累计失效率为F(tp)=Mp/A,瞬时失效率为λ(tp)=mp/[(tp+1-tp)Ap-1],式中Ap-1表示tp时段起始时刻批次内剩余合格品数。
(3)建立线性拟合方程。对时间tp取对数,对累计失效率导出函数1/(1-F(tp))取双对数,设定X=ln(tp),Y=ln(ln(1/(1-F(tp))),建立直角坐标系,依时间顺序,将各时段对应的(X,Y)在坐标纸内描点,通过线性回归法得到线性拟合方程Y=buX+ku。
(4)拟合优度检验。运维数据拟合结果需经过拟合优度检验合格,才能在工程中应用。当R2大于等于企业自定义阈值比如0.9时,拟合优度比较理想,拟合结果可用于建立失效率威布尔分布模型;当R2小于阈值时,拟合优度较差,从设备启用日期算起,舍弃一定时段的数据进行重新拟合及检验,直到获得比较理想的拟合结果,若无法得到,说明此故障模式运维数据不符合线性关系。
(5)建立故障模式失效率模型并预测[11-12]。当得到理想的拟合结果时,威布尔分布形状参数和尺度参数mu=bu,则可建立第u种故障模式的瞬时失效率和累积失效率的威布尔分布模型并进行预测:
通过此模型可预测下一时段的瞬时失效率和累积失效率;当拟合结果不理想时,则采用平均值作为预测值:
(6)部件失效率预测。部件的瞬时失效率和累积失效率预测:
3.2.2 工程实践意义
通过对关键部件基于各故障模式的统计分析,进行失效率预测。当预测结果达到企业设定的界限时,比如当预测的累积失效率达到20%、3个月瞬时失效率连续达到0.3%,以及威布尔分布形状参数3个月连续达到3以上[13],则此批部件需制定部件更换决策。并根据预测的失效率制定部件备件策略与优化方案[14],避免备件不足而导致无法及时维护及维修,降低对企业的不利影响;或避免备件仓库积压,既可降低企业仓储成本,又可避免因长期积压导致备件失效。
3.3 基于不同故障模式和影响因素的统计分析方法及意义
3.3.1 统计及分析方法
每个部件的各种故障模式对应的失效机理和诱发应力不相同,在使用过程中遭受的各种环境因素及其他影响因素比如温度、湿度、测试量、医院等级等会对部件的可靠性造成不同程度的影响[6]。基于关键部件不同故障模式和影响因素建立威布尔分布模型,通过影响系数的大小判定各影响因素的影响程度,从而便于故障定性判断及影响来源分析,为部件失效分析奠定基础。基于不同的故障模式和影响因素的运维数据统计分析流程如下:
(1)确定预分析故障模式和其影响因素分类及等级。对其故障模式进行分析,以及对实际使用过程中可能遭受的影响因素进行统计,假定经过分析统计后,某部件共有U种故障模式和G种影响因素,每种影响因素分为HG个等级。选择分析部件的第u种故障模式,此种故障模式对应的影响因素共V种。
(2)建立基本拟合线性方程。以月为统计时间单位,时间段记作tp,以某批次此部件共A个作为统计分析对象。不分影响因素,统计每个时段内,此部件此批次第u种故障模式的失效数为mp,则累计失效数为累计失效率为F(tp)=Mp/A,瞬时失效率λ(tp)=mp/[(tp+1-tp)Ap-1],式中Ap-1表示tp时段起始时刻批次内剩余合格品数。对时间tp取对数,对累计失效率导出函数1/(1-F(tp))取双对数,设定X=ln(tp),Y=ln(ln1/(1-F(tp))),建立直角坐标系,依时间顺序,将各时段对应的(X,Y)在坐标纸内描点,通过线性回归法及拟合优度检验,得到较好的拟合结果Y=buX+ku,此方程为基本拟合线性方程。
(3)建立第u种故障模式在每个影响因素每个等级下的拟合线性方程。比如统计某批次某部件第u种故障模式在第v种影响因素第h等级条件下共Au个样本,每个时段内失效数为np,则累计失效数为累计失效率为F(tp)=Np/Au,瞬时失效率为λ(tp)=np/[(tp+1-tp)Au(p-1)]。采用3.3.1(2)中基本威布尔分布模型的建立方法,建立此故障模式在每个影响因素每个等级下的拟合线性方程
(4)确定影响系数。将各影响因素的各等级条件对威布尔分布拟合线性方程中常量的影响程度作为影响系数,即
3.3.2 工程实践意义
不同的影响因素及相应等级对关键部件不同故障模式的失效率贡献度的大小判定,可以用于确定影响部件特定故障模式失效率的主要原因,这为故障失效分析及改进提供大体方向,同时也为同类部件开展物料可靠性评价及可靠性试验方案的制定提供素材。
通过市场故障失效分析,汇总分析结果,形成设计规范,作为研发可靠性设计准则,为研发可靠性设计奠定基础。
4 总结
我们研究了医用电气设备市场运维数据收集方法、内容及特征,从三个层面建立故障时间分布模型,同时分析设备所处的失效期及各影响因素对故障率的贡献度。医用电气设备以MTBF表征产品使用可靠性水平,其随时间变化而变化,我们提出分段建立故障时间分布模型的可靠性评估方法。而关键部件以失效率作为评估指标,基于故障模式建立更加切合实际的故障时间分布模型,可以更精确地预测部件的失效率。基于不同故障模式的激发应力的不同,在不同故障模式和影响因素条件下建立威布尔分布模型,计算其影响系数,分析每种影响因素对各故障模式的贡献度。三个层面的故障时间分布模型及评估结合可靠性数学理论和实际运行工况,在实际工程应用中,有明显的指导作用及意义,对产品开发前期可靠性设计、物料选型及评价、可靠性鉴定/验收等试验方案制定、故障失效分析及质量决策奠定基础和提供数据支撑。