军用电子设备的可靠性管理
2012-08-15生建友
生建友
(总参第六十三研究所,南京210007)
1 概 述
美国军用标准MIL-STD-785A中指出,军用系统的可靠性直接取决于规定的可靠性要求以及管理部门在产品整个寿命周期内对可靠性的重视程度[1]。可靠性管理是大投入大产出的事业,投入大产出更大[2]。各装备承制单位虽然重视设备的可靠性问题,但主要侧重于可靠性设计,对可靠性管理普遍做得不够。有人曾对两种典型电子产品进行统计分析发现,设备因可靠性管理不善引起的故障率高达40%~80%[2];科研院所对可靠性管理的研究投入不大,可靠性管理的理论研究成果不多,可借鉴的文献偏少,从而导致装备的可靠性水平不能大幅提高。为满足信息化作战的需求,现代军用电子设备的组成结构越来越复杂,功能越来越强大,使用环境越来越恶劣,研制过程所涉及到的部门和相关工作也非常多,再加上电子器件自身的可靠性受电应力、热应力和机械应力的影响比较大,设备的可靠性管理问题尤为突出。为此,必须科学地把与产品可靠性实现过程有关的各项工作有机协调起来,进行有组织、有计划的可靠性管理活动,以实现并提高设备的可靠性指标。
2 可靠性管理的概念及特点
2.1 可靠性管理的概念[2,3]
可靠性管理就是从系统的观点出发,对产品全寿命周期内的各项可靠性工程技术活动进行计划、组织、监督和控制等综合性的工作,用最小的资源(包括人力、财力、时间等)实现既定的可靠性目标[2]。所谓“计划”是指分析、确定可靠性目标,选择达到可靠性要求的必须要做的工作,制定每项工作的实施要求,估计完成这些工作所需的资源。“组织”就是建立一个可靠性管理机构,确定可靠性工作的总负责人以及专职和兼职的可靠性管理、设计人员等,使其各司其职,在管理与设计上有机协调起来,以完成既定的可靠性目标与工作。“监督”是指通过报告、检查、评审、鉴定以及认证等一系列的活动,来督促承制方、转承制方和供应方的各项可靠性工作是否按计划进行。“控制”就是通过制定和建立各种标准、规范、指南等,指导和控制各项可靠性工作的开展,使各项可靠性工作过程处于受控状态,并收集相关可靠性信息,及时反馈、分析和评价产品的可靠性状态,以便制定改进措施并对其有效性进行监控。
2.2 可靠性管理的特点
可靠性管理作为质量管理的重要组成部分,是建立在健全的质量管理的基础上的,有以下几个特点[1-3]。
(1)可靠性管理是一项技术性很强的管理工作。它既要有可靠性方面的基础及专业知识,又要有与电子设备相关的业务知识,也需要管理方面的知识,在可靠性管理过程中,只有把这三方面的知识与技术相结合,才能做好可靠性管理工作。
(2)可靠性管理是设备寿命周期内全过程的管理,需要多部门合作。设备的可靠性涉及设计、生产、使用和维护等全寿命周期内的所有过程,涉及多个部门的工作,因此,设备的可靠性管理是一个全过程的管理,需要各部门之间的大力协作,进行统一管理。
(3)可靠性管理是数据管理。可靠性管理工作以数据为基础,将统计分析作为管理手段,不断对现场故障和试验数据进行分析处理,并及时反馈,采取改正措施。为提高设备的可靠性,除了收集设备可靠性试验和运行现场观测到的数据,还要尽可能利用数据库已有的可靠性数据,并随时对数据进行补充、更新和整理。
(4)可靠性管理具有明显的经济性。可靠性与费用密切相关,要提高设备的可靠性,就必然会增加设备的成本。但是,可靠性提高则会相应减少设备的维修次数,从而降低设备的维修费用,因此,要对设备的可靠性管理与成本之间进行经济分析,制定合理的可靠性指标。
3 可靠性管理内容[1,3-6]
可靠性管理涉及到理论、标准、技术、管理、教育培训等多项内容,其中技术又包含设计、制造、使用、试验、评估、失效分析等,是一项贯穿于产品寿命全过程的复杂的系统工程。产品寿命周期包括论证阶段、方案阶段、工程研制阶段、定型阶段、生产阶段、使用(含退役)阶段。可靠性管理的核心是推动产品可靠性的提高,可靠性管理就是紧紧围绕这一核心开展,不同阶段的工作重点也不同。
3.1 论证阶段
这一阶段的主要工作是提出设备的可靠性定量指标与定性要求,具体包括下面的内容。
(1)确定设备的寿命剖面、任务剖面、使用环境等约束条件,这些条件是确定可靠性定量指标、指标验证方案和方法,以及制定可靠性保证大纲的依据。
(2)根据设备的预计服役年限、上述约束条件以及国内外同类设备的可靠性水平,提出初步的可靠性定量指标和定性要求,并对定量指标进行论证。
(3)对经过论证的可靠性定量指标进行评审,并纳入《项目研制总要求》。评审工作可以单独进行,也可以与项目的技战术指标同时进行。
3.2 方案阶段
这一阶段的主要工作是确定设备的可靠性技术方案及相应的保证措施,具体包括下面的内容。
(1)根据通过评审的可靠性定量、定性要求,确定相应的考核或验证方案,明确故障定义与判据。
(2)制定可靠性保证大纲和工作计划。这两个文件可以单独制定,也可以合二为一,如何拟制以及拟制的注意事项后面再具体讨论。
(3)采用故障模式、影响及危害度分析法(简称FMECA)确定对设备可靠性影响较大的关键件(特性)和重要件(特性),并对其进行专门论证,形成专题论证报告。
(4)根据《项目研制技术方案》,综合考虑设计手段、分析计算与制造水平、研制经费与进度、使用环境、维修保养等约束条件,拟制具体的可靠性技术方案报告,具体见文献[10]。
(5)对可靠性技术方案进行评审。按照质量管理的要求,可靠性技术方案报告作为重要内容之一,在项目技术方案评审时一并进行。
3.3 工程研制阶段
工程研制阶段包括初样机和正样机研制两部分。这一阶段的主要工作是从设计、制造、外包、试验等过程全面落实设计措施,提高可靠性水平。
(1)全面贯彻落实可靠性保证大纲、元器件大纲、可靠性工作计划。
(2)依据有关标准、规范、指南等设计文件开展可靠性分析、预计、设计等工作,直到结果满足指标要求。
(3)建立数据收集、分析和纠正措施系统(FRACAS),发现薄弱环节和潜在故障,改进可靠性设计。
(4)制定并落实可靠性增长试验计划,实施老练和环境应力筛选,发现问题,暴露设计与工艺缺陷,采取改进措施并验证。
(5)按照相关国军标的要求规定,进行可靠性评审,评审通过后转入定型阶段。
3.4 定型阶段
定型阶段包括设计定型与生产定型,这一阶段的主要工作是完成各种试验,进行可靠性评审,对小批量试生产及部队使用过程中各种质量数据进行分析,完善相应设计文件,为批量生产做好准备。
(1)制定设计定型可靠性试验大纲并实施试验,试验大纲中应规定故障定义和判据。
(2)完成定型样机的性能与功能测试、环境试验、部队试验和可靠性增长试验,并按试验大纲的要求进行可靠性鉴定试验。
(3)根据通信军工产品定型工作的有关标准和规定的要求,考核生产定型样机的可靠性,确认小批量试生产条件下设备的可靠性能否满足规定指标要求。
(4)对试生产和部队使用过程中的各种质量数据,尤其是暴露的缺陷和发生的故障进行分析,并采取有效纠正措施。
(5)根据试验、试用的实际情况,修改、完善有关设计文件,并按照质量管理体系要求,做好设计定型的技术状态控制工作。
(6)按照相关国军标的要求进行可靠性评审,检查定型样机是否达到合同或者是《研制总要求》的可靠性要求,鉴定在批量生产条件下的可靠性水平以及可靠性保证措施的有效性。
3.5 生产阶段
这一阶段的主要工作是全面实施《产品质量保证大纲》(质量计划),按照质量管理要求加强生产过程的检验、监督和控制工作,确保设备在批量生产中的可靠性。
(1)加强供方、转承制方提供的零部件、元器件的质量控制,必要时实施筛选和老练。
(2)加强对关键件(特性)、重要件(特性)的跟踪管理以及关键过程的监督、控制工作,降低设备在生产制造过程中的缺陷和误差。
(3)对生产、贮存、交验中发现的缺陷和发生的故障进行分析、处理,促使产品的可靠性继续增长。
(4)按照相关国军标和产品规范的要求进行可靠性验收试验。
3.6 使用阶段
这一阶段的主要工作是保持、发挥设备的固有可靠性水平,提高其使用可靠性。
(1)按照合同要求,做好有关技术资料、备件供应、人员培训、技术支援、门市维修及定期巡回维修等售后技术服务工作。
(2)做好有关设备可靠性、维修性等信息的收集、处理工作,改进设计与管理,为实现设备的可靠性增长创造条件。
4 可靠性保证大纲的制定
可靠性管理的核心内容就是制定可靠性保证大纲(以下简称可靠性大纲),大纲反映了装备承制单位对可靠性工作重视的程度,体现了对设备可靠性要求保证的程度。大纲如何拟制、拟制的依据、内容等许多设计师不是很清楚,下面就这些问题进行探讨。
4.1 大纲的拟制依据
可靠性大纲的拟制依据主要有3条。
(1)GJB450A《装备可靠性工作通用要求》。该国军标立足于装备的全寿命过程管理,对可靠性大纲的组成结构有明确规定,是一份指导全军武器装备可靠性工作的纲领性文件,军用电子设备应根据实际情况进行删减。
(2)GJB9001B《质量管理体系要求》和各单位依据《质量手册》而制定的《程序文件》。《程序文件》中的可靠性大纲是单位所有产品研制的指导性文件,内容不具体,实际拟制时,应根据设备的具体情况进行适当的增加和补充。
(3)顾客要求,即《项目研制合同》。将顾客对设备的可靠性使用要求正确地转化为设备研制的可靠性要求,即具体的定性和定量要求,并在大纲中明确规定。
4.2 大纲的内容
可靠性大纲是设备研制过程中全部可靠性工作的总体规划,应包括以下内容[5-8]。
(1)可靠性要求,包括定性和定量要求、环境要求和维修性指标要求。
(2)可靠性工作组织及其职责。应明确可靠性组织的职责、负责人和组成人员,明确各成员的分工和职责。
(3)可靠性工作计划。可靠性工作计划是实现设备可靠性大纲的具体化与保证措施,通过项目研制计划网路图实施计划管理,使可靠性逐步实现。对于研制周期短、复杂程度不高的设备,可以只编制一个工作计划,且可以将保证大纲与工作计划合二为一,否则,应按阶段制定工作计划,且单独形成报告,工作项目实施表应包含工作项目名称、内容、实施结果、负责人和完成日期等内容,工作项目可参考GJB450A。
(4)对供方和转承制方的监督与控制要求。明确供方和转承制方的资质要求,明确外购、外协产品的可靠性定量要求,明确外购、外协产品的验证试验要求等。
(5)元器件大纲。电子元器件作为电子设备的基础,自身可靠性的高低直接影响设备的可靠性。大纲中应明确元器件的选用、采购控制要求,元器件的质量、可靠性和筛选等级要求以及降额设计要求。
(6)故障报告、分析和纠正措施系统。明确建立故障报告、分析和纠正措施系统的工作程序;确定故障报告的内容,应包括故障部位、时间、现象等;制定采取有效措施的办法;对关键件、重要件出现的故障提出纠正措施的方法。具体参见GJB841。
(7)故障审查及其组织。明确故障审查的组织及其职责,评审在功能与性能测试、验收试验、环境试验、可靠性增长试验等活动中的故障资料,查明故障原因,确保纠正措施可行。
(8)建立可靠性模型。以设备的功能框图为基础,建立设备的可靠性数学模型,这是进行可靠性指标分配和预计的基础,模型越详细、正确,可靠性指标的分配和预计就越准确。
(9)可靠性指标分配。根据设备的相关资料和使用条件,按照可靠性分配原则,用一定的分配方法将设备的可靠性指标合理地分配到设备的各组成单元。分配时均以可靠性指标的上限值进行,上限值除以2为可接受的指标下限值。
(10)可靠性预计。通过可靠性预计来估计设备的可靠性水平,实施对可靠性工作的监控。在方案阶段通常采用相似设备法,对于电子设备来说,元器件及设备的寿命服从指数分布,即失效率为常数,且有成熟的预计标准和手册,在样机阶段常用简单枚举归纳推理法或元器件计数法,定型阶段采用应力预计法,预计值与实际值误差在1~2倍之内是正常的。
(11)可靠性分析,包括电应力分析、热分析和安全性分析,安全性包括设备和人身安全以及电磁信息安全。通过分析,确定设备每个模块/组件/元器件的电应力、工作温度以及电磁辐射水平,确定影响设备和人身安全的功能组件,提出最佳的电应力、热设计、电磁兼容性以及安全性设计方案,分析时应综合考虑设备的环境条件要求和邻近设备的影响。
(12)确定可靠性关键件和重要件。做好关键件、重要件的可靠性管理工作,对实现、确保设备的可靠性指标至关重要。应明确关键件、重要件的定义,根据上述可靠性分析方法与结果,确定关键件和重要件清单,提出质量控制要求,并采取相应的控制措施。
(13)故障模式、影响及危害度分析。系统地分析元器件、模块、设备所有可能的故障模式、故障原因和后果,以发现设计中潜在的薄弱环节。通常情况下,应分析到部件级和关键器件,具体的分析程序和表格见GJB/z 1391。
(14)环境应力筛选。通过环境应力筛选,来发现和排除不良元器件、工艺缺陷及其它缺陷造成的早期失效组件。根据用户需求,应提出环境应力筛选项目和要求,确定筛选范围,如器件、电路板、模块/组件、分设备等。
(15)可靠性增长试验。应制定可靠性增长试验计划,根据设备的寿命剖面和任务剖面确定试验条件和实施方法,明确数据的收集和记录要求。可靠性增长试验可以单独进行,也可以与其它试验结合起来进行,如研制过程中做的老化筛选、温度冲击、常温负荷试验、环境试验等,发现故障并采取了改进措施后都可以称为可靠性增长试验。
(16)可靠性鉴定试验。明确规定可靠性鉴定试验的试验计划、试验程序,统计试验方案。通过鉴定试验来判断设备是否达到用户要求。
(17)确定功能测试、包装贮存、装卸运输及维修对可靠性的影响。详细分析设备在功能与性能测试和维修时对可靠性的影响,分析设备的可靠性在贮存及装卸运输过程中受环境条件影响的因素,提出相应的改进措施。
(18)可靠性大纲评审。依据可靠性工作计划,制定可靠性大纲的评审计划、评审时间和评审内容。如何评审下面讨论。
5 可靠性评审[5,6,9]
从上述可靠性管理以及可靠性大纲的内容可以看出,可靠性评审是可靠性管理中的一项重要工作。在项目研制的各个阶段,邀请相关专家对可靠性工作进行评审,尽早发现设计上的缺陷,排除可能的隐患,及时检查可靠性大纲中的工作项目的完成情况,以便采取改进措施。阶段不同,可靠性设计及其管理的内容不一样,相应的评审要点也不同。
5.1 论证阶段的评审要点
(1)设备的寿命剖面、任务剖面是否正确、完整?
(2)可靠性指标是否经过充分论证和确认?可靠性指标与国内外同类设备相比是先进、一般还是落后的水平?
5.2 方案阶段的评审要点
(1)是否制定了可靠性大纲(含可靠性工作计划)?可靠性大纲规定的工作项目与其它研制工作是否协调?
(2)设备的可靠性模型是否正确?相应的指标分配(初步)是否合理?
(3)可靠性预计结果能否满足规定的指标要求?
(4)系统方案是否进行了可靠性的比较与优选?
(5)方案中的可靠性关键项目与薄弱环节分析是否正确?
(6)可靠性工作所需的条件和经费是否得到落实?
5.3 工程研制阶段的评审要点
(1)是否修正了可靠性模型?是否进行了可靠性预计和指标的再分配?
(2)是否确定了可靠性关键项目与质量控制要求?是否确定了设备所有严重、致命或灾难性故障模式及其相应的补救措施?薄弱环节是否采取了改进措施?
(3)是否对外包配套产品的转承制方进行了有效质量控制及明确的可靠性设计要求?
(4)设计是否尽量采用标准件、通用模块,并尽量减少零部件的种类和数量?设备的标准化系数高不高?
(5)设计是否充分考虑了设备的热设计、电磁兼容性设计、抗干扰设计、防电磁脉冲设计,以及“三防”设计(防潮湿、防盐雾、防霉菌)、防振动抗冲击设计等环境适应性设计要求?电路模块是否进行了容差与漂移设计、潜在通路分析以及简化与优化设计?
(6)是否考虑了功能测试、贮存、包装、装卸、运输及维修对设备可靠性的影响?
(7)是否制定了可靠性增长计划?并按计划进行了包括器件级、模块级甚至设备级的老练处理和环境应力筛选?可靠性关键件是否进行了可靠性增长试验?老练和环境试验条件是否符合顾客要求?试验是否模拟了任务剖面?
(8)故障报告、分析和纠正措施系统是否记录并报告了从进货检验、加工检验、研制试验、部件(模块)试验、设备组装和检验、老练和环境应力筛选、验收试验、可靠性试验等全过程中发生的故障?故障报告表格是否符合规定的要求?
(9)故障的定义和判据是否符合规定的要求?是否对所有故障进行了原因分析?
5.4 定型阶段的评审要点
(1)可靠性应力预计法的结果、可靠性指标的鉴定结果是否满足合同要求?
(2)研制过程中发生的故障的改进措施是否全部落实并且有效?
(3)试生产的条件是否能保证产品达到规定的可靠性要求?
(4)部队试验和试用期间出现的可靠性问题是否得到解决
(5)批生产工艺规范及质量控制措施是否能保证产品的可靠性要求?
6 结束语
可靠性管理的重点是防止、发现和纠正设计缺陷、薄弱环节以及工艺缺陷,减少维修保障的时间、人员、设备等,为顾客研制出可靠性高的产品。因此,在产品寿命周期内的每个阶段都要重视可靠性管理问题,对所涉及的可靠性工作进行科学计划、精心组织、强化监督、严格控制,来提高并维持产品的可靠性水平,从而实现设备“两提高、两降低”的可靠性目标,即提高战备完好性,提高任务成功性;降低保障资源要求,降低寿命周期费用。
[1]施国洪.质量控制与可靠性工程基础[M].北京:化学工业出版社,2005.SHI Guo-hong.Quality Control and Reliability Engineering Bases[M].Beijing:Chemical Industry Press,2005.(in Chinese)
[2]苏秦.质量管理与可靠性[M].北京:机械工业出版社,2008.SU Qin.Quality Management and Reliability[M].Beijing:China Machine Press,2008.(in Chinese)
[3]杨为民.可靠性维修性保障性总论[M].北京:国防工业出版社,1995.YANG Wei-min.General Remarks of Reliability,Maintainability and Supportability[M].Beijing:National Defense Industry Press,1995.(in Chinese)
[4]宋太亮.装备保障性系统工程[M].北京:国防工业出版社,2008.SONG Tai-liang.System Supportability System Engineering[M].Beijing:National DefenseIndustry Press,2008.(in Chinese)
[5]GJB 450A-2004,装备可靠性工作通用要求[S].GJB450A-2004,General Requirements of Reliability Work for Materiel[S].(in Chinese)
[6]GJBz 20343-1998,全军武器装备可靠性维修性管理大纲[S].GJBz 20343-1998,Management Program of Reliability and Maintainability for Military Weapons and Equipment[S].(in Chinese)
[7]GJB 841-90,故障报告、分析纠正措施系统[S].GJB 841-90,Failure Report,Analysis and Corrective Action System[S].(in Chinese)
[8]GJB/z1391-1992,故障模式、影响及危害性分析程序[S].GJB/z 1391-1992,Procedure for Failure Mode,Effects and Criticality Analysis[S].(in Chinese)
[9]GJB/z 72-1995,可靠性维修性评审指南[S].GJB/z 72-1995,Review Guide of Reliability and Maintainability[S].(in Chinese)
[10]生建友.军用电子设备研制过程中的可靠性工作[J].舰船科学技术,2011,33(1):122-126.SHENG Jian-you.Reliability work among developing military electronic equipment[J].Ship Science and Technology,2011,33(1):122-126.(in Chinese)