提高某国产化电子设备可靠性的方法
2021-04-12谭晟吉李彦平
黄 菊, 谭晟吉, 袁 强, 李彦平
(中国兵器装备集团自动化研究所, 四川 绵阳 621000)
0 引言
目前在航空、航天、船舶、兵器、电子、核工业等各种武器装备和军事设备中广泛应用以集成电路为代表的各种电子元器件的计算机、电力、金融、通信等电子设备[1]。目前我国大部分高端集成电路从日本、美国、欧洲等国家进口。 据中国海关数据统计,2019 年我国芯片的进口金额为3040 亿美元,较去年同期减少80 亿美元,同比下降2.6%。2020 年7 月我国半导体器件进口量为482.8 亿个,同比增长12.7%, 进口金额为2069 百万美元, 同比增长23.3%,2020 年8 月我国半导体器件进口量为481 亿个,同比增长12%,进口金额为1991.6 百万美元,同比增长18.6%。 2020 年8 月前我国半导体器件进口量不断增长。引用“中国半导体产业战略规划和企业战略咨询报告”国外垄断高端电子元器件会面临停产断档、 限制出口与禁运、存在安全隐患以及假冒伪劣等问题,严重影响和制约我国国民经济和武器装备的发展,甚至危及国家安全。国家层面出台了电子元器件行业, 各个地方政府也是大力支持本土电子元器件的行业发展,凭借政策支持、资金投入,积累技术经验和人才储备,拉近与国外的差距,逐步占据产业战略高地。
LC 领域国内企业开始发力进入市场, 尤其是在国家大力推进“智能制造2025”的大背景下,行业增速一直保持在20%以上,国内企业的市场份额也在逐步增加。 看好国内企业在渗透率提升和进口替代国外企业双重机遇下的发展潜力。 芯片国产化是中国制造崛起之匙,国产设备迎来了历史机遇,目前处于快速发展阶段,器件的可靠性还存在问题,需采取相应的手段提高设备的可靠性。
1 国产电子设备可靠性增长的现实意义
电子设备的基础是电子元器件, 提高电子元器件的可靠性即可提高设备的可靠性。 国产电子元器件可解决我国电子设备尤其是军用电子设备选用进口电子元器件面临的多种问题,主要包括设备的性能指标、质量与可靠性水平以及供货保障能力。
随着高新技术的发展, 现代武器系统和民用设备具有电子化、自动化、智能化的特点。 电子设备系统越复杂,其可靠性问题就越尖锐[2]。 “引用电子元器件可靠性增长的分析技术”目前国产电子元器件处于刚起步的阶段,元器件的可靠程度低,可能由不可靠产品引起的巨大经济损失、战争教训使可靠性工程的重要性越发明显。 目前国防对武器装备性能和可靠性的要求提高到一个前所未有的高度,航空、航天都在进行可靠性增长工程,如果元器件的可靠性没有相应地跟着增长,航空、航天等领域产品的可靠性增长必将受到极大的影响。电子元器件作为电子设备和电子系统的基本组成单元其可靠性得到了高度重视,因此,电子元器件的可靠性技术也显得越来越重要。
在可靠性增长中, 通过失效试验与分析→控制失效模式→提高产品的可靠性是最主要的方法, 但失效分析是事后分析,实现可靠性增长的周期较长、费用很高。 通过故障模式、失效机理、失效原因以及影响设备的可靠性因素进行分析及试验,从而采取可靠性增长的设计措施。
为了提高电子设备的可靠性需进行可靠性增长,通过逐步改进产品设计和制造中的缺陷,不断提高产品可靠性的过程。需要明确产品可靠性管理阶段的划分、 可靠性增长方法等内容。产品的全寿命周期阶段分为工程研制阶段、 设计定型阶段、生产定型阶段。 提高电子设备可靠性的方法包含可靠性分析、可靠性增长试验等。
2 可靠性分析
2.1 数据收集
可靠性分析工作之前需要明确分析的电子设备的功能与结构组成, 明确设备故障的故障判据,尽量采用定量描述,少用定性的描述,是可靠性工程的基础。
可靠性分析工作之前需进行数据收集, 收集电子设备全寿命周期的失效信息, 包括设备在生产、 测试、FMEA、试验及现场使用等过程中各组成单元(含元器件)所有可能出现的故障模式、故障原因、影响分析。
电子设备的常见的故障模式包含功能丧失、 功能降低、间歇性故障、非预期的功能。故障原因是造成故障模式的原因,一般分为开路、短路、参数漂移。 故障原因是由某些物理、化学等失效机理造成的,如疲劳、温度过高、机械应力等。 针对测试、试验中出故障的元器件,可采用DPA的方法进行故障分析,DPA 是元器件故障分析的有效的手段,根据DPA 结果明确故障模式及故障原因的分析。
2.2 故障模式及影响分析
故障模式及影响分析又称FMEA, 是提高设备可靠性的重要方法。在电子设备设计、生产、试验过程中,通过对电子设备各组成单元的各种可能出现的故障进行故障模式与对系统影响进行分析, 进而提出改进措施的一种分析方法。
在不同的阶段可实施不同程度的FMEA, 在方案阶段一般进行功能FMEA,在工程研制阶段进行硬件FMEA与工艺FMEA,本文着重于功能和硬件FMEA 进行说明。FMEA 工作要点包含:明确产品的功能、故障模式、故障原因、产品功能故障的判据确认及影响后果、改善措施。
本文中某型国产电子设备的功能为某车载系统的控制系统,使用千兆以太网通信实现车载系统的控制,如果千兆以太网出现故障则会造成系统故障。 以某型国产电子设备的功能FMEA 为例进行说明,故障模式、故障原因及影响分析见表1。
表1 某型国产电子设备的功能FMEA 表
3 可靠性增长试验
可靠性增长是贯穿于电子设备寿命周期内, 为达到逐步改正产品设计和工艺缺陷、 提高产品可靠性而进行的“试验、故障分析、改进”[3]。在电子设备研制阶段可以通过可靠性增长摸底试验及可靠性增长试验实现设备可靠性增长。 可靠性摸底试验的受试产品需具备产品规范要求的功能和性能,在设计、材料、结构与布局及工艺等方面能基本反映将来生产的产品的技术状态。 在试验前需经过全面的功能、性能试验,以确认产品的技术状态已经满足可靠性增长摸底试验的要求。 同时应通过环境应力筛选,同批次产品完成规定的环境试验项目。根据工程经验, 通常可靠性增长摸底试验的试验时间取100~200 小时较为合适, 也可取该产品MTBF 设计定型最低可接受值的10%~20%。 可靠性增长试验与摸底试验相比,试验阶段不一致,可靠性增长试验一般在工程研制后期,在鉴定试验之前。可靠性增长试验取决于选择的可靠性模型,工程经验及对产品的可靠性要求,一般取产品MTBF 目标值的5~25 倍。同时也可根据工程经验加大可靠性增长的应力, 但需注意的是应力在不破坏产品且不会引起与实际使用时不相符的故障前提。
可靠性增长试验需要模拟产品实际的使用条件制定试验剖面,包括环境条件、工作条件和使用维护条件。 其中环境条件及其随时间变化的情况应能反应受试产品现场使用和任务环境的特征,选用模拟现场的综合环境条件。综合环境条件实施时,先确定一个综合环境试验剖面,该试验剖面一般由温度、湿度、振动等环境应力和电应力构成。
已知某型国产电子设备的任务剖面和寿命剖面共同确定试验剖面,试验剖面含温度、湿度、振动的环境应力和电应力。采用可靠性增长模拟试验进行可靠性增长,试验的时间选取200 小时。
本文中某型国产电子设备在可靠性增长摸底试验过程中出现高温工作时, 出现设备意外关机且恢复环境温度为室温后重启设备,设备启动正常的故障。需针对该故障进行分析,以实现设备可靠性增长。经过故障检测分析手段,得到某国产电源芯片长期工作在高温环境下,器件温升较大可能会导致器件失效,从而导致设备故障。
结合可靠性分析与可靠性增长试验, 可实现设备的可靠性增长。其中可靠性设计是事前措施,而可靠性增长是时候试验评估。 可靠性增长试验中发现问题通过可靠性分析可以反馈到设计中,为其提供指导,两者是提高产品可靠性的重要环节[4]。 为了解决该故障,后续设计时在PCB 设计中增大热焊盘的面积,加大该芯片在PCB 上的热量, 同时可以在结构设计针对该器件增加专用的散热手段,最终使得设备可靠性提高,能以高概率通过可靠性鉴定与验收试验,提高装备的费效比。
4 结论
电子设备可靠性增长的核心在于元器件的可靠性,要有效的控制或消除设备的失效, 需要实现对设备准确的失效分析,采用有效的可靠性增长失效,并实现全生命周期失效数据的收集, 才能针对电子设备的特点采取有效。 本文从元器件级到设备级进行全寿命周期内故障信息收集、FMEA、 可靠性增长试验的工作, 通过详细的测试、分析、试验得到设备可能出现的失效模式、失效原因及影响程度,从而提出有效的可靠性增长措施,提高产品的可靠性。