电子元器件质量与可靠性技术及其研究进展
2022-01-13罗雨薇李晓红
罗雨薇,李晓红
(1.中电科技集团重庆声光电有限公司,重庆 400060;2.中国电子科技集团公司第二十四研究所,重庆 400060)
0 引言
由于全球经济的一体化变得愈发良好,市场的竞争也变得逐渐猛烈,无论是历史经验还是现实情况都透露出了一点,那就是企业要想赢得竞争和市场占有率,就必须注重产品的质量。改革开放以来我国的军工事业蓬勃发展,产生了巨大的经济效益。电子元器件作为武器装备的重要组成部分,其性能好坏直接影响到整体系统的稳定性,所以近些年来对于电子元器件行业的质量要求也越来越严格。在目前的生产过程当中,质量保证方法基本上停留在事后检验的水平上,这种方式只能在一定程度上发现废品,很难预防废品的产生,这在很大程度上增加了企业产品的制造成本,给企业带来了重大的经济损失。由此可见,加大对电子元器件质量管理力度和可靠性技术研发是至关重要的。
1 国内外电子元器件质量与可靠性技术发展现状
在二战之前,人们对质量管理的理解还停留在质量检验的层面,就是采用严格的检验,以控制和保障出厂或进入下一道进程的产品质量。然而,由于产品质量和可靠性水平提高到了一个新阶段,以及生产规模的不断扩大,传统的检测技术已无法满足一些高可靠性产品的要求。于是某些统计专家和质量管理专家便试着将数理统计方法应用到质量检测之中。1924年,美国的Shewhart提出了统计过程控制(SPC:Statistical Process Control)技术的概念,并成功地创造了监控该过程的工具——控制图,将质量管理推进到统计质量控制阶段。20世纪50年代末,Feigenbaum提出了全面质量管理(TQM:Total Quality Control)的理论和方法,即在产品研制全过程中保证和评价产品质量与可靠性。电子元器件设计、生产和应用全过程对质量与可靠性的影响如图1所示。基于此,可靠性技术于20世纪60年代迅速地发展起来,并逐步地形成为一门独立的学科。
图1 产品研制全过程对质量与可靠性的影响
我国的可靠性事业起步较晚,例如:在航空航天领域,由于航天事业发展的需要,钱学森于1963年提出要搞可靠性工程,并于1965年在原国防部五院组建了质量控制专业研究所,开始研究型号研制过程的可靠性保证和质量控制问题。20世纪70年代在电子工业和航空工业中初步地形成了可靠性研究体系,并将其应用于军工产品[1-2]。
最近几年,由于半导体技术的迅速发展,元器件可靠性技术迎来了一些未曾出现过的挑战,比如电性能的不可测性、有关环境和机械试验的不可模拟性和传统试验方法对现今情形的不适应性,也因此带来了一些未曾出现过的可靠性技术的相关研究课题。而今,无论是国内还是国外有关电子元器件的可靠性技术的发展走向,都是将可靠性和电子设计互相结合,将器件的失效物理和电路设计密切地关联在一起,使可靠性不再仅是一个附属品。从另一方面来说,由于各式各样的可靠性试验、保证和评价技术的发展进步,也带来了一些新的失效分析技术和可靠性的分析方法。
2 电子元器件可靠性技术分析
2.1 可靠性设计技术
可靠性设计是可靠性工程的核心,主宰着电子产品的潜在可靠性,是企业在产品开发过程中考虑得最多的问题之一[3]。在做可靠性设计时不仅仅要满足功能和特性参数指标的要求,还必须考虑到全寿命过程中与可靠性有关的诸多因素。例如:可能遇到的各种环境应力对电子产品可靠性的影响[4],以及在要求的时间内产品可能会出现的失效模式。
2.1.1 产品可靠性需求分析及设计原则
为了设计可靠性高的产品,第一步需要采集和剖析产品的环境信息,就是所规定的相关条件。主要思路是建立产品的典型任务剖面、提取环境特征和挖掘隐性的使用条件,从而形成产品可靠性设计技术要求,以及对产品样件的验证测试大纲,为产品的可靠性设计和验证确认提供依据[5]。除此之外,元器件本身的设计、使用材料、工艺和生产过程等方面也会对产品的可靠性造成一些影响。因此,提出了以下几个需要在电子产品可靠性设计中关注的重点内容。
a)通过失效数据统计分析和对失效样本的分析,确定影响该产品质量与可靠性的主要失效类型和失效机理。例如:随着元器件尺寸的降低,电迁移、TDDB和热载流子等新的失效机理发生得越来越多,在可靠性设计中需要给予更多的重视。
b)从元器件结构和图纸设计、工艺技术和组装等多方面采取合适的可靠性设计技术。例如:在单片集成电路设计中应考虑工作电流不能太高,以防电迁移失效;版图在设计时应注意互连线的宽度,保证电流的密度不能过大;组装工艺应考虑散热措施,防止工作时温升过大。
c)当性能参数和可靠性之间相互矛盾时,需要先考虑产品的可靠性条件。例如:对大功率半导体器件,在芯片与底座之间采用钼片作为缓冲,可以提高粘接可靠性,但同时会使得串联电阻增大,导致饱和压降增大。
2.1.2 元器件的选用及控制
组成电子产品最基础的元素就是电子元器件,电子元器件的选型会直接影响整个产品的可靠性,可以采取如下方法来控制:首先,选择通过质量认证的电子元器件,同时需要对已有的元器件进行归类管理,并建立优选元器件库;然后,制定严格的物料管理程序,对新物料进行筛选和控制;最后,依据电路的工作参数和整机的使用环境,筛选出符合条件的元器件,使得元器件的使用可靠性得以充分地发挥。
2.1.3 常用的可靠性设计方法
2.1.3.1 降额设计
各种电子元器由于它们的材料、结构、设计和制造工艺等方面的原因,对外应力都有一定的耐受强度,当外应力超过元器件本身的应力承受强度时,元器件就会损坏[6]。所谓降额设计,就是使元器件运用于比额定值低的应力状态的一种设计技术[7]。合理的降额可以大幅度地降低器件的失效率,在一定程度上提高产品的可靠性水平[3]。
王志民[8]等人,针对高海拔、强辐射、低气压和低气温等严酷的高原特殊气候环境条件,在考虑电气设备高原降额的前提下,按5 000 m等级水平就逆变器的功率模块进行降额设计并确定其降额系数。经过技术方案对比和光伏电站性能评估,结果表明:负载缺电率达1.37×10-3,可靠性高;系统平衡部件的总效率收敛于45%左右,并且其稳定性变强。
2.1.3.2 热设计
如今,电子设备中所采用的电子元件的密度比以前高得多,并且元件之间通过传导、辐射和对流产生的热效应,是电子元件发生故障的重要原因之一。根据统计数据可以看出,电子元件的温度每增加2℃,其可靠性就会降低10%;当温升达到50℃时,其寿命仅有在温升到25℃时的1/6。为此,需要采取一些技术措施来控制器件的温升[7,9]。例如:可以采用功耗较低的器件,以减少器件的发热;将印制线的宽度加宽,以提高元器件的效率;采用热传导、辐射和对流技术来加强散热。
刘汉涛[10]等人,对研制中的便携式密封机的热行为进行了数值模拟,获取了密封机箱内各个元器件的温度分布。因采用了热阻较小、且传输效率较高的热管来传递热量,将芯片冷却,以此获得了比以往更加优异的冷却效果。
2.1.3.3 冗余设计
冗余设计是一种被广泛使用,且实用性较高、操作简便的可靠性设计方式。设计人员常常会在一些重要的部位多加一个元件或设备,这样当此部位的元件失去它的作用时,附加元件往往可以代替原来的元件继续工作,这样就不会影响整个系统的运行。冗余设计中较为简单的冗余系统如图2所示[11]。
图2 并联系统的可靠性
赵宪宁[12]等人,在开关电源模块中摒弃了传统的通过二极管进行冗余电源的设计,改为使用MOS管来实现冗余控制,如图3所示,利用电源模块的远端补偿sense端子设计了并联均流电路,均流效果良好。由于并联电源模块的地位都是平等的,因此这些模块都可能会成为主电源。经过合理设计,可扩充容量,实现均流和冗余功能。
图3 冗余电源系统
2.1.3.4 电磁兼容设计
电磁兼容指的是在同一电磁环境下,能够和谐地实现系统、子系统和设备自身功能的并存状态。电磁兼容性同时包含了系统内部和系统之间这两个方面,这也是电子产品的重点指标。因此,必须进行电磁兼容设计,以下是一些常用的抗电磁干扰的设计方法:在系统的电气元件和参考点(地)之间需建立起导电通道;在各个金属元器件的表面需建立起低阻通道,以减少各个元器件之间形成电位差产生干扰的可能性;需要采用某些屏蔽的手段,用于阻隔辐射的电磁波。
赵阳[13]等人,针对电力电子噪声源的电磁兼容分析,基于Mardiguiana噪声分离网络,设计了一种高性能的EMI传导分离网络,如图4所示。通过理论和试验研究结果可以看出,新网络的插入会使损耗和噪声的抑制性能提升许多,同时对于电力电子系统的电磁兼容性能的改善也十分有效。
图4 新型噪声分离网络拓扑结构
2.1.3.5 三防设计
在气候环境中有许多不可控的因素,比如湿度、盐雾和霉菌等,而电子产品又由于其精密性,所以需要严格地考虑其工作环境对其本身的影响,因此相关人士提出了在电子产品可靠性设计时应该考虑的防潮湿、防盐雾、防霉菌的“三防”设计。
吴杰[14]等人,针对安装于舰载直升机上的某型信号处理机,考虑到海洋环境具有高温、湿热和盐雾的特点,容易引起结构件和印制板电路的腐蚀和发霉。为了保证信号处理机能正常工作,要在设计之初就把三防设计给考虑进去,从不同的维度出发,比如选择比较耐腐蚀的材料、在材料表面覆盖一层防腐蚀发霉的物质等。之后通过试验测试信号处理机的防护性能,结果显示,在高温、湿热和盐雾的环境下,信号处理机能正常工作,表明三防设计满足信号处理机在恶劣环境下工作的要求。
2.2 可靠性试验技术
在产品研制过程中,设计是决定产品质量和可靠性的关键技术与环节,那么测试与试验就是验证设计的重要手段[15]。只有在可靠性试验的过程中取得必要的数据,然后通过对数据的分析、处理才能得到可靠性指标的统计量,进而推算产品的可靠程度[16]。
2.2.1 可靠性试验的目的
可靠性试验的总体目的是了解设计是否满足了可靠性指标的要求,但不仅仅是对产品下合格或不合格的结论。可靠性试验的另一个目的是找出并排除设计与制造过程中的缺限和不足,采取有效的纠正措施,从而提高产品的可靠性[16-17]。
2.2.2 可靠性试验的分类
在进行可靠性试验的时候,首先要明确产品研制的过程,半导体元器件在开发的不同阶段需要进行不同的可靠性试验,其分类方法也各异。经常用到的是统计可靠性试验和工程可靠性试验。其中,工程可靠性试验包括环境应力筛选试验和可靠性增长试验,是为了提高产品固有可靠性而进行的试验;而统计可靠性试验是为了获得产品在特定条件下工作时的可靠性指标,为设计、生产和使用提供可靠性数据支撑,包括可靠性鉴定试验和可靠性验收试验,如图5所示[17]。
图5 可靠性试验的分类
除了上述分类,可靠性试验在实际的应用中还有其他各种分类,比如按照环境的不同可分为各种应力条件下的现场和模拟实验;根据不同的试验性质可分为破环性实验和非破坏性试验;按试验项目划分,可分为环境试验、寿命试验、加速试验和各种特殊试验[16]。
2.3 可靠性分析技术
元器件可靠性分析技术是指用物理或化学手段,从结构设计、原材料选用和制造工艺等方面对元器件进行深层次的技术分析,从而为评价元器件可靠性提供客观的证据。下面简单地介绍几种元器件可靠性分析技术。
2.3.1 破坏性物理分析
破坏性物理分析(DPA:Destructive Physical Analysis)是为验证元器件的设计、结构、材料和制造质量是否满足预定用途或有关规范的要求,按元器件的生产批进行抽样,对样品进行解剖,以及解剖前后进行一系列的检验和分析的全过程。它可以判断是否有可能产生危及使用并导致严重后果的元器件批质量问题。20世纪70年代,美国NASA在航空、航天领域使用的元器件中首先使用了DPA方法,并取得明显的效果。我国航天系统自20世纪80年代初起也开展了DPA工作,保证了当时装机元器件的质量,由此也促使生产单位改进工艺,逐步地提升产品质量。
郁振华[18]等人,提出了铜丝键合塑封器件DPA的步骤及判据参照标准,讨论了器件激光开封技术的工艺步骤和参数值,以及键合强度测试判据和典型断裂模式,以解决铜线键合塑封器件的DPA问题。
2.3.2 失效分析
产品失效是制造型企业生产时遇到的共同问题,失效分析是其必须要做的一项工作。失效分析技术是针对从设计到应用过程中失效的元器件,从电性能、物理和化学等多方面查找其失效原因,确认失效模式和失效机理,并采取相应的纠正措施;从根本上解决,最终达到提高元器件质量、降低元器件失效率的目的。
张杰男[19]等人,提出了一种二次电池电芯的失效分析方法,其流程图如图6所示,包括失效背景信息获取、外观检查、通过无损检测以获取电化学和结构信息、对电芯进行拆解,并对其内部元件的样品进行测试和分析。该方法能够实现对二次电池电芯的失效原因与机理全面系统的分析,可以提高失效分析人员的效率与水平,同时积累失效分析数据库,对行业的长远发展提供帮助。
图6 二次电池电芯失效分析方法的流程图
2.3.3 结构分析
元器件的可靠性要求是指元器件能否在规定的条件下完成相应的任务,在某种程度上说取决于元器件的固有可靠性,固有可靠性则又牵涉到其结构设计,结构设计又与制造材料、工艺流程等方面存在一定的关联,无论哪个过程出现问题,工艺结构都会存在缺陷,影响元器件的固有可靠性,进而影响产品整体。如果在选用元器件前能够比较详细地了解其结构和工艺缺陷,就可以在最大程度上避免损失。在这种需求的引导下,逐渐地形成了一种新的元器件可靠性评价方法——可靠性结构分析(RCA:Reliability Construction Analysis)。
崔德胜[20]等人,发明了一种陶瓷封装单片集成电路结构分析方法,包括对元件形态、外壳、内部互联、内部环境和芯片进行分析。解决了目前元器件结构分析对设计、结构、材料和工艺等要素分析覆盖性不足的问题,并且能根据实际应用给出合理的改进建议。同时,对要素的分析更关注所用的材料、工艺及结构对实际应用的影响,有效地避免了现有的结构分析方法和DPA的分析覆盖性不足的问题。
2.4 可靠性评价技术
元器件的可靠性评价是指对元器件成品、半成品或模拟样片通过各种可靠性试验技术、方法和手段,施加一定的应力并记录过程变化相关数据,最后通过梳理统计工具或有关模拟仿真软件来评定其寿命、失效率或质量等级等元器件可靠性特征参数的过程。
2.4.1 元器件寿命试验
寿命试验的目的就是为了判断元器件的寿命特征,可以通过此试验得到元器件的工作寿命和贮存寿命等参数。试验开始之前需要准备一定数量生产条件相同、未经使用的元器件,然后在模拟工作环境里进行贮存或者使其工作,然后记录一系列的相关数据(试验条件、失效时间和个数等),最后进行统计分析,得到评价元器件的寿命特征、失效率和平均寿命等可靠性特征量。
2.4.2 元器件加速寿命试验
随着制造业的迅猛发展,客户对产品质量的要求也越来越高,加上激烈的市场竞争,制造型企业面临的压力越来越大,价格方面不仅不能上涨,甚至还要下调,同时还要保证质量。对产品的设计制造企业来讲,各种项目时间紧、任务重,传统的可靠性试验方法已经不能满足要求。加速寿命试验(ALT:Accelerated Life Testing)方法应运而生,加速寿命试验是在原有的可靠性试验的基础上加强试验应力水平,同时保证元器件正常工作、失效机理不变地进行试验,能够快速地得到产品的寿命特征。它不仅缩短了产品研制时间,节省了成本,并且也因此提高了公司产品的竞争力[15]。
王孟美[21]等人在2015年第11期《传感技术学报》上发表了一篇名为《冲击应力下高g加速度传感器的加速寿命评估》的文章,该文章提出了冲击应力下高g加速度传感器的加速寿命评估方法。通过分析冲击载荷作用于加速度传感器时产生的应力波及故障树分析法,确定了传感器的主要失效模式和敏感环境应力。通过理论验证了加速试验过程的失效机理,并建立了可靠度评估模型,计算出可靠度函数。试验和评估结果表明:该方法可有效地评估高g加速度传感器的寿命,简捷易行,可信度高。
2.4.3 元器件加速退化试验
随着科技的发展,对于高可靠、长寿命类型的产品,一般的寿命试验已经不能满足元器件可靠性评估,因此,相关人士经过研究,发现可以利用元器件在工作中的退化情况来估计元器件的寿命特征与可靠性,由此衍生了针对高可靠、长寿命元器件的寿命试验方法——加速退化试验(ADT:Accelerated Degradation Testing)。原理和加速寿命试验相差不大,只不过是观察记录的数据是元器件在高应力环境下性能退化的相关数据,从而计算和预测出正常应力水平下元器件的寿命特征。
吴兆希[22]等人,以高可靠模拟集成电路为研究对象,对选取的运算放大器SF-XXX、驱动器SW-XXX和数模转换器SDA-XXX为代表的3类典型的高可靠模拟集成电路分别进行复合应力条件下的加速贮存/工作和正常贮存/工作退化试验。通过对试验数据的分析,在复合应力条件下的两项退化试验中得到寿命分布函数一致;其模型的准确度均大于85%。利用加速退化试验,不仅对高可靠模拟集成电路有了可靠的寿命评估,而且此项试验耗时较短,大大地节省了人力、物力和财力,寿命评估效果如表1-2所示。
表1 模拟集成电路工作寿命评估效果
表2 模拟集成电路贮存寿命评估效果
3 电子元器件质量与可靠性技术发展趋势
近年来,随着半导体技术的飞速发展,SiC、MEMS和深亚微米级IC等新型元器件不断涌现,对元器件可靠性技术也带来了新的需求与挑战,例如:电性能的不可测性、环境与机械试验的不可模拟性和传统试验方法的不适应性等,从而引出了新的可靠性技术研究课题[23]。
3.1 多芯片组件技术可靠性研究
随着科技发展,电路封装技术的可靠性成为可靠性技术发展的重点之一。多芯片组件(MCM:Multi-Chip Module)封装技术是指将大量的芯片安装在同一个相互连接的衬底上,具有体积小、重量轻、性能优异、可靠性高和散热性良好等特点,可以在很大程度上提升通讯设施、军/民用和宇航用电子产品的性能和可靠性。由于有大量的MCM用于航空航天等军工领域,其使用环境更为严酷,可靠性要求更高,某些传统的可靠性研究方法已不能满足要求,需经历一系列的加速寿命试验。目前,MCM产品中存在的可靠性问题侧重在封装技术和测试方法等,对MCM产品可靠性的研究也尚在不断地发展与完善之中。
3.2 已知良好芯片技术可靠性研究
进入20世纪90年代后,由于MCM的大量涌现和高速发展,通常需要在一个壳体内组装功能复杂且数量繁多的大规模芯片。若仅在电路封装成成品后才进行老炼筛选试验,那么仅仅几个芯片的失效将会导致整个电路的报废,这无疑会大大地增加成本。为了解决芯片级老炼和测试问题,已知良好芯片(KGD:Known Good Die)技术应运而生,KGD技术就是指裸露、封装前的芯片具有与封装好的芯片相同的失效率。目前市场对KGD的需求非常旺盛,各大半导体公司对此技术更是格外关注,他们根据宇航用、军/民用等不同的市场需求,制定了不同的KGD工艺流程,使裸芯片的试验和老练技术在过去的10年中明显地成熟起来。
冯永杰[24]等人,针对垂直双扩散金属-氧化物半导体场效应管(VDMOS),研究了功率裸芯片的测试与老炼筛选技术。参考了封装管的测试与筛选方法,确定了功率裸芯片的筛选项目,并提出了一种脉冲功率老炼的方法。采用热敏参数法来测量结温,同时调整脉冲的功率、频率和占空比来控制结温,使结温达到老炼要求。通过实践验证了这种方法的可利用性,并确定了一种多器件串行脉冲功率老炼的方法流程。
3.3 微电子机械系统可靠性研究
21世纪以来,随着经济的发展,我国在各个领域的生产技术更加精湛。微电子机械系统(MEMS:Micro-Electro Mechanical System)是在半导体制造技术的基础上发展起来的,是世界瞩目的重大科技领域之一,具有广阔的应用前景。如今,MEMS正处于高速发展期,新的失效模式和各种可靠性问题层出不穷,而各国在此方面的研究也是刚刚开始。由于MEMS的体积极小,其内部结构一般在微米甚至纳米量级,其可靠性问题就不再是电学、材料和机械可靠性的简单组合。由于尺寸的缩小,许多物理、化学性质与宏观世界有很大的区别,跨领域的信号、各种干扰和物质的相互作用也会带来未知的失效模式。若能对MEMS器件的可靠性进行准确的评估,就可将其大量地应用于军用、宇航用等武器装备中。
董明佳[25]等人,对冲击载荷下的MEMS微加速度计的结构可靠性进行了评估,着重地研究了加速度计中梳齿、微梁和质量块对其可靠性的影响。通过仿真,分析了冲击载荷的方向、幅值和频率对梳齿结构的响应特点;通过对器件模型施加冲击加速度,分析了其变形过程和应力分布。该研究为提高微加速度计的冲击可靠性给出了参考意见,为同类系统的可靠性研究打下良好的基础。
4 结束语
在科技发展的今天,随着各种先进技术的引进,电子元器件的适用范围越来越大,提高电子元器件在更加恶劣环境中的使用可靠性已迫在眉睫。因此,我们需要通过增强电子元器件的质量与可靠性技术,以推进自主研发的电子元器件在我国各个领域的发展和应用。