E2 PROM失效故障分析
2013-04-25孙爱中
刘 冰,孙爱中,谢 涛
(中国航空计算技术研究所 第6研究室,陕西 西安710068)
在使用中发现有个别模块出现数据丢失问题,经分析该E2PROM(电可擦写存储器)出现失效的主要原因是由于PCM(过程控制监视)工艺参数RRPOLY3.6V波动较大,导致部分芯片的冗余范围变小,且偏差超过10 %会引起复位判断阈值变化,造成上电复位异常,并容易在写控制电路中引起误写操作。因此在E2PROM筛选中增加非易失性测试,可发现芯片早期失效问题。
1 故障定位及原因分析
用户在使用中,发现E2PROM数据存储器存在数据丢失的题,导致计算机无法正常工作。利用读出程序通过开发系统读出故障件上E2PROM内的程序内容,用UE自带的文件比较功能和正确的加载程序进行比对,发现故障件部分地址单元数据被改写,数据“0”被改写为“1”。重新加载程序,故障件工作正常,再反复上下电后,却又出现工作异常。数据被改写的地址并无规律,确定E2PROM存在数据丢失的问题。根据系统结构分析,建立了CPU模块上E2PROM数据丢失的故障树,如图1所示。
从图1可看出,导致E2PROM芯片数据丢失有5个:元器件虚焊、印制板断线、测试程序错误、芯片硬件使用环境问题和E2PROM芯片失效。
(1)元器件虚焊排查。对故障模块进行了5DX检查,并未发现虚焊、短路等焊接工艺问题,因此可排除因元器件虚焊造成的E2PROM数据丢失。
(2)印制板断线排查。用万用表量印制板上E2PROM所在位置附近所有印制板连线,测量静态电阻满足仲裁检验:每25 mm的电路电阻应<0.1Ω的要求。结果显示,连接正常,可排除因印制板断线所造成的数据丢失。
(3)测试程序错误排查。在排查过程中,首先对测试程序进行排查,观察软件数据保护是否工作。
依据手册说明,解除/启用软件数据保护需按照一定的序列在特定的地址单元写入特定的数据方能生效,程序中有解除/启用软件数据保护。
现场进行试验验证:程序中不执行解保护功能代码,则无法完成写操作;反之,程序中执行解保护功能代码,则可正常实现写操作,同时在使用过程中,可启动数据保护。
图1 故障树
再查看测试程序,观察是否有异常写操作。
在保护未启动和异常写操作同时发生的情况下,才会导致数据丢失,依此得出结论:测试程序按照手册要求进行编写,保护有启动且无异常写操作,其使用正常。因此可排除测试程序错误。
(4)芯片硬件使用环境问题排查。芯片硬件使用环境问题有4个因素:电源异常、时序设计问题、上电信号抖动干扰和I/O电平出错。先排查电源异常,如图2所示,用示波器测量,1通道为电源电压,在CPU模块测试时使用稳压直流电源供电,电压+5 V,未见异常,可排除电源异常情况。再排除时序设计问题,在上电和运行过程中只有读操作,所以主要看读时序的设计。
图2 上电时控制信号波形
图3 读周期时序图
表1 E2PROM读时序参数表
图4 实测读周期时序
从图5可看出,片选和读宽度为300 ns。芯片参数表上,读周期为120 ns,能满足芯片手册的要求。
图5 实测读周期时序数据标示
其次要排除上电信号的抖动干扰,图2是上电时抓到的电源(1)、CS(2)、OE(3)、WE(4)的波形。从波形上可看出,设计满足各芯片手册要求,E2PROM芯片手册要求芯片工作电压5 V(允许误差±10 %),设计保证了在供电电压达到4.5 V,信号状态稳定时,满足手册要求;上电时间接近8 ms,而E2PROM芯片手册对上电时间未要求。
正常电压下的信号未发现异常,检测控制、地址、数据信号未出现异常抖动。故排除上电过程中信号的抖动干扰。
最后看I/O电平是否出错,芯片的I/O电平异常一般表现为:芯片I/O管脚在板上短路或开路和芯片I/O电平上出现异常干扰或信号反射纹波。
通过采用万用表检测模块,芯片I/O管脚连接正确,未出现短路或开路。同时,采用示波器监控I/O信号,工作过程中均未发现异常干扰信号,可排除I/O电平出错。
综上所述,排除芯片硬件使用环境问题。
(5)E2PROM芯片失效排查。经设计复查,以及该芯片在其他方面的设计使用,可确认模块设计完全符合器件手册上的要求。根据E2PROM数据丢失故障树的分析以及部分分支的分析与排除,可确定芯片问题,E2PROM失效导致数据丢失,致使模块工作异常。
2 机理分析
通过DPA分析,进一步确认是E2PROM芯片失效。E2PROM器件存在芯片某流片生产批次工艺参数RRPOLY3.6电阻参数偏差较大(超过10 %),工艺线参数存在一定的非线性偏差,降低了设计中保留的冗余度,导致该产品抗干扰能力降低,易受外部干扰的影响;若在外部电源上电过程中出现毛刺或纹波干扰,引起复位判断阈值变化,有可能造成复位信号提前产生翻转,此时电源电压尚未达到最低工作电压,后级逻辑电路即不能正常完成初始化操作,在后面的连锁效应情况下,最终可能导致写控制电路中引起误写操作,使得E2PROM单元被误写。
3 改进措施
完善工艺参数的控制标准,增加工艺参数的统计控制。在4个关键工艺参数(N管、P管的阈值电压与饱和电流)统计的基础上,增加对该E2PROM工艺电阻参数的一致性进行统计分析的控制。对工艺参数的控制范围应根据产品特性要求制定,E2PROM工艺的RRPOLY3.6电阻参数的控制范围由原本的±20 %缩小至±10 %。
在E2PROM筛选中增加非易失性的测试,在所有测试环节中先进行读测试,再进行先写后读的测试验证。
4 结束语
E2PROM存在芯片工艺参数RRPOLY3.6电阻参数偏差较大,影响上电复位电路的工作状态,造成部分芯片在上电过程中出现失效问题;后期加强PCM参数控制,可将本次产品的质量问题彻底解决,同时可杜绝发生类似问题。另外在E2PROM筛选中增加非易失性的测试,可及时发现E2PROM早期失效问题。
[1] 深圳国威电子有限公司.Flash SM9968手册[M].深圳:深圳国威电子有限公司,2007.
[2] 杨志忠,卫桦林,郭顺华.数字电子技术基础[M].2版.北京:高等教育出版社,2009.
[3] 刘冰,孙爱中,张琬珍.一种解决Flash SM9968编程出错的设计方法[J].现代电子技术,2013(7):138-140.
[4] 李烁,王得宇,苗蓉丽.高压电容引脚断裂失效分析[J].失效分析与预防,2010(1):56-59.
[5] 康治德.模拟电子技术基础[M].北京:高等教育出版社,2009.
[6] 田永胜,杜良祯.晶振器件电路部分的失效分析研究[J].电子产品可靠性与环境试验,2010(1):27-31.
[7] 李伯成.E2PROM在构成IC卡中的读写[J].电子科技,1994(3):21-24.
[8] 陈海花,王翰卓.Multisim10在“数字电子技术基础”教学的应用[J].电子科技,2012,25(8):141-143.