一种变电站计算机监控系统寿命的评估方法
2012-09-27朱英伟
钱 肖, 朱英伟, 刘 栋
(1.华北电力大学,北京 102206;2.金华电业局,浙江 金华 321017)
0 引言
近年来,在电力系统一次设备全寿命管理方面,已开展了一系列研究工作,提出了规范化的指导原则和管理方法。但针对电力系统二次设备,尤其是计算机监控系统的使用寿命周期研究则并不多见。目前国内对监控系统寿命的判断大部分依据主观经验,一般5~8年,多的10年,与国外使用寿命12~15年差距较大。由于缺乏科学化、系统化的对监控系统等二次设备全寿命周期管理的方法,导致很多监控系统未到使用寿命年限就进行了更换,造成投资的浪费。因此,有必要对计算机监控系统的使用寿命评估方法进行研究。
本文介绍了一种针对变电站计算机监控系统整体寿命进行评估的方法。该方法首先对单一电子产品的故障机理及故障特点进行了分析,结合变电站计算机监控系统的特点,对计算机监控系统的失效(故障)、寿命周期界定、延长寿命周期是否合理等判据进行了建模和定义,从而得出整个变电站级计算机监控系统的寿命评估结论和延长寿命策略。
1 电子产品的可靠性
电子产品的可靠性,是评估其质量好坏的重要指标之一,可靠性用概率表示时称为可靠度,就是在规定的时间和规定使用条件下,无故障地发挥运行功能的概率[1-2]。国内外的现场数据都说明:正常运转期的电子产品的故障率约等于常数。其物理意义是:在任何时间还在工作的产品,在单位时间内大体上以固定百分比的产品出现故障。例如抽检某种大功率管9 800只,按照故障率每月2%,算出196只故障。以此类推,第12个月末,大体还剩3 641只不出现故障。由于电子产品在正常运行期内也会出现故障,其可靠性的高低在于故障率的大小,不像机械产品那样,有一个基本不出现故障的正常工作期。
电子产品的任何故障总是由特定的化学、机械、热、物理或电子驱使的故障机理所导致[3]。而产品抵抗内外部应力的能力,一般与产品局部位置的材料、结构等设计特性以及工艺特性有关,电子产品常见的潜在故障及其机理见表1。按故障机理可分为:
(1)过应力故障:A—脆裂;B—延展破裂;C—屈服;D—翘曲;E—大的弹性变形;F—软错误;G—辐射导致的热击穿。
(2)耗损故障:J—腐蚀;K—树枝状生长物;L—内部扩散;M—疲劳裂纹生长;N—物质扩散;O—绝缘相关的失效;P—过量漏电;Q—链接界面的层裂;R—疲劳裂纹萌生;S—Frenkel缺陷增生;T—电迁移;U—金属化层迁移;V—应力导致的扩散空穴(SDDV);W—电陷;X—EOS/ESD;Y—离子污染;Z—解聚(合)作用。
(3)辐射应力包括Gamma射线、Alpha粒子、快中子、宇宙射线、电子以及质子等作用。
2 变电站监控系统可靠性建模
从电子产品故障机理可以看出电子产品的失效是概率问题,可采用平均无故障时间(MTBF)描述。MTBF是衡量一个电子产品的可靠性指标,单位为“年”。它反映了产品的时间质量,体现产品在规定时间内保持功能的一种能力。
变电站计算机监控系统从板级到装置、从装置到系统的可靠性计算可采用以下方法:
(1)如果两个部件看成串联工作,其中一个发生失效,整个功能就失效了,系统MTBF计算为:
1/MTBFtotal=1/MTBF1+1/MTBF2
(2)对于并联或冗余的结构,虽然一个部件失效,不影响其他部分功能,系统MTBF计算为:
1/MTBFtotal=1/MTBF1+1/MTBF2+(MTTR+0.1)/MTBFdouble/MTBFdouble
双龙变计算机监控系统由多个电子装置组成,3层结构,板件组成装置、装置组成系统。评估的数学模型应该体现3层结构的特点。计算机监控系统功能众多,不能将单一功能的失效定义为监控系统的失效,同时电子产品的特点决定了其在正常运行时也会发生故障,因此不能将监控系统无故障作为系统运行目标。
判断是否结束电子产品或者一个系统的寿命,涉及的因素包括故障率、故障后损失、维护的经济成本、厂家技术支持保障等因素。应将故障率、故障后损失、厂家技术支持保障3个因素抽象化、定性化,或者将不易度量的指标转化为直观可度量的指标,对问题进行合理抽象简化。
在此采用可靠性科学中的重要概念:
表1 电子产品故障位置和故障机理[4]
可用率=无故障时间/(无故障时间+修复时间)
根据不同功能在监控系统中的重要程度,将监控系统的不同装置按不同的可用率要求划分为三大类:可用率要求分别为99.8%(故障17.52 h内进行恢复);98.81%(故障4.3435天内进行恢复);91.67%(故障30.4045天内进行恢复)。
以双龙变运行统计数据和系统装置中逻辑图计算板件可靠性和期望可用率作为基础数据;再通过板件可靠性依次推算装置、小室和系统可靠性,在分析过程中采用从板件到装置、从装置到系统的思路,分三级对可靠性进行分析计算。
3 评估数据的有限性分析
研究过程中收集到的数据包括:计算机监控系统的实际运行缺陷统计及厂家提供的产品全球缺陷统计数据、设计时参考的可靠性数据、根据试验数据进行预计的可靠性数据。数据质量的好坏直接关系到评价结果的准确性。
由于电子产品的故障属于随机事件,从数学角度考虑用概率问题进行判断比较合适。作为概率问题,样本数量的大小关系到是否对问题的本质能真实反映。对计算机监控系统的现场实际运行数据要严格进行统计,包括重新启动后能恢复的缺陷数量,但样本数量较厂商提供所有售出系统的统计数据少,很多故障在特定监控系统中并未发生,以单一监控系统的缺陷数据为基础来估计可靠性显然不合理,只能作为参考。
厂家提供的每年故障返修和修复次数的统计,数据比较全面,覆盖年份比较大,详细描述了同型号产品每年的实际故障情况。但是电子产品故障是随机问题,厂家统计未发生的故障,不代表不会发生,而且各地的运行环境和管理水平不尽相同。因此这类数据适合利用拟合的方法来判断故障属于指数分布、威布尔分布或者泊松分布等数学分布。
厂家通常提供可靠性数据,例如MTBF,包括设计时参考及通过试验估计的数据。这类数据都比较全面,数据涵盖了电子产品的每个组成板子。尤其是通过试验后估计的可靠性数据,很多参考文献和厂家的工程师都指出该数据是对产品可靠性和寿命进行评价的可信度最高的数据。因此,厂家提供的通过试验后估计的可靠性数据MTBF作为全寿命周期管理的基础数据,应较为科学合理。
4 算例及结果
以国内首座综合自动化变电站500 kV双龙变作为评估对象,变电站监控系统的站控层系统采用了南瑞科技的SSJ2000系统。间隔层由西门子LSA678系统组成,站控主单元6MB5510/5515,站级联锁系统8TK1组成站控层,8TK2,I/O单元6MB522/524及同期装置7VK组成间隔层。在500 kV小室、220 kV小室和35 kV小室分别设有间隔层主单元、8TK1/2和6MB监测控制系统。
500 kV双龙变于1997年12月18日正式投入运行,所用8TK和6MB52*/5515等西门子公司产品已于2002年停产。因此迫切需要对双龙变电站的间隔层LSA678系统寿命进行评估。
根据西门子提供的板级MTBF,计算装置的MTBF。以6MB551*主单元可靠性计算为例:FP/LPII,SC/SK,SV,BF板为组成6MB5510/5515装置主单元的基本元件(见图1),其中任何一个板件故障会造成整个主单元故障。RK板是连接基本单元和扩展单元的关键部件,如果RK板故障会造成扩展单元所有的数据无法传输;BA板为命令输出模块,如果BA板故障则该板所有输出命令无法实现;AR板为模拟量采集模块,如果该板件故障则该板所有的模拟量数据无法获得;DE板为状态信号量采集模块,如果该板件故障则该板所有状态数据无法获得。如图1中圆形部件可造成整个装置失效,椭圆形部件可造成部分失效,方框形部件可造成本部件失效。
根据其逻辑结构映射成为串、并联关系,6MB5510(500 kV 1号、2号,220 kV 1号、2号、3号主单元),由 FP,RK,SK,AR,BA,BF,SV,DE板组成,其MTBF值为18.80。6MB5515(500 kV 3号主单元), 由 LPⅡ,RK,SC,AR,BF,SV,DE,BA板组成,其MTBF值为13.47。
图1 6MB5510/5515装置结构
同理依次计算6MB5512(主单元光纤通信箱),其MTBF为980;6MB524(I/O单元(具备闭锁功能),MTBF值为202.53;8TK1(单元控制及闭锁装置),MTBF为88.17。8TK2(中央闭锁单元),MTBF为 94.93;6MB522(I/O 单元),MTBF值为84.34;7VK(同期装置),MTBF185。可靠性从高到低排列为:6MB5512,7KG,7VK,6MB524,8TK1,8TK2,6MB522,8TK1, 8TK2, 6MB522。MTBF值大小可以衡量装置可靠性,6MB5510和6MB5515主单元的MTBF值较低,可靠性也较其他装置低。
根据装置的连接关系,计算的小室可靠性见表2。
表2 小室可靠性分析结果
从小室可靠性来看,各小室的可靠性指标都比较接近,MTBF平均值为15.42。最后计算出整个变电站级的MTBF值为15.21。
5 经济性评估
根据MTBF的定义,当运行时间等于“平均无故障工作时间”,其对应的失效数量约占总数的50%~60%。双龙变投运至今运行时间为14年,2012年将接近MTBF值15.21。因此需加强可靠性较低的重点装置和重点板件的维护(停产前采购相关备品),根据西门子公司提供的产品报价,计算出维持正常运转至运行到2013年总成本为174.8万元。预计双龙变自动化系统整体改造成本约1 800万元,可正常运行12年,年平均折旧费用约150万,2013年维护成本174.8万元超过了折旧费用。从经济性及安全角度考虑,建议从2012年开始进行监控系统的更新改造,以确保变电站的安全运行。
6 结语
以500 kV变电站的计算机监控系统为研究对象,提出了一种变电站计算机监控系统寿命的评估方法,该方法为变电站计算机监控系统的全寿命周期管理提供了一种新的思路。
[1]卢昆祥.电子产品可靠性测试[M].天津:天津科学技术出版社,1987.
[2]CHEN ZEHUA,ZHENG HURONG.Lifetime distribution based degradation analysis[J].IEEE Transactions on Reliability,2005,54(1):3-10.
[3]J AYARAM J S R,GIRISH T.Reliability prediction through degradation data modeling using a quasi likeli hood approach[C]//Proceedings Annual Reliability and Maintainability Symposium.New York:Institute of Electrical and Electronics Engineers,2005.
[4]XU DI,ZHAO WENBIAO.Reliability prediction using multivariate degradation data[C]//Proceedings Annual Reliability and Maintainability Symposium.New York:Institute of Electrical and Electronics Engineers,2005.
[5]VLADIMIR CRK.Reliability assessment from degradation data[C]//Proceedings Annual Reliability and Maintainability Symposium.New York:Institute of Electrical and Electronics Engineers,2000.
[6]姚立真.可靠性物理[M].北京:电子工业出版社,2004.
[7]峁诗松,王玲玲.加速寿命试验[M].北京:科学出版社,1997.