数据中心供电系统可靠度计算与分析
2020-10-26谢拥华
[谢拥华]
1 数据中心供电系统概述
近年来,随着我国社会信息化水平的不断提高,数据中心产业迎来了高速发展。据统计,2019年,中国IDC业务市场规模达到了1562.5亿元,居世界第二位,同比增长27.2%。而随着5G、工业互联网和人工智能等信息技术逐渐应用于社会各行业领域,全社会对数据中心的需求将进一步增大。2020年突如其来的新冠疫情,也迫使全社会采用科技防疫、远程办公、远程教育、网络购物等,培育了大量的新兴客户需求,必将带动IDC市场业务持续增长。
数据中心在社会中的地位越来越重要,而数据中心要想稳定可靠地运行,作为其基础设施的供电系统,其可靠性非常关键。根据国家标准GB 50174-2017《数据中心设计规范》的要求,A级数据中心的基础设施宜按容错系统配置。所谓容错,是指具有两套或两套以上系统,在同一时刻,至少有一套系统在正常工作。按容错系统配置的基础设施,在经受住一次严重的突发设备故障或人为操作失误后,仍能满足电子信息设备正常运行的基本需求。
毫无疑问,采用容错配置,可以提高系统可靠性。那如何评价数据中心供电系统的整体可靠性呢?我们知道,数据中心的供电系统一般包括高压配电、变压器、低压配电、柴油发电机组、交流不间断电源(UPS)、蓄电池组、列头柜配电设备等。系统的总体可靠性与上述各设备的可靠性息息相关,也与各设备之间的连接关系有关。
2 可靠度指标与模型
2.1 可靠性定义及指标
可靠性是指产品在规定条件下和规定时间内完成规定功能的能力,可以用一些定量的特征量指标来表征系统的可靠性,实际中常用的指标主要有平均故障间隔时间(MTBF)和可靠度。
(1)平均故障间隔时间(MTBF)
平均故障间隔时间是指可修复产品的两次故障间工作时间的平均值。在YD/T 1051-2018 《通信局(站)电源系统总技术要求》和各种通信电源设备行业标准中,对大部分常用通信电源设备的MTBF值提出了明确的要求,如表1所示。
表1 常见通信电源设备的可靠性要求
(2)可靠度R(t)
可靠度是指产品在规定条件下和规定时间(或操作次数)内完成规定功能的概率。可靠度是时间的函数,一般用R(t)表示。简单来说,可靠度是多次试验中该事件发生的频率估计,是可靠性理论最基本的一个指标。
电气产品的失效分布类型一般为单参数指数分布。
典型指数分布类型的可靠度函数R(t)为:
从公式(1),可以看出:
(a)、设备的可靠度随着MTBF的提高而增大。
(b)、在MTBF不变的前提下,可靠度会随着时间的增长而呈指数下降,因此,在设备运行的后期应加强维护力度。
为便于对比分析,本文统一取1年时的可靠度进行计算,即t=8760 h。例如,通信行业标准YD/T 585-2010《通信用配电设备》中规定,交流配电设备的MTBF≥105 h,则交流配电屏在1年时的可靠度为:R(8760 h)=91.61%。
另外,大型数据中心的市电一般为一类市电,有两路10 kV高压引入,任何一路高压市电均可以满足机房所有负荷的容量要求。根据YD/T 1051-2018《通信局(站)电源系统总技术要求》的规定,一类市电的可靠度取值为99.96%。
2.2 基本的可靠性分析模型
根据设备间的逻辑关系,可靠性模型可以分成3种基本类型:串联系统、并联系统、混合系统。其中,混合系统可以最终分解成串联系统和并联系统。
(1)串联系统
假定一个系统由n个设备组成,只要有一个设备故障,系统就故障,我们则称之为串联系统。串联系统可表示为:A1∩A2∩……∩An。如图1所示。
图1 串联系统的可靠性框图
显然,串联系统的总可靠度Rs(t)为:
由于任一设备的可靠度均小于1,所以串联系统的可靠度小于任一组件的可靠度,而且串联的设备越多,系统总可靠度越低,因此,通过简化系统结构、减少串联级数,可减少单点故障点,从而有效提高系统可靠度。
在串联系统中,增加原可靠度最低设备的可靠度,对系统可靠度的改善最明显。
(2)并联系统
假定一个系统由n个设备组成,只要有一个设备正常,系统就正常,称之为并联系统,并联系统可表示为:A1∪A2∪……∪An。如图2所示。
图2 并联系统的可靠性框图
可以推导出,并联系统的总可靠度Rs(t)和MTBFs为:
(3)混合系统
实际的系统通常是由并联系统和串联系统组合成的混合系统,如图3所示。
图3 混合系统的可靠性框图
在分析中,可以将图3中的系统进行简化,如图4所示。
图4 简化框图1
图5 简化框图2
通过上述方法,一般总可以将一个复杂系统简化为一个简单的串联或并联系统,再根据前面的公式就可推导出其总可靠度。
3 数据中心供电系统可靠度计算
3.1 数据中心供电系统典型方案(一)
当前,中大型数据中心几乎均按A级数据中心设计建设,根据规范要求,A级数据中心的供电系统应满足容错要求,典型的数据中心供电系统框图如图6所示。
图6 数据中心供电系统典型方案(一)
图6中,市电为一类市电,有两路10 kV高压引入,任何一路高压市电均可以满足机房所有负荷的容量要求,如前文所述,其可靠度根据行业规范取值为99.96%。
柴油发电机组为低压380 V柴油发电机组,其每年运行时间为市电停电的时间。根据YD/T 1051-2018《通信局(站)电源系统总技术要求》的规定,其每年运行时间为0.74次×3.37 h=2.49 h,而柴油发电机组的MTBF为800 h。即在可靠度计算时,t取2.49 h,MTBF取800 h。
UPS为供电系统中的关键设备,大型数据中心的UPS系统一般采用2 N双总线供电方式,即2套,每套为3台400 kVA或500 kVA的高频UPS并联组成,提供1 200 kVA或1 500 kVA的总容量,注意,要达到该总容量,必须3台UPS都正常运行,所以,在可靠度计算时,3台UPS应按串联系统计算。每台UPS按配置1组480 V的蓄电池组考虑,该组蓄电池与UPS的整流器部分属于并联关系,而480 V蓄电池组的可靠性可以按10组48 V蓄电池组串联计算得出。UPS的整流器参照通信行业标准YD/T 731-2018《通信用48 V整流器》的规定,可靠性MTBF≥105h,UPS的逆变器参照通信行业标准YD/T 777-2006《通信用逆变设备》的规定,可靠性MTBF≥105h。
将供电系统方案方框图绘制成可靠性分析模型,如图7所示。
图7 数据中心供电系统典型方案(一)可靠性分析模型
根据表1中各设备的可靠性要求,可以计算出上述典型方案的总可靠度,如表2所示。
表2 典型方案(一)的可靠度
从表2中,可以看出,可靠度最低的环节在于UPS的逆变器。
3.2 采用高压油机的数据中心供电系统
当前,有很多数据中心采用了10 kV高压柴油发电机组,供电系统框图如图8所示。
图8的方案(二)和方案(一)相比,除了采用了高压油机,其余方案完全一样。经过计算得出,系统可靠性如表3所示。
图8 数据中心供电系统典型方案(二)
由表3可以看出,系统总可靠度有所下降。可见,虽然高压油机和低压油机都是并联在供电系统中,且高压油机的可靠度和低压油机的可靠度数值相同,但由于低压油机更靠近用电设备,其对系统总可靠度的提升作用更大。
表3 典型方案(二)的可靠度
3.3 采用1路市电+1路UPS混合供电方式
出于节约投资和节能的考虑,采用1路市电+1路UPS的供电方式也应用得越来越多。根据国家标准GB50174-2017《数据中心设计规范》的要求,采用这种方式,需要UPS为N+1并联冗余运行方式。供电系统方案图如图9所示。
图9 数据中心供电系统典型方案(三)
图9中,供电系统采用低压油机,UPS系统为3台UPS组成2+1并联冗余系统,即3台UPS中只需要2台UPS运行正常,在进行可靠度计计算时,3台整流器和3台逆变器均为只需要2台正常运行即可。
可靠度计算结果如表4所示。
表4 典型方案(三)的可靠度
从表4可以看出,由于UPS系统为2+1并联冗余系统,其自身的可靠度有了很大的提高,同时带了整体可靠度的提高,系统总可靠度达96.51%。
和表2相比,通过对UPS设备进行并联冗余,原可靠度最低的UPS逆变器的可靠度得到了大幅的提高,这也大大地提高了系统的总可靠度。
3.4 采用1路市电+1路高压直流的混合供电方式
高压直流系统在数据中心的应用越来越多,也是数据中心供电系统的常见方案,一般来说,会采用1路市电+1路高压直流的方案。供电系统方案图如图10所示。
图10 数据中心供电系统典型方案(四)
图10中,供电系统采用低压油机,高压直流电源配置2组240 V的蓄电池组。系统可靠度计算结果如表5所示。
表5 典型方案(四)的可靠度
从表5可以看出,系统总可靠度提升至了98.33%,提升的主要原因是高压直流电源在直流输出屏并联了2组蓄电池组,且该两组蓄电池已经非常接近用电设备,因此,大大提升了系统可靠性。
4 结论
综上所述,根据对数据中心中常见的各种供电方案进行的可靠度计算,经过分析,我们可以得出如下结论。
(1)柴油发电机组作为一种后备电源,它与市电供电形成并联关系,可以提高系统可靠性。
(2)低压柴油发电机组相对于高压柴油发电机组更靠近用电设备,因此,采用低压发电机组的系统总可靠性更高。
(3)采用混合供电方式,其中1路为市电供电,由于供电环节减少,减少了单点故障点,故可以提升系统总可靠度。
(4)采用1路市电+1路N+1并联冗余UPS系统供电方式时,N+1并联冗余提升了逆变器的可靠度,相对于采用2N UPS供电方式,系统的总可靠性更高。
(5)采用高压直流供电方式,由于有两组蓄电池并联在直流输出端,且十分接近用电设备,极大地提升了系统可靠性。