高校数据中心机房绿色运维服务的实践探索
2023-11-28许熠堃谭欣晨
许熠堃 谭欣晨
高校数据中心机房绿色运维服务的实践探索
许熠堃 谭欣晨
[厦门大学]
近年来,伴随5G、AI等新技术的兴盛,高校数据中心的发展按下了加速键,早期建设的数据中心机房日益不再符合新形势下绿色低碳、可持续发展的要求,需要借助节能改造实现集约化、高能效转变。文章以某高校绿色机房运营保障服务项目为例,在实现“双碳”目标背景下,探讨如何通过采用委托运维方式进行节能改造,降低数据中心机房运维成本,实现绿色发展。
数据中心机房;运维管理;节能
高校数据中心机房集成了信息化运算、数据存储和网络通信等软硬件设备设施,为高校提供了一个高性能、可靠的信息应用环境,其基础设施(包括供电、制冷、不间断电源、空调等系统)的安全、平稳运行是保障业务系统持续运行的必要条件。近年来,伴随高校教学科研活动的开展,大数据、云计算、物联网、人工智能等新技术的深入应用,机房设备数量不断扩增,数据中心机房体量越来越大,能源消耗也随之增长。在落实国家“双碳”战略,推进绿色低碳转型的大背景下,高校作为碳减排、碳零排关键技术研究和科技创新的主力军,应当通过数据中心机房绿色智慧运维,加强在能源的绿色开发、低碳利用、减污降碳等方面的应用,助力“双碳”目标的实现。
一、推动数据中心机房绿色发展的重要意义
党的二十大报告中明确提出,实现高质量发展是中国式现代化的本质要求之一,高质量发展是全面建设社会主义现代化国家的首要任务。实现高质量发展必须要推动经济社会发展绿色化、低碳化,必须站在人与自然和谐共生的高度谋划,加快发展方式绿色转型。2023年2月,中共中央、国务院印发的《数字中国建设整体布局规划》指出要加快数字化绿色化协同转型,建设绿色智慧的数字生态文明。各类意见及方案的提出,为落实“双碳”目标指明了政策方向,同时也为数字化引领绿色发展建设擘画了蓝图。
数据中心作为数据处理所需算力的载体,已成为我国数字化转型发展的关键信息基础设施和重要数字战略资源,同时也已成为我国主要的碳排放源之一。国际环境保护组织绿色和平与工业和信息化部电子第五研究所计量检测中心(广州赛宝计量检测中心)联合发布的《中国数字基建的脱碳之路:数据中心与5G减碳潜力与挑战(2020-2035)》预测:到2035年,中国数据中心和5G总用电量约是2020年的2.5-3倍,预计将达6951-7820亿千瓦时,将占中国全社会用电量5-7%。同时,2035年中国数据中心和5G的碳排放总量将达2.3-3.1亿吨,约占中国碳排放量的2-4%,其中数据中心的碳排放将比2020年增长最高103%。面对碳排放迅速增长的预期,数据中心提升能效、降低碳排放并全面向可再生能源转型的进程刻不容缓,绿色低碳已成为数据中心建设的应有之义。
二、绿色运维是实现数据中心绿色发展的有效途径
高校数据中心机房除了必不可少的IT负载(本文未涉及数据生产设备,故不做相关论述),还包括为了支持这些IT设备正常运行,需要在数据中心机房中配套的UPS供电系统、空调系统和照明系统等动力及运行环境保障系统。机房运行环境所需的功耗约为IT设备功耗的1-1.8倍左右,以一个典型的数据中心为例,在初期建设时,制冷设备一般仅占投资额的6%,但均为24小时运行,其后期的电费支出却能占到整个数据中心电费支出的38%,是不折不扣的能耗之源。[1]
信息化技术的迅猛发展,对数据中心机房的服务保障提出了更高的要求。运维保障服务不同于“传统建设+维保服务”,它是以按需扩容模块化的形式对机房的基础建设与保障提供服务,不对机房的正常运行造成影响。运维保障服务模式的前期建设及后期维护管理全部由服务商提供,使用方不再需要承担日常巡查、值班值守、专业学习、备件备品储备、建立机房紧急事件相应机制等繁琐的内部管理职责,仅需在每年或者季度末按照约定的考核办法对服务商进行绩效评价,根据整体机房保障面积或负载末端接入的用电量支付对应的托管服务费。通过购买安全保障等级享受相应的保障服务,可以大大节约基础运行环境建设支出和人员管理费用。数据中心机房绿色运维服务保障,“绿色”体现在整体的设计规划以及机房空调、UPS、服务器等IT设备、管理软件等软硬件配置上,即“严格适配原则,少消耗即少排放”。
在已经颁布的数据中心性能指标中最常见的是电能使用效率PUE,在我国,PUE不但是数据中心研究、设计、设备制造、建设和运维人员最为熟悉的数据中心能源效率指标,也是政府评价数据中心工程性能的主要指标。[2]PUE是数据中心的总体能耗较IT设备实际使用能耗的倍率,该值越小越好。PUE指标对数据中心机房的真正作用,并不仅仅体现在直接考量机房是否节能,更为重要的是体现机房管理者对机房节能的管理水平,如何让数据中心机房实现高效、清洁、集约、循环的绿色发展。数据中心机房容量变化很难做太长时间的估算,冗余过多是浪费,估算不足导致机房重建浪费更大,采用运维保障服务有效解决了机房建设初期规划与实际未来发展的矛盾,同时针对不用机房制定不同的实施方案,通过绩效考核有效实现能效管理的目标。运维保障服务通过对机房全生命周期的管理,采用持续优化资源配置、机房改造扩容、集约化的管理方式、标准化的结构体系,达到各系统之间的均衡,是实现数据中心机房绿色发展的有效手段。
三、高校数据中心机房绿色运营保障服务模式应用案例
X大学机房总面积为430㎡,划分为3个功能区:中心机房230㎡,托管机房120㎡,UPS配电间80㎡,采用机房硬环境运维保障服务的模式:即学校仅提供机房场地、电力及水源的环境条件,由服务商出资建设机房硬环境,并提供持续的运维管理,保障各项机房运行环境指标能持续达到双方约定要求,学校根据考核情况按年度支付服务商运维费用,项目经过10年运维管理,机房的“绿色”成效得到充分的贯彻与体现。
(一)经济效益明显
从实际使用情况看,机房10年期间主要有三次较大扩容,分别在2012年、2016年、2019年,UPS主机容量经历了2*60KVA、2*160KVA、2*300KVA(UPS自身消耗功率按照10%计算),三个阶段,机房空调系统制冷量也从120KW(用电功率40KW)到240KW(用电功率80KW)再到350KW(用电功率117KW)同步进行扩容。(备注: IT设备负载根据学校的需求逐步增加因此不计入本次能耗核算) 下面将按照这三个阶段对比“传统一次性建设”和“运维保障服务”,从支持机房硬环境的设备(UPS、空调、辅助用电)进行能耗统计分析对比来看(能耗计算公式:能耗=用电设备功率KW*24小时*365天):
1.传统一次性建设模式
传统一次性建设按照UPS系统:2*300KVA 空调系统总制冷量:350KW一次性建设到位,该模式能耗情况详见表1。
表1 传统一次性建设模式设备能耗
2.运维保障服务模式
按需扩容:2012年-2016年-2019年,UPS主机容量从2*60KVA-2*160KVA-2*300KVA(UPS自身消耗功率按照10%计算)三个阶段,机房空调系统制冷量从120KW(用电功率40KW)-240KW(用电功率80KW)-350KW(用电功率117KW)同步进行扩容,该模式能耗情况详见表2。
表2 运维保障服务模式设备能耗
通过以上数据对比可得出:采用运维保障服务的模式较传统一次性建设在机房能耗上可节省6570000KWH,根据当地居民生活用电单价0.5483元每度电(KWH),从经济效率上可节能超过360万元。从人力成本效益方面,若采用传统建设及自营,机房管理者需要具备UPS、空调、综合布线、消防、防雷等不同专业的技术能力,至少需要2个专业管理人员,按照2012年-2022年10年平均社评工资:6439元/人,2人*120个月*6439元,采用运维模式,10年间人力成本可节省约154万元。按照10年的对比方案,在投入资金成本和人力成本可节约500多万元。
(二)节能效果显著
对于机房硬环境来说,本项目不涉及IT负载设备,对能耗管理主要是针对空调、UPS等其他要素,对此,本项目在外围护结构(密闭、遮阳、保温等)、设备布局规划、制冷架构、供电布局等方面进行针对性优化。
1.防护结构设计
机房采用密闭设计进行建设,机房内部形成一个正压环境,机房外部为负压环境,保持机房洁净度和恒温恒湿。机房墙体采用防火岩棉彩钢板敷设,岩棉采用具有防火、保温、屏蔽、降噪等作用;机房顶部采用微孔铝扣板敷设,具有阻燃、防尘、自我清洁降噪作用。
2.设备布局规划
机房机柜采用“面对面”+“冷通道密封”形成一个冷通道微模块,将整体机房划分为若干个独立的机房微生态模块,分离且共生。根据硬件类型、软件类型要求每个微模块内部通过灵活调整仅满足当前设备运行配电功率和制冷量,避免造成无效资源堆砌导致浪费,实现能效比的最大化。通过预制+管理+扩容的方式配置不同应用场景、不同区域机房环境各系统独立运行策略,在满足设备运行要求的同时,实现了资源的合理优化配置,减低了设备能耗。
3.制冷架构设计
机房空调外机设计因地制宜,综合考虑遮阳与周围环境协调统一,选择在机房外部绿化区域放置空调外机,此区域为回字形绿化区域,四周群楼有效解决了太阳上午东晒和下午西晒的问题,同时高耸的棕榈树形成一道天然屏障阻挡了中午太阳直射。很大程度上提高了外机的散热及制冷效率,并延长了使用寿命。采机房用风道精准送风与共用冗余双管齐下,在冷通道微模块的基础上进一步减少能耗的损失并提高了空调设备的利用率,同时采用封闭冷通道对机房的冷、热风进行隔离,通过对气流的组织管理,有效地提高了空调制冷效率。根据测算,封闭冷通道使能源节约达到30%以上。
4.供电设备
整体机房供配电及UPS电源连续系统采用A级机房容错的方式,两套完全独立的供电系统确保了机房高可用性和高可靠性。“按需扩容”是运维保障服务主要特色之一,最大程度实现了机房节能降耗,解决了机房初期小负载与未来大规划之间的矛盾。运维服务商按照机房实际负载配置对应的动力设备功率与数量,随着机房信息化业务的发展,采用按需扩容的方式提供运维保障服务。
采用机房运维保障服务通过模块化的建设以及对应配套适合的动力设备,不会因过量的冗余,导致无效的能耗损失。实践证明,采用机房运维保障服务,无需采用任何新技术节能措施时,10年间平均PUE值可简单地达到1.65以下。经过进一步优化,现阶段,该机房的PUE指标在1.4左右,低于全国超大型数据中心平均PUE值(1.46),逐步向1.3以下的目标迈进。
四、结语
我国数字经济发展进入新时代,数字中国建设如火如荼。在推进产业数字化转型过程中,绿色低碳转型也是不可忽视的重要一环。通过对机房的运行管理实现节能降碳的新模式,可以为高校提升其信息化基础设施并使其管理方式更灵活化、多样化,更为重要的是,通过绿色运维保障服务的示范带动作用,推动传统产业转型升级和创新发展,助力实现碳达峰碳中和目标任务。
[1]海阳. 为机房贴上节能标[J].中国计算机用户,2005(21):41.
[2]殷平.数据中心研究(4):关键性能指标、电能使用效率PUE和EEUE[J].暖通空调, 2017,47(04): 36-45.
(责任编辑:赵鹏程)