数据中心基础设施成本模型架构及关键指标敏感性分析
2021-03-26李勇
李 勇
(腾讯科技(深圳)有限公司,深圳 518057)
0 前言
数据中心作为互联网行业的基础设施,如何全面地评估其基础设施的成本,一直是行业内比较关注的问题。互联网企业、第三方数据中心供应商及资本方受自身利益的影响,对其成本的评估角度各有不同。即使是同一家公司,其不同的内部团队对于数据中心预期成本和收益的评估,可能也会存在比较大的差异。以技术团队和财务团队为例,主要是由于技术团队一般缺乏对主要经济参数的敏感度,同时财务团队也可能缺乏对关键技术参数的敏感度导致的,即不同团队对同一项目的评估,在最初的评估指标体系的建立上就存在着关键偏差。此外,对数据中心成本的理解,一般也会局限在其建设成本(CAPEX);部分专业人员也可能进一步理解为建设成本(CAPEX)和运营成本(OPEX)的总和。本文从使用者的角度,全面的去看待这个问题。
数据中心行业有别于传统的房地产和IT行业,是具有房地产属性的IT行业。在其项目建设过程中更多显现的是房地产属性。而在其前期选址评估、政府审批、后续运营以及收益等方面更多的是受IT行业相关资源和政策的影响。基于数据中心的这种属性,需要将其技术参数与经济参数同等对待,以技术经济分析的方法论去构建数据中心基础设施成本评估模型会更为合理。
1 数据中心基础设施技术经济分析
技术经济分析方法一般分为静态方法和动态方法,其中静态评价方法主要包括静态投资回收期法、投资效果系数法和追加投资回收期法;动态评价方法主要包括净现值法、内部收益率法和动态投资回收期法。
本文主要采用动态评价方法中的内部收益率法,同时参照动态投资回收期法以及静态评价的方法论,构建成本模型架构。其中静态评价方法主要用于分析不同阶段数据中心的总拥有成本(Total Cost of Ownership,TCO),以便于指导不同阶段的数据中心资源战略。
结合数据中心的特点,先对部分关键评估指标做一下简明扼要的说明。
(1)动态回收期:考虑资金折现后的项目投资回收期。
(2)总拥有成本:在一定时间范围内所拥有的直接和间接总成本,利于进行结算等。
(3)净现值(NPV):特定项目未来现金流入与流出的现值之间的差额,NPV>0,理论上项目可行。
(4)内部收益率(IRR):净现值为零的折现率,大于资本成本率(或贷款利率),理论上项目可行。
(5)息税折旧摊销前利润率(EBITDA):未计利息、税项、折旧及摊销前的利润率,该指标越高说明企业销售收入的盈利能力以及回收折旧和摊销的能力越强。
(6)设计PUE值:项目设计标定的数据中心PUE值,即数据中心设计总能耗量(总功率)与IT设计用能量(IT功率)的比值;该值理论上≥1,同时越接近于1,说明能源用于IT设备的比例越高,数据中心系统有效性越高,即有效产出越高。
(7)运营PUE值:运营阶段的PUE值,即运营阶段数据中心总能耗与IT能耗的比值,体现数据中心的能源利用效率。
(8)IT负载率:实际使用IT功率与设计IT功率的比值。
(9)外市电负载率:数据中心实际使用外电容量与设计外电总容量比值。
(10)业务上架进度:机架空间的使用进度或使用计划。
(11)机柜上架率:机架的空间利用率。
根据数据中心的特点,笔者将输入边界条件分为三大类,即技术、财务以及建设运营关键参数;技术经济评估指标主要采用内部收益率、净现值、动态回收期、息税折旧摊销前利润率以及总拥有成本。成本模型总架构如图1所示。
图1 数据中心基础设施成本模型架构图
图1中所示技术、财务以及建设运营关键参数均为该模型的输入边界条件,均可根据实际项目情况调整。通过项目计算期内逐年现金流的流入流出,以IRR与NPV作为主要的经济评估指标,同时参考动态回收期与TCO作为主要的参考指标(该模型涉及公式较多,在这里不逐一列举了)。笔者将该成本模型架构梳理成思维导图(图2),即数据中心基础设施成本模型定量关键指标体系。
图2 IDC成本模型思维导图(关键指标体系)
以上的模型架构是基于各个子架构逐级建立,以图2中财务参数中的“单位IT功率建造单价” “资本成本”为例,简述其构建原理。
(1)单位IT功率建造单价的关键指标
如图3所示,单位IT供建造单价由基础设施总建造成本和总IT功率产出计算而来。其中总建造成本包括前期工程、建筑工程、设备采购、施工安装、市政配套以及其他不可预见费用组成。而总IT功率产出受总的外市电容量、机房空间面积以及项目的设计效率(设计PUE)等关键条件限制。
图3 单位IT功率造价思维导图
这里的外市电容量为限制性资源,与当地的电网架构、变电站布局、市政管网布局、变电站本身电压等级及高压侧机电架构密切相关。这里主要考量公司总体资源规划能力以及对国家及地方政策的理解与协调能力,是IDC类公司的核心竞争力之一。
总建筑面积受限于土地本身的规划设计条件(如容积率、绿地率、限高等),以及其他一些规划限制条件(如文化保护建筑区域、航空港区等区域的限制高度)。同时机房建筑面积又受到单栋建筑的体量、建筑内部的空间布局、单机柜的规格以及建筑结构承重等相关条件的限制。IT机房产出是评价数据中心空间设计效率优劣的关键指标,主要考察IDC公司对政府规划部门相关规划政策与标准的精确理解,设计团队建筑、结构、机电专业的协作能力,一定程度上体现了公司的综合技术能力。
而设计PUE值,主要受当地的设计温度、空调系统架构、电力系统架构的影响,主要体现了数据中心系统的设计效率,是评价数据中心系统架构优劣的关键指标,若与IT机房产出指标同时兼顾,可以有效考量IDC公司的综合技术能力,包括选址评估、基础机电设计、施工等,是IDC公司的核心技术能力的直观体现。
降低设备采购成本可以有效的降低数据中心总建设成本。目前市场上多以集采的方式进一步降低数据中心基础设施机电成本,同时降低公司在设备方面的库存。对于设备单价与库存量两方面的成本关系,需要在建立数据中心成本模型的基础上去分析评估,以确定设备成本与库存的最优平衡点。进一步而言,数据中心本身其实也是一个供应链和库存的问题,在建立数据中心的成本评估模型之后,可以进一步在这方面优化,以指引公司的决策。
(2)资本成本的关键参数
资本成本主要的影响因素如图4所示。资本成本是公司取得资本使用权的代价,一般分为债务成本、股票成本、留存收益及其他。债务成本主要包括银行借款、公司长期债券以及其他类型的债务;股票成本主要分为优先股和普通股资本成本。而留存收益一般可以按照股票普通股资本成本计算(无筹资费用)。关于以上几类资本成本的计算方法比较成熟,本文不在赘述。
图4 资本成本思维导图
在这里解释一下资本成本与几个关键边界条件的关系:1)企业所得税对资本成本的折减,这是由于利息可以免税,相当于政府实际上支付了部分债务成本,故企业所得税在一定程度上降低了公司的资本成本。2)无风险利率(一般参考银行长期存款利率或者政府长期债券利率),其一般作为资本成本稳定收益的基准,对公司资本成本的影响较大。3)风险溢价,一般分为经营风险溢价和财务风险溢价,如果公司未来的不确定性高,负债率高,收益变化大,那投资人要求的报酬率也就越高,相应公司的资本成本就越高。
这些影响因素只是资本成本的一部分,一般公司到一定规模后,会设置专业的资金团队去寻找最优的资金来源,以保证公司业务发展的需求。
以上对IDC成本模型的架构以及其中的两个关键项做了示例分析。与公司的实际运营相结合,模型中的各项指标,均可以进一步深化,为各个职能部门的工作方向提供决策参考。
下面基于以上模型对数据中心基础设施几个关键指标进行敏感性分析,来分析下各种数据对数据中心成本的影响权重。
2 关键指标敏感性分析
通过单独调整表1中的关键参数,可以看到其对项目IRR的影响。由于各公司情况不同,具体项目情况也有所区别,所以大家计算的准确数据会有所不同,但各个关键参数之间的横向对比是可以借鉴的,权重顺序差别不大。
关键参数敏感性分析 表1
根据以上敏感性分析结果可以发现,在对应表中参数变化幅度的情况下,对数据中心影响最大的是空置,即投资的有效性。其次是销售价格,再次是单位IT功率的造价,数据中心负载率和业务规划进度也影响很大。反而经常关注的设计PUE值等,并没有想象中的重要。同时可以发现,数据中心的更新成本,即变更,对数据中心的影响需要关注。
以上是根据敏感性分析,得出的部分数据中心规划建议,在建立对应项目的IDC成本模型后,各种关键参数的变换,均可以得到定量的经济评估结果,可以为公司决策提供有效依据。
那对于前文中提到的TCO,又是如何来影响数据中心决策的呢?
3 TCO对数据中心资源储备决策支持示例
对于TCO的分析,仅针对数据中心基础设施部分,不考虑网络带宽及服务器成本。参见图5~6的数据中心TCO算例(本文仅列出了百分比供分析)。
图5 数据中心95%上架率,80%IT负载率下的TCO算例
图6 数据中心50%上架率,42%IT负载率下的TCO算例
首先看图5,在达到设计工况的情况下,数据中心的TCO比例中最大的是电费,因此在数据中心选址和日常运营中,需要格外关注电力销售价格、当地电力市场的变化以及当地政府关于用电类型变更的规定,以有效降低数据中心TCO。
其次,通过以上的算例可以看到,在数据中心基础设施的TCO中,土地摊分占总TCO比例为0.19%,IDC机楼的折旧占比为1.22%,变电站折旧占比在1.76%,而TCO占比最高的两项成本为基础设施机电折旧16.9%,电费60.46%,当然,在不同的边界条件下,以上几项的比例会有所不同,但是权重顺序基本不会有大的改变。
根据以上的权重顺序,在储备数据中心基础设施资源的最优策略为:储备周期较长的土地资源、IDC机楼及变电站资源。具体顺序为:(1)优先购买土地并启动变电站相关的申报流程(110kV及以上电压等级的变电站受上级电网规划及审批流程时间制约,到位时间较长,会严重制约数据中心的交付使用);(2)将IDC机楼的建设前置(建设审批手续繁琐,基础工程可能受地质条件制约,周期较长);(3)在明确一定比例的预定机柜意向后,启动成本占比较高,但建设周期较为确定的数据中心机电设施建设。
最后,将图5与图6进行对比,两个算例的区别在于对数据中心的利用率,即上架率和负载率。可以看到在低负载情况下,电费占比降低,机电折旧占比增加,说明投资有效性降低。因此在运营过程中,当IT负载率较低时(一般在30%以下),重点关注机架上架情况,提高投资的有效性;当达到较高IT负载率(一般超过50%以上),重点关注运营PUE与设计PUE的差距,降低电费成本。当然,不同的系统设计可能会导致以上两种情况的阈值不同,但电费成本的控制逻辑无差别。部分IT负载下的运营PUE与设计值的偏差也是评价系统设计优劣的重要参考指标。
以上的分析是在相同的电度电价的情况下进行,在电价调整后,需要重新进行计算。
4 展望及总结
作为互联网公司从业者笔者认为,互联网公司更加倾向使用TCO来评估数据中基础设施心的成本情况,这主要是有利于业务侧的成本核算。同时基于以上技术分析构建的数据中心基础设施成本模型,可以向更加宏观的层面扩展,向上加入服务器和网络带宽的成本,从而构建全面的互联网公司基础设施成本模型。当然,在打通业务线的基础设施成本核算(如CPU/GPU算力、存储容量)、供应链采购成本(如采购系统合同额数据)等各个环节的情况下,可以进一步扩展,构建从业务侧算力、存储等IT资源需求到数据中心基础设施、网络带宽、服务器等全要素、全周期的技术经济评估模型。从而在保证公司业务发展需求的情况下,更为有效的优化公司基础设施资源储备,以最低的成本锁定公司发展所需的资源,有的放矢的降低互联网公司基础设施成本。