互联网数据中心业务机架需求预测方法研究
2015-05-11孙丽玫SunLimei
孙丽玫/Sun Limei
(中国移动通信集团设计院有限公司 北京100080)
1 引言
随着国家对战略性新兴产业的重视以及对云计算、下一代网络的积极推进,互联网数据中心(Internet Data Center,IDC)市场迎来了前所未有的发展机遇。
2008~2014年,中国IDC市场的规模增长了6倍,年均增长率超过35%。基于大数据、移动互联网的应用发展迅速,SNS、电子商务、视频等业务带来的数据大规模爆发性增长给IDC市场带来了持续的需求。2008~2014年我国IDC行业市场规模情况统计如图1所示。
2014年,中国IDC市场规模达372亿元人民币,同比增长41.8%,增长显著。可以预见的是,市场进入了基础建设成熟发展的阶段,而IDC行业经历了转型、整合、多元化发展阶段后,逐渐变得规范、有序。
目前IDC整体市场中,基础业务依然占据主要地位,IDC基础设施建设正在全国各地掀起新的高潮。建设多大的数据中心才能适应公司业务发展和区域IDC业务发展的需求,是困扰许多IDC企业的问题之一。因此,预测互联网数据中心的建设规模,是工程建设首要解决的问题。
本文将确定适应业务发展的IDC主机房预测方法,旨在为相关IDC咨询设计项目提供参考。
2 预测方法的原则及常用预测方法
2.1 预测方法的原则
随着通信业务的快速发展和业务格局的不断变化,数据中心面积需求预测环境越来越复杂,需要考虑的因素越来越多,同时,预测的要求在不断提高,预测难度也在不断加大。在复杂的环境下,做好预测工作,需遵循以下基本原则。
(1)连贯性原则
可以说,任何一种事物的发展预期都与过去的行为存在联系,过去的行为不仅影响现在,还会影响未来。事物发展趋势的特征(如发展方向、发展速度、变化周期等)在一段时间内呈现延续性。
(2)类推原则
类推原则是指根据不同事物之间的相似性预测未来。可以根据其他地区曾经发生过的事件进行类推,也可以根据历史上曾经发生过的时间类推当前或未来,还可以根据局部类推总体。利用类推原则进行预测,首要条件是两种事物之间的发展变化具有类似性,否则就不能进行类推。
(3)相关原则
世界上各种事物之间都存在着直接或间接的联系,任何事物的发展变化都不是孤立的,都与其他事物的发展存在或大或小的相互影响、相互制约、相互促进的关系,如果认识到预测对象与相关因素确定的关系,就可以利用该关系中相关因素的变化进行预测。相关性的表现有多种形式,其中最重要、应用最广的是因果关系分析。因果关系是事物之间普遍联系和相互作用的形式之一,因为任何一个事物的发展变化都是有原因的。
2.2 常用预测方法
由于事物发展具有内在规律性、连续性,事物发展与影响因素之间的关联性、事物发展间的相似性等特点的存在,根据预测的一些基本原则,科学的预测一般有以下几种方法。
(1)因果分析法
通过研究事物的形成原因来预测事物未来发展变化的必然结果。经济分析中的投入产出预测法,股票预测中的基本面分析,瑞利分布的多因素分析等都属于此类。
(2)类比分析法
通过对事物间相似条件的分析,根据一事物的发展推断另一事物的发展。经济预测中借鉴经济领先地区所走过的发展道路,在分析两地差异的基础上推断本地的经济发展道路;通过对某种产品在一地的表现推断该产品在其他地区的可能表现等,都利用了类比分析方法。
(3)统计分析法
运用一系列数学方法,通过对事物过去和现在的数据资料进行分析,去伪存真,由表及里,揭示出历史数据背后的必然规律性 (各种时间序列分析、股票预测中的技术面分析等)。
2.3 常用的通信业务量预测方法
鉴于IDC业务与运营商的通信业务联系紧密,可以借鉴主流的通信业务量预测方法作为IDC业务预测的基础。
常用的通信业务量预测方法主要包括基于历史数据拟合的业务量预测方法、基于业务分类的业务量预测方法和基于终端分类的通信业务量预测方法。
(1)基于历史数据拟合的通信业务量预测方法
是采用数学预测的常规做法,利用模型解决预测问题,根据历史业务数据进行回归分析,推演出未来可能的通信业务量。
(2)基于业务分类的通信业务量预测方法
借助对每类业务年增长率预测的手段解决业务总量预测的问题。利用基准年份细分的每类业务数据乘以预测的每类业务的年增长率,得到通信业务的预测结果。
(3)基于终端业务分类的通信业务量预测方法
重点在于对终端进行恰当分类,并根据使用不同终端用户的行为特点收集数据,分别预测未来通信业务量,然后将不同终端的业务量加总。
3 IDC建设规模预测因子的确定
预测方法的适当与否直接影响预测结果的好坏,因此要结合预测对象的特点和预测方法本身的特点,选择适当的预测方法并建立数学模型,来反映预测对象发展的方法。在选用预测方法和建立数学模型前,必须确定影响IDC建设规模需求的主要因素。
在进行IDC机房面积需求预测时,最直接的因素是机房内机架的需求量。在常用的机房面积预测方法中,主要考虑的预测因子有机架数量和单机架综合建筑面积。常用的主机房面积需求计算表达式为
其中,J1表示系统或平台1需要新增的机架数量;J2表示系统或平台2需要新增的机架数量;Jn表示系统或平台n需要新增的机架数量;K表示平均单机架建筑面积。
因此,IDC建设面积需求主要预测因子为业务机架安装数量及平均单机架建筑面积。IDC主机房面积预测的主要因子如图2所示。
IDC业务机架数量与IDC业务发展需求息息相关,机架数量需求是根据业务发展、定位、收入目标等情况,分析需要配置的IT设备机柜数量而确定。
单机架平均综合建筑面积主要由机房平面布局、机架尺寸、机架功率密度、空调末端方式等决定,基本范围为6~9m2/架。
本文主要对IDC主机房业务机架需求预测方法进行研究和分析。
4 IDC业务主机房机架数量预测方法
IDC业务目前处于高速发展期,电信运营商、IDC企业和互联网企业都在进行全国性数据中心的布局和建设。其中,电信运营商和IDC企业建设的数据中心多以出租为主,互联网企业自建的数据中心多以自用为主。
IDC主机房由业务发展情况确定。对于电信运营商和IDC企业而言,IDC业务为集团客户业务,与互联网发展、IDC整体发展环境和企业市场营销策略有密切的关系。由于互联网普及率在国内各地区有较大差距,且IDC业务在全国市场发展不均衡,因此,各企业IDC业务发展策略也不尽相同,对于业务发展的预测方法也不同。
在IDC业务需求预测中,通常需要考虑市场因素,包括企业发展战略、营销策略、区域市场情况等,同时还需要考虑供给因素,包括网络、技术及局房土建基础资源等,具体如图3所示。
根据调研,适用于现阶段的IDC主机房需求预测可以采用两种方法:业务分类法和收入预测法。
4.1 业务分类法
对于业务基础数据不足的公司,IDC机房面积需求预测建议采用业务分类法进行预测。
一般情况下,IDC业务按照现有市场的分类,可分为基础类业务和增值类业务两大类。基础类业务是IDC通常提供的公共型业务,主要表现为资源出租型业务,如机房空间出租、网络带宽出租等;增值类业务是各IDC企业根据自身的实力和优势以及面向的用户群体推出的差异化服务,如安全、数据备份服务、代维服务等。
IDC业务机架需求主要来源于资源出租型业务。借鉴通信业务的分类预测法,IDC业务机架也可按机架分类进行预测需求。IDC业务机架按使用用途可分为托管类机架、VIP机架、服务器托管类机架、云业务机架以及必要的网络安全支撑等管理类机架;按客户类型可分为政企客户类、互联网客户类、中小企业类、云业务类等;按可用性等级可分为A级、B级、C级机架或T4级、T3级、T2级机房机架等;或按公司的实际产品类型分类。每一种分类都有其实际意义。
在采用业务分类预测法时,可根据公司的产品情况或发展战略等,确定一种适合本企业的IDC机架分类方法,每一类机架需求可以按目标值,如机架增长率或机架目标值等公司目标发展情况来进行预测。在IDC业务机架需求预测中,还需要考虑必要的自有网络安全支撑等系统机架的需求,此类机架需求初期需按平台系统要求设置,平台建立后可按业务机架的比例适当增加。在各类业务机架需求预测中,建议采用类比法,即调研和参考同类公司或同地区、同行业发展的轨迹进行目标预测。
业务分类法的预测步骤如下。
①统计基准年份IDC各类业务的机架数量情况,了解和统计所在区域IDC业务发展情况及公司在IDC行业的市场份额情况。
②分别对每种业务以固定的时间步长,如每隔3~5年预测业务增长倍数。
③对①中已经预测了业务增长倍数之外的年份进行线性差值,得到年增长率预测值。
④考虑IDC业务发展的地区渗透率不同和采用技术的差异性,对年增长率进行调整。
⑤计算每种业务基准年份的机架数量与年增长率预测值之积,并对所有业务求和,即得到未来总的机架数量预测结果。
IDC机架需求业务分类法的预测示例见表1。
4.2 收入目标法
对于IDC业务发展较为成熟的企业来说,IDC业务收入是衡量业务发展的重要指标。因此,依据业务收入来预测机架资源需求是本研究的第二种方法,也是目前应用较多的方法。
一般而言,IDC业务收入是公司的既定目标,也可根据历史数据进行目标的曲线拟合。如常用的指数曲线,其函数模型可用下式表示。
取定了IDC业务收入后,如何确定IDC业务收入与机架资源数量需求的关系?则要分析IDC业务收入的组成。IDC业务收入S由机架托管收入S1、带宽收入S2和增值业务收入S3组成,即
机架托管收入与机架数量有直接关系,IDC企业根据机房的等级和单机架功耗都有明确的收费标准,一般按月或年收费。为确定机架资源需求,首先将机架托管收入S1从业务总收入S中剥离出来。通常根据业务实际情况预测出机架托管收入占总收入的比例k1,各企业的这个比例差距较大,侧重于金融客户的IDC企业,其收入中S1占比较大;侧重于互联网客户的IDC企业,其收入中S2或S3占比较大。因此,k1系数应根据企业数据中心的客户定位、业务方向来取定。
设IDC托管业务单机架年收入为M,则产生业务收入S1需要的机架数量(架),也就是说,全年的IDC业务机架托管收入S1来自全年的J1机架租用费用。但是考虑J1个机架不一定能在当年年初完全出租,销售的周期性导致需要考虑机架资源储备的需求,即需要考虑理论年销售机架和资源储备机架的差距。建议可根据公司历年的销售情况,统计出年度新增实际销售机架与资源储备机架的比例情况,这个比例也可定义为机架实际使用率X。
根据对多家大型IDC企业的调研,X目前为0.6~0.8。因此IDC中心需要建设机架数量才能满足业务需求所需储备的机架数量,按下式计算
资源储备的机架数是IDC建设规模需要到达的机架数,是IDC建设规模的基础依据。
收入目标法的预测步骤如下。
①统计公司业务开展以来历年的IDC业务收入、IDC业务收入中机架出租部分的收入占比、IDC业务机架出租机架的单机架售价。
②了解统计所在区域IDC业务的发展趋势和公司在IDC行业的市场份额情况。
③根据公司历年IDC收入情况和公司发展目标,采用指数函数趋势预测模型进行拟合分析,对未来需求进行预测。
④根据其他组织或机构对本区域IDC发展趋势的预测,对拟合预测结果进行调整修正,得出IDC收入预测结果。
⑤根据公司发展目标和市场策略,预测未来各年度机架资源出租收入、机架出租平均单价。
⑥计算各年度理论销售机架数量,并根据公司的销售情况,考虑销售周期性的实际情况,给出销售冗余量,计算各年度需求的资源储备机架数量。
表1 IDC业务机架需求预测方法示例
IDC机架需求预测采用收入目标法的预测示例见表2。
4.3 组合预测法
IDC业务机架需求预测方法中的收入目标法是以历史数据为基础进行数学拟合,未来业务数据为历史规律的延续,所以必须增加对未来市场、技术以及企业IDC建设策略等因素的考虑,并应参考其他机构对市场的预测结果,对历史数据拟合的结果进行调整,以减少拟合曲线带来的偏差。
IDC业务机架业务分类预测法由于缺乏历史数据,因此仅对历史数据进行参考,预测的准确性在很大程度上依赖于预测人员对业务的深入理解和调研以及对未来发展趋势的分析能力。应用该方法时,业务分类的颗粒度也会对预测结果产生较大影响。
为进一步减小预测偏差,对IDC机架需求进行预测时,在有条件的情况下,建议采用组合预测方法或者分别采用上述两种预测方法分别预测,之后将各年度预测结果分别设置权重,再取其综合数据。对于历史数据较多、业务开展时间较长、已由市场拓展期进入发力期的公司而言,建议采用收入目标法预测的结果权重比例较高;对于还处于市场拓展期的公司,建议采用业务分类法预测的结果权重比例较高。预测结果的表达式为
其中,ωi为预测模型fi的权重。
综合应用上述两种预测方法的预测结果见表3。表3中权重比ω的取定可以根据实际情况确定,可以阶段性如3~5年一致,也可每年不同。
5 结束语
在IDC建设过程中,确定IDC建设规模是首要解决的问题。本文从实际咨询工程出发,研究和确定了IDC业务机架预测的实用方法,建议采用业务分类法和收入目标法分别预测,并根据市场趋势进行权重重置而得出相对合理的趋势预测。
本文中的部分内容已在实际工程中得到了应用,由于业务发展影响因素较多,实际工程中预测方法的应用要根据业务发展情况和所在区域的发展情况进行合理的调整修正。
[1] 张爱华,张丽贤.电信需求预测[M].北京:科学出版社,2014.