新基建新机遇:数据中心发展探讨
2021-03-28何宝宏
何宝宏
(中国信息通信研究院云计算与大数据研究所,北京 100191)
0 引言
从电报网络、电话网络到广播电视网络,通信网络一直是专用的基础设施。例如,电报网络负责传递文字,电话网络负责传递话音,计算机网络负责传递计算机数据。自20世纪90年代以来,以TCP/IP技术为代表的互联网,致力于把通信基础设施通用化,让IP网络能够同时承载文字、图片、话音、视频和数据等。
把通信网络作为基础设施已经上百年了,但把计算进行基础设施化,只是最近十多年的事情。自计算机诞生起,计算的主流售卖方式就是产品,比如售卖的是某型号的计算机,或者某版本的软件产品。但从2006年开始,云计算[1]的出现开始改变了这一切。云计算把计算产业从第二产业变成了第三产业,从售卖产品为主转变成售卖服务为主。
近二十年来,以云计算为代表的计算服务和基础设施发展相对成熟,然而新基建又开始扩军,纳入了AI、区块链和工业互联网等。之所以现在才扩军,是因为这些新技术的基础设施化,需要以通信(通用)的基础设施化和算力的基础设施化为前提。
1 至少与5G同等重要
2020年3月,在中共中央政治局常务委员会会议上,明确提出要加快5G网络、数据中心等新型基础设施建设进度,这是数据中心首次被国家列入新基建条目。但数据中心真得有那么重要吗?
不能说数据中心比5G重要,但至少也是与5G同等重要。5G贴近生活,可以讲很多动人的故事,大家更熟悉;但数据中心就像工厂的生产车间、城市的地下工程,相对来说比较陌生。
从市场角度看,根据中国信息通信研究院的预测[2],2021—2025年,全国信息基础设施的投资规模约4.2 万亿,其中5G等网络约为1.25 万亿,云/数据中心等约为2.45 万亿,是5G等的2倍。
可以把互联网的“边缘”分成两大类:一类是用户侧,计算和内容消费型,如智能手机、APP、5G、IoT、家庭网络和车联网等;另一类是服务侧,计算和内容供给型,如网站、服务器、云计算和数据中心等。
5G和数据中心都位于互联网的物理层,即互联网的边缘,从物理上连接和驻留各类终端,但作用不同。5G把计算需求侧的智能手机、智能家居、智能汽车和传感器等接入互联网,而数据中心通过光纤等把供给侧的服务器和云计算等接入互联网。
5G和数据中心是隔岸守望的“数字孪生”,一侧技术的进步必然引发另外一侧的共振。
2 数据中心的开放
过去十余年来,数据中心的技术发展呈现标准化、工程化、预制化、模块化、高密度、软件定义和绿色节能等特点。但数据中心最重要的特点是开放性,开放使数据中心能够成为新型基础设施,能够标准化分工协作,能够相互学习,能够降本增效,能够让整个产业发展壮大。
传统意义上,数据中心可能是自用,也可能是对外提供租用服务。对自用型的数据中心,数据中心技术被当作企业业务中核心竞争力的重要组成部分。对租用型的数据中心,对保护用户身份和用户数据的秘密提出了要求。互联网企业是数据中心的用户,无论是自建自用还是第三方租用,数据中心都是其成本中心。
数据中心从封闭走向开放,是在2011年,以Facebook创立的OCP项目和中国BAT联合成立的天蝎计划项目为代表(后来逐步发展成为开放数据中心委员会)[3]。
2.1 国际数据中心开放情况
Facebook作为互联网的后起之秀,其社交业务的流量激增,但其数据中心基本上都是租用的,既无很强的技术能力,作为租户也很难做技术性优化。与此同时,互联网巨头Google等已经开始自建数据中心,并且有能力、有机会做很多技术优化,但都作为公司的秘密不向社会开放。Facebook意识到,数据中心的支撑能力已经开始拖核心业务的后腿了。
互联网服务是一个赢家通吃的市场,TOP1的企业可以闭源建生态赚大钱,其他企业要么投靠TOP1、要么抱团取暖。但“抱团”不是你抱着我、我抱着你,而是一起抱着“开源社区”添砖加瓦,以期形成一个可以与闭源生态抗衡的开源生态。这一现象在历史上频繁出现,比如智能手机领域的iOS和Android,云计算领域的AWS和OpenStack等。
如果Facebook像Google等那样,也采用封闭的技术路线,是根本无法与之抗衡的。于是,Facebook依托其强大的社会影响力和采购能力,在数据中心领域引入了开源文化和方法,开放了其数据中心、服务器、机架和主板的规范,以及CAD的机械图纸,并且邀请开源社区一起进行优化和完善[4]。
2.2 国内数据中心开放情况
在此背景下,阿里巴巴、百度和腾讯于2011年年底发起成立了天蝎计划项目,首先致力于开放服务器的工作。之所以选择服务器,是因为数据中心成本总费用支出包括投资成本(CAPEX)及运营成本(OPEX)两大部分,而服务器的购买和维护会占总成本的60%~70%。
2014年8月,在天蝎计划取得成功的基础上,扩展中国电信、中国移动和中国信息通信研究院为核心会员,拓展了模块化数据中心、白盒交换机、开放网络、液冷和运维等研究领域,正式成立开放数据中心委员会(Open Data Center Committee,ODCC)。截至2020年年底,ODCC累计发布150余项研究成果,已经成为具有全球重要影响力的数据中心组织。
数据中心的开放浪潮是从上到下、由内而外发生的。2006年后期,全球掀起云计算浪潮,到2011年直接改变为云计算提供硬件资源,比如服务器、网络和存储等,同时软件定义和虚拟化等得到应用。随着这些硬件的陆续变化,又开始影响存放这些设备的数据中心,并从2014年开始向开放、预制化、模块化、高密度和智能运维等方向发展。到了2019年前后,在IT领域数据中心模块化后,这一开放浪潮又外溢到非IT领域,比如供配电和制冷等。
3 丰富的类型
1960年以来,计算机向两个方向发展,一是追求更强大的计算性能,以HPC为代表;二是优先追求更广阔的应用场景,以PC、智能手机和可穿戴设备等为代表。
数据中心就好比计算机,正在走着与计算机的历史类似的道路,一是优先追求集中后产生的规模效应,比如以云数据中心、大型超大型数据中心为代表;二是优先追求更广阔的应用场景,比如以边缘数据中心等为代表。
随着新基建的提出,数据中心的外部性、网络化、生态化和社会属性变得更加明显,需要满足的场景也越来越多,类型也越来越丰富。以下从不同的角度,对数据中心做出不同的分类。
(1)从规模上看,数据中心可以分为超大型数据中心、大型数据中心、中小型数据中心,甚至微型数据中心等。
(2)从运营模式上看,可以分为自用型数据中心和租赁型数据中心。
(3)从形态上看,可以分为模块化、集装箱式、单体建筑、园区模式和集群式。
(4)从部署位置看,可以分为集中式的云计算数据中心和分散式的边缘数据中心。
(5)从建设运营的方式看,可以分为自建、代建和代维等。
(6)从供电方式看,可以分为市电直供、高压直流、双路柴发等。
(7)从制冷方式看,可以分为自然冷却、机房空调组、绝热冷却、冷热通道隔离和液冷等。
4 国内外发展情况
数据中心位于新旧基建的交叉口上,像传统基建里做IT行业的,IT行业里做房地产的。数据中心是数字社会的底座[5],其市场增速反映的是整个数字社会增长的“综合指数”。
无论是5G、云计算、大数据、人工智能、区块链、物联网和工业互联网等技术,无论是搜索、社交、支付、直播还是视频应用,也无论是数字产业化还是产业数字化,都需要数据中心的支撑。
4.1 国际情况
各国数据中心政策抓手基本上有3个:一是抓能源效率;二是整合老旧小、优化新布局;三是订规范、推示范。
(1)美国政府从2010年开始,陆续推出数据中心整合与节能改造计划[6],10年来先后关闭了7000多家数据中心。
(2)欧盟自2012年开始,提出了数据中心行为规范[7],出台节能最佳实践方案和实施计划,推进数据中心节能降耗。
(3)中国从中央政府到地方政府,自2013年开始从合理布局、绿色节能、技术创新和示范基地等多个维度出台了多项政策,2020年更是将数据中心与5G并列纳入了新基建。
据IDC预测,2020年全球数据中心的市场规模约为623 亿美元,近几年一直保持10%的增长。据Gartner数据,2019年全球数据中心约有910 万个机架,服务器6300 万台,其中北美地区互联网流量占比超过40%,亚太地区增速较高的占比已经超过30%,预计未来中东、南美、非洲等地区的数据中心规模将快速增长。
全球数据中心的布局,主要聚集在经济发达和人口密集区域。北美地区数据中心总体体量大、上架率高,产业发展优势明显;欧洲地区城市数量较多,云业务驱动增长较快,但新建数据中心受限,部分大型企业开始在气候寒冷的北欧地区建设数据中心;在亚太地区,中国市场增长较快,新加坡、东京等数据中心网络条件较好,成为跨国企业国际化发展的优先选择,但数据中心资源紧缺,价格较高。
全球数据中心市场竞争格局呈现出明显的马太效应,美国、中国、日本企业占据主要市场份额。2020年,TOP10的企业占据了全球45%以上的市场份额,美国Equinix仍占据龙头地位,中国电信跃居全球第二,日本NTT、KDDI、中国联通、中国移动和万国数据也跻身全球前十名[7]。
全球数据中心投资并购市场活跃,龙头企业加速收购。2015—2019年,全球数据中心交易量大幅增长,共完成约350 笔数据中心投资交易,总金额超过800 亿美元。其中,2019年全球投资并购交易数量约为2015年的4倍,非上市公司参与的并购数量大幅增加了50%以上,2020年并购投资事件依然非常活跃[9]。
4.2 国内情况
2020年,我国数据中心市场规模为1500 亿元,年均增速继续保持在30%左右,远高于全球10%的年均增速。其中,大型以上数据中心增长强劲。2010年,我国数据中心的第一波建设热潮,主力军是电信、金融和互联网等行业;2020年,受新基建相关政策等的鼓舞和企业数字化转型等需求的驱动,云计算厂商及新生代互联网公司也纷纷加入自建或合建数据中心的大军,掀起了数据中心建设的第二波热潮。
(1)从竞争格局看
电信运营商和第三方IDC服务商仍是我国数据中心的主要参与者。但更多的投资和运营主体正在涌入,如转型的钢铁企业、房地产企业、数据中心设备商等。另外,基于分担风险、整合资源等考虑,数据中心合建模式越来越多,企业差异化竞争,构建优质生态圈。
(2)从应用模式看
我国数据中心正在从企业自用数据中心(EDC)向互联网数据中心(IDC)转移。EDC呈现出个数多、规模小和技术差等特点,而IDC规模效应明显,技术也较为先进。
(3)从行业来看
我国数据中心应用逐渐多元化,加速向第二产业渗透。互联网和通信行业发展最早,占据主要市场份额。金融和政府行业信息化、数字化相对较早,应用逐渐深入,规模快速增长。制造、能源、医疗、教育、交通等行业的数据中心逐步加速。
在政策引导下,国有和民间资本大量涌入数据中心投融资市场。据不完全统计,全国24个省份的新基建项目约2 万个,投资超过48 万亿。据中国信息通信研究院测算[8],2020年投资达到3000 亿元,未来3年将增加1.4 万亿元。REITs(房地产信托投资基金)[9]为数据中心产业增添新的融资渠道,北京、上海等地已启动试点项目申报工作,或将有效减轻经营者的融资压力。
从布局来看,我国数据中心越来越呈现出明显的“哑铃型”:一头集中在东部和一线城市,一头集中在资源富足地区。第一波热潮时,我国数据中心高度集中在互联网用户密集的地方,比如北京、上海、广州、深圳等一线城市。近年来,随着国家和地方相关政策的出台和引导,以及企业在经济上的考量等,越来越多的数据中心尤其是大型、超大型数据中心,纷纷在中西部地区选址。
5 结束语
数据中心就像是IT行业做房地产的,房地产行业里做IT的;就像早期的蒸汽机其实不是机器而是个硕大的房子,早期的计算机其实也不是个机器而是个硕大的房子。随着房子里的硬件和外设等越来越微缩化和集成化,房子慢慢与里面的计算机耦合,演变成了专门放置计算机的房子,简称“机房”。
到了20世纪八九十年代,家用PC的兴起推动着“机房”的没落;但与此同时,互联网的爆发让客户/服务器计算模式兴起,“机房”演化成了互联网数据中心(IDC),成了WWW和E-mail等服务器的聚集地。
近年来,随着云计算和大数据等的发展,数据中心的地位日益重要,迎来了黄金发展期,也出现了很多新变化。例如,类型越来越多,以服务于不同的场景客户。随着数据中心技术开始走向开放、标准和云化等,带动了白盒设备、无损网络和液冷技术等的发展,日益成为技术创新的制高点[10]。
2020年,数据中心被纳入了新基建,历史开始重新定义数据中心的地位。未来的数据中心,不再只是商业的和互联网的,而是整个社会的,其基础性、公共性和社会属性将会越来越强。这将给业界的发展带来更多的动能,我们也期待着更多的技术创新。