信息化实现绿色低碳发展的策略分析
2021-07-24骆科东
骆科东*
(中国石油天然气股份有限公司规划总院)
0 引言
理念是行动的先导。自从习近平总书记在党的十八届五中全会首次提出创新、协调、绿色、开放、共享的发展理念以来,绿色低碳发展作为新发展理念的重要组成部分,在全社会得到广泛全面践行,并在实践中不断丰富完善对其的认知和实施能力。党的十九届五中全会进一步提出“促进经济社会发展全面绿色转型”,绿色低碳发展还将深入贯彻到“十四五”和今后更长时期发展过程中去。
2020 年9 月22 日,习近平总书记在联合国大会上郑重宣布:“中国将提高国家自主贡献力度,采取更加有力的政策和措施,二氧化碳排放力争2030年前达到峰值,努力争取2060 年前实现碳中和。”在这一要求下,信息化工作也需要在支持数字经济健康发展和推动各行业数字化成功转型的同时,更加努力实现自身的绿色低碳发展,为“碳达峰”“碳中和”贡献一份自己的力量。
近年来,随着国家数字经济的发展和各行业数字化转型的大力推进,信息化建设应用越来越普及,但同时能源消耗和碳排放也越来越多。而且,随着数字经济的加速发展和数字化转型的深入,信息化建设应用步伐还会进一步加快。因此,研究信息化本身的绿色低碳发展问题,采用恰当的策略辅助信息化工作实现绿色低碳发展,成为当务之急。
1 信息化绿色低碳发展的重要性
伴随着互联网经济的迅猛发展,消费领域信息化建设带动了社会信息化发展,当工业互联网、数字化转型、智能工厂等理念逐渐深入人心,生产领域各行业的企业信息化建设也随之兴起,引起更大规模的建设浪潮,如管道工程数字化移交[1]、“互联网+”城市燃气销售[2]、油田企业数字化建设[3]等。从信息化建设的载体—数据中心(Data Center)的发展来看,截止2018 年中国超大型、大型和中小型数据中心在用机总架数达到226×104架,规划在用机架数达到181×104架,且2017、2018 的年度增长率分别为34%和36%,呈现高速增长态势[4]。特别是随着5G、边缘计算等新技术发展,作为感知连接、就地计算、云边协同、云端互动载体的各类型运算节点,会更加快速地增加。
加速增长的数据中心、运算节点必然带来巨大的能耗需求。据绿色和平组织和华北电力大学报告显示,2018 年中国数据中心用电总量为1 608×108kW·h,占全社会用电总量的2.35%,耗电对应总碳排放达到9 855×104t,占中国碳排放总量约1%(中国2018 年碳排放总量为95×108t)[5],预计2023年总用电量还将增加65.82%,耗电对应总碳排放预计达到1.63×108t[6](发电结构不变情况下)。以上只考虑了成规模的数据中心,如果叠加海量存在的设备间、基站、智能设备等分散式小规模运算节点,信息化的总能耗及碳排放问题会更加凸显。
按照党中央提出的“十四五”及今后一段时期经济社会发展目标要求,许多地方已经将数字经济作为未来发展的重点。在国务院国资委的大力推动下,各行业的龙头企业纷纷带头加入数字化转型的浪潮之中。数字经济、数字化转型的蓬勃发展将政府、社会、企业的信息化带入了一个全新的阶段。信息化建设及应用的总量势必成倍增加,其在全国能耗总量、碳排放总量中的比例也会大幅上升。在这种形势之下,深入分析信息技术和信息化工作的特点,制定有针对性的策略,降低信息化建设应用的单位能耗,以更高的效率和相对更低的能耗排放来提供信息化产品与服务,助力数字经济和数字化转型工作,就显得非常重要了。
2 信息化绿色低碳发展策略
2.1 策略构成
信息化绿色低碳发展最终效果体现在算力的能耗上。算力主要是指在数据中心,也包含小规模机房、设备间乃至于智能设备上的计算能力。但是要减少能耗,不能只考虑算力本身,还要考虑数据和应用两个方面,后两者的理顺、优化可以促进高效计算、避免无效计算,从源头减少能耗。数据方面与能耗排放主要相关的是各种业务数据,而不是系统配置、技术管理相关的数据。应用方面与能耗排放主要相关的是各种算法,当然也包括所采用的软件架构。
不管是算力、数据还是应用,主要的降低能耗和排放措施都可以从领域内主体技术的改进和相关资源的共享方面着手,并结合一定的指标约束管理机制,达到有效利用信息化资源的目的(见表1)。
表1 信息化绿色低碳策略表
下文的分析主要站在信息化建设主体的角度,即指信息化建设的组织实体,包括但不限于政府、企业、行业组织、社会团体等。当然从全社会信息化的工作量比例来说,还是以政府和企业为主,在策略考虑上也主要针对这两类建设主体。
另外,本文所提到的策略只是从信息化工作本身着眼,而信息化建设应用的能源消耗和碳排放更是与全社会的绿色低碳发展息息相关。如果社会发展结构实现了清洁能源、可再生能源转型,在相同的信息化建设模式下其碳排放也会大大减小。再比如,相当多的大型数据中心采用了燃气发电机组冷热电三联供技术,这样燃气发电技术本身的改进也将会直接影响数据中心能耗。由于这些都是通用的技术和方法,不限于信息化领域,也就不在本文的探讨范围之内了。
2.2 算力方面策略
首先是应用先进的数据中心用能节能技术。数据中心在节能减排方面的主要措施是降低 PUE(Power Usage Effectiveness)值,可以采取三种方式:一是建设选址到气温相对较低的地区,降低最主要的空调能耗;二是结合精细化温度监控、动态环境监测,通过精准降温减少能源开销,通过高效的冷却技术降低额外能耗[7];三是考虑能源技术本身,选址宜选择可再生能源资源丰富的地区,规模较大者可直接部署冷热电三联供提高能效水平。
其次是算力方面的资源共享。在建设主体内部,已经广泛采用集中式的数据中心实现算力相关的技术资源共享,这方面已经相对集约化。但随着数字经济的发展,不管是政府、企业还是社会组织,相当多的信息化需求需要借助于外部算力资源,比如地理信息、身份识别、智能预训练模型等等,这就需要将建设主体的自有算力与外部算力有机结合,形成混合云的协作方式实现高效的算力资源利用。
随着物联网(Internet of Things)的广泛应用和边缘计算(Edge Computing)的发展,除了考虑大量现场数据采集、业务处理的建设主体,还需要考虑云边协同的算力利用问题,将数据、算法在云、边、端合理分布,合理设置分发本地计算所需参数,从而在实现有效的信息采集、知识获取和业务响应基础上,降低整体数据通信和计算需求。如,利用智能摄像头或视频流处理算法在边端对监控视频进行处理,只将异常、报警相关的视频片段上传云平台。
算力方面的指标约束上,首先是数据中心PUE(Power Usage Effectiveness)值。这些年国家努力促进数据中心的低PUE 值设计,推广绿色数据中心先进实用技术,设定绿色数据中心标准并开展评比,明确要求新建数据中心PUE 值要低于1.5。其次是CPU、存储等主要算力资源的利用效率,并通过对资源利用情况的监控,及时释放无效占用资源、缩减低效使用资源。还有边缘计算数据上传比,通过指标约束促进大量价值密度低的数据在本地处理。
2.3 数据方面策略
数据方面的策略最基础的还是数据治理(Data Governance)。建设主体通过数据治理建立起组织内部的元数据、主数据、数据标准、数据质量、数据集成、数据资产、数据安全等一整套模型、工具以及机制,以实现对数据的全面高效管理[8]。通过良好的数据治理,可以减少数据冗余,避免重复采集,实现精准使用,加强挖掘利用,同时也降低了数据采集存储使用过程中的能源开销。
数据方面需要重点关注的是多媒体、参数模型、运行日志等大体量数据。相当多的建设主体,其涉及数据的资源开销也符合二八原则,往往大多数计算资源和绝大多数存储资源都被少量大体量数据占用,而相当多的大体量数据利用效率较低,无效低效计算开销广泛存在。可以根据大体量数据的技术及应用特点采取针对性措施,比如划分数据“冷热”度,对于“冷”数据采用离线、半在线存储方式,大幅度减少数据维持开销;对于“热”数据,加强缓存、预处理等手段,提高数据利用处理效率。还可以通过数据索引、特征提取等技术,实现预处理、局部精准提取等便捷计算方式。
数据资源的共享对节能降耗也十分重要。当前大型组织内部数据共享的主流手段是数据湖(Data Lake),也就是综合利用数据存储技术,集中式存放不同规模、不同原生格式的各类型数据,并支持对不同类型数据洞察分析,帮助用户做出科学决策[9]。内部数据的集中存储将显著提高数据查找、分析、重复利用能力,从而降低能耗开销。外部数据共享也很重要,建设主体要改变一切数据自行拥有的旧有观念,在数字经济时代,数据安全和隐私保护的发展,会进一步促进建设主体之间的数据共享利用。目前已经有不少行业都在采用数据湖技术加强内外部的数据共享能力建设[10]。
数据方面的约束指标设置上,首先是数据治理覆盖度,也就是已经完成数据治理的数据域占数据域总量的比例。其次是大容量数据利用效率,可以用一段时间内大容量数据利用总量除以在线大容量数据存储量来表示。另外,还可以有数据标准化、主数据等方面的指标。
2.4 应用方面策略
应用方面最主要的策略就是平台化方向。不管是微服务(Microservice)设计还是业务中台、数据中台概念,都是平台化的方向,总的来说就是整体架构组织内部信息化所需要的各类技术资源,取消单个系统建设运维的烟囱式模式,代之以统一平台、成熟资源、快速开发、APP 应用的模式,可以大幅度减少应用的建设周期、工作量以及基础软硬件方面的投入,从而降低能耗开销。
平台化需要注意两个问题。一是平台本身也有相当的性能开销,因此只有具备相当规模的应用、应用间可共享大量技术资源,平台化带来的效率提升超过自身性能开销,才具备实施的基础。二是要注重共享技术资源的长期治理,及时清理过时、低效、甚至是失效的服务及应用,保证平台整体的健康高效运行。
应用方面策略的关注重点是算法的效率,尤其是在智能化发展的今天,虽然人工智能、机器学习算法能带来很大的业务效率提升,但自身的计算开销也是相当巨大的,有些深度学习模型达到亿级的参数规模,单次训练就消耗大量电能。所以根据需要选择所应用算法的技术路线,不是越准越好,也不是越快越好,而是适应业务要求,不要过分拔高;同时不断根据应用情况开展算法优化,努力实现高效率低能耗的算法应用。
应用方面也存在外部资源利用问题。比如图像识别、自然语言处理等通用任务。可以直接利用通用模型甚至是在线服务,如果自身业务存在一些特点需要进行特定性模型优化,也可以引入预训练模型进行改造,或者在通用算法结果上二次优化。未来随着全社会数字化、智能化工作的进一步扩展深化,从单一的模型应用走向群体智能、跨媒体智能、人机混合智能、自主智能等新方向[11],也会演化出更多的算法服务模式,有利于各建设主体更加多、快、好、省地利用算法,节约能源。
应用方面的约束指标设置上,首先是平台化的表征指标,从目前主流技术来说主要是微服务化率,也就是已经实现微服务化的应用占比。其次是通过总线实现应用间流程、数据接口的比例,微服务化率和总线化率的提升,可以有效提高应用之间的共享协同能力,并降低单个应用的开发周期,保证技术标准的一致性,减少基础技术的重复投入,实现技术能力的共享利用。当然算法效率也是很重要的考虑因素,但由于各类型应用在算法上的差异性,需要根据业务需要、应用特点合理设置算法效率的约束指标。
3 总结与展望
当前中国的信息化工作所需要的能耗已经达到全社会能耗总量的相当比例,并将随着数字化转型、智能化发展,进一步增大能源消耗和相应的碳排放。在这种形势下,采用绿色低碳方式发展信息化显得尤为重要。在一个建设单位内部,实施绿色低碳的信息化策略可以从算力、数据、应用三方面入手,在技术改进、资源共享和约束指标设置等方面落实具体措施。
不管是政府还是企业的信息化工作,目前仍处于从分散建设到集中建设、集成共享的阶段,关注点还没有更多放到节能减排上来。未来随着集中集成的全面实现、自动化智能化的广泛应用,能耗占比越来越大,对节能减排的思考会更主动更深入,对绿色低碳的策略研究会更广泛更实际。
当然,绿色低碳策略应用需要因地制宜,本文只是介绍了相对通用的方法和指标,建设单位在应用的时候,还需要结合自身特点,选择具体的适用方法、指标,或者定制更有业务针对性的方法、指标,总的目的就是减少能耗和降低碳排放。同时,绿色低碳策略还需要与系统的安全性、方便性等结合起来统筹考虑,在满足业务需求的前提下,将各种策略措施有机融入信息化的建设、运行、应用等各个环节,才能真正体现出绿色低碳发展的作用。