大规模分布式服务化架构在能源数据中心信息系统的适用性研究
2022-02-16朱伟暐
朱 祺,朱伟暐
(中国电力工程顾问集团华东电力设计院有限公司,上海 200001)
0 引言
随着近年来“互联网+”的不断推进和数字经济的不断发展,各类企业都在积极推进自身信息系统建设并在此过程中广泛应用云计算和大数据技术以确保建成的系统符合主流信息技术水平并为后续的扩建和改造留有充足的空间和接口。能源企业的信息、业务和数据与以面向商业服务为主的互联网公司相比具有明显的差异,如业务较为集中、服务要求有更高的可靠性、数据有更高的保密性要求等。因此在进行信息系统架构设计时无法完全参照大型互联网公司所采用的主流系统架构方式,需要在主流架构的基础上根据自身的业务特点和期望实现的目标进行取舍或改造。信息系统架构经历了数次比较大的模式、理念和技术升级,从而进步到了目前能够成功应对大规模流量的分布式服务化系统架构,因此各类大型企业目前在信息系统建设架构方案设计时自然而然地会优先考虑采用分布式服务化框架。能源企业往往体量大但是业务却相对集中,因此在信息系统总体架构设计过程中对于分布式服务化框架在能源数据中心信息系统的适用性方面进行研究具有实际意义。
1 信息系统总体架构模式的升级路径
随着数据时代的到来,数据的井喷使信息系统的总体架构经历了单机架构、集群架构、分布式架构、分布式多活数据中心架构四个阶段[2]。伴随着总体架构一同演变和升级的还有各种中间件、存储系统和外围系统,比如对关系型数据库进一步进行分库分表改造、流量和数据的处理从本地缓存过渡到分布式缓存等。信息系统从上线初期开始就是在不停的迭代升级过程中通过自身架构的发展和演变满足其自身业务的发展,因此业务需求是信息系统总体架构设计的核心[1]。在业务需求相对简单的早期,如图1所示的单机架构即可满足要求。
图1 典型单机架构方案[2]
随着企业各类业务的发展和并发流量的增加,单机系统架构因为单体应用过为庞大而造成信息系统在开发的效率、部署的灵活性和运维的效率方面产生了诸多问题,通过调整和优化架构设计模式来解决这些问题的核心是提升业务系统并行处理能力的同时降低单机系统负载,确保增量业务的部署和存量业务的升级。因此,信息系统的总体架构发展为通过将多台独立的服务器通过网络相互连接从而形成一个有效的整体对外提供服务的分布式集群架构如图2所示。
图2 典型分布式集群架构方案[2]
云计算和虚拟化技术是支撑分布式集群架构落地实施的基础,这样当单台服务器的处理能力接近或已超出其容量上限时不用更换性能更高的服务器,而是采用云计算来通过增加新的虚拟服务器来分散并发访问流量,只要上层业务系统的设计能够支持虚拟服务器的横向弹性伸缩,那么从理论上来说就能在服务器集群总的计算力范围内实现可伸缩性和高可用性。虽然虚拟化的过程中因为对虚拟服务器进行调度和控制的控制节点会分走一部分计算力而造成性能损耗,但是使用集群架构的目标收益仍然远高于所付出的损耗代价。
随着企业体量的逐渐庞大,业务需求随之变得复杂,通过以业务功能为维度拆分出多个子系统以能够更清晰地规划和体现出每个子系统的职责、降低业务耦合以及提升容错性为目标使信息系统架构在分布式集群架构的基础上衍生出了服务化架构。以往在各种不同类型的业务需求下系统中往往会存在数个会被频繁调用并且完全可以共享的业务,而且业务系统中诸如数据库连接限制之类的底层资源必然会限制业务系统所允许横向扩展的节点数量。服务化架构通过将原本耦合在单一节点中的共享业务逻辑进一步剥离,使各类共享业务的逻辑处理由独立部署的节点负责,从而使其他以单一服务为主的业务应用无须再处理共享业务逻辑,因此整个系统的计算资源利用率会得到提升,如图3所示。
图3 典型分布式服务化架构方案[2]
之后提出的微服务架构理念从本质上来说和服务化是一个概念,因为从系统全局上进行分析,微服务无非就是更进一步细化服务拆分过程中的粒度,当粒度越细时业务的耦合就越小,整个系统的容错性就越好,并且在云平台上进行弹性扩展也会越容易。但是,粒度过细不仅会增加维护成本,影响排查问题时的效率,还会让后续业务开发人员很难梳理清楚诸多服务之间的依赖关系,这也是采用服务化架构特别是微服务架构中需要避免的问题。
面向服务的设计理念结合了集群架构分布式的特点最终使分布式服务化架构呈现以下几个特点:
1)信息系统成为了一个以各类应用服务来满足业务需求的生态;
2)各类应用中的业务逻辑不存在紧密耦合关系;
3)存在会被各类其他业务频繁调用且业务逻辑相对独立的共享业务;
4)能够很好的利用云平台弹性伸缩的特点对业务所需计算力进行合理分配和部署调整;
5)业务的细粒度结合云平台的弹性特征使整个系统的容错性较好,不会因为单一节点故障影响整个业务模块从而无法提供服务;
6)信息系统规模一般较大,不然既无法发挥业务细粒度的优势也无法发挥云计算的弹性优势。
2 分布式服务化架构与能源数据特征的匹配分析
2.1 架构与数据特征的匹配分析原则
信息系统总体架构模式演变和升级至分布式服务化架构的驱动力是业务在不断的发展过程中带来的需求,而各类业务之间交互的本质就是一个数据和信息的交互过程。随着信息基础设施技术的发展,海量数据的接入成为可能,而如何最大化地发挥出信息基础设施的性能以确保能从这些数据中提炼出更多有价值的信息使整个信息系统的架构设计模式必须随之改变,更多的信息和数据又为各类业务的发展提供了资源支撑[3]。因此,数据时代下信息系统架构的适用性分析过程中可以以承载业务所需要的数据能否被有效接入和高效处理作为判断标准。
样品取自于涉县东南部岭底村附近,寒武系张夏组上部。该巨鲕灰岩最大厚度约2m,EW向延伸数千米。上覆泥质条带灰岩,下伏灰色中厚层鲕状灰岩。该组地层的形成起因于中朝准地台在寒武纪的第一次沉降,形成了大规模海侵,在张夏阶形成广泛的潮间泻湖相、局限海和水下浅海相沉积[7]。
本文参考大数据的4V特征来进行大规模分布式服务化架构在能源数据中心信息系统的适用性分析,即:规模性(Volume)、高速性(Velocity)、 多 样 性 (Variety)、 价 值 性 (Value),4个特征的具体表现见表1所列。
表1 大数据的4V特征及表现
2.2 大规模分布式服务化架构的匹配分析
能源数据的与大数据4V特征的匹配结果如表2所示。
表2 能源数据与大数据4V特征匹配结果
从满足规模性角度进行分析,根据不同信息系统总体架构模式的特点,分布式集群架构和分布式服务化架构都能够满足能源数据的庞大规模,由于面向服务的主要理念是满足业务需求的发展,因此如果信息系统的业务较为集中但是单一业务的数据量庞大,分布式集群架构即可满足要求而非必须采用分布式服务化架构。
从多样性角度进行分析,能源企业各类对内业务和对外业务都较为复杂并且数据之间的关联性极强,因此能源数据中心的信息系统必然能够拆分出一些共享业务,在这个基础上采用分布式服务化架构完全能够适应复杂业务生态之间的相互调用并且为未来新业务的部署创造一个具有充分可拓展空间的平台,明显优于分布式集群架构。
从高速性角度进行分析,能源行业的部分业务对于计算的实时性要求极高,其中一些甚至要求系统的时延在数毫秒内,在大规模数据接入的同时要做到如此强的实时性只能采用分布式架构,但是和是否采用服务化架构却没有必然关系,核心的问题在于如何通过整体架构的设计优化和采用合适的流计算引擎来最大地发挥云平台的弹性计算能力。
从价值性角度进行分析,能源数据的价值性非常高,甚至对于行业外的领域仍然具有很大的影响力,较高的价值代表在对外业务的发展上具有很大的拓展空间,因此信息系统在进行设计时有必要考虑目前所建设的平台对于未来业务的拓展是否具有良好的承载力,分布式服务化架构即是在业务快速发展的前提下诞生,能够承载对外业务的快速拓展是其原生使命。
表3 能源数据中心信息系统对架构的需求
因此,从系统需要处理的数据量角度,能源数据中心信息系统建设过程中采用分布式架构(包括分布式集群和分布式服务化)是非常有必要的。在此基础上进一步采用分布式服务化架构并不是必须的选项,但是随着能源数据的高价值被不断挖掘,各类业务的增多使分布式服务化架构对未来业务的拓展需求有更好的适应性。
3 结论
本文通过对信息系统总体架构模式的升级路径、大规模分布式服务化架构的核心组件的组成和功能进行梳理和研究,在此基础上根据能源数据的特点对大规模分布式服务化架构在能源数据中心信息系统的适用性进行研究,得出结论如下:
1)大规模分布式服务化架构的最大特点是能够应对海量数据的接入和处理,核心是能够满足业务快速拓展的需求。
2)大规模分布式服务化架构是一个由服务注册与发现、负载均衡和反向代理服务器、服务网关、配置中心和链路追踪等核心组件及其他功能组件所组成的分布式框架。
3)以大数据4V特征进行分析,分布式架构完全适用于能源数据中心信息系统。
4)在分布式架构基础上进一步采用分布式服务化架构有利于能源企业为因能源数据的高价值而预期可能产生的业务快速拓展提前在信息系统层面做好准备,但也并非是当前必须的选项。