浅谈多云互联架构设计及实施
2021-03-18
上汽通用五菱汽车股份有限公司 广西 柳州 545005
引言
上汽通用五菱汽车股份有限公司作为年销售200万辆汽车的制造业企业,对相关生产、研发、销售等系统的要求很高,2018年以前,公司系统基本都部署在自建的数据中心里面。
随着公司业务的不断发展,公司对数据中心资源在满足可靠性前提下,资源的可弹性扩展及收缩的要求越来越高,并且还希望在满足业务的同时,最大限度降低使用及拥有成本[1]。
1 现状及存在的问题
1.1 现状
在云资源这个新兴技术平台的开发使用上,SGMW也是百花齐放,目前有使用到的云平台就有5家(分别为阿里、微软、百度、华为以及本地的电信运营商平台),所涉及的业务部门也是从销售到研发,甚至还关联到部分制造业务。而不同平台云资源之间并没有可靠的数据链接通道,基本通过互联网连接来进行数据的交互。
而作为企业的数据中心也存在6个(其中国内5个,国外1个),各数据中心均通过双线路专线连接回总部,以完成数据交互。
1.2 存在的问题
随着SGMW业务的不断发展以及汽车市场的风云变化,各云平台之间的连接规划需求,各云平台与企业数据中心的连接需求,以及各数据中心专线连接的降成本需求都变得急迫起来。
(1)各云资源缺少可靠安全的数据交互通道
SGMW在云资源使用初期是百花齐放,不同的业务部门在不同厂商的云平台上尝试着各种业务应用,但各个业务系统之间的数据交互性则缺少相关规划考虑(大部分通过互联网接口进行加密传输),下图仅以一个部门的某业务为例,从图中我们可以看到一个部门的多款应用运行在5个公有云平台上,之间的数据传输都只能通过互联网加密进行,这种多平台互联的架构不得不说在传输的稳定性及可靠安全性上都存在问题。
图1 xx系统公有云拓扑图
(2)各站点之间专线线路成本较高
SGMW国内有3个站点和几个物流点位,每年都需要支持大概140万的专线费用。
2 架构方案设计
为了解决现有存在的上述问题,经过多次云架构讨论和调研,SGMW最后制定出依托第三方的网络平台资源,构建打通各云平台之间/云平台与企业数据中心之间互联的三层网络架构。
而针对此网络架构,SGMW也在平台功能、多云资源、传输冗余性上提出了自己的要求。
2.1 方案设计要求—平台功能
此次方案实施涉及专线网络的部署和日常运维管理部分,所以在平台要求上我们有以下几点考虑:
(1)具备SDN平台管理能力,可以提供专线数据、监控数据等 API接口;
(2)具备客户服务平台,平台支持自主创建专线,客户可以自主设置vlan,带宽等专线信息,专线带宽必须具备弹性扩容能力;
(3)具备二层网络及三层点到多点的业务模式选择功能;
(4)提供端到端全程可视化监控,针对时延、丢包率、流量在线全程监控;
(5)支持自定义设置监控模版,添加监控联系人,以及提供邮件和短消息通知功能。
2.2 方案设计要求——多云互联
此次方案实施实现了云上资源与数据中心资源互联操作(其中云上资源为华为广州站点资源,而数据中心则在广西柳州),而考虑到公司日后可能的多云平台互联的需求,所以对平台有如下考虑:
(1)平台具有腾讯云、阿里云、华为云、金山云、百度云、京东云、AWS、微软云公有云对接资源
(2)平台需要在各省均有网络接入点,能实现柳州总部及各站点接入平台网络的需求
2.3 方案设计要求-传输安全可靠
(1)专线传输需要进行多重加密
(2)线路质量要求有一定的冗余性
3 架构方案实施
基于上述的要求,SGMW最终选择了犀思云平台来构建SGMW的多云互联的网络架构,而为什么选择这家平台来进行互联架构的实施,则是从以下几点进行了考量:
3.1 线路的选择
要实现多云互联,连接方式很重要(特别是要满足之前架构设计所提出的要求),那该如何考虑呢,我们基于以下几个维度进行了综合考量,最后选择了专线的连接方式。
图2 公有云链接方式对比表
而有关专线的连接也有直接物理连接和托管两种方式,介于此次项目的成本/实施周期以及专线带宽需求不高的考虑(需求小于1G),我们选择了托管的方式(犀思云正好属于第三方专线托管运营商,满足了SGMW的要求)
3.2 安全可靠性的选择
在涉及与公有云资源链接的安全可靠性方面,我们了解到犀思云平台骨干网全网为MPLS架构,基于IP协议,通过标签封装协议将网络数据进行高速转发和交换,这样实现的网络架构就能有效冗余和快速收敛,使业务的灵活扩展可用性进一步提升,单链路故障切换收敛时间更是能控制在毫秒级别。
而在安全方面,其平台通过MPLS-VPN和IPsec技术将网络数据多重加密,确保了用户数据的传输安全。
3.3 多云资源平台的选择
接下来就是针对多云平台资源的考量,在这方面,犀思平台目前全球连接上游公有云服务商包括阿里云、腾讯云、华为云、AWS、AZURE 等公有云服务商,连接上游数据中心服务商 EQUINIX、世纪互联、德利迅达、万国数据等数据中心。而在骨干网的组建上则由北京、天津、济南、徐州、南京、合肥、上海、杭州、宁波、广州、长沙、武汉、石家庄、郑州14个站点 400G 互联组成。
3.4 平台运维上的选择
最后的考量就是平台的运维上,在这方面,犀思云平台向用户提供可自行对网络控制层进行管理和调度的功能,具体管理功能如下所示:
监控:线路实时流量、丢包、延时;
管理:新增/减少节点、带宽调整、路由发布;
运维:自定义监控策略,设定警告信息接收人;
特别是带宽的实时监控和动态调整,这个让企业能很好地了解专线的使用情况以及动态的调整相关业务。
4 架构实施效果
4.1 灵活可扩展的三层网络架构
此次项目建立初期只是建立了单实例的三层网络混合应用架构,逻辑架构图如下图所示。
图3 a集群公有云逻辑图
从此图中我们能清楚地看到我们通过犀思云平台的网络资源,将本地数据中心和广州华为云的两个冗余接入点进行了三层组网,从而为本地应用与云上资源应用平台的联动创造了关键的基础环境(图中标示“主”和“备-1”的为冗余线路,标示“备-2”的为管理线路)。
后期随着业务的发展,云上的其他资源也需要与本地数据中心进行数据交互(华为云上不同账号的资源),依托于建立好的这个三层网络架构,我们只需要在犀思云平台上简单的建立到新账号的逻辑连接线路(物理连接线路平台已经建好),然后统一配置规划中的ip网段和路由信息,这样新增加的云上资源便可实现与本地数据中心的数据联通,整个操作都在平台上完成,极大地缩短了构建相应基础环境的时间成本(整个操作2小时内完成),并且还可以共享已经建立好的专线带宽线路,使得专线资源得到充分的利用,新的云上资源增加后的逻辑架构图如下所示。
4.2 成本优势
从前面的专线费用表格中我们能看到SGMW每年专线的成本为140万左右,其中我们可以拿柳州到上海30m的专线进行对比,传统专线的价格是其5倍多,我们可以按此比例进行折算,如果SGMW专线均采用犀思云专线,那么成本将在30万左右,每年将节省110万。
5 结束语
在系统上云的浪潮下,各家企业不管是基于应用系统的需要还是成本的考量,都在不断进行云资源的利用和开发,但各个云平台种类繁多,有些平台还有自己的特定功能,再加上一些系统还需要和企业数据中心进行数据交互,如何设计多平台的互联,以满足企业不同业务需求,这个是企业架构师所需要进行综合考虑的课题。
本文所提到的利用第三方网络平台(SDN技术)来实现多云平台互联,进而打通多云与企业数据中心的数据连通性,组建一个既有公有云资源,又有企业私有云资源的混合云环境,这个不失为一个企业建立自己混合云的方案(比起需要将企业内部资源做大规模调整,引进一个多云管理平台来进行运维的方案来说,这个方案无论在成本投入上,人才技术储备上都更加有优势)。
总的来说,多云互联的架构设计仍需要根据企业自身的业务需求来进行设计,但依托于第三方网络资源(SDN技术)来实现仍然是比较可行的解决方案