APP下载

云计算在智能工厂信息化建设的应用探讨

2019-03-28王仁诠

铜业工程 2019年1期
关键词:副本磁盘备份

王仁诠

(江西铜业集团有限公司 贵溪冶炼厂,江西 贵溪 335424)

1 引言

在科学技术不断发展的推动下,信息化技术取得了很多优秀的成果,其中云计算技术尤为突出,该技术自发展完善后已经被广泛地应用到各行各业中,不仅提高了工作质量,提升了工作效率,同时提高了管理水平,为各个行业与领域带来了变化与创新。随着中国制造2025规划的发布,智能制造在各个行业纷纷开展试点,工业和信息化部也印发了《关于开展智能制造试点示范2016专项行动的通知》。在这种背景下,贵冶也开展了智能工厂的试点工作。

2 综述

2.1 云计算的定义

云计算的核心思想,是采用网络连接的方式,将大量的计算资源进行统一管理和调度,从而构成一个计算资源池并按照用户需求提供服务。而提供资源的网络被称为“云”。这些计算资源能够被快速提供,仅需投入很少的管理工作,从而方便用户进行使用和管理。

2.2 云计算的关键技术

云计算技术的实践结合了:虚拟化、分布式计算、网络计算[1]。其核心技术主要包括以下四个方面:

2.2.1 平台的优化和管理

优化和管理是提高云平台的运行质量和平台性能的核心技术。其核心技术有:

(1)云服务资源管理。研究底层物理设备、虚拟机与集群的按用户所需管理以及虚拟分区直接的隔离机制;

(2)云平台内的任务管理。研究云计算平台的任务调度、高效使用、负载均衡、任务管理与容错机制等;

(3)数据管理。研究不同类型的数据,如结构化、非结构化、以及多媒体等数据的建模、存储、归类、备份、搜索、和离线保护等数据技术[4];

(4)平台内的应用探索。研究云计算对应用的负载均衡、各类任务监控,与云平台底层任务的互相兼容性;

(5)数据安全及个人隐私保护。对于个人用户支持的功能、性能以及出现故障后的恢复和隔离机制,研究用户身份验证和个人隐私数据的保护,支持监督机构的接口等。

2.2.2 云计算应用部署与系统集成

云计算应用部署与系统集成是向最终用户提供环境交付的关键。其主要技术如:虚拟资源池、网络虚拟化、集成技术。

2.2.3 云计算平台不间断运行

对于用户的关键业务,云计算平台环境的稳定且持续运行是基本要求,国内外大型云资源提供商,其不间断稳定运行要求,一般都在99.99%以上,因此对于云计算平台的不间断运行技术,主要在:

(1)云计算平台底层物理设备和虚拟化资源的异常监控;

(2)云计算平台各类进程和服务的监控、云计算底层应用和租用用户的监控;

(3)对于监控中出现的故障进行评估、异常做应对性处理、容错和及时恢复机制,以及软件的实时切换技术等;

(4)关注云计算平台中虚拟主机出错后的快速切换机制、虚拟化集群的容错、虚拟主机安全防护等。

2.2.4 云计算平台的客户端接入技术

云平台的计算是以数据、最终用户和提供的服务为基础,在云端的各用户之间的共存、互动是云平台架构的发展趋势。而云客户端访问会有如:PC机、笔记本、手机、掌上电脑等智能移动设备。面向云计算行业用户的各种应用需求,需要提供多种模式,以及未来5G环境下的各种移动端接入技术,为最终用户提供多样的云计算服务。

3 云计算在智能工厂的应用

考虑到贵冶生产数据的私密性,我们采用私有云的方式来建设贵冶的云计算平台。

3.1 逻辑架构

对于部署方式来说,我们采用图1的架构设计来确保冗余性和安全性。

图1 逻辑架构设计

3.2 功能架构说明

私有云解决方案的平台构建是在底层服务器硬件的基础上进行的[3],同时考虑到生产环境中网络的重要性,所以方案中对于网络设备采用双路冗余的设计。以下是方案的重点。

(1)图1中所有连线默认均为10Gbps连接。

(2)交换机之间进行两两堆叠,接入交换机之间也进行两两堆叠,即虚拟成一个逻辑的交换机,为 active-active。

(3)为确保冗余和高速,所有接入设备均分别上联2台交换机。

(4)管理与备份区单站点推荐采用4台物理服务器,其中3台作为管理KS服务,2台复用作为VBR备份与镜像服务。

(5)云平台VG虚拟网关区采用2台物理服务器,承担云内与云外边界及负载集群服务。

(6)计算存储区但站点推荐采用8台4路融合型物理服务器设备,用于分布式计算、分布式存储和分布式网络服务。

3.3 虚拟资源池

虚拟资源池是基础设施层的具体应用,主要模块有计算存储资源模块(计算存储节点)、网络资源模块(网络设备)和业务管理系统(管理节点)。

3.3.1 计算存储资源模块

服务器是搭建云平台重要的组成设备之一,所以方案中底层的服务器资源也采用传统的X86架构的服务器。底层虚拟化技术采用国际最主流的KVM, KVM目前已成为学术界的主流VMM之一,是基于硬件的完全虚拟化,因此性能一举超过其他的虚拟化技术,经过调优之后的KVM更是将这种性能发挥到极致,虚拟资源的能力可以达到98%的物理资源的能力。

正是因为采用了KVM这样全虚拟化的技术,云平台系统可以为其用户提供支持QoS策略保障虚拟机资源分配,不会造成用户之间共享物理资源时相互干扰,这是以前半虚拟化技术所不能达到的[6]。多点、跨域自动化调度是云平台系统另外一个特点,支持x86架构服务器的管理数量无设计上限,实现多地的统一管理。

要让这些虚拟机正常工作,还需要为他们提供映像(image)。映像是一个包含了软件及必要配置的机器模版。对于基础软件操作系统是必须的,也可以根据自己的需求将任何应用软件(比如,数据库、中间件等)放入映像中。所以映像分为两类:其一是系统提供的,称之为“系统映像”,包括了各种Linux、Windows等操作系统;其二是用户通过捕获一个主机来自行创建的,名为“自有映像”。系统映像全局可见可用,自有映像只有用户本人可见可用。在映像中用户可以自行开发和测试各种服务和应用,并通过系统提供的映像功能,建立、配置并捕获模板,用于提供给不同的团队与项目使用。

存储资源也是搭建云平台重要的组成设备之一。云平台存储资源目前主要针对块存储设备(磁盘),会将所有的磁盘构成一个全局的块存储系统,由它为云平台上的用户统一提供存储服务。

在存储资源模块设计时,根据实际运营的经验数据,建议配置的存储系统可以支持多种类型的磁盘:SSD型磁盘、SAS型磁盘、SATA型磁盘,正如物理世界中的磁盘。SSD型磁盘适用于对I/O要求特别高的应用,例如数据库等在线业务;SAS型磁盘适用于跑一般的虚拟机和对I/O有比较高要求的应用,SATA型磁盘拥有更大的单块磁盘容积,适用于对容量要求较高的应用,例如文档存储等离线业务。

存储资源中提供的磁盘独立于主机的生命周期而存在,可以被连接到任意运行中的主机上,为主机提供持久化的、块级存储,并可以随时解除连接,转接至其他主机,如此还可以实现数据的快速转移。

除了磁盘,还提供了备份服务。备份(Snapshot)用于在块设备级别(block device level)上进行磁盘的备份与恢复,可以同时对多张磁盘做备份(包括系统盘和数据盘),也可以对正在运行的主机做在线备份。一张磁盘可以有多个备份链,每条备份链包括一个全量备份点以及多个增量备份点,用户可以随时从任意一个备份点恢复数据。

3.3.2 网络资源模块

尽管网络资源模块也是搭建云平台重要的组成设备之一,但是在云平台对于网络设备的使用都只当做为二层(链路层)设备来使用,物理网络设备只是解决连通性问题,无需使用任何三层(网络层)的协议。这样的好处是在确保性能最优的前提下,无需复杂的配置,无论是工程实施,还是后期维护,工作量都大大减少了。

为了提升整个云平台的高可靠性,系统中设计了多重实时副本,一旦发生硬件设备故障时,异地的实时副本就会自动开始工作,确保用户数据不会丢失,甚至上层的业务系统也不会下线。正是为了在内部支撑网络中高效传送多重实时副本,以及确保虚拟机之间的通信带宽,强烈建议采购方采用万兆(10Gb/s)以太网交换机来构建后端的网络系统。这些万兆网络设备都只以二层设备方式工作,把所有物理服务器连接起来,并且与互联网进行连通即可。

除了后端支撑网络系统外,网络资源模块设计还包括用户层面的网络服务。提供了多种组网方式:VPC虚拟私有云网络、与现有企业网直连的基础网络。

基础网络的好处是简单,无需用户做任何配置与管理即可直接使用, 但正因为它是全局网络,所以其安全保障需要依靠防火墙(Security Group)来实现的。

VPC私有网络需要用户创建并管理,VPC之间是100%隔离的,以满足对安全的100%追求。

私有网络类似物理世界中使用交换机(L2 Switch)将多台服务器连接在一起,组成的局域网[5]。VPC用于多个受管私有网络之间互联,并提供多项附加服务:DHCP服务、端口转发、VPN、隧道服务和访问控制,涵盖了常用的网络配置与管理工作。如果提供的VPC功能仍然无法满足网络管理的需求,可以创建自管私有网络,并自行配置和管理该网络。

IP地址的管理也是网络资源模块设计中的一个重要部分。弹性IP地址是在互联网(或企业内部办公网络)上合法的静态IP地址。在系统中,弹性IP地址与用户的账户而非特定的资源关联,用户可以将申请到的弹性IP地址分配到任意主机、负载均衡器和VPC中的资源,并随时可以解绑、再分配到其他资源,如此可以快速替换用户的对外资源。

3.3.3 业务管理系统

在规划好计算资源、存储资源和网络资源后,还需要规划智能管理系统,这部分功能可以运行在物理服务器上。作为管理节点,主要负责:

(1)物理机器的管理。每台物理机器都需要分配独有的ID,并能标识出物理机器的状态(活跃、待命、修复、不可用)。

(2)机器人管理。在P2P机器人社区中有各种类型的机器人,为这些机器人分配独有的ID,并能标识出机器人所处的状态[2]。

(3)区域管理。系统支持多地域的部署,需要为每个部署做个命名与标识。

(4)控制台管理。控制台与多地域也是具备独立生命周期的,既可以为每个地域的部署配置控制台,也可以让1个控制台服务于多个地域。

(5)API管理。对于通过API方式进行资源调度与管理的用户,需要管理访问的Quota以及密钥。

3.4 云计算容灾

在分布式虚拟机和虚拟磁盘上采用多副本机制保证了数据的安全。这些副本都要是实时副本,而且至少包含1份异地副本,即数据的写入只有在多个副本上都完成后才算成功,实时副本可以保证硬件设备出现问题时数据不丢失,这样即使源数据所在的主机突然出现问题,通过异地副本也能快速恢复。1份原始数据有多份实时副本,这也是系统热迁移的技术基础。构建在低延迟无损耗的物理专线上的跨数据中心异地副本也能快速恢复。

备份快照用于在虚拟磁盘块设备级别上进行磁盘的备份与恢复,可以同时对多张磁盘做备份(包括系统盘和数据盘),也可以对正在运行的主机做在线备份。1张磁盘可以有多个备份链,每条备份链包括1个全量备份点以及多个增量备份点,可以随时从任意一个备份点恢复数据。

4 云计算的不足和展望

通过云计算平台,我们可以实现虚拟化平台、云平台管理软件、SDN分布式网络和SDS分布式存储,支持硬件的自动发现与配置,支持通过简单的增加节点、连线、上电完成云平台的部署和扩容,满足业务大规模发展的需求。云平台提供的服务涉及IT基础设施层所有元素:计算、存储、网络和安全,还包括自动监控和运维,在云平台系统中可以一站式解决。

在本次云平台的建设中还有很多不足,例如:(1)对于虚拟化环境,需要建立一套适应江铜内部管理和运维的新流程。(2)自动化是云平台的一个重要组成部分,但随着自动化的不断完善会变得逐渐复杂,这就要求IT团队不断更新和储备知识。(3)私有云平台对外是一个相对封闭的平台,日后第三方的软件在接口对接上需要不断完善。

贵冶的云平台建设可以减少新系统上线的初期投资成本、降低业务部门整体运营成本,从而实现业务快速上线能力,最终提升贵冶的整体创新能力。

猜你喜欢

副本磁盘备份
浅谈数字化条件下的数据备份管理
叶腊石聚合成型及其旋转磁盘的制作方法
它的好 它的坏 详解动态磁盘
创建vSphere 备份任务
解决Windows磁盘签名冲突
Windows10应用信息备份与恢复
使用卷影副本保护数据
面向流媒体基于蚁群的副本选择算法①
一种基于可用性的动态云数据副本管理机制
Windows系统下动态磁盘卷的分析与研究