APP下载

基于云计算的全球眼业务平台研究

2010-06-27闻剑峰石屹嵘

电信科学 2010年6期
关键词:计算资源物理节点

闻剑峰,石屹嵘

(中国电信股份有限公司上海研究院 上海 200122)

1 概述

云计算是一种新型业务交付模式,同时也是新型IT基础设施管理方法。通过新型的业务交付模式,用户将通过网络充分利用优化的硬件、软件和网络资源,并以此为基础提供创新的业务服务。云计算让IT部门可以把海量资源作为一个统一的大资源进行管理,支持IT部门在大量增加资源的同时无需显著增加相应的人员进行维护和管理。

全球眼业务是中国电信提供的基于IP技术和宽带网络的网络视频监控业务。全球眼是一个可行的远程监控解决方案,利用网络直接把设备感应到的图像信息传输到远端的网络计算机上。典型的全球眼应用包括管理、安防等管理应用以及看护、安全等家庭应用。全球眼系统由前端设备和后端平台两大部分组成,前端设备主要包括摄像头以及编解码器;后端平台主要实现视频数据的存储、访问以及分析应用。本文着重探讨全球眼系统后端平台的实现方式,即基于云计算的全球眼业务平台。

1.1 引入云计算技术的驱动力

全球眼系统提供的是典型的高计算、高存储应用,将云计算技术引入全球眼系统可以提升多方面的性能。

·在全国建设统一的全球眼系统,设立一级、二级和三级平台,统一管理全国的全球眼业务,由多级平台统一管理和分配计算、存储和网络资源,采用云计算技术可以标准化和自动化全球眼业务平台的资源管理。

·全球眼系统包含众多的业务系统,且基本上都是以烟囱方式进行建设和管理的,每个业务系统独占物理服务器,为了保证服务质量,在扩容时一般都是按照峰值时的需求配置的,在正常情况下大部分的资源将被浪费,没有得到充分利用,引入云计算技术实现现有全球眼系统后端平台资源池化,可以极大地提高资源利用率和管理水平。

·基于全球眼监控数据的智能分析可以提升全球眼系统的核心竞争力,以区别于市场上其他类似的方案,在给用户提供更多服务的同时,能够给中国电信带来更高的附加值。分析应用往往都是计算密集型应用,利用云计算技术实现计算资源的统一管理,为各个分析应用提供弹性的计算资源,能够以更少的物理资源满足需求。

1.2 目标和定位

云计算技术主要应用于全球眼系统的后端平台,目的在于通过云模式下的资源自动化和虚拟化技术,实现资源的统一管理和共享,使全球眼基础架构得到简化,可以快速、灵活地响应业务发展需要,提高资源利用率,降低运营成本。

2 业务模型

基于云计算的全球眼业务平台从3个方面完成对传统的全球眼系统的改造:首先是对原有全球眼应用的迁移和改造,提高资源利用率,降低建设和运营成本;其次是创建新的特色服务,特别是智能分析应用;最后是提供新的业务模式,除了面向政企、家庭等封闭型客户外,拓展面向公众客户的全球眼应用。

2.1 对传统全球眼系统的改造

(1)通过整合共享平台计算资源

在传统的全球眼系统下,每个客户都按照峰值需求配置了独立的物理资源平台,这些平台相互之间没有实现共享。每个客户系统有不同的负载周期,其中系统处于峰值时间较少,普遍存在物理资源利用率不高、建设和运营成本偏高的现象。利用云计算技术实现物理资源的虚拟化和统一管理,多个客户之间共享一个物理资源平台,综合不同客户的不同负载周期,用更少的资源来满足客户的服务质量需求,保证客户的业务体验;同时通过共享实现物理资源成本的分摊,使客户可以更低的价格享用服务。

(2)弹性化视频分发服务

视频分发服务器负责用户视频请求的处理和分发,在用户数量较多的情况下,需要按照用户数量和视频服务器实际的处理能力考虑增加视频服务器,以保证用户的请求可以得到正常的处理。但是,用户的视频请求通常波动很大,具有不确定性,用户在视频分发服务器上的投资不能得到充分利用。

将视频分发服务构建在云基础设施平台上,监控用户对视频分发服务器的请求数,通过云平台计算资源的自动扩展和收缩,动态地调整视频服务器的数量,保证用户的业务使用体验。同时,通过云计算资源的按需租用,能够最大限度地保护用户的投资,降低用户的使用成本。基于云计算的视频分发服务适用于用户访问量高、负载变化大的全球眼客户(如学校、医院、旅游景点等客户)以及面向公众开放的全球眼应用 (这些应用有一定的用户访问量,而且用户访问量随时间变化较大)。

(3)可扩展和动态存储系统

存储是全球眼系统的重要组成部分之一,全球眼系统支持两种不同的存储模式:前端存储和后台集中式存储。后台集中式存储便于在后台进行统一管理以及实时的数据分析处理,但对网络传输要求高,需要7×24 h不间歇地传输,如果网络意外损坏,视频数据就会丢失。云计算技术适用于后台集中式存储方式,通过云计算的可扩展性和动态分配这两大特性确保全球眼业务数据的存储安全。

(4)分布式移动编解码

全球眼业务的监控数据在后台以统一的格式进行存储,当通过不同的客户端,特别是通过移动设备客户端进行视频回放时,需要对后台存储的视频数据进行特定的编解码,以适应终端的要求。事先完成所有视频数据在不同格式下的编解码显然不合理,会浪费大量的存储和计算资源。一般来说,视频编解码需要根据用户的请求,判断用户设备的特性,选择合适的编解码标准,然后实时进行编解码。媒体码流的输入、转码和输出,对于VAU(视频接入单元)应用的承载单元需要消耗大量的计算资源,同时需要保证用户的业务体验,需要实时快速地返回编解码结果。采用云计算中的分布式计算平台,可以把计算任务分解到多个节点上执行,最后完成结果的合并,以提高系统的响应时间。

2.2 基于云计算的全球眼的创新业务模式

(1)提供新的智能分析应用

智能分析是全球眼平台提供的增值服务,不同的客户有不同的智能分析需求,目前规划中的分析应用包括行为识别、物体识别、人脸识别、丢失探测、运动检测以及图像搜索等。智能分析应用一般对计算能力有较高的要求,而且智能分析系统的使用模式具有临时、突发的特点,在较短的时间段内需要大量的计算资源,对全球眼业务平台而言,最关键的是在各个智能分析应用之间共享计算资源,提高资源利用率,降低运营成本。通过建设基于云计算的全球眼业务平台,多个分析应用可以共享平台的计算资源,通过分布式计算提高应用性能,同时通过云平台上应用规模扩展的能力,在多个分析应用之间动态地调配计算能力。

(2)提供面向公众用户的全球眼服务

传统的全球眼系统主要为政企客户提供服务,目前服务对象正在向家庭用户延伸,其需要为每个企业或者家庭用户搭建一套全球眼监控系统,根据实施的规模和时间长度收费。基于云计算的全球眼业务平台可以提供创新的服务,例如搭建一套公共的全球眼交通服务平台,中国电信在主要交通节点上由自己或与交通部门合作部署摄像头,为公众用户提供交通查询服务,用户可以查看当前时间某个地点的交通状况,然后根据使用次数或者流量等付费,而非传统的租用方式。这种新的业务模式有两点不同:首先中国电信提供的不是一个应用,而是以SaaS(软件即服务)模式给用户提供服务,这样用户的一次性投入更少,有利于全球眼服务的推广;其次服务面向的是公众客户,系统的负载变化更加复杂和不可预测,需要在平台层提供更灵活的支持以保证服务质量的同时减少总物理资源的投入。

2.3 基于云计算的全球眼业务平台架构

在基于云计算的全球眼业务平台上,不同角色有着不同的业务特性。对于终端用户来说,有两大云特色的业务特性:一个是自服务的使用模式,这要求直观、易用的用户界面,用户可以根据自己的需要以自服务的方式申请和使用;另一个是基于使用的计费,用户无需购买硬件、软件和服务,而是基于云平台记录的用户使用数据来计费,用户只需为他们使用的资源付费,降低了使用成本。

从业务架构的角度来看,构建基于云计算的全球眼业务平台,需要打造全球眼服务的整体生态环境,把终端用户、运营商、开发商和服务提供商有机地结合在一起,促进生态链的良性发展。基于云计算的全球眼业务平台对开发商以及渠道需要提供支持。对开发商的支持,除了提供全球眼规范外,还包括全球眼开发包和公共组件库,并提供全球眼系统的开发和测试环境,以加速开发商对于应用的开发,同时通过社区等Web 2.0的能力有效地连接开发商和用户,让开发商可以更好地了解市场和用户,提供更好的应用。对渠道的支持包括服务的定制打包、批量订阅以及整体计费等。

3 功能模型及技术实现

3.1 功能模型

基于云计算的全球眼业务平台功能模型如图1所示,其包含基础设施、平台和应用3层,各层实现不同的业务功能。

基础设施层提供了对物理资源的管理和虚拟化功能,并把基础设施级的服务(包括镜像管理、实例管理、应用动态扩展)通过API的方式提供给上层,同时用户可以通过服务门户对基础设施平台进行管理。

平台层主要提供了分布式分析计算平台和SaaS平台。分布式分析计算平台给计算密集型的分析和计算应用提供了分布式环境,使得应用可以方便地利用云平台上的多个计算节点,加速计算和处理过程。SaaS平台可以把全球眼应用转换成服务的方式进行交付。平台层还提供了全球眼的公共组件,如弹性视频分发、分布式移动编解码等,这些公共组件基于云计算模型进行开发,其他全球眼应用可以直接调用这些公共组件而不需要各自开发。

应用层则提供了全球眼的各个应用系统,如视频回放、自动报警以及各类智能分析等,用户可以通过浏览器或者特定的客户端访问和使用这些服务。

3.2 技术实现

图2所示为基于云计算的全球眼业务平台的技术架构。

底层是物理资源及其虚拟化,这部分可以单独建设,也可以集成在中国电信的IDC内;在虚拟化资源之上提供的基础服务包括应用管理、负载监控、弹性分配、统计分析等;最上面是具体的全球眼应用功能,包括基本功能和增值功能。在云计算基础设施平台虚拟化基础上,全球眼系统对于应用弹性伸缩、分布式计算以及存储有独特需求,下面对这几部分的技术作进一步说明。

(1)应用弹性伸缩

应用弹性伸缩是基于云计算的全球眼业务平台的一个重要特性,可以根据用户负载的变化动态分配所需的资源,用尽可能少的资源满足业务体验和服务质量需要。应用弹性伸缩基于基础设施平台的镜像和实例管理,在此基础上为应用搭建一个集群环境,监控应用使用的云资源,根据负载的增长或缩减自动给应用集群增加或者减少资源,同时通过弹性的负载均衡把用户的请求分派到集群中各个节点。

(2)分布式计算

分布式计算平台将任务分解成多个并行的子任务,充分利用基于云计算的全球眼业务平台上的计算资源节点,加速分析计算的过程。分布式计算平台主要由分布式文件系统(HDFS)、基于MapReduce的应用框架、特定领域的数据模型以及特定领域的分析工具和算法库组成。对外部客户机而言,HDFS就像一个传统的分级文件系统,可以创建、删除、移动或重命名文件等。存储在HDFS中的文件被分成块,然后将这些块复制到多个计算节点中。这些计算节点包括:NameNode,在HDFS内部提供元数据服务;DataNode,为HDFS提供存储块。存储在HDFS中的文件被分成块,然后将这些块复制到多个计算机中(DataNode)。HDFS内部的所有通信都基于标准的TCP/IP。DataNode通常以机架的形式组织,机架通过一个交换机将所有系统连接起来。HDFS的一个假设是机架内部节点之间的传输速度快于机架间节点的传输速度。

(3)数据存储

存储是基于云计算的全球眼业务平台非常重要的一部分,全球眼视频监控业务数据量大,同时需要为用户保留一定时期的历史数据。随着用户的增加,存储要求越来越高,因此要求在存储方面具备良好的可扩展性。除了存储容量之外,还需要对包括缓存大小、处理能力以及内部互联带宽等在内的各方面进行扩展。在基于云计算的全球眼业务平台中,存储分为两大类,一类是临时存储,常常指物理主机上带的硬盘;另一类是持久性存储,也称为共享存储。一般来说持久性业务数据都需要保存在共享存储中。

在基于云计算的全球眼业务平台中,视频监控数据具有很强的私密性和敏感性,同时大数据量的视频监控数据不适合存储在虚拟机的临时存储中,需要给每个客户在共享存储中开辟一块私有的、隔离的视频数据存储区域,即需要提供多租户特性的虚拟化存储。

4 物理模型及硬件选型

4.1 物理架构

从运营角度看,云基础平台可以分成公共云、私有云和混合云,分别面向公共用户、公司内部用户和混合用户。中国电信可以分别建设全球眼公共云基础平台和内部私有云基础平台。图3所示为公共云基础平台参考物理架构。

在图3中,左侧是管理域,右侧是资源域,管理域和资源域在网络上保持隔离,以保证管理域的安全性。在管理域节点上运行云模式全球眼业务平台的管理功能。资源域包括下部的共享存储,通过存储虚拟化给全球眼客户提供持久性存储;中部是计算节点架构,节点之间网络互联,以虚拟机的方式给全球眼客户提供计算资源和临时性存储;上部是网络架构,通过两级或者多级交换机提供虚拟机所需的网络资源,同时通过防火墙提高公共云网络的安全性,通过VPN给全球眼客户提供专属网络。全球眼客户通过互联网接入访问云模式全球眼业务平台上的服务,可以给每个全球眼客户配置一个虚拟局域网,该全球眼客户的所有虚拟机都在虚拟局域网内,在网络上和其他全球眼客户进行隔离。同时,基于云计算的全球眼业务平台需要与BSS(业务支撑系统)和OSS(服务开通系统)集成,便于电信运营商统一管理。

4.2 硬件选型原则

在物理架构上需要考虑包括共享存储架构设计、计算节点架构设计以及网络架构设计。在共享存储架构设计上建 议 采 用 NAS (network attached storage)和 DAS(disk attached storage)混合的方式,在保证速度的同时降低成本。NAS主要用于镜像和数据的持久化存储,而DAS用于临时性的存储。在计算节点架构设计上主要考虑计算能力和内存,在提供能力的同时需要考虑购置和运营的成本。在网络架构设计上主要考虑物理服务器、虚拟服务器和存储等所需要的网络,分离管理节点和资源节点,考虑资源节点网络的扩展性,建议采用两级网络设计;同时需要考虑设置防火墙,在公共环境下保证云基础平台的安全。

在具体的云基础平台物理设计上,需要从计算能力、网络、存储等多方面综合考虑业务需求进行相应的设计。不同的业务需求对底层的物理设计有不同的要求,例如分析型应用对系统的可靠性要求稍低,适合采用基于x86架构的PC服务器等。从一般意义上讲,建议采用同构的物理平台,通过标准化的同构可以提高平台的自动化处理水平,降低后续的管理和维护费用。

(1)CPU 的选择

主要从计算能力和价格两个方面来考虑。对于计算能力的要求取决于应用场景,一般来说为了提高云平台的密度,一个CPU建议支持16或者32台虚拟机,更高的主频会导致利用率降低。从成本上来说,除了考虑CPU本身的购买价格外,更重要的是考虑CPU能耗导致的费用,这两者结合可以计算出CPU的总成本。最后根据需要在计算能力和价格两方面进行平衡选择。

(2)内存的选择

主要取决于每个节点需要支持的虚拟机数量,一般来说,如果一个节点需要支持32台虚拟机,建议配置64 GB或者更大的内存。同样成本也是需要考虑的因素,目前4 GB的内存条性价比更高,8 GB的内存条单位成本高,而2 GB的内存条因为节点的插槽有限,很难扩展到64 GB或者更大。

(3)计算节点配置

一个计算节点上需配置相应的CPU、内存和硬盘。假设一个节点上需要支持32台虚拟机,一般来说一个节点上可以包括2个CPU、64 GB的内存和5 TB的硬盘(支持每台虚拟机160 GB的临时存储)。同时在计算节点选型上需要重点考虑提高计算密度,因为云平台有大量的物理资源,提高计算密度可以有效地降低对空间、空调等方面的要求。

(4)存储的选型

需要考虑可靠性、数据恢复、容错以及单位成本等方面。在之前有提到建议采用NAS,而不采用SAN。在对具体存储产品进行比较后,还需要考虑具体的SLA要求,选择一个合适的存储方案。

(5)网络的选型

在设计云平台的网络结构时,需要考虑整个平台的容量,假如每个节点支持32台虚拟机,有200个节点时就有6 400台虚拟机,需要考虑相应的子网/交换机的容量。一般建议采用两层模型来搭建网络设施,同时特别需要注意的是在云平台环境下,服务器-服务器和服务器-存储的带宽消耗会远大于互联网和WAN的带宽消耗。

5 演进步骤

基于云计算的全球眼业务平台的建设需要分阶段进行,从提供基础服务开始,然后扩展到应用服务。

全球眼基础平台演进路线:

·在全国各级逐步实现物理资源的集中化管理,以至全国大集中;

·实现物理资源的虚拟化;

·实现基础平台的自动化部署。

全球眼应用平台演进路线:

·实现应用的规模伸缩能力;

·提供海量数据存储和分析处理平台;

·SaaS化全球眼应用,以随用随付费的方式提供给用户,特别是向公众用户提供全球眼应用。

6 结束语

对于目前全球眼业务平台的建设和运营来说,如果实现了业务平台的云计算能力(计算能力和存储能力)的集中管理和灵活分配调度,那么新的业务平台上线只要分配合适的计算和存储能力即可,这样可以彻底改变目前业务平台单独立项、建设的模式,也将大大节约中国电信对全球眼业务平台投资建设的费用,对打造“绿色电信”和“低碳经济”的建设具有非常重要的意义。

1 梁笃国,张艳霞,郑泽民.网络视频监控技术及应用.北京:人民邮电出版社,2009

2 龚德志,闻剑峰.虚拟化技术在电信服务器资源整合中的应用研究.电信科学,2009,25(9):21~23

3 石屹嵘,段勇.云计算在电信IT领域的应用探讨.电信科学,2009,25(9):24~28

4 闻剑峰,龚德志.虚拟化技术在电信灾难恢复计划中的应用研究.电信科学,2009,25(9):16~20

猜你喜欢

计算资源物理节点
只因是物理
CM节点控制在船舶上的应用
Analysis of the characteristics of electronic equipment usage distance for common users
基于模糊规划理论的云计算资源调度研究
基于AutoCAD的门窗节点图快速构建
处处留心皆物理
改进快速稀疏算法的云计算资源负载均衡
基于Wi-Fi与Web的云计算资源调度算法研究
耦合分布式系统多任务动态调度算法
三脚插头上的物理知识