基于沃云的中国联通阅读基地云化工程
2014-05-18杨海云
周 巍 杨海云 杨 华
1 中国联通研究院 北京 100032 2 中国联通阅读运营中心 长沙 410014
引言
伴随着智能手机的普及,手机报、手机杂志、手机电子书等新媒体逐渐融入人们的生活中,人们的阅读习惯也逐渐由传统阅读向移动化、数字化的手机阅读转变。为满足人们对图书、杂志、漫画、报刊和多媒体读物的阅读需求,手机阅读整合各类内容资源,通过手机、计算机、电视机、手持阅读器等终端,以无线网络、互联网、彩信、短信、客户端、电视互联网等形式展现,提供给用户多媒体互动式阅读服务及阅读衍生服务。
截止到2012年底,中国手机阅读用户规模达到了2.91亿,较2011年增长了34.1%,手机阅读的市场规模达到了55.9亿元,比2011年增长了33.7%。在市场规模方面,2010年是中国手机阅读市场的爆发年,当年的市场规模为31.5亿元,较2009年增长了70.3%。此后的两年中市场都在稳步增长,2011年的市场规模为42.1亿元,同比增长33.7%,2012年则是55.9亿元,同比增长32.8%[1]。
为适应移动阅读市场的快速发展,更好地满足手机阅读用户的阅读需求,中国联通在湖南设立了阅读基地,建设全国统一的手机阅读平台。该平台于2012年3月21日正式割接上线运营,支持全网CP接入,满足用户通过WAP网站、Web网站、客户端等多种方式的书籍阅读、下载和互动。
但是,随着阅读基地业务的不断发展,一些问题也逐渐暴露出来。首先,物理服务器的整体负载普遍偏低,而且使用率不均衡,造成资源的浪费;同时,缺少服务器资源的管理和调控手段,无法最优化利用现有资源能力。另一方面,阅读基地目前没有配置容灾备份,其数据安全性存在隐患。上述阅读基地平台的技术需求,急需通过中国联通沃云平台相关技术来解决。
1 阅读基地现状
1.1 业务发展
经过一年来的平台建设及合作发展,阅读基地不仅形成以电子图书阅读为主,兼顾杂志、听书等相关业务形式,更自主开发了E家业务、轻阅读、品牌专区等创新业务模式。手机阅读业务是无线业务和阅读业务的完美联姻,她依托巨大的市场前景,已经成为中国联通发展最快的增值业务之一。
截至2012年底,阅读基地累计注册用户达6 133万户,同比增长21.9%。目前阅读基地累计注册用户情况详见图1所示。
阅读基地2012年度累计访问量29亿次,同比增长23.5%。目前阅读基地累计访问量情况详见图2所示。
图1 阅读基地累计注册用户数量图
图2 阅读基地累计访问量统计图
随着阅读用户的不断增长,阅读业务正进入高速发展阶段。阅读业务不仅为阅读基地带来可观的经济效益和良好的社会效益,也大大提升了阅读基地在移动互联网市场的竞争力。预计到2014年底,阅读平台的月均访问用户数(活跃用户数)将达930万。
从2013年下半年开始,正陆续引入有实力的第三方互联网公司合作运营,通过流量包月、特色专区、协作运营等合作模式,正不断引入大量的新增访问用户。合作方主要包括:1)平台合作方面有网易云阅读、手机腾讯网、百度阅读、贝瓦网、湖南卫视、蜻蜓电台。2)内容合作方面有盛大文学、天闻传媒、龙源期刊、央广之声。
1.2 平台架构介绍
阅读基地于2011年开始建设数字阅读平台,目前已经完成一期工程的建设。一期工程完成后,沃阅读平台可支持月均访问用户数为640万。
手机阅读平台为总部一级架构,可以为全国手机阅读用户提供阅读服务,真正实现了“一点建设,服务全国”。用户可以通过手机WAP、手机客户端、Web页面等方式进行内容的阅读、订购、搜索及下载;内容运营商可以对阅读内容进行转换、上载、定价、发布及更新;运营人员可以对平台用户和平台内容进行管理及营销,对内容运营商进行管理,对平台数据进行分析。平台的系统架构如图3所示。
图3 阅读平台系统架构图
阅读平台分为门户展现层,业务应用管理层和能力支撑层。
门户展现层包含用户门户、管理门户和行业阅读产品。用户门户包含WAP门户(触屏版门户),Web门户,客户端门户(PAD客户端),各用户门户作为在线访问入口,实现用户的WAP、客户端等界面入口的统一阅读支持。管理门户在逻辑上区分阅读基地各级别管理员职能,提供运营管理、内容管理、运维管理、客服管理、营销管理子系统,形成清晰的管理结构,各管理子系统间实现单点登录。行业阅读产品以满足企业、政府、校园等不同行业机构的差异化阅读需要专属打造,以Pad客户端门户、Web门户和手机客户端门户为入口,实现行业阅读的深度阅读特点和专业阅读的体验要求。
业务应用管理层是用户登录站点后可以进行的一系列操作和应用的集合。包括多媒体阅读、社交网络、店中店、在线阅读、用户下载等业务应用功能;以及门户管理、内容管理、产品管理、终端管理、系统管理、作家/CP管理、渠道管理、版权管理、报表、营销推介等业务管理功能。阅读平台设计的开放系统,向各合作伙伴提供了丰富的业务能力开放、调用和融合的手段,实现第三方平台、平台和渠道的多种合作,打造平台的平台。数据经营对用户行为数据的挖掘、分析、自动决策支持,为阅读营销提供最直接的数据依据和可行性分析。
能力支撑层主要是提供支撑能力如多媒体格式支持、下载、DRM、搜索等。
阅读平台对外与SMGW、MMSC、WAPGW/WebGw、VAC等接口,完成短/彩信、计费相关功能。
阅读平台总体系统功能架构如图4所示。
图4 阅读平台总体系统功能架构
1.3 云化需求分析
1.3.1 虚拟化改造
阅读基地自建设以来,业务发展迅猛,规模快速扩大,系统复杂度不断提升,各业务的硬件资源管理、应用管理难度日益突出;另一方面,由于业务发展的不均衡性,导致各个业务模块的资源使用不均衡,部分应用分配的资源较空闲,部分应用分配的资源较繁忙,为合理利用资源,有必要逐步采用云计算架构对阅读平台进行云化改造。改造目标主要包括以下三点。
1) 提高IT资源利用率,减少投资。云计算整合现有的IT基础设施建设,对服务器、存储以及网络等IT设备资源整合和虚拟化管理,实现系统间的错峰使用,提高资源利用率,降低企业的IT基础设施的投资成本。同时,相应的对机房、电力资源的占用也会减少,符合节能减排的要求。
2) 提高系统可靠性,降低投资。云计算技术基于虚拟化技术,目前应用较普遍的是基于X86架构的服务器搭建虚拟化平台。即采用价格相对低廉的X86服务器+云计算技术达到高可用性的IT基础设施,可以节约工程投资。
3) 提高IT资源管理效率。通过云计算技术可以实现批量创建虚拟机、批量部署软件、批量进行虚拟机迁移等管理操作,不用对物理机进行操作,这可以大大提高系统部署速度,从而提高企业生产效率。
1.3.2 容灾备份
目前阅读基地缺少容灾备份机制,为了提高存储资源的利用率和数据保护的安全性,将数据与沃云平台进行对接,将备份数据以文件形式存储到沃云平台。通过云存储能提供大容量的存储空间,用于数据库文件、统计库、计费话单、用户日志、大量图书和多媒体等文件形式的存储,数据存储安全有一定保障,便于维护和管理。
2 沃云平台
中国联通“沃云”平台是由中国联通研究院自主研发的云计算平台,整合了计算、对象存储、数据库、中间件等能力,现已承载集团及外部共30多个业务系统。
2.1 云平台简介
2.1.1 平台架构
沃云平台整体架构分成四个层次:物理资源层、虚拟化层、云计算管理层和业务应用层[2],云计算平台整体架构如图5所示。
图5 云计算平台整体架构图
1) 物理资源层。物理资源层是现有的常规IT硬件资源,包括服务器、存储、网络设备等。
2) 虚拟化层。虚拟化层将物理硬件资源进行虚拟化,以虚拟机、虚拟存储、虚拟网络、虚拟终端等形式提供给上层。
3) 云计算管理层。云计算管理层实现云计算的两个核心功能——资源管理和运营管理,具体包括配置管理、容量管理、发布管理、时间管理、服务门户、服务目录、自动化、监控及计量等方面。
4) 业务应用层。业务应用层是云计算平台所承载的应用,业务应用层向云计算平台申请计算资源,在此技术上部署上层应用软件,开展业务应用。
2.1.2 功能特性
沃云平台主要功能包括以下五点[3]。
1) 计算资源统一管理。能够通过单一集中的管理系统,管理平台中所有软硬件资源,包括服务器、存储设备、网络设备、操作系统、应用软件、IP地址、子网等;可以将服务器分组管理、分类型管理;存储容量、接口、与服务器的关联;VLAN与子网定义等。
2) 计算资源池化管理。将所有计算资源以资源池的方式进行管理,可以定义资源池,并将服务器、存储添加到资源池中;可以按照预定义的模板自动安装配置新加入的服务器;可以为资源池定义统一的策略。
3) 虚拟化管理。能够统一管理各种虚拟化软件及平台;可在服务器上实现虚拟机的创建、删除、迁移、启停及更改配置;可展现虚拟机与服务器的关联;支持管理存储虚拟化,可在存储上创建虚拟磁盘,维护虚拟磁盘配置;支持管理网络虚拟化,可进行VLAN的维护、VRF的管理。
4) 高可用性。当硬件服务器出现故障后,系统应该自动将上面运行的虚拟机迁移至其他服务器,迅速恢复服务;当需要对某服务器进行维护时,系统应对服务器上的虚拟机进行实时迁移,避免业务中断。
5) 动态调整。客户项目在运行期可以对资源需求进行动态调整,包括调整项目周期、服务器数目,以及单个服务器的cpu、内存、存储空间等。
2.2 云存储技术
2.2.1 技术架构
沃云云存储是一套分布式统一存储系统,具有优异的性能、可靠性、可扩展性、灵活性。沃云云存储的底层是由多台X86服务器组成的存储节点通过分布式算法组成的一套分布式统一存储文件系统,可以通过底层访问接口直接访问到分布式统一存储系统[4](支持C、JAVA、C++、python等主流开发语言),同时Client也可以通过上层的对象存储服务、文件存储服务、块存储服务进行相应的存储服务访问。
整个云存储从上至下分为服务接入层、控制管理层和数据存储层,如图6所示。
图6 沃云云存储架构
1)服务接入层:客户端身份验证,负责响应来自客户端的数据访问请求。2)控制管理层:通过分布式随机算法维护一张资源所在数据存储节点的映射关系表,负责将来自服务接入层的数据访问请求转发到相应的数据存储节点。3)数据存储:负载最终的数据存储,响应数据请求。
2.2.2 系统功能
沃云云存储可提供对象存储服务、文件存储服务和块存储服务[5]。
1) 对象存储服务实现对象、容器及用户相关的具体功能。①对象相关功能:包括创建对象、删除对象、获取对象、设置对象属性、 获取对象属性、获取对象权限、设置对象权限、对象公开访问URL设置等功能。②容器相关功能:包括创建容器、删除容器、获取用户所有容器、获取容器中对象、设置容器权限、获取容器权限等功能。
2) 文件存储服务实现基于文件的新建、删除、修改、获取文件权限、设置文件权限等功能,能够兼容主流的Windows/Linux系统,具有极大的跨平台兼容性。
3) 块存储服务。块存储是一种基于存储网络的、可弹性扩展的、可由客户端主机进行管理和使用的卷设备。块存储服务提供的块存储挂载进客户端主机后的使用方式与现有普通硬盘的使用方式完全一致。块存储服务的主要功能有以下四点。①弹性扩展:支持对块存储设备存储容量的扩容与收缩。②块设备镜像的导入/导出。③块设备镜像的镜像复制与重命名。④基于块设备的快照创建与回滚。
3 阅读基地云化
3.1 虚拟化改造
为了提高资源利用率、降低运维成本、加速业务部署,阅读基地需要对服务器资源进行云化改造,形成池化的服务器资源,满足应用系统对底层计算资源即需即取的要求。部署云平台管理系统对资源池进行统一管理、调度,并对上层应用系统提供统一的服务接口。为保证原有系统的稳定运行、平滑过渡,云化改造采用先构建种子云的方式,后续把应用系统逐步迁移到云平台的方式进行,其原则包括以下几点。
1) 先易后难。资源池建设的最终目标是构建统一的全局共享唯一资源池,当前目标是先易后难,逐步过渡。
2) 前瞻考虑未来系统建设发展。需要前瞻性考虑应用系统发展对资源池的需求,探索和尝试各类系统应用的资源池部署模式,先梳理一批轻量级、规模小、易改造的应用,将其部署到X86资源池。
3) 立足于当前应用系统的实际情况,以向应用系统提供便捷的基础资源服务为建设目的。构建的资源池应对目前应用系统的改造影响尽量小。应用在未彻底进行分布式改造前,高端小型机在关键业务、高性能需求的应用场景下仍有不可替代的作用。
云化资源池建成后,为保证业务稳定运行与平滑过渡,需要把原有应用逐步按顺序迁移到云化资源池,如图7所示。
云计算的本质是提高资源利用率,对于管理类应用来说(比如:OA系统、网管系统),由于其低并发、资源消耗小等特点,导致传统的烟囱式建设方式资源利用率低下,大量计算资源闲置。此类应用迁移到云化资源池后,可以得到很好的整合比,资源利用率提高效果明显。同时由于此类应用对可靠性要求较低,在使用云计算建设方式的初期可以有效验证系统稳定性,积累运维经验。
图7 应用系统向云化资源池迁移原则
生产类应用系统(如:门户服务器、业务管理系统)面向最终用户,系统并发量大,要求系统有高可用性,同时由于业务量大,要求使用低成本的X86系统。此类应用系统的迁移可以在管理类应用之后进行。
数据分析类应用系统(如:大型数据库服务器)由于已经有较高的资源利用率,迁移到云化资源池后可以得到较好的管理统一性、便利性,但系统整合比不高,资源利用率提高不明显。建议根据应用的特点,后期迁移到云化资源池,或者不迁移。
阅读基地现有X86架构的业务服务器三十余台,其中主要的服务器其CPU、内存利用率都偏低,见下表1所示。
依据上文分析的迁移策略,将分步骤地把应用系统迁移到虚拟化平台。计划先迁移接口服务器、SLP业务服务器、OMM服务器;其次门户服务器、DCACHE服务器、搜索引擎服务器、社区服务器等,而对数据库服务器则根据虚拟化平台运行情况在后期进行迁移,或者不迁移。同时,计划在虚拟化平台上实施阅读基地的扩容工程,部署新的应用系统,使平台的整体CPU/内存利用率达到80%以上,实现资源利用的最大化,如表1所示。
表1 服务器利用率
3.2 云存储异地容灾
为保证阅读基地数据的安全性,在中国联通研究院沃云平台内建立存储节点,对阅读基地内云存储数据进行异地容灾。系统架构如图8所示。
图8 异地容灾备份架构
云存储备份服务是基于底层的云存储平台所提供S3 RESful API接口或者SMB/CIFS通信协议,在此之上实现的文件备份服务,通过底层云存储之间的异地数据同步,从而实现数据的异地容灾备份。在阅读基地新增2台备份Server,安装备份软件和云存储接口程序,通过接口程序接入云存储,实现备份Server与云存储的对接。 阅读业务平台服务器作为Client,安装Agent代理程序,并根据实际备份需求定制文件备份策略,实现最终的文件备份。
异地容灾备份支持多种不同的备份策略。
1) 完全备份(full backup),即按照备份计划每次备份都对需要备份的数据进行完全备份。当发生数据丢失的灾难时,只需要一份备份数据(即灾难发生前最近一次的备份数据),就可以恢复所有丢失的数据。但由于每次都对整个系统进行完全备份,造成备份的数据大量重复,备份所需的时间也就较长。
2) 增量备份(incremental backup),即按照备份计划,每次备份时都只针对当前数据与上一次备份相比变化过的数据进行备份。这种备份策略节省了磁带空间,缩短了备份时间。但当灾难发生时,数据的恢复比较麻烦。恢复时需要将最近一次增量备份到最近一次全量备份之间的所有增量备份数据都恢复,同时可靠性也较差。
3) 差异备份(differential backup),即每次备份都只针对当前数据与上一次全量备份相比变化过的数据进行备份,与增量备份的主要区别就是变化数据的参照数据,增量备份是跟前一次备份的数据相比,差异备份是跟上一次全量备份的数据相比。差异备份无需每次都对系统做完全备份,因此备份所需时间短,并节省了磁带空间,其次,它的灾难恢复也很方便,每次恢复只需要最近一次差异备份和最近一次全量备份的备份数据就可以将系统恢复。
4 结语
综上所述,将沃云平台的虚拟化和云存储技术应用于阅读基地平台,一方面解决了阅读基地服务器资源管理问题,提高了平台服务器的资源利用率,加强了对资源的管理调控能力;另一方面,通过云存储技术,将阅读基地数据文件在沃云平台中进行异地容灾,提高了数据的安全性。
参考文献
[1]2012-2013中国手机阅读市场年度报告[R].艾媒咨询,2013
[2]张云勇,李卫,陈清金.电信运营商云综合管理平台研发实践探索[J].信息通信技术,2013,7(1):28-32
[3]房秉毅,张云勇.浅析云计算基础资源池化在电信运营商业务支撑系统中的应用[J].中国电信建设,2013,25(1)
[4]李卫,李济汉,张云勇,等.电信运营商云计算体系架构思考[J].电信科学,2013,29(3):123-127
[5]李卫,张云勇.2012年中国云计算发展研究[R].2012通信行业发展分析报告,2013