基于成本收益分析的云计算环境下数字图书馆建设研究
2011-08-11马晓亭兰州商学院信息工程学院甘肃兰州730020
马晓亭 (兰州商学院信息工程学院 甘肃兰州 730020)
陈 臣 (兰州商学院网络中心 甘肃兰州 730020)
1 引言
云计算是一种新的数据计算、处理与管理模式,是一种多用户条件下数据密集型的超级计算。用户可根据云服务需求,按照“共享、按需、安全、经济、透明、可扩展”的原则从云服务提供商购买云服务。Google宣称,由于使用了云计算技术,其计算成本仅为竞争对手的1/100,存储成本仅为竞争对手的1/30。
随着云计算技术的发展与成熟,依靠云计算技术构建数字图书馆,为用户提供高效、安全、经济、个性化的云服务成为必然。在云图书馆建设中,效率、安全、成本、服务是决定云图书馆建设水平的四个关键要素。如何依据图书馆云用户数量和云业务需求,提供相应的图书馆云服务风险管理,确保云图书馆较高的服务效率与用户满意度的前提下,加强以收益率为核心的云基础设施采购、管理、运营、维护建设,不断降低云图书馆建设与运营成本,是关系到云图书馆未来发展的重要问题。[1]
2 基于Amazon弹性云计算新加坡地区云服务的云图书馆成本构成
基于云计算技术的数字图书馆主要经历建设、运营、维护、更新四个生命周期流程,生命周期流程中的投资主要包括硬件成本、软件成本、带宽成本、空间成本、电力成本、以及维护成本。不同云图书馆建设、运营、服务规模与管理理念的差异,导致云图书馆整体收益率不同。结合云图书馆四个生命周期流程对云图书馆成本构成进行有效划分,并依据收益率最优化原则分配资金及制定有效的资源分配及基础设施管理策略,是提高云图书馆成本效率、安全及最优化运营的保证。
2.1 云计算中心基础设施资源租赁成本
为降低云图书馆建设、管理、运营、维护成本,确保在世界区域内为用户提供安全、高效、满意的云服务,基于云计算的数字图书馆在基础设施建设中,应租赁具备较高信誉度、安全标准、技术水平的云服务提供商基础设施资源。
世界上具备较高水准的云服务供应平台有Google和Amazon的公有云计算平台和IBM企业的私有云计算平台。为确保数字图书馆云用户不会因为地域、网络接入方式、租赁费用及云个性化服务要求而影响云服务质量,云图书馆在建设中主要以租赁公有云基础设施资源及云技术服务为主,结合自身云服务目标建设自己的云图书馆。我们依据地域最近和价格性能最优化原则,选择Amazon弹性云计算新加坡地区云基础设施租赁数据,分析我国图书馆租赁Amazon云基础设施资源建设云图书馆的成本问题 (Amazon弹性云计算新加坡地区云计算基础设施资源包租收费情况见表1)。
表1 Amazon弹性云计算新加坡地区包租收费表
首先,根据2008年1月1日实施的《中华人民共和国企业所得税税法》,电子设备折旧年限最低为3年,因此将自购硬件系统的折旧周期定为3年。其次,由于基础设施资源技术更新、OEM厂商的质保年限要求及设备折旧等因素,Amazon弹性云计算服务提供了以一至三年为基准的年度租赁方式。云图书馆可根据自身云业务与用户云服务需求,选择投资、收益比最高的租赁方式。
对表1数据分析可得,云计算基础设施资源租赁费用是云图书馆建设、运营投资的主要方面。对租赁成本、效率分析,以年度为单位方式租赁基础设施资源,其成本远远低于其它租赁方式,且数字图书馆以3年期为标准租赁方式是最经济、高效的。
云图书馆数字服务具有并发用户数海量及云计算高速、即时、准确的要求,因此,较快的CUP计算速度与较高的内存储容量是云图书馆对云计算服务特有的要求。在云基础设施资源服务购买上,特别要加强在CUP与内存储容量方面的投资,防止因数字图书馆云计算速度过慢,而不能应对云图书馆数字用户并发访问数量过多、云个性化服务信息处理量过大等问题,导致云服务瓶颈现象的出现。[2]
2.2 云图书馆网络带宽及流量成本
云图书馆网络带宽是影响用户云服务的关键性因素,在云图书馆建设、运营投资比例中仅次于基础设施资源租赁成本,占有较大的投资比重。即使云数据中心基础设施资源有较高的云计算、存储、传输效能,云图书馆网络带宽传输瓶颈的出现,也会导致用户方产生云系统运行、应答缓慢,个性化云服务因数据传输量巨大而出现拒绝服务的现象。因此,云图书馆网络具有较高的网络传输带宽租赁需求与数据流量海量特点 (Amazon弹性云计算新加坡地区数据流入/流出计费标准见表2)。
表2 Amazon弹性云计算新加坡地区数据流入/流出计费标准
对表2分析得出,Amazon对经Internet网络传输的数据按照流入和流出云数据中心分别计费,并且流入云数据中心的数据传输费用为零。对于流出云数据中心数据的传输费用,随着云用户租赁数据中心每月数据流出量的增大,数据传输投资与传输数据量之比呈下降趋势,云网络传输投资效率呈级数上升状态。当网络每月数据传输量高于524TB时,云数字资源用户可根据实际使用量与Amazon协商获得更大优惠,且优惠幅度与数据传输量呈级数上升趋势。因此,云图书馆利用较低的费用增加网络传输带宽及数据传输流量,可大幅提高云图书馆数据传输性能与云用户服务满意度,有较高的投资收益比。[3]
2.3 Amazon EBS(Elastic Block Store)存储和弹性 IP 地址的费用
EBS是Amazon EC2(弹性云计算)的一种持久存储特性,是为用户在云中提供相当大的计算容量的基础设施服务。利用Amazon EBS,云图书馆可以编程方式创建存储容量,并附加到Amazon EC2实例上。甚至在需要更高的持久性时,还可以利用快照备份到Amazon简单服务存储上。
Elastic IP(EIP)是为动态云计算而设计的静态IP。一个EIP地址关联用户账号,EIP地址可以通过编程方式重新映射Public IP地址到用户账号关联的任何一个实例。因此,允许用户掩盖实例或者Availablity Zone的错误,而不用重新配置或者替换新的主机。Amazon EC2通过编程方式重新映射用户EIP地址到一个替换实例,达到处理实例或软件问题(Amazon弹性云计算新加坡地区EBS存储与弹性IP地址费用见表3)。
表3 Amazon弹性云计算新加坡地区EBS存储与弹性IP地址费用
对表3数据分析可得,云图书馆可根据用户弹性云计算的规模与需求选择EBS存储方式。在云计算环境下,云图书馆为用户开放了许多高计算能力、大存储容量的即时个性化云计算服务,从未来发展趋势看,这种个性化云计算服务模式会成为图书馆云服务的主流与核心。因此,云图书馆采用以用户请求次数作为EBS付费方式可以大幅节省云存储成本。[4]
Amazon对正在使用的弹性IP地址不计费,未使用的IP地址每小时收费$0.01,每个月的头100次IP的RemaP不计费,额外的RemaP每次收费$0.10。
2.4 Amazon云系统监测与弹性负载均衡费用
Amazon云系统监测可以对图书馆云资源和运行的云应用程序实施监控。图书馆云系统开发人员和云系统管理员可以通过编程方式检索监测数据,查看采样数值图形并设置警报点。通过云监控系统,图书馆云系统管理员可及时对云系统资源利用率、云应用、服务指标、数据传输和存储磁盘使用活动进行收集和跟踪管理,并结合监测数据及时对云系统安全、效率、业务参数进行配置,确保图书馆云系统、各项云应用程序和业务平稳运行。[5]
Amazon云负载均衡采取资源统一管理与调度原则,将单个重负载的运算、存储分担到多台节点设备上并行处理,计算结点设备将所得结果汇总。存储节点设备根据业务繁重程度共同分担存储数据。当出现故障节点时,存储任务均衡迁移到其它正常节点,确保云系统计算与存储能力得到大幅度提高。通过弹性云负载均衡技术,可以解决图书馆云计算中应用系统的可用性和可靠性,提高云计算数据的访问速度。Amazon弹性云计算新加坡地区云系统监测与弹性负载均衡费用如表4所示:
表4 Amazon弹性云计算新加坡地区云系统监测与弹性负载均衡费用
对表4分析可得,为确保云图书馆为用户提供安全、高效、经济、不间断的云服务,在云系统监测项目中,必须选择对图书馆云中心采用较高监测频率的细节监控方式。监控内容包括云图书馆站点、服务器性能、网站安全扫描服务、故障分析、用户访问速度、警告通知等方面,且必须进行不间断高标准监控。虽然所采用的监控方式为价格最高模式,但有性能与云安全最优化的投资收益比。
图书馆提供的云计算数字服务以各种编码方式的海量高速数据传输为主,数据传输具有海量、即时、安全、经济的要求。因此,从收益率最大化出发,在弹性负载均衡方面应选择以每小时为单位的计费方式。[6]
2.5 其它方面的成本
云图书馆建设其它方面的成本主要包括机房建设成本、云应用软件成本、电力及维护成本、人员工资及培训成本等。机房建设成本与云图书馆建设规模和云服务方式成正比,基础设施租用费用一般按照机架支付。软件成本主要为基础设施即服务(Infrastructure as a Service)的应用服务,主要有虚拟化平台软件、客户端操作系统、存储管理软件及系统监控管理软件。在云图书馆总体成本中占有较小的比例,但对云用户服务满意度影响较大。因此,对云应用软件较小的投入可得到较高的用户满意度收益率。电力及维护成本主要包括数据中心的IT负载、制冷、照明、UPS的耗电成本及维护成本,并随着季节、云用户服务数量、服务器工作效率呈周期性变化。随着云计算系统集成复杂度及运营维护、安全标准的提高,电力及维护成本在未来云图书馆建设、运营中将逐步提高。人员工资及培训成本在云图书馆建设投入中所占比例较小,但技术水平优秀的员工对云系统高效、安全运营影响较大,因此,要加强云图书馆人员工资及培训成本的投入。[7]
3 基于云计算的数字图书馆成本、性能优化方法
基于云计算的数字图书馆与传统图书馆在建设、管理、运营、维护模式上相比,最大的优势在于大幅度降低能源消耗和有较低的成本效用,在确保低碳运营前提下提高了用户满意度与市场竞争力。如何加强云图书馆业务与规模建设,在提高云服务质量与效率前提下降低能源消耗,关系到未来云图书馆的发展与社会责任。
3.1 利用虚拟化技术加强云基础设施资源整合
对表1云图书馆基础设施租赁情况分析可得出,在云数据中心规模小、用户数少、基础设施结构简单的情况下,利用虚拟化技术对云图书馆进行整合,会得到较小甚至负面的投资收益。当云数据中心规模较大、服务用户数较多、云服务资源环境要求高、基础设施结构复杂和数据存储管理难度大的情况下,合理的虚拟化资源管理策略会提高系统投资收益率,并降低运营成本。
首先,要提高基础设施(主要为计算与存储服务器)资源虚拟化的规模、程度和所占基础设施资源设备的比例,实现虚拟化和物理基础设施资源管理的高度可视化和可管控性。其次,通过虚拟化技术对计算和存储资源进行整合,提升服务器资源的利用效率。根据图书馆云用户需求动态分配云系统资源,提高云计算速度和成本效率,通过降低电力等能耗降低云图书馆运营成本。[8]
3.2 整合图书馆云应用程序
为了提高图书馆用户云个性化服务水平,云图书馆应基于云租赁商基础设施平台,自主或与第三方合作开发各种云用户满意的个性化应用程序。图书馆云应用程序的可操作性、个性化、便捷性、经济性是影响用户满意度的关键因素。因此,在图书馆云应用软件系统建设中,要以图书馆云用户个性化服务需求为指导,加强云图书馆应用程序与云租赁商云系统的融合,提高图书馆云系统内不同云应用程序间的整合。同时,应提高云图书馆自主或与第三方共同开发、运营云应用程序的效率,提升图书馆个性化云应用系统的可操作性与服务水平,降低程序开发成本与周期。[9]
3.3 采用集群技术与负载均衡技术降低云图书馆运营成本
由于云图书馆基础设施具有规模庞大、结构复杂的特点,集群内部设备的性能、管理模式和系统资源利用率性能差异较大,会出现云系统不能将用户提出的服务请求均衡交付服务器的情况,造成服务器有的过载有的空闲,最终导致云集群系统整体性能大幅下降。因此,必须采用科学、有效的负载均衡算法,将云图书馆用户服务请求合理、均衡地分配给后台各个服务器,当个别设备发生软、硬件故障时,通过负载迁移确保云服务的不间断性。
对云图书馆基础设施租赁成本分析得出,云图书馆系统规模与集成化程度与投资收效率、云用户服务满意度成正比关系,与云系统维护成本、资源损耗收益率成反比关系。因此,在云图书馆建设中,要租赁大规模、高安全性的云服务提供商云系统服务,并选择以3年为周期的租赁方式。在云系统集成中,即要考虑目前云用户服务需求与高峰时期云系统负载量,同时又要兼顾未来图书馆系统云服务的可扩展性,确保在云服务租赁模式上有适当的基础设施资源冗余度。[10]
3.4 加强云图书馆系统资源精细管理
在世界上不同的地域、季节与一天内不同时段,云图书馆数字用户访问量及服务负载有较大不同。云图书馆在云服务高峰期有较高的资源占用率和能源损耗,在云服务低峰值阶段,如果不采取有效的云系统资源管理策略,则会造成不必要的云基础设施资源及能源(云中心能耗以服务器及空调设备耗电为主)损耗。通过云系统资源精细管理策略,利用云系统软件或者人工方法设置功耗管理的智能逻辑,可对服务器资源池进行合理调配。通过设备监控系统将空闲服务器关机或者休眠,对冗余的云服务器资源暂时关机断电,使其成本效用达到最优化状态,在降低功耗基础上提升云资源的可管理性。
3.5 确保云图书馆网络带宽与基础设施资源使用效率匹配
对表2数据分析可得,网络带宽是影响云图书馆运营成本与服务质量的关键因素。网络传输带宽较小不能满足用户个性化云服务数据传输高速、安全、即时、准确的要求,导致数据传输速度远远低于云系统数据处理能力,降低了云基础设施资源利用效率。网络传输带宽过高甚至超过云系统接收、发送与数据处理能力,会导致较高的网络租赁费用而增加云图书馆运营成本。因此,为确保云图书馆网络带宽与云基础设施资源使用效率达到最优化均衡,必须认真分析云图书馆用户网络传输带宽需求与云系统基础设施资源接收、处理能力,通过最优化均衡策略确保云图书馆网络带宽与基础设施资源数据处理、存储能力均衡。
影响云图书馆网络使用用户满意度的几个主要因素为云用户连接数、云系统响应时间、数据传输量、传输稳定性。决定基础设施资源使用效率的因素为云计算能力、云系统读取数据的速度、网络传输带宽。云系统应针对不同图书馆云应用、SLA(云计算服务级别协议)或者数字用户云服务需求,将提升网络带宽与基础设施资源使用效率均衡相结合,提升云网络传输带宽与基础设施资源租赁的成本综合效用。[11]
4 结语
云计算技术在数字图书馆建设、运营、管理、维护中的应用,实现了云数字图书馆对信息系统资源与效率的自主可控管理。通过云基础设施资源的智能化管理与按照云用户需求智能化分配云系统资源,在降低能耗的基础上大幅提高了数字图书馆云IT资源利用率。随着未来云计算技术的产业化、规模化发展,云计算成本必将大幅降低。只有坚持以数字图书馆云用户满意度为目标,以高效投资收效率为指导,不断加强基础设施资源的虚拟化管理与云系统整合,才能建设用户满意的高效、经济、安全、低碳的云数字图书馆。[12]
[1]王鹏.走进云计算[M].北京:人民邮电出版社,2009:121-135.
[2]冯丹.网络存储关键技术的研究及进展[J].移动通信,2009,33(11):35-38.
[3]陈康,郑维民.云计算:系统实例与研究现状[J].软件学报,2009,20(5):1337-1348.
[4]Amazon.Amazon Elastic ComPute Cloud(AmazonEC2).2011[EB/OL].[2011-07-20].http://aws.amazon.eom/eeZ/.
[5]陈康,郑纬民,云计算:系统实例与研究现状[J],软件学报,2009,5(5):57-58.
[6]屈志毅,苏文洲,赵玲.一种基于信息分散算法的分布式数据存储方案[J].计算机应用,2006,26(5):1102-1105.
[7]王庆波等.虚拟化与云计算[M].北京:电子工业出版社,2009:181-184.
[8]严庄.高校数字图书馆存储整合研究[J].图书馆学研究,2010,(2):34-36.
[9]孙健,贾晓菁.Google云计算平台的技术架构及对其成本的影响研究[J].电信科学,2010,(1):38-44.
[10]吴吉义等.云数据管理研究综述[J].电信科学,2010,26(5):34-41.
[11]何国伟.IBM:虚拟化是“云计算”关键能力[J].计算机应用,2009,32( 11):35-36.
[12]周舒,张岚岚.云计算改善数字图书馆用户体验初探[J].图书馆学研究,2009,(4):28-30.