云环境下VoLTE核心网负载均衡及高可用性研究
2019-09-10徐伶伶张欣张淑莲
徐伶伶 张欣 张淑莲
摘 要:VoLTE可将全部业务承载于4G网络上,并实现数据与语音业务在同一网络下的统一。由此,本文研究运行在云计算环境下的VoLTE核心网的可行性、可靠性、负载均衡能力和高可用性,并提出采用N+K模式和NoSQL DB作为数据存储方式实现负载均衡的可行性,以期为相关学者的研究提供借鉴。
关键词:VoLTE核心网;N+K模式;高可靠性
中图分类号:TN929.5 文献标识码:A 文章编号:1003-5168(2019)28-0015-03
Study of Load Balancing and High Availability of Volte Core
Network under Cloud Environment
XU Lingling ZHANG Xin ZHANG Shulian
(Qingdao Institute of Technology,Qingdao Shandong 266300)
Abstract: VoLTE can carry all services on 4G network, and realize the unification of data and voice services in the same network. Therefore, this paper studied the feasibility, reliability, load balancing capability and high availability of the VoLTE core network running in the cloud computing environment, and proposed the feasibility of using N+K mode and NoSQL DB as the data storage mode to achieve load balancing, in order to provide reference for the research of relevant scholars.
Keywords: VoLTE core network;N+K mode;high reliability
1 研究背景
4G網络,无论是TD-LTE还是FDD-LTE,采用的都是分组交换技术,即全IP网络,不再提供专门的语音信道。4G时代的到来让移动上网的速度进入了一个崭新的时代,但对移动通信最基本的业务,即语音通话却没有提供足够的支持。对于该问题,目前,各运营商给出的解决方案大部分都是双待机或电路域回落(Circuit Switched Fallback,CSFB)。双待机技术即一部手机在4G和2G网络下同时待机(与双卡双待的区别是只使用一张SIM卡),4G网络负责上网,2G网络负责打电话,互不影响。这种方式由于需要两套射频发射系统,因此,功耗是最大的问题。电路域回落方案只使用一套射频系统,通话时进行切换并接入2G网络,此时4G网络会断开,通话结束后再切换回4G网络。这一方案的最大问题是切换网络需要时间,这一时间可能长达十几秒,只能作为牺牲用户体验为代价的权宜之计。无论是双待机还是电路域回落,打电话都必须通过2G网络完成。对运营商来说,必须同时维护2G和4G两个网络,成本太高,非常不划算,而且从长远来看,2G/3G网络必然会被4G所淘汰。因此,在4G网络内部实现语音通话功能是必然趋势。由于4G是纯IP网络,因此VoIP(Voice over IP)技术自然而然地成为解决这一问题的首选方案,VoLTE(Voice over LTE)技术应运而生。VoLTE是基于IP多媒体子系统(IP Multimedia Subsystem,IMS)的语音业务[1]。IMS由于支持多种接入和丰富的多媒体业务,成为全IP时代的核心网标准架构[2]。经过几年的发展成熟后,如今IMS已经跨越接入方式,成为固定话音领域VoBB、PSTN网改的主流选择,而且也被3GPP、GSMA确定为移动语音的标准架构[3]。VoLTE无须2G/3G网络,全部业务承载于4G网络上,可实现数据与语音业务在同一网络下的统一。
2 电信设备的云化
随着云技术的发展和人们对云技术的接受程度不断提高,运营商越来越倾向于搭建自己的云平台或租用云提供商的平台来部署IMS网络,运营商不用再花大价钱购买硬件,而是将服务器搭建在云端的虚拟机里。为了适应这一变化,通信设备制造商也转型成为纯软件提供商,不再出售硬件,而改为出售可以部署在云端的软件服务。这样做对运营商的好处是显而易见的,一方面节省了硬件投资,另一方面提高了灵活性和可扩展性。为了应对偶发的大话务量,如春节拜年、全国性的观众参与活动等,需要准备大量的硬件余量,从而占用大量的机房。而如果将IMS网络部署在云端,扩容只需要创建新的虚拟机实例,进行简单的配置即可。这使得运营商不必再按照最大话务量来准备资源,可以根据需要,随时增加和减少资源,灵活性更强,且提高了资源利用效率,大大降低了成本。
3 采用N+K模式和NoSQL DB作为数据存储方式来实现负载均衡及高可用性
将电信软件成功移植到云平台使电信设备制造商完成了向软件提供商转型的第一步,也是最重要的一步,使SaaS(Software as a Service)成为现实。但是,并不是完成这一步就万事大吉了,仍然还有很多可以改进的余地。其中最显著的问题就是原来的设备是1+1冗余备份的,移植到云平台后,依然保持了1+1冗余备份的特点,即一半虚拟机是备份设备,在主用设备(虚拟机)正常工作时不参与话务处理,这就意味着一半虚拟机资源在正常情况下被白白浪费。1+1冗余备份的另一个特点是如果主用和备用虚拟机同时出现问题,其他虚拟机是帮不上忙的,因为数据只在这一对主用/备用虚拟机之间备份,其他机器并没有这些数据。这种情况在传统电信设备上出现的可能性很小,但在云环境下却有可能出现。比如,主用和备用虚拟机运行在同一个物理实体机器上,如果这个物理实体机器出现故障,将影响所有运行在该物理实体机器上的虚拟机。因此,1+1冗余备份并不适合在云环境下使用,而N+K冗余才是适用于云环境的备份方式。
在N+K模式下,一共有N+K个虚拟机实例在运行,其全都是主用设备,正常进行话务处理,但每台设备并不是100%的资源都被使用,而是都留有一些余量。如果某一个或几个虚拟机实例发生故障,不能正常运行,其他正常运行的虚拟机实例可以接替它们继续工作。当同时故障的设备数不超过K时,不影响系统的目标处理容量和稳定性。如果失效的实例超过K时,系统将无法达到设计的目标处理能力,造成系统过载,从而影响系统的稳定性。运营商可根据实际情况和需要的处理容量来调节N和K的具体配置。
同时,N和K并不是一旦部署就不可改变,运营商可根据话务量的大小动态地增加或减少虚拟机的实例,这个过程可以人为调整。比如,在重大节日或活动开始前,人为增加虚拟机的实例以提高处理能力,节日或活动结束后再减少虚拟机的实例,扩容非常灵活。这个过程也可以是自动的,當系统检测到话务量增加,处理能力不足时,动态增加虚拟机的数量;当系统检测到话务量较低,有大量处理资源闲置时,可以动态减少处理机的数量。
但要做到这一点,需要解决一个根本问题,即数据存储。虚拟机实例A要接替另一个虚拟机B运行,那么实例A必须要拥有或者能访问到虚拟机B原有的数据。在1+1冗余备份的模式下,主用设备的数据是完全备份在备用设备上的,这样,当主用设备出现故障时,备用设备可以轻松接手,因为其拥有所有需要的数据,而且只有这一个备用设备可以接替,其他设备即使空闲也无法接手,因为其他设备没有数据。而在N+K模式下,任何一个设备失效,要求其他任何一个实例都能接替其工作,这就对数据的存储和访问提出了要求:每一个设备都可以访问其他设备所生成的数据。
通信设备处理的话务量是巨大的,在忙时,每秒钟有数以万计的呼叫在进行,与话务量相关的数据随着呼叫的发起和结束不断地发生着动态变化,如果使用传统的关系型数据库来处理这些数据显然不可行,需要新的机制来存储这些动态变化的数据。
随着互联网和云计算等技术的应用与发展,大数据广泛存在,同时也产生出了许多云环境下的各种新型应用,如移动服务、社交平台、协作编辑等。这些新型应用对海量数据管理/云数据管理系统也提出了新的需求,如事务支持、系统弹性等。同时,云计算时代海量数据管理系统的设计目标为可扩展性、弹性、容错性、自管理性和“强一致性”。随着互联网的兴起,传统的关系数据库在应付超大规模和高并发SNS类型的动态网站已经显得力不从心,暴露出了很多难以克服的问题,而非关系型的数据库则由于本身的特点得到了迅速发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题,因此NoSQL数据库非常适用于存储所有节点的会话数据。
4 实验仿真
通过MATLAB软件对1+1模式和N+K模式的可靠性进行仿真,模拟大话务量情况下不同数量虚拟机失效情况以及总体呼叫的接通率,两种模式均采用20个VM,[N]=15,[K]=5,得出如图1所示的结果。
从以上仿真结果可以看出,N+K模式在节省硬件成本的同时,提高了系统的可靠性。
5 结语
本文研究运行在云计算环境下的VoLTE核心网能否满足电信设备对高可靠性和容灾能力的要求,提出采用N+K模式和NoSQL DB作为数据存储方式来实现负载均衡以及高可用性。通过虚拟机实时迁移、服务节点故障自动恢复、分布式部署等获得集群级别的高可用性和容灾能力,达到比设备级备份更高的可靠性。
参考文献:
[1]中国电信股份有限公司.中国电信IMS网络容灾技术要求[Z].2013.
[2]王丽瑛.IMS网络容灾实现方案研究[J].电信技术,2014(21):146-150.
[3]许盛宏,李力卡,刘智德.IMS核心网元准POOL容灾方案研究[J].移动通信,2015(13):19-23.