APP下载

5G消息中心容灾的研究与实践

2022-09-08张吉春

江苏通信 2022年4期
关键词:容灾华东信令

张吉春 葛 良 刘 玲 秦 磊

中国移动通信集团江苏有限公司

0 引言

中国移动有八大区虚拟化网络云资源池,业务网元以NVF化承载在网络云平台上。中国移动5G消息与短信业务已全部上云,八个大区同厂商5G消息中心互备容灾。

5G消息中心各大区间容灾关系如下:华东南大区与华东北大区互备容灾;西南大区与西北大区互备容灾;华南大区与华中大区互备容灾;华北大区与东北大区互备容灾。各5G消息中心容灾对应关系如图1所示。

图1 5G消息中心容灾关系图

大区之间做AA(active-active)互备容灾,采用双归属策略。正常状态下各大区各自处理本大区业务,而在容灾时,则能迅速接管对方大区的全部业务。

目前江苏移动的5G短信一半承载在华东北资源池,一半承载在华东南资源池,如果华东南大区节点出现重大故障,其上承载的全部江苏移动5G短信业务将迁移到华东北资源池,这需要维护人员人工登录网络后实施手工切换来开展容灾,完成全部业务的切换预计需要1个小时,在切换期间会造成大量业务的丢失,造成公司收入的损失。

双归属策略通过DNS查询、options探测、内部心跳机制,实现主用路径发送,并支持备用路径,达到容灾切换目的。而为避免大区内大量业务的同时联动切换,将容灾粒度设置为按短信处理模块、消息处理模块、SIP接入模块、MaaP平台模块分别切换,最终实现业务跨大区资源池的自动和无损切换,对客户的业务体验无任何影响。

1 业务模块容灾方案

1.1 短信处理模块容灾方案

短信模块目前包括点对点短信、梦网短信、行业短信、互通短信等业务场景。

1.1.1 点对点短信业务

华东北1短信中心承担苏北点对点短信、消息转短信业务。与WXLSTP1/2/3/4各有4条IP高速信令,与NJLSTP1/2/3/4各有4条IP高速信令,与NJHSTP1/2各开8条IP链路。共48条IP高速信令。

华东南2短信中心承担苏南点对点短信业务。与WXLSTP1/2/3/4各有4条IP高速信令,与NJLSTP1/2/3/4各有4条IP高速信令,与NJHSTP1/2各开8条IP链路。共48条IP高速信令。华东南、华东北短信中心信令连接拓扑如图2所示。

图2 华东南、华东北短信中心信令连接拓扑图

以苏州点对点短信业务切换为例,苏州短信中心的ID有:13800512500。如果华东南大区出现4-8级故障,需要干线维护人员手工修改南京HSTP1/2、南京LSTP1/2、南京LSTP3/4、无锡LSTP1/2、无锡LSTP3/4的路由数据,将苏州短信中心的ID(13800512500)从华东南2短信中心的信令点编码(9-247-141)指向华东北1短信中心的信令点编码(9-247-133)。

为了支撑点对点短信业务的无损切换,技术人员通过制作SCCP层主备信令点的方案来实现GT路由的自动容灾切换。如果华东南大区出现4-8级故障,无需维护人员人工接入,业务自动切换到华东北大区的短信中心,实现点对点短信业务的无损切换。

贝尔STP实施方案:创建SCCP层数据时将entityset定义主备两条entity数据,对应优先级为1和2,将GT指向该entityset,当优先级为1的entity出现信令点不可达时,GT会自动路由送往优先级为2的entity的信令点进行翻译。

华为STP实施方案:创建SCPP寻址策略,在寻址策略中定义主备两个信令点数据,对应优先级为0和1。创建GT数据时,采用多点翻译模式索引至该寻址策略,当优先级为0的信令点不可达时,GT会自动路由送往优先级为1的信令点进行翻译。

1.1.2 网关短信业务

网关短信业务包括全网梦网短信、省内梦网短信、行业短信、互通短信业务。以全网梦网短信业务为例,该业务承载在华东北短信中心3。如果华东北大区出现4-8级故障,需要短信网关维护人员在全网梦网网关上手工修改路由指向,将原来需要指向华东北短信3的路由修改为指向华东南短信中心4。

为了支撑网关短信业务的无损切换,技术人员提出通过在网关设备下设置主备账号的方式进行网关自动快速容灾。当主用短信中心故障时(比如SNDS5GMC3),网关会自动将业务切换至备用短信中心账号(比如SNDS5GMC4)下发。目前现网所有的网关(全网梦网网关、省内梦网网关、互通网关、行业网关)都通过版本升级实现了该功能,并且网关下面都要求下挂主用短信中心账号和备用短信中心账号。

1.2 消息处理模块容灾方案

当用户归属大区消息模块或文件服务器异常时,主用大区SIP接入模块以90秒为间隔探测主用大区消息模块的异常。当SIP接入模块检测到异常时,将使消息模块的链路与信令媒体的路由自动切换到容灾大区消息模块。同时,域名解析系统将修改主用大区消息模块域名与主用大区文件服务器域名指向容灾大区消息模块IP与容灾大区文件服务器IP,并且在所有大区的MaaP模块查询域名解析结果时,路由均指向到容灾大区的5G消息模块,外部chatbot查询域名解析则指向容灾大区的文件服务器。消息处理模块容灾原理如图3所示,消息处理模块信令流程如图4所示。

图3 消息处理模块容灾原理

图4 消息处理模块信令流程图

1.3 SIP接入模块容灾方案

当SIP接入池内其中一个SIP接入模块故障时,终端会根据本地策略自动切换到接入池内其他可用的接入模块上,后续当故障SIP接入模块恢复正常后,待终端重新注册时会再度切回到原来的SIP接入模块上。SIP接入模块容灾原理如图5所示。

图5 SIP接入模块容灾原理图

1.4 MaaP接入模块容灾方案

主用大区在MaaP平台不可用情况下,将进行MaaP容灾切换。承载网DNS将修改本大区MaaP域名指向对应容灾大区的IP地址,同时文件服务器、用户终端、chatbot与5G消息中心将根据DNS返回的地址指向容灾大区MaaP平台。公网DNS分别修改本大区MaaP平台提供给文件服务器、用户终端、chatbot与5G消息中心的域名所指向的IP为容灾大区的MaaP平台地址。MaaP平台模块容灾原理如图6所示,MaaP平台模块容灾信令流程如图7所示。

图6 MaaP平台模块容灾原理图

图7 MaaP平台模块容灾信令流程图

2 应用实践与效果

华东南可信资源池1&2均位于金华数据中心D01号楼202机房,采用中兴的服务器和虚拟层、华为的TOR/EOR配对路由器。两个资源池承载了江苏移动6套短信中心NFV网元,一套大区5G消息中心。

华东南短信中心、消息中心和华东北短信中心、消息中心一对一进行容灾配置且互为主备。现以华东南短信中心与消息中心进行说明,其归属资源池、备用短信中心、业务属性关系如表1所示。

表1 华东南短信中心与消息中心资源关系对应表

5月26日凌晨关闭华东南大区中兴资源池1&2的EOR配对路由器上行业务端口,模拟资源池故障。检查统计MO起呼业务量,容灾前苏南地市业务全部在2局承担,容灾开始后2局业务量降为0,容灾局点华东北1局MO业务量开始增加;容灾完成倒回后,1局业务量开始减少,2局业务量恢复至平时夜间正常水平。

检查统计手机起呼MO成功率,容灾前苏南地市业务在2局承担;容灾开始后2局成功率降为0,容灾局点1局MO成功率容灾开始后指标显示正常;容灾完成倒回后,1局业务量开始减少,MO成功率也恢复到正常值;2局业务量增加恢复至平时夜间正常水平,成功率也恢复正常。

华东北5G消息中心在0:23分左右接管华东南用户,华东南用户业务拨测正常、计费正常,无异常告警,和预期一致。华东北5GMC统计的华东南四省NO业务量、NO成功率和同时段华东南指标基本一致。

3 结束语

本文研究了5G消息中心各模块跨大区的容灾方案,包括短信处理模块、消息处理模块、SIP接入模块、MaaP接入模块。通过华东南大区整体容灾演练的实践,验证了容灾方案的可行性,并对后续其他云化业务平台的容灾方案制定起到一定的借鉴作用。

猜你喜欢

容灾华东信令
华东销售在一线
杭州中美华东制药有限公司
高速公路收费中心容灾备份系统建设方案分析
0到1500万!华东已布局!看看渔东伽这场年会还透露了什么?
移动信令在交通大数据分析中的应用探索
利群:顺势而为,登场华东
基于信令分析的TD-LTE无线网络应用研究
关于建筑企业容灾备份系统方案的探讨
基于数据容灾技术在企业信息系统中的应用研究
LTE网络信令采集数据的分析及探讨