国网客服中心异地双活系统GTM全局负载均衡方法
2020-06-29杨维邓志东马永波王雷
杨维 邓志东 马永波 王雷
摘 要:传统大型数据中心实现异地双活是一种必要的发展趋势,具有资源利用率高、业务连续性好和灾备能力强等特点。针对高并发访问、海量数据处理、应急响应和灾难快速恢复等要求,国家电网公司适时提出了95598核心业务异地双活系统的建设方案。以此为基础,介绍了异地双活环境下GTM全局负载均衡总体逻辑架构,并遵照该架构介绍了包括基于DNS域名解析、OSB企业服务总线和全局路由表的3种GTM设备全局负载均衡关键技术。最后,兼顾考虑省市接入距离和数据中心最大负载量利用率,提出了一种基于logistic回归模型预测潜在用户数量的省市用户优化接入方法。
关键词: 异地双活; 95598核心业务系统; GTM全局负载均衡; 潜在用户
中图分类号: F426
文献标志码: B
Abstract: The implementation of remote dual-activity for traditional large-scale datacenters is a necessary development trend, it has the advantages of high resource utilization, good business continuity and strong disaster recovery capabilities. In response to the requirements of high-level concurrent access, massive data processing, emergency response and rapid disaster recovery, the State Grid timely puts forward a construction scheme of the remote dual-active system for the 95598 core business system. Based on this system, this paper introduces the overall logic architecture of GTM global load balancing under the remote dual-activity, and describes the global load balancing design in detail which includes three key technologies for global load balancing based on DNS domain name resolution, OSB enterprise service bus and global routing table. Finally, taking into account the access distances of provinces and cities and the maximum load utilization rate of data centers, an optimized access method for provinces and cities based on the logistic regression model to predict the number of potential users is proposed.
Key words: remote dual-active; 95598 core business system; GTM global load balancing; potential users
0 引言
目前,越来越多的组织机构选择异地多数据中心的建设模式进行容灾备份,如银行、医院和社保等[1-3]。根据国网公司改革总体部署,国网天津客服中心于2012年4月23日正式挂牌成立,下设南上海、北亦庄两个相距100公里以上的分中心。在日常工作中,两个系统可以共同承载业务的服务,互为备份,保证当其中一边发生灾害事件时,另一方接管所有的业务服务,是一种充分利用资源的计算机灾备方案,以实现远距离异地双活。
然而,双数据中心环境下,数据中心要得到整体上较高的服务水平,也需要考虑均衡数据中心之间的负载均衡。本文结合异地双活环境下95598客户服务中心GTM全局负载均衡总体逻辑架构,介绍了全局负载均衡的关键技术,包括GTM设备基于DNS域名解析、OSB企业服务总线和全局路由表的全局负载均衡方法。之后,兼顾最小化省市接入距离和考虑数据中心最大负载量利用率,提出了一种简单的基于logistic回归模型预测潜在用户数量的省市用户优化接入方法。
1 异地双活系统全局负载均衡总体逻辑架构
95598核心业务系统主要包含基础支撑平台和业务支持系统两部分。其中,业务支持系统作为使用人员的登录平台及界面,全面受理95598客戶服务业务,负责业务工单受理、查询、咨询等,而基础支撑平台作为底层的数据支撑,是27个省公司营销数据来源的存储数据中心,同时提供对外的企业服务总线OSB服务,起到承上启下的关键作用。95598核心业务系统的GTM全局负载均衡的总体逻辑架构图,如图1所示。
全局负载均衡[4-5](global server load balance,GSLB)是指应用在生产中心前端、对放置在不同地理位置和不同生产中心间的负载均衡,实现将用户访问流量快速导向距离其最快、最近的可用生产中心的相对应的业务系统,提高用户
服务响应速度和访问体验,同时实现两个异地生产中心之间互相备份和负载均衡。
异地双活数据中心构建在两个生产中心的基础上,需要考虑实现两个生产中心间的协调工作,控制广域流量全局负载均衡,同时引导用户访问最优的生产中心,或者当某个生产中心出现灾难性故障后,引导用户通过访问其他生产中心实现关键业务的访问,是实现异地双活最为关键的问题。
在服务区域划分的过程中,针对省市用户接入数据中心,传统的做法通常仅仅是依据依靠地理上的位置分布信息,没有考虑数据中心的用户负载量。同时,在区域内访问用户数量的处理上,直接假设潜在用户数与与人口数成正比。因此,在3.2节的访问概率估计的基础上,为了优化省市接入数据中心方案,本节提出了一种兼顾考虑数据中心负载量的优化模型,对基于最小化用户接入距离的接入方案进行重新划分。
对于电力客服中心多数据中心系统来说,不同的省市接入方案都会带来相应的代价。这里,为更清楚地描述接入代价,需定义0-1二进制数,当且仅当aij值为1时,表示将省市Ui接入数据中心Dj,并且规定每个省市仅能接入一个数据中心。
首先,从传统的单数据中心改造为多活数据中心后,保障各中心的负载均衡性对于系统性能提升尤为重要,因此,本文定义“均衡代价”,如式(6)。
其中,调和系数α,β满足和为1,以调整生成接入方案时总接入代价F对于均衡代价VA和时延代价DE的重视程度,即当α较大时,方案偏向于考虑负载均衡性,反之,则偏向于考虑控制总接入距离。此外,为尽可能的协调各个数据中心的用户负载量,引入λ,γ分别表示数据中心的最低利用率和最高利用率,达到既能够充分利用数据中心的资源量,又避免数据中心负载量过大。
3.4 仿真结果及分析
在仿真过程中,本文对27个省市和南北两个数据中心的数據进行合理地数学化处理,并采用数据挖掘工具中的逻辑回归模型预测各省市的潜在用户,结果如图5所示。
同时,结合图5中估计的潜在用户数和图6中的各省市到数据中心的距离,运用LINGO优化求解器求解省市用户接入数据中心的优化模型。仿真过程中,将各省市的省会到数据中心的距离作为省市到数据中心的距离,并设置两个数据中心的最大用户负载量相同,且作为对比,本文同时实验了用户就近接入的方案,即α为0,相关结果如图6—图8所示。
从图7和图8可以看到,在两个数据中心的最大负载相同的情况下,按就近接入原则分配时超过大半的省市用户都将接入北方分中心,造成该中心负担严重而另一个中心的资源大量闲置的局面。相反,按照本文的优化接入方案,考虑各省市的接入距离和潜在用户数量,同时兼顾数据中心的最大负载量,各省市被合理地分配到南北两个数据中心,能有效发挥异地双中心的优势。同时,由于接入距离一定程度上可以反映访问时延,因此随着调整调和系数α,β的相对大小,可以获得在负载均衡性和时延上的不同要求。
4 总结
本文简要介绍了国家电网公司95598客户服务中心全局负载均衡总体逻辑架构,并详细叙述了此架构下的3种GTM全局负载均衡关键技术,包括DNS域名解析、OSB企业服务总线和全局路由表。最后,兼顾最小化省市接入距离和考虑数据中心最大负载量利用率,提出了一种基于logistic回归模型预测潜在用户数量的省市用户优化接入方法。
参考文献
[1] 鲁茜, 徐迅. 异地双活容灾技术在数字化医院信息安全中的应用[J]. 企业科技与发展, 2015(9): 28-29.
[2] 宋汝勇. “双活”异地容灾的技术方案社保行业解决方案[J]. 科技经济导刊, 2016(19): 215.
[3] 秦文劭. 浦发银行网上银行安全体系的构建[D]. 上海:复旦大学, 2012.
[4] 武欣欣, 徐敏, 储世华. 全局负载均衡器技术在双数据中心架构下的研究与实现[J]. 科技风, 2016(1): 34-35.
[5] 张鹏飞, 魏军, 李方军,等. 应用层全局负载均衡及本地负载均衡研究及设计[J]. 电力信息与通信技术, 2015(2): 119-122.
(收稿日期: 2019.08.10)