故障转移集群部署在石油销售企业档案管理系统中的应用
2012-04-29刘鹏靳文婷
刘鹏 靳文婷
[摘要] 本文首先介绍了故障转移集群技术在档案管理系统中的实现原理,通过对石油销售企业档案管理系统中故障转移集群的研究,阐述了当数据库服务器处理客户请求发生故障时,故障转移集群技术是如何应用于档案管理系统中,保证客户请求正常处理的。
[关键词] 故障转移集群技术; 档案管理系统; 数据库服务器; SQL Server
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2012 . 16. 043
[中图分类号]F272.7[文献标识码]A[文章编号]1673 - 0194(2012)16- 0074- 02
1故障转移集群概述
网络中的多个服务器构成一个组,并以单一系统的模式加以管理。一个客户向集群提出服务请求时,集群作为一个独立的服务器对客户提出的服务请求进行处理。集群配置是用于提高可用性的解决方案。
故障转移集群是用于实现SQL Server数据库服务器高可用性的解决方案。一个集群通常由多台服务器组成,每台服务器称为一个节点。通过使用冗余节点来减少宕机时间,为档案系统数据库业务的高可用性提供了有力的保障。
2故障转移集群在石油销售企业档案管理系统项目中的应用
2.1故障转移集群技术的实现原理
SQL Server支持本地集群,即所有节点都在同一个子网内,通常位于同一个物理地点;如果节点跨越不同区域,则必须把所有的节点都配置到同一个VLAN中,客户在访问不同节点服务器时所访问的地址都在同一个子网内。
SQL Server故障转移集群有两个核心层次,一个是Windows系统层,一个是SQL Server数据库层。Windows故障转移集群是一个平台,提供了与应用无关的故障转移的基本功能,比如节点之间心跳检测、故障转移策略管理等。SQL Server故障转移集群提供了具体应用的故障转移功能。安装SQL Server故障转移集群前,必须要先把所用的节点加入到同一个Windows故障转移集群中。
SQL Server的故障转移集群也支持多实例。每一个SQL Server故障转移集群的实例都有一个虚拟的网络标识,客户通过该标识访问集群数据库。当客户访问数据库服务器时,只是针对特定的服务器集群地址进行访问,集群内部有很多服务器节点,客户是不能指定的。正常处理客户请求时,只有一个节点上的SQL Server实例处于运行状态,此节点称为活动节点,而所有其他节点则称为被动节点。集群的虚拟网络名字总是映射到当前活动节点的IP上。
故障转移有两种形式:① 由管理员发起的,一般是在对当前活动节点进行系统维护之前先把整个集群转移到其他节点上;② 系统检测到故障时自动进行的故障转移。Windows故障转移集群会首先停止当前活动节点上的SQL Server实例进程,然后根据该实例的故障转移策略选择一个新的节点,最后在此新节点上启动SQL Server的实例进程,同时获得对SAN的独占访问权。这个节点就成为了新的活动节点,虚拟网络名字也随之映射到此新节点上,从而保证客户应用还能正常连接数据库。由于数据都是存储在共享的SAN上的,在故障转移过程中并不需要数据复制。宕机时间只发生在故障转移时短暂的瞬间,即旧的活动节点的实例进程被停止后,到新的活动节点的实例进程正常工作之前。当然,故障转移之前的客户连接都会被中断,所有未完成的事务都会被回滚,并且故障转移完成之后,客户端需要重新连接数据库。
2.2故障的检测和转移策略
故障的种类多种多样。如前所述,Windows故障转移集群为集群应用提供了底层服务,对于网络故障、磁盘故障等,都是由它来检测的。而每个SQL Server集群实例自身的故障(比如拒绝客户端连接、无响应等)则是由一个为SQL Server定制的集群资源来检测的,称为“SQL Server资源”,其任务就是定期去查询数据库的状态。通过轻量查询“LooksAlive”默认配置每5秒钟检查数据库服务器的状态,本身并不会失去数据库连接,查询次数也较多,对数据库造成的影响很小。
故障发生时,转移策略可以很好地满足客户需求。当然,客户还可以随时根据自己的特殊需求,用Windows集群管理器对集群实例内的每个资源单独配置不同的策略。如果要转移到新节点,则同实例内部的所有其他资源都会跟着转移。集群内部的状态信息都会同时记载到集群日志和Windows事件浏览器中,所以一旦集群发生了异常,总可以通过研究这些信息了解系统状态变化的全过程。
2.3故障转移集群配置
根据规划,石油销售企业档案管理系统采用PC服务器,所有服务器安装中文版Windows Server 2008 R2操作系统(x64位),每台服务器操作系统均安装在硬盘的第一个主分区上,用于生产系统。
为确保档案系统操作系统和应用部署,集成现有的AD环境和ERMS权限认证平台,生产系统服务器均加入PTR域,通过域用户(ERMS)进行集中控制、安全管理、应用软件部署等。
每台服务器都同时连接两个网段,分别是广域网网络和内部专用网络。广域网地址主要用于档案系统Web服务访问、远程操作系统维护等;内部专用网络主要实现集群心跳网络、档案系统Web服务器与数据库服务器交互及服务器远程控制管理等。通过ERMS登陆到节点服务器,建立数据库服务器“故障转移集群”,具体配置如下:
(1) 打开“服务器管理器”,“功能”,“故障转移群集”,选择“创建集群向导”。
(2) 在选择服务器框中,通过浏览的方式,加入所有群集节点名。
(3) 在“验证警告”中,选择运行配置验证测试。
(4) 等待验证测试完成后,继续进行群集建立。验证完成后,可以看到验证报告,其中如果有红色的错误应纠正后重新验证,有黄色的警告信息可以选择“查看报告”查看后决定是否纠正。
(5) 返回安装向导,输入群集名和IP地址。
(6) 完成群集建立,查看報告检查建立日志。
(7) 完成服务器集群配置后,对已规划的集群存储修改其“卷标”,准确定位和判断数据存储信息。在可用存储中,依次选择每个可用磁盘,在属性中,修改其显示名为正确的卷标。
3总结
石油销售企业档案管理系统通过故障转移集群技术成功实现了系统高可用性,避免了服务器在处理客户请求时长时间等待、同步数据传输遗漏等问题,保证了客户访问系统数据的实时性、完整性,同时保证了石油销售企业档案管理系统运行稳定。
主要参考文献
[1] [美]Rich Seifert. 千兆以太网技术与应用[M]. 郎波,译. 北京:机械工业出版社,2000.
[2] 王亚平. 数据库系统工程师教程[M]. 北京:清华大学出版社,2004.
[3] 冯萍. 计算机软件技术及应用基础[M]. 北京:清华大学出版社,2009.