高集成的数据中心应用
2016-11-14尹良原
尹良原
摘要:数据是整个信息化系统的生命线,数据库服务器负责着数据的接收、处理和存储等工作。所有数据的安全保密、高可用以及方便地查询都与数据库的安全性、稳定性和性能密切相关。应用系统业务量不断地增加,数据量也不断增长,服务器必须能同步的进行扩展,因此服务器必须要满足安全可靠,性能高等要求。数据中心系统的使用,提高了可用性和高性能问题,实现了低成本使用服务器平台,专门为特殊应用行业和高密度计算机环境设计的。该文就安徽日报报业集团的统一集成数据中心的应用进行阐述。
关键词:高集成数据中心;存储
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2016)24-0015-03
1 安徽报业集团数据中心简介
安徽报业集团中心机房由2009年建成,设计之初已经将小型机、数据中心的建设已经考虑之中,伴随着信息技术的高速发展,各种各样的数据也在加速膨胀,信息系统逐渐地从以应用为中心转变为以数据为中心,因此,为了提高管理效率和整体数据安全在2013年开始我们部署了数据中心和虚拟化管理系统。
1.1数据中心现状
现在大部分数据中心都是将低性能、低可靠的服务器作为数据中心的硬件主要配置,是一种废物利用的做法,也有使用高性能的机架式服务器作为主要配置,但这些作法都是高能耗、占体积、高运维、高风险的一套方案,作为数据中心是一个系统工程从它的基本要素和数据中心全生命周期的角度出发,以上的作法没有把数据中心的节能、降耗、运营成本等进行综合考虑,节能减排是国家可持续发展重要的战略决策,眼前是省下设备的投入但从长远来说“绿色数据中心”是一个长期更节省成本的目标。
1.2数据中心的需求分析
根据安徽报业集团目前硬、软件环境条件分析做出如下需求:
1) 数据中心硬件必须达到节能要求;
2) 数据中心易建设管理;
3) 数据中心易运维;
4) 数据中心节约采购成本;
5) 数据中心与信息系统的灾难恢复。
1.3数据中心的方案选型
由于安徽报业集团的小系统多,大文件较少我们在选择硬件时遵循了高集成、高性能、高可靠、节能的硬件设备。主要是利用刀片服务器、存储作为基础设备以及虚拟化软件建立起多台虚拟服务器为全集团各种应用提供服务。
服务器:以刀片服务器为主,刀片服务器主要特点可以共享资源,从外表上看可高密度部署服务器,节约使用空间和费用,升级灵活、便捷易操作,各部件可以做到全冗余安全系数较高,特别内置的负载均衡技术特别适合运行虚拟化系统。
存储:NETAPP存储最大优点就是存储速度快,特有的指针地址表的作法使得数据快照建立时不会对系统增加负担,恢复时能够做到数秒内即可完成,还有特殊的数据压缩与查重功能,使数据尽量精简节约资源空间和快速存取。
2 高集成的数据中心在安徽报业集团的应用
2.1安徽报业集团数据中心组成
安徽报业集团数据中心包括硬件系统和软件系统两部分组成:
硬件系统中服务器系统由两套刀片服务器主机组成,存储系统主要由Netapp磁盘阵列实现业务数据集中处理。刀片机箱上的二台网络交换机通过ISCSI协议与Netapp存储连接。服务器虚拟化通过此硬件系统对硬件资源进行整合,配合Vmware vSphere 5服务器虚拟化软件配置安装虚拟机和虚拟交换机。
软件系统为Vmware vSphere 5,Vmware vSphere 5 中ESX Server是安装在每台刀片服务器底层的操作系统,Vmware virtual client可以安装在局域网的任一台计算机中,可以安装多台计算机,多终端进行管理,结合windows的域控服务管理可做到多用户、多角色的个性化用户管理方式。
2.2数据安全的核心数据存储系统实施
所有这些数据都是以存储系统为基础的,因此一个较好的存储系统将能够的提升整个信息系统的价值。为了保障存储系统对系统应用的高性能支持和可扩展要求,存储系统设计符合以下原则:
2.2.1数据存储系统硬件架构
NetApp 3210A存储从硬件上来看主要由两个部分构成,控制器A/B(机头)和磁盘柜。3210A采用了双控制器,两个磁盘柜,分别安装有13块450G 15000PRM SAS 2.0企业级硬盘和12块 1T 7200PRM SATA接口企业级硬盘。从数据流向来看,控制器A管理13块450G SAS盘,采用RAID DP校验技术,最高允许2块盘同时损坏,此外,还有1块热备盘,划分一个RAID组,(13-2-1=10块)做完RAID后可用空间为3.41TB。控制器B管理12块1T SATA盘,采用RAID DP校验技术,最高允许2块盘同时损坏,此外,还有1块热备盘,划分一个RAID组,(12-2-1=9块)做完RAID后可用空间为6.22TB。
2.2.2数据存储系统物理连线方式
磁盘柜分别通过万兆电口和控制器连接,SAS盘柜和A控制器连接,SATA盘柜和B控制器连接,当A控或B控某个控制器出现故障时,将自动切换到另外一个控制器。每个控制器上有2个ISCSI电口,分别和核心交换机、刀片交换机连接。
2.2.3数据存储系统主要的软件架构
NetApp存储提供了一个复杂的软件架构来保证管理简单和业务可持续性的最大化。包括以下三个主要因素来提供速度和可靠性:
实时的处理执行机制;WAFL文件系统包含NVRAM和Snapshot;RAID管理器;
RAID Manager——独立磁盘冗余阵列(Redundant Array Of Independent Disks),将多个磁盘组成一组冗余集合。NetApp 支持 RAID-DP 与 RAID-4 两种 RAID 类型。 RAID-DP 为 NetApp 采用的默认 RAID 类型,每组 RAID 至少由 3 块盘组成,最多允许同时有 2 块盘出现故障。它比其他RAID系统执行更加快速,为数据在保存在磁盘前是放在NVRAM,而且是整合在WAFL文件系统里面的,不需要额外的软件和硬件(NetApp的RAID是软RAID实现的)。
WAFL——Write anywhere file layout。条带化写数据在多个硬盘上。数据可以写在系统的任意位置并从多个盘读出。
NVRAM——NVMEM Battery 非易失性随机访问存储器电池,NVRAM(Non-Volaile Random Access Memory):NVRAM 工作在内存与磁盘之间,其内存容量约为标配内存的八分之一大小,与内存之间通过直接内存存取(DMA)的方式来进行交互。因其具备独立电池供电,所以可保证在发生意外时,正在交互的数据也不会丢失。需注意的是,电池的最大供电时间为 24 小时。
Snapshot——WAFL使用Snapshot作为一个快速而且简单的备份系统。当采用 Snapshot的时候,会保留整个文件系统的快照。Snapshot不是保留文件系统任何事的一个拷贝,但是其保留了一套文件在被更新时刻之前的样子。Snapshot可以发现和拷贝到常规的文件系统。Filer在线情况下就可以按照计划自动创建Snapshot或者手工创建Snapshot。每个volume可以同一时刻保留255个快照,这个数值依赖使用什么DataONTAP版本。
网络服务---提供了使用多种网络协议连接到不同类型的网络。通过NFS、CIFS、DAS、HTTP和FTP实现文件级的访问,通过FCP和iSCSI实现块级别的访问。
3 安徽报业集团数据中心的特点
1) 高集成:目前两个标准机柜即可存放两套刀片机笼安装30个刀片服务器和两套核心存储,并且还有很大的扩容空间,一个机柜最多可存放四套刀片机笼。
2) 高性能:能够实现高速的数据存取,以保证应用功能的高效运行;还能提供较高的文件读写速率,IO操作次数,以及较短的响应时延;
3) 高可靠性:数据存取稳定,满足应用长期高效运转的要求;
4) 高扩展性:在满足当前的业务需求的同时,还考虑到今后业务发展的需求,确保在未来扩容时能够扩展到更多的存储容量支持。系统应有灵活的系统扩容方案,能够进行不影响系统和应用工作的在线扩容;
5) 可管理性和可维护性:存储系统在提供高可靠性的同时,也应具有较高管理性和可维护性,能够采用图形化界面对存储设备进行配置管理;
6) 安全性:保证数据的损坏与丢失尽量少,即使出现意外情况,也能够快速地进行恢复;
7) 标准性:存储系统应基于现有计算机和网络设备业界的开放标准,适应现有网络系统硬件环境要求。由于现有主机系统的多样性,存储系统需要支持不同种类的操作系统,同时还要支持多种数据库应用,并支持跨平台的数据共享,而不仅仅是介质共享。
4 使用效果及问题修补
自系统组建以来正常运行近两年,曾发生过服务器的硬件、存储的硬盘损坏,但应用系统从未因此中断,这归功于整个系统的冗余性,任何节点均可中断但数据、应用不会受此影响,更换完备件后立即恢复多点冗余状态。
问题:安徽报业集团的数据中心建成只是本地化的数据中心,数据安全性与系统运维连续性还受着高危的考验,异地容灾将是往后的后续工作主要目标。
结束语:本文简要阐述了安徽报业集团数据中心的应用方案,数据中心是信息化社会的IT基础设施,作为机构信息系统的运行中心、测试中心和灾备中心,承担着机构的核心业务运营、信息资源服务、关键业务计算、数据存储和备份,以及确保业务连续性等重要任务。当今社会,那些缺乏可持续发展能力的数据中心已暴露出了较多的问题,例如供电能力不足、无法实现在线扩容、机房送回风不顺畅产生局部热点、数据中心能耗巨大等。这些问题直接影响数据中心的可用性和可靠性,大大缩短了数据中心的正常生命周期,高集成的数据中心将解决部分弊端,数据中心建设是长期的工程,它不仅取决于IT技术发展的驱动,而且也和其他工程技术发展有关,我们将不断优化数据中心的各个环节,与同行们共同学习、进步。
参考文献:
[1] 姚书怀, 刘兴伟. 大型数据中心海量数据存储解决方案的设计[J]. 四川工业学院学报, 2004, 23(12): 27-30.
[2] 李丹, 陈贵海, 任丰原, 等. 数据中心网络的研究进展与趋势[J]. 计算机学报, 2014, 37(2): 259-274.
[3] 谷立静, 周伏秋, 孟辉. 我国数据中心能耗及能效水平研究[J]. 中国能源, 2010, 32(11): 42-45.