APP下载

集群存储实现海量备播数据管理

2015-02-26何云飞

西部广播电视 2015年16期
关键词:数据管理

何云飞 王 浩 黄 亮

(作者单位:遵义市广播电视台)

集群存储实现海量备播数据管理

何云飞 王 浩 黄 亮

(作者单位:遵义市广播电视台)

摘 要:本文分析了备播系统的现状,提出建设新一代集群存储平台作为备播内容存储,并介绍使用集群存储实现对海量备播数据管理所带来的好处。

关键词:集群存储;备播内容存储;数据管理

1 备播数据管理现状及需求

以往,电视台节目生产与播出业务受传统技术模式的限制,播出系统备播工作流程主要是基于效率底下的节目磁带库作为近线存储,节目素材从本地上载到播出服务器,人工将播后素材再迁移到带库,无法直观地统一管理备播素材。

近年来,随着电视台网络化制播系统的建设发展,节目的播出业务模式发生了根本的改变,我国电视节目备播系统正在向网络化、文件化以及流程化的业务系统发展。而随着高标清同播业务需求,按照标清播出文件的码率为12Mb/ s,高清播出文件的码率为50Mb/s来计算,每小时高标清同播的素材大小为62×3600/8=27.9GB。传统的在线存储空间早已不能满足日益增长的海量备播节目数据的存储需求,因此,建设集中的后台集群存储作为备播业务支撑是非常有必要的,可以更有效率地完成播出素材的上载工作,安全稳定地保障备播区域素材到播出服务器的迁移工作,方便直观地开展播后素材管理以及重播、重审工作。

但是海量的备播数据爆炸式的增长向集中的集群存储数据管理方式提出了挑战,一方面要应对数据容量的不断扩充,另一方面需要确保所有有效数据的高安全性和可管理性。

2 集群存储平台介绍

2.1集群基础架构

集群存储平台系统主要由元数据服务器集群、存储服务器集群两大部分组成。元数据服务器集群管理文件系统的元数据,管理整个存储系统的命名空间,对外提供单一的系统映像。存储服务器集群存储用户的实际数据,是整个集群存储系统的存储资源提供者。整个集群按大模块分类可以分为以下三个部分。

元数据服务器(Metadata Server,简称MDS)。元数据是集群存储的核心,文件的地址、基本属性、列表、一致性维护、负载均衡和副本等信息都存储在元数据服务器上,读写文件时能提供高效的信息随机访问。

存储服务器节点(Data Server)。存储节点仅提供单纯的存储服务,功能较简单,应用客户端根据元数据反馈给它的设备信息和偏移信息直接和存储节点建立通信存取数据。

应用客户端(Client)。此模块安装在需要访问集群存储的服务器或PC上,负责提供统一视图的存储空间给服务器(Windows服务器看到如同新增一个本地硬盘,Linux新增一个挂载目录),同时负责跟元数据服务器交互元数据属性信息,跟存储节点交互数据流。

2.2元数据工作原理

(1)为了提高元数据的安全性,元数据服务器总是成对出现的,每台元数据服务器上存放的元数据信息metadata在设计时又被拆分为metadata1(M1)和metadata2(M2)两部分。(2)元数据服务器MDS2提供M1的服务、M2的备份;元数据服务器MDS1提供M2的服务、M1的备份。(3)元数据服务器MDS1既提供M1的服务,又提供M2的服务;元数据服务器MDS2作为备份服务器。(4)元数据服务器MDS2既提供M1的服务,又提供M2的服务;元数据服务器MDS1作为备份服务器。

默认情况下,元数据服务器1提供metadata1的服务,元数据服务器2提供metadata2的服务,假如元数据服务器2异常离线或服务关闭,用户在访问客户端(客户端有读/写操作)时,metadata2的服务会自动切换到元数据服务器1上。元数据服务器2启动恢复服务后,元数据服务器1上的数据会自动同步到元数据服务器2上,保证了主备元数据的一致性和冗余性。

3 备播系统采用集群存储优势

3.1系统容量扩展

由于备播节目数据量在非结构化大数据时代背景下指数增长,未来系统所需容量难以预估,初步部署时可预估两年内容量进行部署。集群系统支持Scale-Out的扩展方式,保证整个系统的扩展非常平滑,任何存储节点可以在线地添加和删除,相应地可以在线扩容和缩小容量。添加或删除节点后,存储节点上的数据会均匀分布到每一个节点。

3.2数据读写性能

集群存储可以使用全台网备播系统现有的以太网环境,总带宽达到2.2GB/ s以上,部署万兆+千兆工作站及服务器的高速交换网络。单存储节点的64M分配机制可保证同时多硬盘的读写,加上分布式文件调度的多节点同时读写,使所有的存储服务器上的磁盘性能和网络带宽都可以同时得到充分的利用,这样集群存储系统的聚合带宽由多台存储服务器上的IO带宽相加而成,从而克服了NAS的单一出口点所造成性能瓶颈,可以满足高速度素材送播。

3.3数据安全性

硬件方面,所有元数据服务器和存储节点都采用冗余部件,如电源、风扇、网络接口等,具有较强的可靠性。集群系统至少有两台元数据服务器,这两台元数据服务器采用双机热备模式,实时双向同步元数据信息,任何一台元数据服务器节点故障/宕机都不会造成数据的丢失。存储节点之间可选择采用粗粒度副本、条带化副本、网络纠删码等多种数据安全策略,任何一个磁盘故障甚至存储节点故障/宕机都不会导致数据的丢失。

猜你喜欢

数据管理
基于大数据管理的管道智慧检验系统的研发及应用
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
大数据时代的海洋数据管理体系构建
海洋环境数据管理优化与实践
列控联锁数据管理分析平台的研究与探索
CTCS-2级报文数据管理需求分析和实现
土地权属调查的方法及数据管理
自然资源一体化数据管理与服务平台关键技术研究与应用
列控数据管理平台的开发