APP下载

广播电视监测网络存储系统选型分析

2016-09-20刘志远

中国传媒科技 2016年6期
关键词:存储技术副本存储系统

■文/刘志远

广播电视监测网络存储系统选型分析

■文/刘志远

广播电视与网络视听节目的快速发展以及高清技术的大规模应用给广电行业带来了音视频数据量的飞速提升。广播电视监测部门对全国广播电视节目进行统一采集、存储与处理,针对各级监测技术系统的需求与特点,寻求技术先进性、适用性、可靠性、安全性、经济性兼具的存储技术至关重要。本文比较了各类主流存储技术的特点,给出了各级广电监测系统对存储技术的选型分析,为未来系统建设提供了参考。

存储系统;广播电视监测;SAN;NAS;分布式存储

随着广播电视与网络视听节目的快速发展,节目类型、数量越来越多,清晰度从标清向高清快速发展,特别是4k技术带来的超高清革命,给了观众全新的观看体验,同时也带来了数据量的飞速提升。广播电视监测部门采集中央以及全国各省市卫星、有线、无线广播电视节目,集中存储与分析处理。随着监测范围的扩大与数据量的飞速提升,存储系统的容量、稳定性与安全性日益受到关注,针对不同业务范围与需求,寻求技术先进性、适用性、可靠性、安全性、经济性兼具的存储系统,已逐渐成为各级监测技术系统建设的重中之重。

本文比较了DAS、NAS、SAN、SAN与NAS融合架构、分布式存储等主流存储技术的特点以及适用范围,给出了音视频文件单点采集系统、区域节点、中心节点以及云存储等系统对存储技术的选型分析,为各级广播电视监测技术系统建设的存储技术选型提供参考。

1.存储技术的分类及特点

存储介质的发展历经磁带、磁鼓、硬盘、软盘、光盘、Flash芯片、磁盘阵列等,伴随着磁盘阵列技术的发展和IT系统需求的不断升级,大型网络化磁盘阵列出现了。相比用于备份与归档的磁带库与光盘库,磁盘阵列以其在存储量、传输速率、可靠性等方面不可比拟的优势,通常作为一级在线存储使用,这也是本文讨论的重点内容。

网络化的存储技术发展至今,大致分为直接连接存储(DAS)、网络附加存储(NAS)、存储区域网络(SAN)三个阶段,而各种融合技术也应运而生。

1.1DAS

直接连接存储(DAS)是指存储设备通过SCSI接口或者光纤接口,直接连接到一台计算机上,其他主机不能共享这个存储设备,例如个人PC或者服务器自带的磁盘。分布在全国的音视频信号采集系统对有线、无线广播电视信号进行采集并进行预处理。在这些系统中,存储通常为DAS结构。由于带宽所限不能全部传回至远端的音视频文件在本地短期存储,当位于远端的用户想要调用这些内容时,需要访问这个站点的服务器,以连接直连在服务器上的硬盘。

DAS具有成本低,部署简单等优点,适用于网络远端的末梢节点,但是也有共享能力差,连接距离短、备份能力低等缺点。一旦服务器出现故障,所有硬盘将无法访问。

1.2NAS

网络附加存储(NAS)是一种含有文件系统,并且可以对外提供文件访问的存储。对外提供的接口通常包括用于Unix环境的NFS(网络文件系统)协议和用于Windows环境的CIFS(公用Internet文件系统)协议等。NAS不一定是磁盘阵列,一台普通的PC机或服务器也可以做成NAS,利用操作系统自带的文件系统对外提供文件共享。在广电监测技术系统中NAS的地位很重要,大部分存储的音视频文件需要通过共享访问的方式,提供给后台做音视频自动处理的各类计算服务器。NAS的性能、并发访问能力、稳定性成为音视频处理软件正常工作的保障。

1.3SAN

存储区域网络(SAN)是一种存储网络,通过光纤或以太网,将存储阵列和服务器主机相连接,成为专用于数据存储的区域网络。与DAS不同,SAN提供了多存储设备对应多主机连接,理论上存储容量可以无限扩展。在存储容量达到PB量级的文件存储网络中,通常SAN是不可或缺的,它使集中存储设备替代多个独立存储,支持容量共享并且具有很高的可扩展性与可靠性。

1.3.1FC SAN

传统的SAN通常指FC SAN,即使用光纤(FC)作为其内部传输通路,使用SCSI协议作为存储访问协议,将存储子系统网络化,实现高速共享。FC SAN效率高,速度快,常用单端口可达到8Gbps,是关键领域、高性能网络、大规模存储的不二选择。但是FC SAN成本高,需要专用光纤交换机,服务器要配光纤存储卡,在小规模应用中性价比不高。

1.3.2IP SAN

IP SAN是近几年新兴的存储技术,用以太网替代光纤作为SAN的内部传输通路以降低成本。随着以太网从千兆(1Gbps)发展到万兆(10Gbps),传输速率已经和FC SAN不相上下,但是在协议效率等方面还有一些差别。IP SAN的实质是将SCSI指令封装在IP包中,即iSCSI技术,利用IP网络进行包的传输。这种方式可以更好地利用IP技术的广泛性和普及性,成本低,易部署,小规模存储系统中性价比较高。但是IP封装的开销大、效率低,每个IP包中要附加较高比例的包头和包尾以进行校验,相比而言,FC包的校验则比例更低,传输效率更高。

1.4SAN与NAS的融合

SAN与NAS的融合架构如图1所示,和传统结构相比,NAS从存储设备中分离出来,通过SAN和存储设备相连,即成为NAS网关。这种架构既保留了NAS数据共享的优点,又发挥了SAN在结构上和可扩充性上的优势。但这也使NAS网关成为系统潜在的瓶颈,所有用户对存储设备的访问都必须经过NAS网关,采用多NAS负载均衡的方式,可以在一定程度上提高系统的可靠性。

图1 SAN与NAS的融合架构

1.5分布式存储系统

随着大数据时代的到来,数据量的飞速发展带来了存储系统规模的指数增长。专业性的集中存储可扩展性有限,互联网公司越来越多地选择分布式系统用于数据的存储、计算。与传统的高端服务器、高端存储器和高端处理器不同的是,分布式存储系统通常由数量众多低成本、高性价比的普通PC服务器组成,横向扩展能力很强。先买小型机,不够时再买中型机、大型机的纵向扩展模式已经无法适应当前信息爆炸的速度。云计算和大数据处理的核心,都是对海量数据进行存储、计算,后端通常都应用了分布式存储系统。

分布式存储解决了可扩展性和大规模部署成本的问题,但是普通PC服务器性价比高,故障率也高,需要在软件层面实现自动容错,保证数据的一致性。常用的多副本复制及故障恢复机制如图2所示,数据块A、B、C分别在3个节点存储了3个副本,A1、B1、C1为主副本。复制保证了副本之间的一致性,发生写请求时将沿图中W1-W4的顺序,客户端将写请求发给主副本、主副本同步给备副本,备副本更新后通知主副本,主副本再通知用户。发生读请求时,可按照R1-R2的顺序直接访问任何副本。当主副本发生故障,总控节点通过心跳检测到,会选择一个最新的备副本替代主副本。如果主副本在规定时间内重新上线则不改变原有存储内容,如果规定时间未上线,则需要增加副本,在其他节点拷贝数据块A成为新的备副本。

2.各级广电监测系统存储技术选型分析

中央级广播电视监测网络由分布全国的音视频信号单点采集系统、区域处理节点以及中心节点组成,下面对这三种典型系统以及未来云平台的存储技术选型进行分析,为广电监测系统建设中存储技术选型提供参考。

2.1单点采集系统

图2 多副本分布式存储系统的复制及故障恢复机制示意图

通常单点采集系统位置分散,结构简单,一般为主机直连存储(DAS)。以有线电视采集为例,假设某个单点采集系统需要对当地所有的地面电视频道、调频广播频道进行采集和短期存储,其所需存储量可以当地的频道数量进行估算。普通地市设立的电视频道一般为2个,广播频道2-3个。省会城市和计划单列市一般为6-8个电视频道及4-6个广播频道。省级一般为8-12个电视频道及8-10个广播频道。保证内容可辨识的标清视频信号经过压缩后码率最低为0.8-1Mbps,广播信号为0.15-0.2Mbps。以保存7天为例,考虑码率和频道数的最大值,普通地市存储需要约190GB的可用容量,使用RAID机制备份,可用容量按照实际容量60%计算,则需要320G的磁盘容量。计划单列市需要约680GB的可用容量,约合1.1TB的磁盘容量。考虑省会电视台与省级电视台地面频道,省会城市需要约1.7TB的可用容量,约合2.8TB的磁盘容量。单台服务器的硬盘就可以满足存储量需求,考虑到位置分散等特点,DAS是目前较为经济合理的存储方式,为了增加可靠性,可采用双机备份。

2.2区域处理节点

区域处理节点可以对所在省及临近省份的广播电视音视频文件进行存储和处理,假设每个区域节点平均负责2个省的范围,平均每个省约有41个电视频道以及35个广播频道,按照每天保存省级卫视频道,其他频道每个月抽样一天,共保存半年为例,需要10TB的可用容量,约合17TB的实际容量。音视频处理通常以文件为单位,因此需要存储系统对外提供文件共享服务,此外对比IP SAN和FC SAN的特点及性价比,区域处理节点使用IP SAN与NAS的融合架构建设可以满足基本的存储容量、访问速度、并发量的要求,并且性价比较高。在一些对性能要求非常高的重点系统中,可以使用FC SAN代替IP SAN。

2.3中心节点

中心节点可以对全国广播电视信号进行集中存储处理。假设存储内容含全国重点的100个卫星电视频道、300个地面电视频道及300个调频广播频道,以保存一年为例,需要1.7PB的存储容量,考虑冗余后约合2.8PB的磁盘容量。由于中心节点存储容量大、并发访问量大、访问速度要求高,按照前文对各存储系统的分析比较,FC SAN融合NAS的架构,将具有更好的性能。

2.4广电监测云存储系统

随着三网融合的趋势以及光纤通讯技术、云计算相关技术的发展,越来越多的广播电视节目以及互联网音视频具备传输至云平台进行统一存储、统一计算的能力。截至2015年6月,根据国家新闻出版广电总局公布的数据,地级以上共有电视频道1191个,广播频道1104个,此外还有1998个县级广播电视播出机构制播的地面频道。根据广播电视监测的分级管理体系,考虑地市级以上的频道,一年的实际存储量将达到5.2PB,考虑冗余后,实际存储量将更大。对于这个规模的存储系统,1.4节介绍的传统SAN 与NAS融合架构,将使NAS网关成为系统的瓶颈,FC SAN的性能优势不能很好地体现出来,横向扩展能力有限。在建设云平台时,选择分布式的存储系统,将具有更高的性价比以及扩展能力。

3.结语

随着大数据时代的到来,存储系统成为各类云计算、大数据处理系统的底层核心。随着广播电视与互联网音视频的发展和高清技术的大规模应用,各类技术系统存储容量的需求增长很快,选择技术先进性、适用性、可靠性、安全性、经济性兼具的存储技术非常重要。本文根据各类监测技术系统对存储的要求,给出了存储技术选型分析,为各级广播电视监测技术系统建设中的存储技术选型提供了参考。

[1]张冬. 大话存储II-存储系统架构与底层原理极限剖析[M]. 北京:清华大学出版社,2011.

[2]谢胜彬,陶洋,王国梁. DAS、NAS与SAN的研究与应用[J]. 计算机与现代化,2003(7):8-11.

[3]张继征,杨波,陆体军,贾惠波. NAS与SAN的融合[J].计算机应用研究,2005(8):190-192.

[4]杨传辉.大规模分布式存储系统原理解析与架构实战[M]. 北京:机械工业出版社,2015.

[5]国家新闻出版广电总局网站公布,“地级以上广播电视播出机构和频道频率名录(截至2015年6月)”. [6]国家新闻出版广电总局网站公布,“县级广播电视播出机构名录(截至2015年6月)”.

(作者单位:国家新闻出版广电总局二○三台)

TU248.8

A

猜你喜欢

存储技术副本存储系统
分布式存储系统在企业档案管理中的应用
面向流媒体基于蚁群的副本选择算法①
天河超算存储系统在美创佳绩
关于计算机网络存储技术分析
基于FAT文件系统的数据存储技术的研究
数据存储技术的应用
副本放置中的更新策略及算法*
基于FPGA的并行测试高速存储技术
华为震撼发布新一代OceanStor 18000 V3系列高端存储系统
一种基于STM32的具有断电保护机制的采集存储系统设计