APP下载

谈国内非编网的10年发展史

2010-08-09孙林记

电视技术 2010年12期
关键词:板卡字幕以太网

孙林记,冒 卫

(南通电视台,江苏 南通 226000)

责任编辑:任健男

1 引言

非线性编辑网络系统是全数字化的电视节目制作系统,它在把电视节目的编辑、修改、配音、存取等全部信息进行数字化处理和传输的同时,将其网络化。1999年,福建电视台成功建成起第一个规模化非线性新闻制播网络系统。至今,国内非编网经历了十多年的发展历程。伴随着电视技术与IT技术在这10年中的巨大发展与飞跃,非编网也经历了几次里程碑式变革与进步,总的说来可以分为三个有代表性的阶段,下面分别就这三个阶段非编网的技术、特征及影响等方面加以说明与阐述。

2 划时代的第一代非编网

第一代非编网代表时间段可以看作是从1999年至2003年,大洋公司与福建台合作建成的非编网拉开了国内非编网建设的序幕,此后国内大大小小的电视台都加入了轰轰烈烈的非编网建设中。下面就这一代的非编网相关技术特点展开阐述。

首先,这个时期的非线性编辑系统本身的硬件、软件方面。早期的非线性编辑系统大多选择Macintosh,这是由于PC机相比于Macintosh,在多媒体和交互方面有着较大的欠缺。在硬件方面,随着PCI总线的广泛采用和奔腾PRO芯片的推出,Windows NT的PC机在性能和市场上优势反而越来越大。由于当时PC机硬件性能的限制,这个时期的非线性编辑系统在视音频处理上都是依靠专业的板卡来完成的,比较有代表性的板卡有Truevision公司的 Targa2000 RTX/SDX,Matrox公司的DigiSuite套卡,Pinnacle公司的ReelTime等,其中国内厂家大多采用DigiSuite套卡,譬如新奥特公司采用此套卡在PC机上的Windows NT平台开发而成的NC79、北京大洋公司的DY3000、索贝的创意97。

在软件体系方面,国内厂家利用板卡驱动所提供的应用程序接口开发了适合国内电视台使用的非线性编辑软件,在外观、人性化、功能性等方面都有不错的表现。这个时候的软件大都采用C/S的二层结构,数据库主要承担的是基本配置信息的管理,如帐号、权限、目录路径等,而对于素材则采用文件式的管理,具体组织管理方式如图1所示。

这种素材管理方式的缺点是过于开放,对目录及文件权限设置稍有不当就会造成素材的误删。当素材数量达到一定量的时候,检索或查找素材就会变得很慢。

第一代非线性编辑系统绝大部分采用Motion-JPEG压缩方式,Motion-JPEG压缩方式对活动视频图像通过产生帧内编码单独地压缩每一帧,在编辑过程中可以随机存取压缩视频的任意帧,而与前后帧无关,这对精确到帧的后期编辑十分理想。而且Motion-JPEG的压缩和解压缩是对称的,可以由相同的软硬件来实现,算法也不太复杂,可以用很小的压缩比进行全帧采集,实现广播级指标要求。根据压缩比的不同,DigiSuite套卡在采集过程中可以同时生成高低两种码率的文件,低码率的素材文件可以在无卡机(不带专业视音频板卡的普通PC机)上编辑,完成的工程文件可以在有卡机上打开,通过编辑信息映射到高码率的素材实现0帧精度回放出广播级质量的信号。正是通过这种思想,可以实现较少的投入,建设规模较大的非线性编辑网络。

其次,网络共享存储技术。共享是网络的优势所在,共享存储又是其根本,它带来的最直接的结果就是素材的共享,借此使用仅有的几台上下载设备就能完成全部的上下载需要;同时又可以在任何非编工作站完成编辑任务,实现编辑设备本身的共享;此外,利用此非编网可以实现多人共同完成一项任务。非线性编辑网络存储应综合考虑安全可靠性、数据访问带宽、存储容量、数据容错备份、读写性能、扩展能力等,以满足视音频数据实时存储共享和传输要求。当时可选择的网络存储技术主要有DAS(DirectAttach Storage)和 SAN(Storage Area Network)。

DAS即直接附加存储,存储设备是通过电缆(通常是SCSI电缆)直接连接到服务器的。I/O(输入/输入)请求直接发送到存储设备。它依赖于服务器,其本身是硬盘的堆叠,不带有任何存储操作系统。其特点是存储设备为服务器一部分,该服务器不但提供应用程序的运行,还管理数据的访问。当用户数量增加或者服务器提供其他服务时,其资源被其他程序占用,导致其存储系统的响应速度变慢。在网络带宽足够的情况下,服务器本身成为数据输入输出的瓶颈,数据阻塞是DAS结构的局限,因此稍有规模的非线性编辑网络都不会采用这种存储方式。

SAN存储区域网是指独立于服务器网络系统之外的高速专用网络,这种网络通常采用高速光纤通道作为传输体,以SCSI-3协议作为存储访问协议。将存储系统网络化,实现真正的高速共享存储。FC(光纤通道)协议属于网络传输层协议,在假设物理链路层质量可靠,复杂的冗余校验运算较少的情况下能够提供高速恒定的网络连接。由于非线性编辑网络要能实时传输多路高码率视频数据流,因此当时选择光纤作为传输介质也是必须的。为了实现SAN上的数据共享,还需要运行存储管理软件,实现多台主机对同一个卷的同时读写,譬如知名的综合存储管理软件Tivoli SANergy。SAN需要一个元数据控制器(Meta Data Controller,MDC)来负责硬件安装及控制安全性和分配信息。以SANergy为例,MDC客户端(装有SANergy的有卡非线性编辑工作站)通过以太网向MDC申请文件存储的位置,MDC返回数据存储在磁盘的阵列的指针,MDC客户端即可以通过SAN网络存取数据。通过MDC的工作流程容易看出,在SAN中还需要用以太网传输元数据、控制信息,这就形成了常见的FC+LAN的双网架构,如图2所示。

第三,第一代非线性编辑网络网络管理及业务管理功能很弱,没有网络管理监控平台对服务器、网络设备、存储设备、应用软件的运行情况进行实时监控,也没有人员对非线性编辑系统使用情况、使用时间、节目制作量等业务数据进行记录和统计,因此,第一代非线性编辑网络管理功能很缺乏。

3 过渡型的第二代非线性编辑网络

由于动态编码技术如MPEG-2,DV,DVCPRO等在硬件和软件上的不断成熟,原来单一的帧内Motion-JPEG编码技术由于产生的文件过大、占用带宽较多而显得落伍了。与此同时,计算机硬件性能、网络技术都有了很大的提升和发展,譬如Intel Pentium4 CPU的出现并逐渐普及,大容量内存价格不断走低、高速以太网技术的大规模运用。另外,第一代非线性编辑网络在网络管理、业务管理功能太弱以及数据库技术没能得到广泛应用等因素导致第一代非线性编辑网络被更为完善的第二代非线性编辑网络所取代,代表年份为2003年至2005年。

首先,第二代非线性编辑系统软件、硬件的特点。第二代非线性编辑系统硬件架构上与第一代相似,也是在计算机上安装专业视音频板卡来实现的。但是具体配置上与第一代不尽相同,这一代的非线性编辑系统主机配置较高,一般都采用Intel Pentium4 CPU,512 Mbyte内存,内置上百兆字节的SCSI硬盘,并且支持1394接口的素材采集,板卡也由第一代的DigiSuite LE升级为DigiSuite DTV/LX。

DigiSuite LE卡是DigiSuite卡的简化版,是一种性价比较高的全实时视音频处理卡,与DigiSuite卡相比,只支持四层实时处理(无直通视频层),不支持实时3D处理、倒放和音轨调音功能,字幕效果简单。DigiSuite DTV卡适用于当时较为主流的DV和MPEG-2格式,它的基本编辑功能通道编辑及字幕卡类似于DigiSuite LE卡。DigiSuite DTV卡可以用于广播电视传输、DVD刻录及网络视频传输等方面,配有齐全的模拟和数字输入/输出接口,DigiSuite DTV卡上有2个压缩/解压功能。DigiSuite DTV 卡支持 DV25(5∶1),DV50(3.3∶1),或者MPEG-2 MP@ML,MPEG-24∶2∶2 P@ML I帧的 10 bit信号(3.3∶1)压缩格式,DV25 与 DV50 可混编,输入输出接口相应地增加了DV1394接口、SDI数字接口、SDTI数据倍数接口以及MPEG-2 IBP格式15 Mbit/s或50 Mbit/s的输出。但其内部仅以DV格式进行视频处理,还支持以MPEG-24∶2∶2为基础的I帧编辑,特点是数据流可变(DV格式的数据流是固定的)。

第二代非线性编辑系统在软件上更加人性化,功能更强大,支持更多层的视频图文轨,除了基于板卡的硬件特技,各厂家也开发了各自的视频特技插件。在音频方面,改变了第一代非线性编辑系统音频处理能力薄弱的状况,使非编成为真正意义上的视、音频编辑系统。系统至少有8轨实时音频,可合成1~4声道输出;支持多轨音频的MIX特技、回音、混响、均衡、变调、动态平稳等效果,支持V型、X型过渡;具有灵活的音量调节功能,可调节时间线上一点的音量,也可对某段的音量整体上下调节。系统具有调音台功能;时间线上多轨音频在合成输出时,可通过音频映射表方便控制音频的输出声道。第一代非线性编辑系统都是以位图(TGA)方式处理字幕,因此显得十分呆板,而第二代的系统依靠底层软件算法和结构体系的革新,系统完成了面向对象的字幕处理方式的支持,在非线性编辑系统中不仅完全保留了字幕机的播出效果,更实现了在时间线上多层字幕的制作与播出。在对素材的管理上也从基于文件的管理变为数据库的管理,这样就提高了素材的安全性和素材的检索速度。

其次,网络架构及共享存储技术。由于高速以太网技术的发展,这一代的非线性编辑网络除了SAN的双网架构,还出现了纯以太的NAS技术。NAS(Network-Attached Storage)是一种硬盘存储,它不附属于为网络用户提供服务的应用服务器上,而是被直接连接在以太网上,并拥有自己IP地址。NAS从物理结构上看,通常由一定量的磁盘阵列作为存储空间并提供一个I/O存储调度和网络文件分发的NAS头服务器组成。所谓NAS头服务器实际上是一个独立服务器系统。这种服务器系统去掉了通用服务器原有的大多数计算功能,只提供I/O存储处理和管理、网络文件系统分发(提供NFS和CIFS共享服务)等专有功能。NAS系统用基于IP网络的网络文件协议向多种客户端提供文件级I/O服务,使用NAS存储空间的其他主机不需要维护文件系统。通过群集技术将多个NAS设备整合使用,可以解决独立的NAS设备难以满足大规模非编网络的存储容量、实时编辑读写带宽和系统扩展性的问题,就如同一台NAS设备一样。采用多个NAS机头组成的NAS群集架构如图3所示,前端可以提供很好的负载均衡的网络带宽保障,后端可以直接连接或通过SAN光纤通道连接后端的存储系统上。为规划存储增长带来最大的灵活性,大幅提升了存储系统的利用率,充分体现了存储系统和存储管理软件的实用价值,从而大大降低了运营成本,如图3所示。

第三,第二代非线性编辑网络在网络管理与业务管理等方面比上一代网络有较大的提高,网络管理软件可对用户账号、权限、栏目、节目文件信息、磁盘空间、设备使用情况等进行全方位管理,可控制各栏目对系统资源的使用。通过引入“账号”管理来设定使用者的修改权限,从而避免了对素材的误操作。任何目录对于不具有读写权限的用户是不可见的。系统提供的灵巧实用的素材管理工具解决了编辑人员最担心的素材删除与整理问题。

4 变革型的第三代非线性编辑网络

前两代的非线性编辑系统都是基于专业视音频板卡的系统,系统的性能主要依赖于硬件板卡,这类系统在视频处理方面基本不占用计算机资源,然而硬件板卡所能处理的视频格式、特技和实时性都是固定的,难以支持多格式混合编辑,而且大量结构复杂的专用芯片使其发热量大、不够稳定、故障率高。另外,专业的视音频板卡绝大多数是国外公司生产的,核心硬件上被垄断;非线性编辑系统很大一部分利润被国外厂商占有,非线性编辑系统的国产化程度不高。新一代的非线性编辑系统采用CPU+GPU+I/O的架构,系统完全摆脱了对硬件板卡的依赖,软件技术成为最核心的技术,而且国内大洋、索贝等厂家都能够生产I/O卡,因此非线性编辑系统国产化程度大大提高。在以太网技术上由于主干万兆、桌面千兆的出现并逐渐普及,纯以太的大规模非线性编辑系统组网成为现实,所以说第三代非线性编辑网络是具有变革意义的。

首先,第三代非线性编辑系统硬件、软件特点。在现今CPU和GPU性能得到大幅提升的平台环境下,基于CPU+GPU+I/O架构的新一代非线性编辑系统应运而生,工作原理如图4所示。

图4 CPU+GPU的非线性编辑系统工作原理

这一代的非线性编辑系统一般都配置了1394卡,支持1394采集,I/O板卡采集视频和音频信号,可以达到10 bit高质量视频、24 bit音频。视频接口支持SDI、模拟分量、模拟复合、Y/C、IEEE1394、S-Video 等;音频接口支持 ANALOG,SDI,AES/EBU 等。

CPU+GPU+I/O构架系统完全摆脱了对硬件板卡的依赖,软件技术成为核心,实现了基于标清节目制作、平滑向高清升级、多种格式素材混编,对P2、蓝光等存储媒质更好的支持。

软件方面,非线性编辑系统软件都采用了科学、人性化图形界面,嵌入文稿模块及媒资检索模块,方便协同工作,实现全台共享及提高制作效率。能够实现3层50 M bit/s码流、4轨音频和4层字幕的实时编辑制作,对不能实时的部分提供了智能打包功能;特技具有开放性,支持第三方特技插件;系统大多内嵌字幕模块来实现常规字幕、唱词等功能,所有字幕可以在轨上基于时间线操作,可实现8轨以上的实时字幕,每轨字幕都可以实现不同的特技;模板化的资源管理方式,所有字幕文件可在资源管理器中实现统一管理,无论字幕镜头、物件、唱词、滚屏,甚至物件属性(字体、颜色、特技、大小等)都可当作模板保存;支持同时多个故事板文件的编辑,故事板间随意切换,可方便地进行故事板间的块操作,如复制、粘贴等,以实现不同故事板资源的灵活交互,高级的备份和恢复机制:提供多步恢复列表,能在意外退出软件后仍然保留故事板的所有历史操作记录,以供恢复使用;对音频处理方面功能也更为强大,除了常规的音频调整还支持音频特技、特效制作。

其次,网络架构及共享存储技术。基于CPU+GPU+I/O架构的新一代非编比基于视频板卡的非编具有了更大的缓存调用机制,降低了网络带宽的约束,使得千兆以太网能够承载大数据量、高码流的视音频文件,并提供实时的读写带宽。千兆以太网组网成本比FC网要低很多,且具备完善的网络管理能力,正逐步成为非线性编辑网络的基础架构。前面已经谈了NAS技术,这里说说基于iSCSI协议的IP-SAN技术。

iSCSI(internet SCSI)是 IETF(互联网工程任务小组)制定并于2003年2月正式发布的标准协议,可理解成SCSI over IP,即网络上的SCSI,它实际是将SCSI命令封装到IP包中,从而使数据块在网络上传输。iSCSI融合了SAN和NAS的优势,它基于IP协议,却拥有SAN大容量集中开放式存储的优点。相对于以往的网络接入存储,iSCSI的出现解决了开放性、容量、传输速度、兼容性、安全性等问题。表1是NAS,SAN和iSCSI的对比。

表1 NAS,SAN和 iSCSI的对比

IP-SAN采用的是千兆以太网,继承了SAN的优点,而在性能上接近FC-SAN,成本却低很多。图5为采用了二级分布式存储的IP-SAN非编网,它有效地分配了存储阵列的I/O带宽,均衡了网络负载,保证子网中每个非编站点能够实时编辑视频。

第三,第三代非编网络实现了对基础网络平台和业务运行的全面监控和管理。基础网络管理包括具体的工作站,服务器、交换机等IT设备的运行等情况,一般采用SNMP协议采集实时数据。业务运行管理包括在PC、服务器上运行的软件模块的运行情况;完成某个流程应用所需要的资源的准备情况。

5 总结

回首国内非线性编辑网络的10年发展历程可以看出,FC-SAN为中心存储系统的双网结构一直是占据主流地位,NAS+SAN构架的系统在规模不大的网络中会有一定的应用,IP-SAN以其绝对的性价比优势赢得了中小规模第三代非线性编辑网络大部分市场分额。CPU+GPU+I/O架构的非线性编辑系统依然代表着今后的发展方向,高清节目制作会是未来发展的重点,这就要求未来的非线性编辑网络能提供更高的共享存储I/O访问速率和更大的网络传输带宽。因此FC-SAN虽然建设成本高昂,但在今后的相当一段时间内仍将会是主流,随着iSCSI磁盘阵列I/O速率瓶颈被解决,万兆以太网的普及,IP-SAN必将迎来更广阔的发展空间。

猜你喜欢

板卡字幕以太网
基于1500以太网养猪场的智能饲喂控制系统的设计与实现
基于PCI9054的多总线通信板卡的研制
基于FPGA的多通道模拟量采集/输出PCI板卡的研制
谈实时以太网EtherCAT技术在变电站自动化中的应用
一种基于单片机16×32点阵动态字幕的设计
整合适应选择度下的动画电影字幕翻译——以《冰河世纪》的字幕汉译为例
一种基于光纤数据传输的多板卡软件程序烧写技术
论纪录片的字幕翻译策略
一种90W高功率以太网供电系统的设计
字幕翻译中非言语信息的言语转换——以《BJ单身日记》字幕翻译为例