APP下载

基于流媒体技术的外语音像资源库建设

2009-03-10胡雪飞

中国教育信息化·高教职教 2009年2期
关键词:流媒体数字化

柳 强 胡雪飞

摘 要:信息技术的发展给高校外语音像资料采集、存储、使用带来了全新的方式。外语音像资源库系统是把计算机技术、媒体制作技术、流媒体技术和现代教学方法有机结合起来的一种教学辅助系统。本文介绍了湖北大学外国语学院音像资源库的构建和应用情况,该资源库系统的建成和应用对丰富教学内容、提高教学质量、实现教育技术现代化起到了积极的作用。

关键词:音像资源库 数字化 流媒体

中图分类号:G203 文献标识码:A 文章编号:1673-8454(2009)03-0041-03

一、前言

外语音像资料是高校外语教学中必不可少的重要内容,经过几十年的发展,外语学院存储了大量以磁带、录像带、光盘等为载体的教学音像资料。然而由于传统的以磁带、录像带为载体的模拟音像资料主要采用磁记录的方式进行存储,随着时间的推移,磁带逐渐老化变质,大批珍贵的音视频资源将面临报废的危险。如何整理、开发和利用现有的外语音像资料,充分发挥其特有的效能,更好地为外语教学和科研服务是高校教育技术中心管理人员责无旁贷的任务。

针对上述情况,我校通过将模拟音像资源进行数字化改造,并建立一个基于流媒体技术的音像资源库,实现了对资源的有效利用和管理,更好地为外语教学、广大师生服务。

二、音像资料的数字化处理

1.音像资料的数字化采集

传统教学音视频资料都是以磁带和录像带的形式保存下来的,而磁带和录像带都是采用模拟信号的方式来记录信息的。因此传统的教学音视频资源数字化工程的第一步就是将这些模拟信号记载的信息转化为计算机存储的数字化信息,即音视频材料的采集。[1]

(1)音频资料数字化采集:将录音磁带上的模拟声音信号通过电脑转换成数字音频信号。数字化的音频文件格式有WAV、MP3、WMA等,可以针对不同的需要采用不同的格式。

(2)视频资料数字化采集:通过计算机将传统的模拟视频信号转换成数字信号。如对VHS格式的录像带视频转换,其过程是将录像机与计算机连接,在录像机播放录像带的同时,借助于计算机中的视频采集卡和捕捉工具软件,将录像带播放的模拟视频信号转换为数字信号,转换后的数据可以保存为AVI、MPEG等数字文件格式。

2.音像资料的编辑

有相当一部分通过各种途径(磁带转换、网上下载、自己录制等)获取的外语音像资料,由于其本身或外界环境的因素,会存在着一些质量上的问题,诸如:噪音,单声道,声波振幅小,图像模糊,亮度、灰度、对比度差等等。这些问题都会直接影响到使用效果,所以有必要进行适当的编辑处理。如:对音频资料通过降噪、转换成双声道立体声、增大波形振幅,使声音更加清晰饱满;对视频资料通过改变亮度、灰度、对比度使图像更清晰,根据需要给视频添加字幕、对视频内容进行剪辑、去掉原先视频的声音或者杂音等。[2]

根据目前网络技术、编码技术和流媒体技术的发展,考虑到音视频文件主要是放到网络上供使用者在线点播和下载,应将音视频文件做成便于存储和网上传输的流媒体格式。流媒体文件的优势是当流媒体文件从服务器向客户端进行实时播放时,用户不必等到全部文件下载完毕,只需延迟几秒或几十秒便可播放,其余部分由客户端计算机在后台继续接收,直至播放完毕或用户取消播放,这样可以减少用户的等待时间,真正实现实时点播,并可同时为更多的用户提供服务。

对音像资料进行转换、编辑处理的软件很多,下面介绍几款较实用的软件:

(1)音频编辑软件——GoldWave,用于将磁带上的模拟音频资料转换成数字音频资料及对粗糙的声音文件进行编辑处理。

(2)视频编辑软件——会声会影,用于将录像带上的模拟视频资料转换成数字视频资料及对视频文件进行编辑处理。

(3)视频压缩转换软件——Easy RealMedia Producer,用于将AVI、MOV、MPEG等视频文件压缩成流媒体文件(RM、RMVB、RA),以利于网络上的传送与播放。

综合考虑数字化音视频的品质、网络传输速度、技术实现的难易程度等多种因素,我们采取的方案是:将视频文件转换成流媒体格式的RMVB文件,将音频文件以MP3或WMA文件格式进行保存。

三、数字化音像资源库网络平台构建

单纯由音视频流媒体文件和网络还不能构成一个完整的音视频资源库。要对音视频流媒体文件进行统筹管理、更新维护,并利用网络向用户提供在线点播、下载等各种服务,同时建立一个稳定、高效、易用的音视频资源库网络应用平台。

1.平台结构

在充分考虑系统的可靠性、易于扩展性及操作简单性等因素的基础上,资源库系统平台采用B/S结构,其系统结构如图1所示。

服务器包括Web服务器、数据库服务器及资源服务器。Web服务器是整个系统的核心,是为用户提供服务的窗口,它借助于应用程序处理网络客户发出的各种请求,从数据库中提取有用的数据,并把结果以网页的形式反馈给用户。数据库服务器是资源库系统的信息中心,它存储了与资源库相关的所有信息。资源服务器主要用于存储资源库中所有媒体资源,为用户提供在线点播以及文件下载等服务。

平台Web服务器采用Windows 2000 Server操作系统,后台数据库采用SQL Server 2000,资源服务器采用Windows 2003 Server操作系统。

2.功能设计

本系统分三种角色进行功能设计,即普通用户、资源管理员和系统管理员。普通用户的功能主要是资源的使用,提供资源的浏览、检索、在线点播、下载等服务。资源管理员主要是进行资源的日常管理,如资源类别和资源内容的添加、更新、删除,以及资源文件的上传等。系统管理员要维持系统的正常运行,其职责有系统配置、用户管理、统计分析、安全管理等。

为了实现上述功能目标和设计思路,资源库管理系统可按照其各部分功能的不同分为:资源类别管理模块、资源内容管理模块、用户管理模块、查询功能模块、系统管理模块。

(1)资源类别管理模块

数字化音像资料库网络应用平台建好后,就可以通过该网络平台的后台管理系统向数据库中添加经编辑、压缩过的数字化音像资料。为了方便用户更好地使用资源库,在添加音视频文件时,应先对其进行分类。根据网络应用平台的前台系统,将资源分为音频资料和视频资料两大类。音频资料先按语种分为英语、日语、法语,再细分为教材音频、语音语调、新闻、专四听力、专八听力、外语歌曲等部分。视频资料先按语种分为英语、日语、法语,再细分为教学频道、电影频道(包括爱情、动作、科幻、动画、战争、记录、剧情等)、电视剧、演讲集萃等部分。

(2)资源内容管理模块

资源内容管理模块的服务对象是资源管理员,资源管理员可以在此处对媒体素材资源进行添加、编辑、删除管理。一个具体的资源内容主要包括的信息有:名称、语种、所属类别、图片地址、资源存储地址、资源简介等。当添加一个新的媒体资源时,要将媒体文件上传到资源服务器上。

(3)用户管理模块

用户管理模块负责用户的注册、对用户进行身份认证和使用授权。用户分为三级:普通用户、资源管理员和系统管理员。注册时,不同级别的用户被赋予不同的操作权限,系统管理员的权限最高,可以进行全系统维护与操作。用户登录时,先通过输入相应的口令来验证身份,只有通过认证的用户才拥有相应的操作权限。

(4)查询功能模块

查询功能模块提供一个功能强大的查询工具,以实现用户所需资源的快捷查询。系统提供模糊查询和条件组合查询方式,用户可按照实际需要通过多种方式进行查询,查询项主要包括语种、媒体类别、内容标题等。

(5)系统管理模块

该模块主要是实现系统维护,以保证系统的稳定性和数据的安全性。它包括系统参数配置管理、安全管理、数据备份管理等。

四、系统实现所采用的关键技术

1.流媒体技术

流媒体是指在Internet/Intranet中使用流式传输技术的连续时基媒体,如音频、视频或多媒体文件。流式媒体在播放前并不下载整个文件,只将开始部分内容存入内存,流式媒体的数据流随时传送随时播放,只是在开始时有些延迟,当声音等时基媒体在客户端播放时,文件的剩余部分将从后台服务器继续下载。与单纯的下载方式相比,这种对多媒体文件边下载边播放的流式传输方式不仅使启动延时大幅度缩短,而且对系统缓存容量的需求也大大降低。实现流式传输有两种方法:实时流式传输和顺序流式传输。

流媒体技术主要用于在计算机网络上发布视频和音频流。由于流媒体信息传输和处理的数据量大,并且音频/视频与时间的相关性强,要求实时、同步地传输,因此流媒体系统首先应有很高的带宽,同时采用实时传输控制协议及实时传输技术,以保证网络系统的延迟尽可能减小。

流媒体传输的实现需要合适的传输协议。TCP需要较高的网络带宽,故不太适合传输实时数据。在流式传输的实现方案中,一般采用HTTP/TCP来传输控制信息,而用RTP/UDP来传输实时多媒体数据。主要协议包括实时传输协议RTP、实时传输控制协议RTCP和实时流协议RTSP等。[3] 流媒体传输的过程如图2所示。

当用户选择播放某个流媒体文件后,Web浏览器与Web服务器之间使用HTTP/TCP协议交换控制信息,以便把需要传输的实时数据从原始信息中检索出来,再由Web服务器调用后台数据库中指向流媒体发布服务器的相关链接,然后客户机上的Web浏览器启动A/V(音频/视频)播放器程序,使用HTTP从Web服务器检索相关参数对播放器程序进行初始化,最后通过UDP等协议定位和控制流媒体文件的播放。

2.多媒体数据压缩技术

由于视频所产生的实时数据量非常大,直接进行传输或存储会对网络带宽和存储空间带来很大的负担。因此,多媒体数据在传输或存储之前,先要进行压缩处理,传送到目的地后再解压播放出来。

数据压缩处理一般由两个过程组成:一是编码过程,即对原始数据进行编码压缩,以便存储和传输;二是解码过程,即对压缩的数据进行解压,恢复成可用的数据。根据解压后数据的保真度,数据压缩技术可分为无损压缩编码和有损压缩编码两大类。无损压缩编码是指解码后的数据与原始数据完全相同,无任何偏差。它的压缩能力与所处理数据的类型有关,压缩比较低,一般在2∶1~5∶1。有损压缩编码是指解码后的数据与原始数据相比有一定的偏差,但仍可保持一定的视听质量和效果,其压缩比可达100∶1。压缩比越高,其解压后的视、音频质量就越低。有损压缩主要用于对音频和视频数据的压缩。

利用视频压缩技术,我们将各种视频数据源如MPEG2格式的DVD教学影碟压缩为RMVB格式的流媒体文件,供学生点播。

3.数据存储技术

压缩好的音视频文件占用大量的磁盘空间,如何存储这些数据,合理利用空间显得很重要。本系统采用2Gbps光纤通道(Fibre Channel,FC)标准,通过在资源服务器上装入2Gbps光纤通道卡,与光纤磁盘阵列进行连接。

磁盘阵列是由一个硬盘控制器来控制多个硬盘的相互连接,使多个硬盘的读写同步,减少错误,增加效率和可靠度的技术。磁盘阵列通过RAID技术将多个单一硬盘组合为一个超大容量硬盘,是多媒体资源库中数字音视频资源的理想存储介质。

RAID(冗余磁盘阵列)技术使用校验的概念提供容错能力。磁盘阵列采用分块和交叉存取技术,将数据分块后分布在多个磁盘上,以并行的交叉存取提高速度。其并行性体现在一个或多个独立的请求被一组磁盘驱动器并行服务,减少了I/O请求的排队等待时间;同时大块数据的I/O请求被一组磁盘服务,通过并行的交叉存取从而提高数据传输率。磁盘阵列的性能差别根据采取不同的数据交叉粒度和冗余信息的放置与计算方法,按数据组织不同而分为多个级别,即RAID 0、RAID 1、RAID 0+1、RAID 3、RAID 5等。[4]

本系统采用RAID 5技术,它具有数据安全、读写速度快、空间利用率高等优点。RAID 5将各块硬盘进行条带化分割,相同的条带区进行奇偶校验,校验数据平均分布在每块硬盘上。以n块硬盘构建的RAID 5阵列可以有n-1块硬盘的容量,存储空间利用率非常高。任何一块硬盘上的数据丢失,均可以通过校验数据推算出来。

五、结束语

外语音像资料的数字化和基于流媒体技术的外语音像资料库的建设为我院师生提供了丰富、高质量的视频和音频教学资源以及网上资源查询、在线播放、资源下载、资源上传等功能。资源库的建设是一个复杂的系统工程,它需要我们建设者不断地根据资源库的使用效果和师生的需求及时地进行修改和动态更新,这样才能为教学提供更好的服务。

参考文献:

[1]桑宇芳.高校外语音像资料的数字化[J].教育信息化,2005(11).

[2]付玉明,单兴苗.外语音像资料的数字化处理[J].新疆师范大学学报,2007(2).

[3]杨波.利用流媒体技术建设网上外语教学资源库[J].天津工业大学学报,2002(6).

[4]郭向勇.面向数字视频资源应用的海量存储系统建构研究[J].电化教育研究,2004(10).

猜你喜欢

流媒体数字化
数字化:让梦想成为未来
家纺业亟待数字化赋能
论经济学数字化的必要性
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
数字化制胜
基于云服务的P2P流媒体技术在远程教学视频传输中的应用