视频会议系统关键技术及应用研究*
2010-08-10仲元昌蔡增增
仲元昌 ,林 永 ,蔡增增 ,何 进
(1.重庆大学 通信工程学院,重庆 400044;2.重庆工程职业技术学院,重庆 400037)
1 引言
视频会议是利用通信网络,传输多个与会者连续活动图像和声音的一种通信业务。作为现代通信的重要技术,视频会议系统在远程教育、远程医疗、远程电视电话会议、远程监控等方面有着广泛的应用[1]。
现有的视频会议产品主要分为两大类:一类是基于嵌入式系统的硬件视频会议产品,硬件视频会议产品基于嵌入式操作系统。采用H.323协议,主要面向高端的、大型的专业视频会议需求,图像声音效果好,但是价格高,维护、升级困难;另一类是基于PC+服务器的软件网络会议产品,软件网络会议产品基于PC+服务器软件实现,面向低端小型会议、个人、Internet用户,由即时消息(IM)系统发展而来,采用XMPP或非标准协议。虽然维护升级方便,价格便宜,但图像效果差,与传统H.323产品不兼容,并且无回声抵消,难以满足大型专业会议要求。
针对视频会议系统的关键技术及应用问题,以科达科技有限公司提供的电视会议系统为研究对象,融合现有视频会议系统的优点,构建了一种高性价比的视频会议系统,采用嵌入式技术,充分利用软件技术的强大功能,实现了MCU的小型化,降低了系统成本。
2 关键技术分析
2.1 H.323协议分析
传统的视频会议系统基于H.320标准,H.320是基于电路交换的协议标准[2-4]。从20世纪90年代开始,国际电信联盟(ITU)将视频会议系统标准的制定工作重点转向H.323。H.323是基于TCP/IP网络的视频会议系统的标准协议,它涉及会议终端、多点控制单元、网关、网守、音视频和数据的传输、网络控制、网络接口等方面的内容。H.323协议中采用实时传输协议(RTP)和实时传输控制协议(RTCP)进行音视频数据的实时传输和控制。视频编解码采用H.261,H.263,H.264等标准。音频编解码采用G.711,G.722,G.729等标准。网络层音视频数据的传输都采用用户数据包协议(UDP),并且优先传送音频数据。
H.323标准支持在一个网络环境中同时召开多个独立会议,用多点控制单元来实现多点控制和管理。H.323的主要优点有:1)可以被应用在通用的网络体系结构中,具有网络独立性;2)能够对网络中并发的H.323链接数和H.323应用可获得的总带宽进行限制,保证了视频会议系统的有效传输;3)提供了链接基于电路交换的视频会议手段,支持多播传输技术。但H.323的缺点是协议比较复杂,没有拥塞控制机制,服务质量不能得到保证,效率和可扩展性较差。
2.2 音视频编解码技术
音视频编解码技术是视频会议系统的关键技术指标,是影响会议效果的重要因素[3-4]。采集到的原始音视频信号是模拟信号且数据量大,通过压缩、编解码可以将信号转化成能够在数字信道中传输的数字信号,节约了存储数据的空间,降低了信道带宽,为在现有通信信道上实现多种业务的并行传输提供了可能。
目前在国际上有两个负责音视频编码的组织,一个是国际标准化组织下的运动图像专家组(MPEG),另一个是国际电信联合会下的视频编码专家组(VCEG)。VCEG 制定的标准有 H.261,H.262,H.263,H.264 等,其中H.264是为新一代交互视频通信制定的标准。MPEG制 定 的 标 准 有 MPEG-1,MPEG-2,MPEG-4,MPEG-7,MPEG-21,其中MPEG-4是为交互式多媒体通信制定的压缩标准。目前在视频会议系统中用到的视频编码技术主要有 H.261,H.263,H.264,MPEG-2,MPEG-4 等, 音频编码技术主要有 G.711,G.722,G.723,G.728,G.729,MP3 等。
3 系统模型及工作原理
根据H.323标准,依托科达科技有限公司提供的电视会议系统,构建的系统模型如图1所示[4-6]。主要包括会议终端、多点控制单元(Multipoint Control Unit,MCU)、网守(gatekeeper)、网关(gateway)、传输网络、网络接口等。
图1 视频会议系统模型
会议控制台软件(MCS)是新一代基于Web界面与虚拟仪器技术的视频会议操作功能软件[7-9]。会议控制台软件可运行于普通台式机、笔记本计算机上。该软件以形象的图形界面交互方式,向用户提供一个可以控制整个视频会议的接口,它通过控制多点会议控制单元(MCU)来实现会议电视的各种功能。
会议控制台主要用于视频会议的召集、控制和监视,可运行在安装有Windows操作系统的计算机上,以Web方式启动。同一时刻单个会议控制台可对多台MCU进行控制,而多个会议控制台也可对单个MCU进行控制。
终端控制台,基于嵌入式结构设计,提供H.320&H.323双协议支持;采用机架式结构,内置了1个6×6视频矩阵,可根据会场需要灵活配置多台摄像机输入;支持双视频流,提供高达4CIF的高品质视频图像、XGA的计算机图像和CD级音频效果,配合超群的视频优化技术、自动回声消除技术、自动增益控制技术和背景噪音消除技术,可让用户获得极为真切的现场会议感受。终端控制台为用户提供嵌入式终端的操作界面,用户可以实现对终端的完全控制,包括会议管理、设备控制、系统管理、终端诊断等。一台嵌入式终端目前仅支持一个终端控制台对其进行控制。
会议终端是提供双向实时通信的客户端。一方面它采集现场会议的音视频信号并将其压缩编码后同其他数据信息一起通过传输网络发送到其他会议终端或多点控制单元。另一方面它将接收来自其他会议终端或多点控制单元的音视频信息,经过解压缩、解码等输出到本地的会议显示设备中。
高清视频终端提供了丰富的会议功能,并且提供遥控器可操作界面,提供多个面板快捷键,可以实现会议中的各个操作功能。
桌面终端(PCMT)是直接面向用户的基于计算机的会议电视操作平台,向用户提供执行相关会议功能的操作界面,主要供个人或者人数较少的团体参与会议时使用。桌面终端负责完成视频图像采集、显示,音频数据采集、播放,实时显示会议状态信息和会议消息等功能;通过与PCMT业务通信,与之交换媒体码流和控制消息来完成相应的会议功能。桌面终端成为会议的主席终端后,可以代替会议控制台完成对当前会议的控制管理功能。PCMT支持点对点会议、普通多点视频会议、T.120数据会议。
多点控制单元是视频会议系统的核心设备。它支持3点或3点以上的视频会议,由多点控制器(MC)和多点处理器(MP)组成。MC主要进行数据管理、主席控制、模式切换、建立会议和终止会议等。MP主要进行混音、交换、处理音视频信号和其他数据。总之,多点控制单元负责对音频、视频及其他数据信息进行处理和交换。
网守是可选设备,主要提供呼叫和管理功能,负责对会议终端进行认证处理以及地址转换访问控制和带宽管理等功能。它可以单独存在也可以以功能模块的形式集成到多点控制单元中。
网管客户端用友好的界面来实现各种设备 (包括MCU、桌面终端和各种嵌入式终端)的管理控制,可实时反映当前设备的运行状态,并能查询设备历史状态。网管客户端拥有一个庞大的告警系统,针对于各种设备所产生的告警信息,网管客户端会提供相应的告警解决方案;可以对这些终端进行文件的上传、下载,时间同步,线路测试,远程复位等各种操作。这些功能的实现是通过与网管服务器的交互来实现的。
为了支持外设,在网管客户端上增加对外设的显示,使用户能通过网管客户端对外设进行控制。为了让用户能及时了解到整个系统设备的当前状态,网管客户端还支持用图形化来模拟机架构件现实设备的当前状态。
视频点播系统用于播放在流媒体服务器上发布的多媒体节目。发布的节目可以是服务器上预存的文件,也可以是正在MCU上进行中的组播会议图像。目前,通过改进后,科达视频点播系统配合科达视频会议系统使用更加方便,可以完成更多功能,实现对会议录像文件的即录即播功能、将录像文件直接在会议控制台发布到点播系统。
该系统支持多用户管理,分成一般用户、高级用户和管理员用户。根据权限实现安全管理系统功能:管理员用户除了可以使用点播功能外,还有发布节目、用户管理、安全设置等功能;高级用户则还可以点播保密节目和普通节目;一般用户只能点播普通文件。
随着现代通信技术的不断发展,网络通信也趋向于多元化。现在通信网络的类型繁多,有TCP/IP网络、PSTN(公用电话交换网)、ISDN(综合业务数字网)、ATM网(异步传输模式网)、卫星网络等。系统级联后,简单组网图如图2所示。
基于H.323的视频会议系统可运行在TCP/IP网络上。现在随着网络技术和传输媒体的提高,TCP/IP网络已经发展成为一个高速、高可靠性、高质量的传输网络。在实时性方面TCP/IP网络做了很大的改进,在传输层采用了RTP和RTCP,基本上保证了视频会议系统传输的实时性。在传输带宽方面,通过专线或采用更高效的压缩技术可以保证一定规模的视频会议系统的传输。
4 系统运行测试
会议控制台的登录界面如图3所示,如果在IE地址栏输入MCU地址登陆,则会自动把该MCU地址添加到 “连接的MCU”选择框中并选中,此时用户只需要输入用户名和密码即可。如果用户曾经使用过会议控制台,则登陆时自动选中最后一次登陆的MCU地址即可。
图4为会议基本信息设置界面,如果没有勾选“手动结束”,则设置的会议持续时间有效,输入“0小时0分钟”表示不限时间;如果勾选“手动结束”,则表示会议为人工结束的会议。
图5为实际测得的会议码率信息。会议码率的详细信息包括视频和音频码率以及数据会议的码率,三者之和为会议码率。
5 小结
为了提高视频会议系统的高性价比,采用嵌入式技术,充分利用虚拟仪器技术及软件技术的强大功能,实现了MCU的小型化,降低了系统成本。运行测试结果表明:该系统支持标准H.323协议、支持最新的H.264编码标准和H.239双视频流、支持广泛的网络协议,界面友好,性能稳定,达到了预期效果,可广泛应用于各种视频会议场所。
[1]王晓婕.第三代视频会议系统的研究与实现[J].微电子学与计算机,2006,23(8):98-100.
[2]张学军.基于H.323协议实现局域网嵌入式语音通信[J].网络与信息,2009(5):31-32.
[3]王中元,胡瑞敏,傅佑铭,等.H.323视频会议系统中视频编解码子系统设计若干问题的研究[J].电子与信息学报,2007,29(7):1596-1599.
[4]王枫博,贾世杰,郭字明,等.基于H.323的网络视频会议系统的关键技术研究[J].科技情报开发与经济,2009,19(5):66-67.
[5]黄韵,朱志祥,裴昌幸.IP网络视频会议系统中MCU的设计与实现[J].计算机工程,2004,30(14):138-140.
[6]扶庆华,邓正宏,郑炜.广域网中分布式视频会议系统的设计与实现[J].计算机工程,2004,30(17):157-159.
[7]黄东军,陈松乔.基于源根组播的多点视频会议系统模型及其实现[J].电子学报,2005,33(1):48-51.
[8]仲元昌,王小林.信号频谱虚拟测量实验教学系统[J].重庆大学学报,2003,26(11):95-97.
[9]仲元昌.基于计算机PCI总线的虚拟信号源设计[J].计算机科学,2005,32(6):230-232.