APP下载

数字音频在广播电视工程中的同步传输与控制技术

2023-04-24刘贵臣

电视技术 2023年10期
关键词:数字音频音质编码器

刘贵臣

(沂水县融媒体中心,山东 临沂 276400)

0 引言

随着数字技术的发展,数字音频技术在广播电视系统中的应用日益广泛。相较于传统模拟音频技术,数字音频技术具有抗干扰能力强、质量损失小、编解码方便以及传输容量大等显著优势,能够提供更高的音质和更强大的处理能力。由于广播电视传输系统结构复杂,数字音频信号在传输过程中容易受到信道失真、时延误差等影响,导致音频质量下降,严重时可能出现音画不同步、杂音及失真等问题[1]。对此,本文以数字音频在广播电视工程中的同步传输与控制技术为研究对象,分析数字音频信号的同步传输方法、质量控制技术手段以及系统传输控制方式,为数字音频技术在广播电视工程领域的应用与发展提供理论支撑。

1 数字音频在广播电视中的应用概述

1.1 数字音频概述

1.1.1 数字音频的概念与特征

数字音频是指利用数字信号处理技术对声音进行取样、量化、编码、存储、处理和转换的过程,使用二进制数字代码而非模拟电信号来表示声音信息。数字音频通过模数转换器(Analogto-Digital Converter,ADC)将模拟音频信号转换成数字脉冲编码,再通过数模转换器(Digital-to-Analog Converter,DAC)将数字信号转换回模拟信号。数字音频可以通过提高取样频率(48 kHz 或更高)和采用高分辨率量化(16 bits 或24 bits)来获取更多的声音细节特征,频率响应范围更宽(可超过20 kHz),信噪比高(可达90 dB 以上)[2],因而可以实现高保真的音质,逼真地再现声音的质感,利用数字信号处理技术进行各种音频效果的合成,如回声、混响、均衡等,实现传统模拟音频难以达到的强大音频处理能力。

1.1.2 数字音频的编码标准

数字音频在传输和存储过程中需要进行编码压缩以减少数据量。当前应用较广泛的数字音频编码标准主要包括以下几种。

(1)MP3(MPEG-1 音频层Ⅲ),使用psychoacoustic 模型进行有损压缩,通过过滤人耳难以听见的声音成分,实现11 ∶1 的高压缩率,是互联网使用最普遍的编码格式。

(2)AAC 是在MPEG-2 和MPEG-4 中使用的专业级编码标准,其压缩效率优于MP3,支持多声道、更多比特率选项,应用在数字电视和数字音乐播放中。

(3)AC-3,也称Dolby Digital,是杜比实验室研发的综合多声道数字音频格式,包含1 ~6 个声道,采样率为48 kHz,应用在DVD、蓝光影碟及数字电视等产品中。

(4)WMA 是微软公司的音频压缩格式,可在与MP3 相媲美的音质下获得更小的文件体积,是Windows Media Player 软件默认的编码标准。

(5)FLAC 是一种无损编码方式,可减小50%~60%的存储空间而不损失音质,适用于对音质要求极高的场合。

1.2 数字音频在广播电视工程中的应用方向

1.2.1 数字电视音频广播

数字电视可以提供CD 级别的高保真音质,支持立体声以及AC-3、Dolby Digital 等多声道环绕音效,远高于模拟电视的单声道音质,针对不同节目提供多语言音轨、视障解说等音频服务,还可实现交互娱乐节目中的环绕音效,观众可以自由选择所需的音频通道。

1.2.2 数字有线电视音频

数字有线电视通过有线网络采用数字编码技术传输视频与音频信号,可提供CD 级别音质的数字立体声,支持杜比AC-3、DTS 等多声道环绕音效,同时采用正交振幅调制(Quadrature Amplitude Modulation,QAM)、编码正交频分复用(Coded Orthogonal Frequency Division Multiplexing,COFDM)等数字调制技术,可有效抵抗传输链路中的各种随机噪声和相邻信道干扰,保证音频信号的完整性[3]。

1.2.3 网络在线音视频

网络在线音视频服务的广泛应用,主要建立在数字音频技术基础上。网络在线音视频需要使用数字音频编码技术对音频信号进行压缩,常用的编码标准有MP3、AAC、WMA 等,可以显著降低音频数据流量,满足网络传输的需求。经过编码压缩后的数字音频信号与视频信号多路复用,打包成流媒体格式,通过传输控制协议/网际协议(Transmission Control Protocol/Internet Protocol,TCP/IP)网络进行传输,支持用户点播需求。

2 数字音频同步传输技术分析

2.1 基于时间戳的音频同步

基于时间戳是数字音频同步的一种常用技术手段,其基本原理是在对数字音频信号进行编码和封包过程中,在每个音频数据包的首部添加表示采样时间或发送时间的时间戳信息。解码端接收到数据包后,根据数据包中的时间戳,设置定时器,将音频数据预存入缓冲区。当定时器时间与时间戳一致,从缓冲区取出对应音频数据进行播放。采用时间戳同步的优点有:直接依赖时间信息同步,无须解析音频内容,实现简单;只需要编码端加入时间戳,无须改变网络传输机制;同步精度高,误差可控制在几毫秒以内;可适用于各种网络条件,抗网络抖动能力强。

2.2 基于流媒体协议的音频同步

流媒体协议同步是数字音频同步传输的另一种重要方式,主要过程如下:

(1)在对数字音频流进行封装处理时采用实时流媒体协议,如RTSP、实时传输协议(Real-time Transport Protocol,RTP)等,在协议消息头中插入表示时间信息的时间戳;

(2)在接收端,根据流媒体协议中的时间戳对音频数据包进行重排序和缓存,缓存过长的数据包可以弃用;

(3)解码器根据流媒体消息中的时间戳,在时间一致时从缓存中取出相应的音频数据包进行解码和播放。

3 数字音频传输过程中的质量控制技术

3.1 数字音频传输质量评估指标

评估数字音频传输质量的主要技术指标有:

(1)误码率,用于表示数字传输系统在传输过程中发生比特误码的比率,数字音频传输的误码率越低,传输误差就越少,音质的损失也越小;

(2)抖动和丢包率,抖动是数据包到达间隔时间的变化,丢包率是传输中未能成功到达的包的比率,音频传输的抖动和丢包率越低,音频延迟变化和中断就越少;

(3)客观的听觉质量模型评估,通过仿真信号传输和分析模型,如语音质量感知评估(Perceptual Evaluation of Speech Quality,PESQ)、音频质量感知评估(Perceptual Evaluation of Audio Quality,PEAQ)等,来评估编码和网络传输对音质的影响;

(4)主观听觉质量评估,需要专业评委进行耳机监听,判断数字处理对音质的损害程度。

3.2 数字音频传输质量控制方法

3.2.1 前馈控制

数字音频传输的前馈控制是一种重要的控制策略,主要技术流程如下:

(1)进行数字音频编码和传输之前,通过模型预测等方式,实时获取网络当前的状态参数,如带宽、时延抖动等;

(2)根据这些预测结果,对数字音频编码器的控制参数如编码比特率、丢包补偿能力等进行智能优化,配置编码器使用适应当前网络状态的编码参数;

(3)采用经优化配置的编码器对音频数据进行编码后传输到接收端,从而最大限度地适应网络状态,提高数字音频的传输质量;

(4)通过从接收端反馈获得的实际网络状态和服务质量(Quality of Service,QoS)数据实现闭环控制,持续校正和优化编码器的参数。

采用前馈控制策略的优点在于可以动态调整编码参数以适应网络变化。主动控制策略可以快速反应网络状态,简化接收端处理,可以根据不同指标进行多目标的联合控制。

3.2.2 反馈控制

数字音频传输的反馈控制是基于闭环控制理论的另一种重要控制策略,主要技术流程包括:

(1)在数字音频接收端实时监测网络传输状态和音频播放质量参数,如传输延迟、丢包率及抖动等,将这些监测结果即网络状态反馈传回发送端的数字音频编码器控制器;

(2)控制器根据反馈回来的实际网络状态,动态调整数字音频编码的参数,如编码比特率、丢包容错能力等,经编码器调控输出的数字音频数据,可以更好地适应当前的网络传输状况,保证接收端播放质量;

(3)通过该闭环反馈的控制方式,持续优化数字音频编码的控制效果[4]。

反馈控制策略的主要优点在于可以根据真实网络来调控编码器,可配合其他控制手段实现多目标控制,对网络动态变化有很强的适应能力。通过反馈环路可以有效应对网络动态变化,但其控制效率还取决于反馈通道的实时性能[5]。

4 结语

数字音频技术的发展为广播电视业提供了实现高保真音质传输的可能性。相关技术的持续创新与改进,将促进数字音频在抗干扰、精确同步等方面的性能不断提升,并与视频和数据技术实现深度融合,支持广播电视系统实现更具互动性和智能化的音频服务,为观众提供更优质的视听体验。数字音频技术具有广阔的应用前景,将在广播电视工程领域得到进一步的应用与发展,在保证音质的同时实现传输的可靠性、灵活性与智能化,拓展广播电视的新功能与应用空间。

猜你喜欢

数字音频音质编码器
私人影院音质优选 ATT(安缇)SUB-12+
让全家人共享Hi-Fi音质 DALI(达尼)OBERON C系列
在小空间享受大型音箱的音质 Definitive Technology UIW RLS Ⅱ/UIW RSS Ⅱ
基于FPGA的同步机轴角编码器
其它都好,音质有待提高 小米AI音箱
基于FPGA的多协议数字音频信号发生方法
基于PRBS检测的8B/IOB编码器设计
数字音频及其嵌入技术在广播电视工程的应用
数字音频广播信号接收系统及其软件架构
数字音频广播的特点