广播电视工程中数字音频技术应用分析
2023-12-13欧阳林子
□欧阳林子
传统的广播电视行业受到网络行业的不断冲击,在这一背景下,要想持续提升广播电视的影响力,就要取长补短,加强技术发展。数字音频技术无疑是其中内容之一。数字化音频技术具有低成本、高效率和高质量等特点,尤其是在远距离传输中效果明显,为音频领域带来质的飞跃。相比于模拟音频技术,数字音频技术的数字解析力更高,信噪比更高,频率响应更平衡、延伸更好,同时数字录音方便编辑,且软件编辑不会像硬件编辑那样每一级设备都会有音质损耗。将其应用在广播电视工程之中,势必能够更进一步推动广播电视工程发展。
一、数字音频技术综述
1.模拟音频技术背景
分析“数字音频技术”,不得不提到以前的“模拟音频技术”。“模拟音频技术”以晶体管和集成电路为主要形式,是用原始波形振幅的相似形来代替声音,这里面涉及“相似”的概念。也正因为如此,在多代复制拷贝中,模拟音频也就体现出劣势,运用“相似”的次数越多,每一次复制拷贝都会不可避免地丢失一些东西,或者说每一次复制拷贝的内容都与原内容有一定的偏离,最后导致出现音质问题。在此前提下,伴随着数字技术的不断发展,“数字音频技术”进入人们视野。
2.数字音频技术
数字音频技术脉冲编码调制的过程,本质上就是“采样—量化—编码”的过程。
首先,对声音的振幅进行量化采样,对于一个原始音频,信号先通过一个低通滤波器,切除低于20kHz 以上的所有频率,剩下的信号通过一个模拟转数字(A/D)的转换器,再通过特定的采样速率去测量音频电平,计算机每隔几微秒就会抓拍一次信号,比如一个48kHz的采样率,每秒钟就有4.8 万个采样,也就是说每秒钟测量4.8万次。
其次,计算机再将这些抓拍的信号转化为一串串数字,用来定义声音的振幅的变化,然后使用平滑滤波恢复成波形的形状。
最后,通过二进制的方式,将所有数值存储起来,代替了波形,同时又准确反映波形的特点,和波形有关联性关系。根据耐奎斯特定理:采样频率比信号频率的两倍还高时,信号是可以完全还原的。因此在实际中,采样最常见的为信号最好频率的2.56~4倍。三点合一,就是“模数转换”。
“模数转换”出现后,随之出现了采样率、采样位数、声道、比特率等多点概念。采样率即每秒内进行采样的次数,采样率越高,采样的内容就越多,后续量化和编码的内容就越多,声音还原就越真实。如果用一个波形坐标系来代表声音,横坐标就是时间,纵坐标就是声音相位值,采用率就是在横坐标方向上可采取的若干点,采样率越高,采样的点也就越多,自然也就越精准。采样位数也被称为采样精度,含义是用多少个点来描述声音信号的强度,采样位数越高,对于采样的精度就越精细。声道则是不同空间位置采集或回放的相对独立的音频信号。比特是二进制数中的位,是最小计量单位,比特率则指的是每秒传送或处理的比特的数量,可简单理解为数字带宽或数字编译率。
3.数字音频技术“模数转化”过程
数字音频应用的过程,是一个“模数”转化的过程,音频的采集和播放这两端其实都是模拟的,采集端是(AD)模数转换,一方面要保证模拟音频本身信号的质量,这样转换成的数字信号才有源的保证,另一方面,AD 转换器也要求量化噪声越小越好,因为在AD 转换时是会引入量化噪声的,这个与AD 转换有关,也与量化bit数有关。在播放端口是DA数模转换的过程,也就是AD转换的逆向过程,数字的音频转成模拟时要求尽量保真还原。
二、数字音频技术的优势
1.高清晰度、高还原度
结合上文提到的,模拟音频技术每次复制拷贝的过程,复制拷贝的内容都与原内容有一定的偏离,相似度越来越差。而数字音频技术的应用,则可实现高清晰度、高还原度。理论上,在技术支持下,采样频率越高,采样内容就会越丰富、越精准。同时,采样数据位深越大,采样的精度就越精细,也就具有了更高的保真度。但是在实际应用中对设备有一定的要求。设备的数字功能足够强大,模拟效果才更好,能支持数字音频技术全部功能的模拟调音台是非常复杂、非常精细的。此外,数字信号越精准,所需要的网络与带宽、信号传输时的数据包也将更大,未来将借助5G 通信技术,强化大数据包的打包与解析。
2.编辑制作更加简单
数字音频是相对于模拟音频而言,把模拟音频离散化(数字化)。数字化音频记录方式,常用的有1bit和多bit记录,而多bit数字音频又可以按有损,比如mp3,或者无损,比如wave或flac进一步编码。数字音频技术的多轨录音软件技术功能强大,能够将人声、乐器声等进行分别采集,编辑为一个完整的节目。如果后续广播电视节目有任何问题,也可快速进行声音采集补救录制;需要增录声音的时候,也可以增录这一个轨道的声音,并将其加入原本节目即可。
由此可见,多轨录音技术,让广播电视节目的制作更加灵活。模拟音频技术难以进行二次制作,需要倒带、快进寻找二次制作点,编辑过程是顺序的、线性的,而数字音频技术的应用,可以根据数字音频的编译规则,进行瞬时定位,找准二次制作点进行快速制作。
3.去除大量冗余
人们所采集的音频信号是比较冗杂的,虽然能够随时随地获得需要的音频信息,但是获得的音频信号冗余较多,也会影响到音频信号的清晰度和还原度。对此,如何有效去除音频信号中冗杂的部分,是一个重大问题。模拟音频技术是难以处理的,而数字音频技术则具备一定的去除冗余内容的手段。原理是图像相邻像素、音频相邻振幅之间是有规则的、有关联的,通过数字建模的方式去了解这种关联性,也就对视频、音频内容具有了更高的解析能力,根据关联性特征,可以将冗余内容有目的性地去除,从而大大提升音频的质量。反映在数字音频技术上,即表现为数字解析力更高,信噪比更高,频率响应更平衡延伸更好。
4.数据量大、编译速度快
音频内容的数据量非常庞大,而模拟音频技术的数据传输空间能力与编译能力是不足的,其要存储在磁带或黑胶唱片等模拟介质,介质不易保管,同时其编译的速度更慢,所能存储的空间也有限。而数据量大必然是未来音频内容进行编译、存储、传播的特点,也就是说,要想获得足够的数据存储空间能力,要想提升数据编译能力,还是要将目光放在数字音频技术上,数字音频技术的数字信号经过压缩后,存储能力显著提升。
5.能够更好地保护数字资产
身处于商业化高度发展的今天,资产保护成为人们又一个热议的话题,对于广播电视工程来说,一些音频内容是商业资产,可能需要收费才能获取,一些音频内容仅供对应专业应用或有条件接收。在数字资产保护领域,数字音频技术有着突出作用,将数字技术和密码技术相结合,能够很好地进行数字信息的加密、解密以及加扰、解扰等,也就能更好地对数字资产进行保护。
6.具有较强的可拓展性
从广播电视工程发展来说,数字音频技术具有较强的可拓展性,数字音频技术可以很好地和其他数字设备相结合,在各类通信信道和网络上进行传输,方便人们日常使用。较强的可拓展性,在广播电视工程上也就意味着更广的传播范畴,数字音频内容可以在很多渠道流通与展示,以获得更多受众,增强用户黏性。
7.数字音频广播系统更加人性化
数字音频技术的应用,尤其是在5G 通信技术的加持下,在“输入”端,音频内容制作更优秀、更加方便快捷,可发展高清晰度音质内容。在软件技术加持下,随时录制、随时播放的“直播”形式将是未来发展方向,这也是传统的广播电视较难攻克的难题。
伴随着数字音频技术的持续发展,音频内容的实时获取与传输能力会更强大,直播这一模块需进行调整、优化。在“存储”和“传输”端,5G 通信技术的加持下,数字音频内容具有更强的存储能力和传输速度,这本就是广播电视工程领域的核心业务,将变得更加突出,也将成为行业竞争优势所在。在“输出”端,数字音频广播立足于人耳的听觉特征和个性需求,发挥智能技术,根据人耳特点智能调控播音模式。是数字音频广播更加人性化的体现。例如,数字音频技术的发展,让远程会议的音频内容更加清晰,且实现实时传输,让远程会议更高效。再如,在音乐领域,音乐经历了从模拟到数字音乐的转变,未来数字音乐还将发挥更大的作用,让用户在家中就能感受演唱会现场的美妙音质。
三、应用途径
在数字化时代,广播电视提出“广播+”概念,指出“聚合—分化—聚合”的过程:第一个“聚合”,指内容的采集是数字化采集,并储存在共用数据库中;“分化”,指各种媒体从数据库中取用素材,加工并发布到用户习惯接受的平台;第二个“聚合”,指媒体通过分化发布聚合用户,通过多方式和多层次的传播形态,来满足受众的不同需求,这就是数字音频技术在广播电视工程中的应用途径。
1.在广播数字调音台中应用数字音频技术
在广播电视工程中,通常使用数字调音台来支持数字音频信号的采集和编译,它的功能强大,能应对复杂的活动现场,具备放大、处理、合并、调节与控制等多方面功能,将通道输入的信号分配到该去的地方,数字解析力更高,信噪比更高,频率响应更平衡,延伸更好。另外,数字调音台在节目处理方面也有很多实用应用,数字调音台具有数据库功能,在均衡、压限、机内效果等音频处理环节有不少现存的经过标准处理模式处理过的可供调用的数字音频;也可对数字音频进行灵活处理。可以说在广播数字调音台中集成数字音频技术,应用功能强大。
2.音频嵌入技术中应用数字音频技术
电视广播工程中数字音频技术的应用,还在于系统中的音频嵌入和解嵌技术。系统中的音频嵌入和解嵌技术,指的是对某一个特定区域的音频进行嵌入,能在录制与制作过程中对音频进行控制与监督,使得数字音频的内容符合设计,质量有所保障。
3.利用数字音频技术处理数字内容
数字音频技术中的云存储功能,可以在云端进行存储。由于数字内容的信号量容量较大,连带着对连接、带宽等都有较高要求。在数字音频技术的辅助下,加之5G 技术的加持,可以实现大带宽、高速率地传输信号。基于此,收听广播节目就可以实现跨地域、跨平台、跨终端。在其强大的基础资源、数据资源和丰富的媒体功能组件支撑下,为媒体用户在资源利用率、业务功能呈现、快速生成发布等方面提供最为强大的业务支持。具体处理时,先接收数字音频内容,之后对数字内容进行解译并使用,解译的方式正好和编译的方式相反,通过一个数字转模拟(D/A)转化器将数字信号转换成由电压级差组成的模拟信号,再由反折叠滤波器,比如低通滤波器、平滑滤波器、重建滤波器等,把模拟信号内的极差加以平滑,还原成初始的模拟信号。
四、数字音频技术的未来发展趋势
数字音频技术的未来有三大发展趋势。
一是物理建模。对一个乐器的物理发声原理通过一个复杂系统的数学模型来进行建模,物理建模的特点在于它参数的可调性或者说声音的可塑性,比如对乐器演奏而言,建模使得其能根据不同乐器的特点去模拟不同参数,让声音还原度和清晰度更上一层楼。
二是3D 音频渲染技术。3D 音频渲染技术将具有逼真的空间感,3D立体声效果的逼真程度极高,并且不同的音频对象可以呈现准确的声学特征,能够有效提升音质。
三是更深入的声源分离技术。结合上文提到的“分轨录音技术”来看,分轨录音技术还是存在一定杂质,对音质造成负面影响,相信未来的声源分离技术会更加成熟,优化算法,提升分轨录音的音质。
五、结语
综上所述,数字音频技术的迅速发展对广播电视工程有非常大的价值,其具有高清晰度、高还原度、编辑制作更加简单、去除大量冗余、数据量大、编译速度快、能够更好地保护数字资产、具有较强的可拓展性、数字音频广播系统更加人性化等多方面特点,在广播电视工程应用中有着极大优势。广播电视工程可以充分利用数字音频技术去改善当下经营困局,促进广播电视工程进一步发展。