APP下载

录音教材产品后期制作中的语音信号预处理

2015-07-12唐舒岩

演艺科技 2015年6期
关键词:声道传声器录音

唐舒岩

(人民教育电子音像出版社有限公司录音编辑部,北京 100081)

录音教材产品后期制作中的语音信号预处理

唐舒岩

(人民教育电子音像出版社有限公司录音编辑部,北京 100081)

详细论述了录音教材产品编辑加工中使用数字音频工作站对语音信号进行预处理的对象、类型以及方法,为高质量的录音教材产品后期编辑加工提供了有力的理论依据与技术手段。

录音;预处理;信号;删除;修复;失真

高质量的录音教材产品的前期录制可以有效地控制录音信号中的噪声以及其他无效信号成分的比例,同时减少录音中不良声学效应对音质产生的不良影响,但是某些信号噪声和不良声学效应的产生在实际录制过程中是很难完全避免的,这可能与语言素材在前期录制中传声器的摆位、教材文本的内容类型以及录制方式等诸多因素相关。这些问题会导致前期录音的素材在后期编辑中无法直接进行剪辑加工,所以,应预先对其做必要的优化处理。录音教材产品后期编辑加工中的语音信号预处理主要包括采用音频技术手段对前期语言录音素材进行技术处理、去除信号中的噪声和多余无效成分、减少录音中不良声学效应的影响,使之符合录音产品对语音信号声音质量的基本要求,便于对其进行后期剪辑加工。

随着多轨录音工艺以及计算机数字音频工作站在录音教材制作中的广泛应用,越来越多的技术手段可以被应用于语音信号的音频预处理。而充分合理的语音信号预处理可以弥补前期录音中的技术漏洞,提高录音素材的声音质量,并为后期剪辑加工提供良好的信号素材基础。

根据预处理对象的类型及其成因的不同,语音信号的预处理主要包括信号的删除、修复和改善。信号的删除主要是针对那些在录制过程产生的无效和弃用的音频素材;信号的修复主要指的是对于错误信号的纠正和重建;而信号的改善则主要针对信号音色中不良成分的删除和优化。以下将对这三种类型信号预处理的对象以及方式进行分别论述。

1 信号的删除

通常情况下,由于拾音方式以及声源本身的原因,在语言前期录音中会产生大量最终不需要的音频信号,其中包括声道串音、声源杂音以及无用素材,这些信号通常和正常语音信号混杂在一起,在对语音信号进行后期剪辑之前,应将其与正常信号区分出来,并加以删除。

1.1 声道串音

典型的声道串音一般发生在采用同期多轨录音方式的前期录音素材中,在双人或多人录音时,由于同时使用多支传声器对不同的声源进行拾音,拾取各自语音信号的传声器也会拾取到其他传声器拾取对象的语音信号,从而产生一定的声道串音。由于拾音距离较远,传声器串音的直混比较低,含有大量房间反射声,直接合成就会影响原有信号的清晰度。同时,声道串音也会由于与原有信号的声程差而产生较为明显相位干涉,形成梳状滤波效应。

通常情况下,当多个语音声源同时发声时,声道串音无法通过后期处理完全去除,只能通过前期录音时的传声器设置进行有效的声道隔离,从而减少声道串音的不良影响,如采用同期多轨录音时两支传声器拾取的信号之间产生声道串音,如图1中的圈内部分。单一声源发声时,声道串音是可以去除的,此类情况常见于教材文本中情景对话的录制。

1.2 声源杂音

声源杂音主要来自于录制主体本身,由于播音者本身的发声以及呼吸习惯,在录音时可能会产生口唇部位的杂音和不自然的呼吸声,同时,录制过程中翻阅录音文本时产生的杂音也会被传声器拾取到。此类杂音常常产生于较短的语音信号间隙中,并与语音信号结合得比较紧密,如图2圈内部分。因此,声源杂音在前期录音中往往容易被忽视,甚至有时在后期音频加工中也还需要对录音信号的波形图进行放大并反复监听后才能鉴别到。

1.3 无用素材

当播音员出现误读、错读、漏读录音文稿,以及在朗读文本的间隙翻看录音文稿时,会产生大量无用素材,一般情况下在前期录音中需要停机进行必要的删除。这种剪辑式与插入式的录音模式主要适用于那些素材文本篇幅较短的前期录制,这样可以减少后期剪辑加工的工作量;而在录音教材文本篇幅较长、录音内容较多的情况下,为了节省前期素材录制的时间以提高录音的效率,实际录音中往往采用不停机录音的录制模式,此时,录音技术编辑往往很难实时进行精确的素材剪辑,有时在教材文本存在多种读音方式的情况下,还可能会在前期录音时留下多个素材以便后期选择使用。因此,较大部分的无用素材会存留在录音信号中,而需要在后期编辑加工的流程中删除。无用素材在前期录音信号中占有的比重主要取决于播音员的专业水准以及对录音文本的熟悉程度,在前期录音的审听中,教材文本的内容编辑需要做好录音记录,对无用素材的录音位置进行标注,以便有效地引导后期编辑加工。如图3所示:无用素材在录制波形的形态上与正常使用的素材波形十分接近,在后期编辑加工时应注意观察和监听,以免形成漏删和误删信号。

1.4 信号删除的方式

无论是声道串音、声源杂音还是无用素材,都需要通过删除操作从原始信号中去除。使用数字音频工作站对信号进行删除的方式一般有两种,即有损编辑删除和无损编辑删除。语音信号的预处理应选择有效而安全的信号删除方式,既保证有效的信号删除操作,又不会漏删噪声信号或误删有用的信号。

1.4.1 有损编辑删除

有损编辑删除是指通过使用软件的有损编辑方式对信号进行破坏性删除操作的方法,一般是对音频信号的波形进行不可逆的删除,亦可称为“静音”。如图4显示了同一信号素材在经有损编辑删除前后的波形图示。有损编辑删除具有不可撤销的特点,一旦保存文件后误删信号就无法进行恢复,但此种方式使用时并不破坏音频事件的完整性以及相互关系,比较适用于去除素材信号中波形特征较为明显的声道串音以及声源杂音。

1.4.2 无损编辑删除

在后期编辑加工中,无损编辑方式进行信号删除常被用于大段的无用素材。由于采用非破坏性的删除操作,原始音频数据仍记录在软件的素材库中,当出现误操作时,可以及时恢复原来的数据。在数字音频工作站中,无损编辑删除一般通过两种方式实现:音频事件的删除与音量自动化删除。音频事件的删除指直接删除无效信号所在区域的音频事件。由于只是删除音频事件而非对原始波形进行破坏性修改,因此,该方式可以通过恢复音频事件来进行纠错。如图5所示,通过音频事件删除原始录音素材中的两处无用素材,信号波形周围的实线区域显示了该音频事件的大小。

而音量自动化的删除方式在操作上较为复杂,这种方式是通过音频工作站的音量自动化功能在无效素材相应的时间区域绘制音量变化曲线,使得在该区域内的音频信号电平最小化,进而达到去除此处音频信号的目的。绘制音量曲线需要耗费一定的时间,但操作结果十分直观,方便检查是否出现删除错误,当出现误操作时,可以通过恢复自动化曲线来达到纠错的目的。图6显示了在两处无用素材信号的时间区域内绘制的相应的音量自动化曲线。使用此种方式进行信号删除时需要注意将音频事件轨道与自动化轨道相互关联,以防止由于音频事件移动导致其在时间上无法与相应的自动化曲线对应。

2 信号的修复

信号的过载失真常发生于前期录音中,其中主要包括由于传声器瞬态过载和模数转换过程中信号的削波失真。过载失真信号所产生的噪声会严重破坏录音信号的质量,甚至造成正常语音信号的缺失。在通常情况下,前期录音时应及时调整传声器的设置以及前置放大器的增益,以避免此类噪声的产生,一旦出现问题应及时暂停录制并进行必要的重录和补录。但是,由于此类噪声一般发生在较短时间内,特别是传声器瞬态失真产生的过载噪声,十分容易被遗漏而滞留在前期录音素材中。在无法进行补录的情况下,常常需要在后期编辑加工中对此类信号成分进行必要的修复。

2.1 传声器的瞬态过载失真

当传声器膜片距离播音者较近时,播音者的某些发音会产生较强的气流声,这种气流会使传声器振膜出现瞬态失真,从而形成中低频段的“喷口”噪声。“喷口”噪声在前期录音中的发生具有不确定性,一般会出现在一些语言发音中的爆破音,如:在英语发音中,带有p、t、k、f等辅音字母的单词发音很容易造成传声器的瞬态过载。传声器的瞬态过载失真可通过在前期录音中改变拾音距离和拾音角度的方式加以避免,但有时少量的瞬态失真容易被忽略,需要在后期编辑中对失真进行修复。如图7所示,“喷口”噪声通常会隐藏在正常的信号中,从信号波形上看呈不规律的形状,放大后类似连续的脉冲信号。

2.2 数字削波失真

数字削波失真信号的噪声主要指由于在前期录音时传声器输入增益过大,位于峰值部分的信号超过了数字系统的最大满刻度数字电平,从而产生了采样波形的缺失,最终形成一种中高频的刺耳噪声。数字削波失真的发生通常与数字系统的电平动态储备有关,通过降低传声器的前置增益和使用信号压缩器的方式可以有效避免数字失真。但有时仍有少量的削波失真会被留在录音信号中,如图8所示,这就需要对已经产生削波失真的信号进行有效的还原修复。

2.3 信号修复的方式

在数字音频工作中,信号修复主要是通过音频软件实现的,包括频率修复和振幅修复两种方式。频率修复方式主要应用于传声器瞬态失真的信号修复,而振幅修复方式则用于数字削波失真的信号重建。

2.3.1 频率修复方式

频率修复方式指的是通过特定截止频率的高通滤波软件,对传声器瞬态失真信号进行处理,去除其中的“喷口”噪声。根据语音信号的频谱范围,采用截止频率在150 Hz以内的高通滤波处理,不会对原有信号的音质产生过多的影响。图9显示了带有“喷口”噪声的原始素材信号以及通过带有150 Hz截止频率的高通滤波器去除“喷口”噪声之后的素材信号。

2.3.2 振幅修复方式

振幅修复方式主要是通过音频插件对原有信号的振幅进行修复,使之恢复正常的信号形态。这种方式主要用于消除录音中由于信号在输入端过载而产生数字削波失真噪声。在数字音频工作站中具备过载信号修复功能的软件可以实现对于削波失真信号的修复以及噪声的去除。如图10所示,利用音频修复软件将一处过载信号进行修复以消除失真噪声。需要注意的是,这种利用软件实现的修复删除只是通过软件内部对音频信号的振幅进行还原运算,模拟了原始波形,从而达到去除噪声的目的。在实际工作中,在前期录音中控制好录音电平才是避免信号在模数转换中过载失真的合理方式。

3 信号的改善

录制清晰的语音信号以便于听者学习,是语言录音教材产品录制加工的首要目的,信号音质的改善可以有效地提高语音信号的清晰度和可懂度。在语音信号的预处理中,对信号的改善是指缓解和消除前期录音中的不良声学效应对信号音质产生的不利影响,主要包括近讲效应与嘶声的消除。

3.1 近讲效应

近距离拾音可以捕捉声音的细节,从而大大提高拾取信号的清晰度,特别是对于录音教材的录制来说,清晰的语音信号可以提高语言的可懂度,从而帮助学习者更好地学习语言的发音,理解语言的含义。但为了避免产生过多的声道串音,同时尽可能少地拾取房间反射声,语音信号的前期录音中常用到以心形指向传声器为代表的复合式传声器。因此,近距离拾音所产生的近讲效应在前期录音时难以避免。由近讲效应所引起的语音信号中低频成分的过度增强,会削弱近距离拾音所带来的信号清晰度。如图11所示,某语音信号由于拾音距离较近而产生近讲效应,可以看到该信号在低频段60 Hz~250 Hz之间有明显的提升。为了缓解近讲效应对语音信号清晰度的破坏,应进行必要的信号预处理,消除近讲效应的不利影响。

3.2 嘶声

嘶声是指在录音过程中播音者发音气流与其牙齿及口唇摩擦产生的高频杂音。嘶声的产生与播音者的发声特点密切相关,通常情况下女声多于男声;此外,它还与发音的内容相关,如:汉语中带有声母z、c、s的汉字,在发音时容易产生嘶声,如图12。嘶声的产生并不会影响语音信号的清晰度,但语音信号中过多的高频成分会恶化音质,刺耳的语音信号会导致听音者在短时间内产生听觉疲劳,对语言的学习非常不利。此外,语音信号中过多的高频分量还会导致后期制作中进行信号响度提升时产生的失真,这种失真有时只有通过采用四倍过采样技术的EBU R128标准,其真正峰值表才能被检测到。

3.3 信号改善的方式

采用均衡器对语音信号进行处理,可以有效地缓解近讲效应带来的影响,改善语音信号的音质。对于近讲效应较为严重的信号,可采用截止频率为100 Hz的高通滤波进行处理,必要时可增加中心频率为200 Hz~300 Hz的峰型均衡衰减,衰减量可视情况而定,一般在3 dB~6 dB;对于近讲效应影响较轻的语音信号,则可采用转折频率为100 Hz的低频搁架式均衡衰减,衰减量可在6 dB~12 dB。

消除语音嘶声同样可以使用高频搁架式均衡,通常可采用的转折频率为8 kHz,衰减量在3 dB~6 dB。但单一的高频衰减容易破坏高次谐波分量较为丰富的语音信号,影响语音信号的清晰度。可采用专用的嘶声消除软件(DeEsser)对带有嘶声的信号进行处理,如图13所示。使用此类软件处理可以在保证不破坏原有信号音质的前提下,有效地去除语音信号中的嘶声,达到改善音质的目的。

4 结语

前期录音中语音信号的预处理,是保证语言类录音教材产品后期编辑加工的先决条件,其目的并不是美化信号,而是对语音素材信号进行规范化。在处理的过程中应尽可能地保证原始录音素材中内容的完整性、语言表达的流畅性以及音色的统一性,以不破坏声音的自然属性为原则。

保证内容的完整性主要指在信号删除处理时做到“听”与“看”相结合,仔细地监听、鉴别应删除信号的位置,认真地观察信号波形的形态,避免无效信号与保留的录音文本内容信号之间出现混淆,导致漏删噪声信号或误删有用信号,在必要时尽量使用无损删除方式,最大程度地保留原始数据,为修改留出余地。在实际操作时,由于大部分需要删除的信号以及应保留信号的音头和音尾信号都属于低电平信号,常因计算机音频工作站软件的波形显示精度不够而无法显示明确,此时,可将原始素材信号的波形幅度显示适当放大,看清所需删除信号的边界后再进行操作。如图14所示,同一素材信号的波形在经过振幅显示放大后可以清晰地看到声源杂音所在位置(箭头所指处)。

保证语言表达的流畅性主要指在删除操作时不破坏原有语言表达的呼吸,保持自然的语言节奏。原则上说,语音间隙的自然呼吸信号应尽量保留,删除信号时,在保留信号的开始与结束的位置,要留出一定的空间来保证原有的呼吸不被删除;在不得不破坏原有语言呼吸节奏的情况下,应使用“淡入”和“淡出”功能尽可能地减少人为编辑加工的痕迹。如图15所示,以删除某录音素材中的声道串音信号为例,图15(1)显示信号中原有声道串音的形态;图15(2)中直接采用了音频事件删除的方法去除了该素材信号中声道串音,同时在各个音频事件的头尾保留了一定的长度,保证了音头和音尾的自然呼吸;图15(3)则是使用了音频事件的“淡入”和“淡出”功能部分删除语言呼吸信号,结果显得更为自然。

另外,在使用效果软件对信号进行修复和改善时,由于原有信号的频谱产生了改变,会导致信号的相位失真以及音色的改变,为了保证前后信号在音色上的统一,在实际操作时,应尽可能地缩小信号滤波和修复的范围,以减少处理的痕迹。在对信号做频率和振幅的改变操作时,应明确只做“减法”、不做“加法”,即只做衰减处理、不做增益处理,这样可以最大程度地保证信号的原始形态,并为之后的编辑加工留出一定的余地。

唐舒岩,硕士,高级编辑,现就职于人民教育电子音像出版社有限公司录音编辑部,主要从事音乐和语言录音产品的录制和后期编辑工作。

(编辑 薛云霞)

Preprocessing in Post Production of Language Teaching Materials

TANG Shu-yan
(Record Editing Department, People's Education Electronic Audio and Video Press Co., Ltd., Beijing 100081, China)

This paper discusses the object, type and methods of preprocessingin post production of language teaching materials with digital audio work station in detail. It provides a strong theoretical basis and technical means for the high quality of language t eaching materials products.

recording; preprocess; signal; delete; repair; frequence; distortion

10.3969/j.issn.1674-8239.2015.06.006

猜你喜欢

声道传声器录音
正确选择传声器的响应类型
9.7.8声道、造价250余万 James极品影院赏析
表面传声器校准技术研究
Funny Phonics
funny phonics
为发烧需求打造的11声道后级 Orisun(傲力声)OA-S11
实现从7.2到11.2声道的飞跃 Onkyo(安桥)TX-RZ830
Colorful Seasons多彩四季
A New Term
考虑覆盖率下时差式超声流量计的平面声道模型*